麻将 AI 工具 - 检讨牌谱,派遣个室

Review your game / 检讨牌谱

注意

  1. 只接受四麻牌谱。
  2. 只有一般规则的牌谱才能使用,例如段位战的牌谱。
  3. 对于 Mortal 引擎,只接受半庄(东南)牌谱。

高级选项

📝 Rating 是一个常被人误用的方差很大的值,应谨慎使用。
Rating 和所选择的“Mortal 网络”直接相关,不同“Mortal 网络”计算出的 rating 之间是没有可比性的。

有关 rating 的说明

Rating 存在误导性,主要原因是目前的 rating 是一个很随意的设计,和 Mortal 内部的底层实现高度相关,而大多数人不熟悉这样的背景,就很容易产生误解。另一方面,rating 也不是我做 reviewer 的初衷,更不是什么主打的功能,所以也没有在这上面花多少心思。

Rating 从未在训练时被使用过,无论是直接地(比如作为 loss)还是间接地(比如像 F1-score 一样打给人看),它既不影响也不反映训练的效果。

现在 rating 似乎反而把大家的注意力从更重要的事情(具体的何切判断)上移开了。何况 rating 说到底只是做了一个 min-max scaling 然后求均值而已,没有什么校准,甚至连置信区间都没有给,再加上它又和超参直接相关,换一套参数重新训练又完全不一样了,实在不宜作为参考。可是它就这样莫名成了个很流行的 feature 让我有些苦恼,所以先把它放在了高级选项里,因为它的确是一个高级选项,需要理解相关的背景才能用对。

此外,Rating 的计算基于那张详细信息的表格,然而那张表格只是 AI 的副产品,作为手段而非目的。过度专注于那张表的构建反而可能阻碍对更强的 AI 的研发。在未来的版本中,rating 连同详细信息的表格有可能会改版甚至移除。

脚注
1. --player-id <ID>
需要检讨的玩家的 ID,是一个 0-3 内的数字。这个数字就是天凤牌谱 URL 里 的 &tw= 后面的数字,即,东 1 局时的东家为 0,他的下家 为 1,对家为 2,上家为 3。这个选项比 URL 里的 &tw= 有 更高的优先级。
2. 模型间的对比详见 Mortal vs Mortal
3. --temperature <TEMP>
只针对 Mortal 引擎。变更温度将改变最终展示的数值,但不会影响输出顺序和 rating。详见 FAQ
4. --kyokus <LIST>
需要检讨的局。如果 LIST 是空的,那么就检讨所有的局。例如: E1,E4,S3.1,意为检讨东 1 局、东 4 局和南 3 局 1 本场。

例子

Play with you / 派遣个室

你可以召唤 1~3 个 Mortal 实例到指定的天凤个室里。它们会以 NoName 的名义参战,在大厅最多只会等 2 分钟。

可用数量:?

已选择数量: 1

牌谱

FAQ / 常见问题

点这里可以看有关 reviewer 本身的 FAQ。

检讨一张牌谱要多久?

对于 Mortal 引擎,一般 10 秒内。

对于 akochan 引擎,10 到 60 分钟,取决于游戏的长度以及工作队列的大小。

检讨报告会在服务器保存多久?

超过 15 天的检讨报告会被删除,有需要的话可以自行保存网页。

(Mortal) 给出的一些建议感觉非常怪,或者说有违常规。

尝试用那个更像人类的网络 ("3.0") 再跑一次,它相比其他网络通常能给出更温和或者说人类更容易理解的建议。

尽管很多时候体感上好像这个网络更强,但是统计数据比主观感受更加置信。若对实验及统计仍然存疑的话,欢迎帮忙 review 代码

有没有群?

没有。如有疑问欢迎到 GitHub 上对应 repo 的 discussion 处讨论。

About / 关于本站

Powered by

Equim-chan/Mortal Equim-chan/mjai-reviewer critter-mj/akochan

Developed and maintained by

Equim (Twitter, GitHub, 天鳳)

Frontend designed by

新篠ゆう (Twitter, YouTube)

Infrastructure sponsored by

EDWARDH (Twitter)

Since

2020-09-10 ("akochan.ekyu.moe" era)
2022-06-26 ("mjai.ekyu.moe" era)

Fork me on GitHub