「 はい、0目並んだぜ☆ 手番が来た方の勝ちだぜ☆ 先手必勝☆」
「 完全解析済みだな☆ 評価関数は要らないな☆
じゃあ次☆」
「 はい、0目並んだぜ☆ 手番が来た方の勝ちだぜ☆ 先手必勝☆」
「 ↑ 描くのがめんどくさいんで省くが、からっぽの無限空間の初手では すべてのマスの評価値は 微小量 だぜ☆」
「 すべての指し手の評価値の総和が 無限大 に向かっていってしまうから 指し手評価値はなんとでも言える☆ 不定☆
こっちを上げれば あっちを下げる、というバランスが取れない☆ 言い値☆
すべての指し手の評価値を総和したら 0 であってほしい☆」
「 ゼロ和でないと 何が困るんだぜ☆? 総和が100だったら何が不都合があるのかだぜ☆?」
「 無限空間で なんでもかんでも dx 付けられたら 話が進まないから、有限空間にしましょう!」
「 ↑ まず 0マス から☆
先手の置けるマスが無いぜ☆ 満局☆ 引き分けだぜ☆」
「 2目並べをしようというのに、2マス ないのは おかしいだろ☆」
「 ↑ 3マスで 端攻め をすると 相手は必ず 隣に付けてくるので 必ず引き分けだぜ☆」
「 ↑ 3マスで リャンメン(2面)待ちに置くと 相手がどちらの隣に置いても 先手必勝だぜ☆」
「 ↑ 先手には 常に 100% の手が見えているので、デターミニスティックだぜ☆」
「 この指し手評価値を 機械学習 するには どうやればいいんだぜ☆?」
「 ↑ とりあえず ゼロ和 の 乱数 を入れようぜ☆
できれば -0.0011、 -0.0002、 0.0013 のように 小さな数であるほど良い☆
乱数ではあるが、差はほとんどない、という意図だぜ☆
ここでは 筆算しやすいように 整数でやるぜ☆」
「 ↑ で、端は 必ず引き分けなのだった☆ 勝率は 0% だが、 敗率も 0% ☆
これを どう見るか☆」
「 ↑ リャンメン待ちは必勝だぜ☆ これを どう見るか☆?」
「 評価値が一番高い手を指すの? それとも 評価値はその指し手を選ぶ確率なの?」
「 好きなようにしろだぜ☆ 確率にするなら、もっと 点数配分を続けるべきだぜ☆」
「 ↑ 点数配分の動きは ずっと こうなっているから、 x に 100 でも入れてみようぜ☆?」
「 ゼロ和 をやってるから、プラスがあれば 必ず マイナスが出てくる☆ 正の数の確率とは相性が悪い☆
見方を変えれば……☆」
「 正の数は 勝つ度合い、 負の数は 負けるにしても 相手のミスで勝つのを目指す度合い だぜ☆」
「 ↑ 正と負に分けて、 選びたい確率、 選びたくない確率 に分けてはどうか☆?」
「 選びたくない確率を 選びたい確率 に変換するのは 大変そうだぜ……☆
上図では 2択だが、 これが 7択 になったりしたら☆」
「 選びたくないやつは、雑に底上げすればいいんじゃない? どん底値の 111 で底上げすればいいのよ」
「 だったら めんどくさいので 最初から どん底値で 底上げしようぜ☆?」
「 学習のことを考えると どん底値を常に 0% に確定していいのか疑問だが……☆
1度 0% になったら もうその手を選ばないだろ☆」
「 ↑ 投了は 勝率0%確定 なのだから、 投了も含めて 確率を出せばいいのよ」
「 引き分けも 投了も 同じ価値なんで、同じスピードで減っていくんで、差は付かないから、逆転もしないが……☆」
「 勝ちが一番多かったグループ、 引き分けが一番多かったグループ、 負けが一番多かったグループ に分けて
点数移動したらどう?」
「 ↑ まず すべての選択肢から 供託金1点ずつ を取るのよ。 これで 供託金は計4点よ」
「 ↑ 引き分けグループの中で、一番点数が低いところに 1点ずつ 恵むのよ」
「 勝ちも引き分けも多いグループと、 負けも引き分けも多いグループ もあるだろ☆ 均していいのか☆?」
「 勝ったら増やす、負けたら減らす、引き分けたら均す、引き分けが1人なら変わらず、なのよ」
「 ↑ Resign が えんえんと 減り続けないかだぜ☆?」
「 下限を100にするなり、定期的に とんがってるところを 縮めたらよくない?」
「 実数なら 供託金に提出する量を 0 に近づければいいが、整数だからな☆
供託金として 1 を出すか、 0 を出すか、 発火の閾値を見る関数を 間に挟めばどうか☆?」
-10, 440, -10, -100
90, 540, 90, 0
12.5%, 75%, 12.5%, 0%
「 ↑ 必勝がある場面でも、引き分けを選びやすくないかだぜ☆?」
「 評価関数を2つ作るしかなくない?
勝利確率関数と 引き分け確率関数よ」
「 勝ちが無い局面で、勝利確率関数は 0% に均されるだろうか☆?」
「 投了も含めて4択なら、投了の確率が 0% から 25% に上がるだろ☆
投了の確率が 0% でなくなったなら、勝ちが無い局面に思えたケースがあったということだぜ☆」
「 最初の差が 小さければ どこかで丸めれば いつか均されるだろうけど☆」
<書きかけ>
Crieitは個人で開発中です。
興味がある方は是非記事の投稿をお願いします! どんな軽い内容でも嬉しいです。
なぜCrieitを作ろうと思ったか
また、「こんな記事が読みたいけど見つからない!」という方は是非記事投稿リクエストボードへ!
こじんまりと作業ログやメモ、進捗を書き残しておきたい方はボード機能をご利用ください!