読者です 読者をやめる 読者になる 読者になる

1.2くらいから考える将棋ブログ

わかった気になるも、よくわからないことを考えていく?

旅の記録ー参考となった記事

ひとまずごちゃ混ぜで公開、あとで再編集するかも

 

正直この記事の説明がすごくわかりやすいです

ritomath-shogi.hatenablog.com

 

評価値とは探索の代用であるとの説明

aleag.cocolog-nifty.com

 

yaneuraou.yaneu.com

 

再探索によって評価が変わる例

yaneuraou.yaneu.com

 

評価値の値は何の基準なのかという話

lfics81.techblog.jp

評価値という数値 2:勝率と酔歩模型 : コンピュータ将棋基礎情報研究所

ミニマックス法とは何か? 1:コンピュータ将棋の基本戦略 : コンピュータ将棋基礎情報研究所

ミニマックス法とは何か? 2:アルファベータ枝刈り : コンピュータ将棋基礎情報研究所

 

 

盤デレのブロマガ内で評価値について触れた記事

ch.nicovideo.jp

その他面白かった記事

sitest.jp

 

  

以上

旅の記録ー千田先生の解説

動画が非公開の頃、なんとか動画の内容を思い出そうといろいろ調べていた中でいくつかの解説に当たることができた。

 

千田翔太六段(2017/05/01執筆時点)はコンピュータ将棋の力を棋力に反映させようと様々な努力を重ねている若手有望の棋士で、ブログやTwitterで様々な研究成果が公開されている(雑な説明なので、詳しくはググって)。

 

評価値についてはこちらですでに解説されていた。(Q2を参照)

blog.livedoor.jp

 

一応引用

Q2.なんでソフトは評価値が大きく変わるのか?(ニコ生での評価値)
A.局面がソフトの読み筋と異なる方向に進んでいるから。読み筋と同じ手の進行で変動しているなら、時間が少なく読みが浅い、または信用ならないか。
(例)初手▲76歩に△34歩と突いた局面。このときに読み筋が▲26歩で評価値が+100出ていたとする。
その局面で対局者が▲68銀と指す。すると、読み筋が△88角成で評価値‐1000に変わる。(角得)
これは局面が進んでいるのだから当たり前のこと。
なお、最終盤ほど一手のミスが命取りになるため、(勝ち→負けに変わるため)読み筋よりと異なる手や悪手が出た場合、+2500→‐800のように大きく変動しやすい。

 

つまるところこのシリーズもN番煎じであり、理解力のある方はこの説明の時点で評価値についてわかるようなことであった

 

以上

旅の記録ー動画内での解説

現在将棋ソフトで目にする評価値については、盤デレ7話で説明がなされている。

現状の将棋ソフトが提示する評価値は、その時点の局面を評価関数で計算したものではなく

その局面から将棋ソフトがお互いの応手を探索した先にある局面を、評価関数で計算した値である。

f:id:jotcutJshakki:20170501014256p:plain

 

評価値の反転現象については盤外で説明されている。

反転以前の局面では探索されなかったマイナスの局面が、対局が進行したあとの再探索では見つかり、評価を修正したことで評価値が変動する。

f:id:jotcutJshakki:20170501020130p:plain

 

以上

評価値の意味を考える旅ーほぼ完結

もともとこのテーマで書こうと思ったきっかけとしては、前述の記事にある動画が非公開となってしまったため、動画の感想など残された情報などから評価値の意味を復習していく予定であった。

 

jotcut-jshakki.hatenablog.com

 

その後情報収集をするもブログ更新をほったらかしていたのだが、3月中旬頃幸運なことにその動画シリーズは再公開された。

infinoteさんのファンアートへの感謝の言葉:四駒関係(KKPP)のブロマガ - ブロマガ

そのため、評価値が何を示しているかについてはKKPPさんの動画を見たほうが早いと思うので、評価値関連の記述がある2つの動画を貼ってこの旅は終わりとし、以降は忘備録も兼ねて収集した情報を書きなぐっておこうとおもう。

 

評価値の意味を考える旅

きっかけはこちらの動画

いわゆる盤デレシリーズの作者が番外編として制作したこの作品は、ニコ動等で見られる評価値に対する意味の取り方を示していた。

しかしこのシリーズは昨年秋に突如として非公開となってしまう。