戦法名と起源主張って?
最近戦法の名称や起源について面白いやりとりがあったので、流れに乗っかってみる。
スタートはここから
今のうちに言っておきますが
— ユキ (@YukiN_shogi) 2017年8月6日
これについてですが
最近ソフト流とか宇佐見蓮子流とかいろんな名前ついてますけど
7一から6二に戻して組み替える形は
元々僕のものです pic.twitter.com/LL0j5oSvTr
それと
— ユキ (@YukiN_shogi) 2017年8月6日
4七銀4八玉2九飛車についてですが
これもソフト流とは無関係です
— ユキ (@YukiN_shogi) 2017年8月6日
どちらかといえば藤井システムの派生です
4七銀2九飛車は元々藤井システムやトマホークの一つであることと
— ユキ (@YukiN_shogi) 2017年8月6日
7一玉6二玉の組み換え、6三金5二金の構えが僕の物であるってだけなので
最近これが話題に上がった理由ですが
— ユキ (@YukiN_shogi) 2017年8月6日
おそらくelmo系列がこれを読むようになったことと
元から指されていた対策だが
銀冠穴熊自体が増えたため指される局数が増えたことが原因だと思います
ちなみにRenko-Usamiは僕のアカウントではないです
— ユキ (@YukiN_shogi) 2017年8月6日
ただあの指し方は僕が教えたものなので…
というか自分の考えたものがソフト扱いは悲しい…
— ユキ (@YukiN_shogi) 2017年8月6日
(Renko-Usamiは私のアカウントなのであの指し方は宇佐見蓮子流では)ないです pic.twitter.com/COcTbxFB7U
— 蓮老頭 (@renroutou) 2017年8月6日
まあツイートはこの辺を意識した感じでしょうか
www.fgfan7.com
【pona流銀冠穴熊対策】
— こいなぎ (@naginyan135) 2017年7月21日
これ流行りなのか pic.twitter.com/r4kffJIdq4
【pona流銀冠対策▲4八玉型への居飛車の駒組みの指針】
— こいなぎ (@naginyan135) 2017年7月22日
△5三銀△7四歩を急ぎ、△7五歩の仕掛けを見せて宇佐見蓮子の▲3九玉を誘ったところで△3二銀から銀冠を目指すのが正しい手順である。
それでも▲4八玉〜▲6八角には△6四歩〜△6五歩が間に合うので、6筋から仕掛けていく。 pic.twitter.com/QEbSYZbK2K
ツイートを貼り付けるだけで記事が長くなるので次に続く
将棋所と技巧改で遊びながら評価値を鑑賞する
jotcut-jshakki.hatenablog.com
この記事のメモに、探索深さを変えることで評価値に変化が出るのかという話がある。
こちらのアイデアについては、Mizarさんが探索深さ制限機能のある技巧というものを公開されており、今回はそちらを利用する。参考リンク:読みの深さを制限した技巧のレーティングby uuunuuun
方法としては、例の課題局面においてDepthを1から徐々に上げていき技巧の評価値の推移を見比べるというもの。Depthの低い段階では、8八角成と角を取れるが、それ以上先は読めないため、3000前後の評価値にはなかなかならないと予想した。
なお、技巧ではやねうら王のようなUSIコマンドによる現局面の評価値を出す方法がなかった(少なくとも私はわからなかった)ので、読み筋先の評価値のみ表示する。
結果
Depth1
8八角成以降がよめず、1300程しか有利ではないと計算した。
8八角成の局面で再度検討を行うと、成り込んだ馬が取り返されないためか、評価値は3000付近まで上昇している。(先手から見ているのでマイナスの値)
Depth2
深さ2以上になり、成り込んだ馬が相手の応手によって取り返されないことがわかったためか、評価値は3000付近まで上昇した。予想より早く3000代になってしまった。
Depth3以降は以下の通り
Depth3
Depth4
Depth5
今回は技巧Depth1とDepth2の評価値を見比べることで、将棋ソフトで提示される評価値が読み筋の先にある局面の評価関数での計算結果であると、間接的に説明できた。
まだ調べてないのでわからないが、やねうら王で深さ制限をかけられる場合(やねうら王miniで遊ぼうシリーズにあった気がする)、同様に低Depthでの評価値と、evalによる値を見比べて見たいと思う。
以上
やねうら王と将棋所で遊びながら評価値を鑑賞する
前回の将棋所で遊んだ際に残したメモである、評価関数を入れ替えることによる評価値の変化を観察してみる。
jotcut-jshakki.hatenablog.com
最も、課題局面は前回と同じであり大差のついた局面なので、評価関数違いが目に見えるかは不安なところである。
やねうら王、Apery系列は、評価関数に互換性があるため、Aperyチルドレン、やねうら王チルドレンの評価関数は入れ替えて使うことができる。
今回は、やねうらお氏の公開している28種の評価関数の181_0020Gと500_0000M、第4回将棋電王トーナメントでやねうらチルドレン最強と評された読み太の評価関数、第27回世界コンピュータ将棋選手権で優勝したやねうらチルドレンのelmoの評価関数を用い、前回の課題局面での評価値を見比べてみる。
将棋所の設定は次の通り
評価関数:500_0000M
課題局面では8八角成からの展開で3200有利と表示し、読み筋先でのEval値は2880であった。
また、課題局面自体の評価は0と計算している。これは500_0000Mが駒得のみの計算基準に基づいているからだと考えられる。
評価関数:181_0020G
課題局面では8八角成からの展開で3074有利と表示し、読み筋先でのEval値は-3006であった。
また、課題局面自体の評価は-58と計算している。
評価関数:読み太_SDT4
課題局面では8八角成からの展開で2967有利と表示し、読み筋先でのEval値は2686であった。
また、課題局面自体の評価は48と計算している。
評価関数:elmo_wcsc27
課題局面では8八角成からの展開で3627有利と表示し、読み筋先でのEval値は-3265であった。
また、課題局面自体の評価は154と計算している。
500_0000Mに比べて、他の評価関数は読み筋先での局面の評価値との差が少ない気がする。
気が向いたらそれぞれの評価関数の設計思想とこれらの値を照らし合わせてみようと思う。
閑話
elmoの第27回世界コンピュータ将棋選手権での優勝おめでとうございます。正直Ponanza Chainerを二度も打ち破るとは思いませんでした。見立てが甘かったです。
旅の記録ー書籍編(未完成?)
ひとまず評価値と探索の関連について、参考になった書籍を羅列するだけです。
人工知能はいかにして強くなるのか? 対戦型AIで学ぶ基本のしくみ (ブルーバックス)
- 作者: 小野田博一
- 出版社/メーカー: 講談社
- 発売日: 2017/01/18
- メディア: 新書
- この商品を含むブログを見る
- 作者: 松原仁
- 出版社/メーカー: 共立出版
- 発売日: 2005/12
- メディア: 単行本
- クリック: 10回
- この商品を含むブログ (6件) を見る
- 作者: 松原仁
- 出版社/メーカー: 共立出版
- 発売日: 2012/05/09
- メディア: 単行本
- 購入: 1人 クリック: 10回
- この商品を含むブログ (11件) を見る
- 作者: 松原仁
- 出版社/メーカー: 共立出版
- 発売日: 1994/07
- メディア: 単行本
- クリック: 2回
- この商品を含むブログを見る
Java将棋のアルゴリズム―アルゴリズムの強化手法を探る (I・O BOOKS)
- 作者: 池泰弘
- 出版社/メーカー: 工学社
- 発売日: 2007/04/25
- メディア: 単行本
- 購入: 9人 クリック: 18回
- この商品を含むブログ (9件) を見る
いやぁ、今年のコンピュータ将棋選手権も面白い展開ですね、正直言って去年二次予選に進めなかったelmo(monkeymagic)がPonanzaを、大合神クジラちゃんが技巧を倒すとは思っていませんでした、すみません。
決勝リーグではPonanza Chainerがelmoにリベンジを果たすも、クジラちゃんに負け、混戦の末にPonanza三連覇とかになると根拠なしの予想をしておきます。(執筆2017/05/04時点では二次予選まで終了)
旅の記録ー実験(将棋所編)
前回の記事では、将棋ウォーズの棋神(2016Ponanza)による解析の評価値から千田先生の解説を噛み砕いていった。
今回は将棋プログラムのやねうら王(Yaneuraou-2017early)を使った実験で、先の説明を補完していった結果を示す。(正直最初にこれに気づいてれば回り道しなくてよかったかも)
やねうら王には将棋所で使えるUSI拡張コマンドが多数用意されており、その中に'eval'というコマンドが存在する。このコマンドはその時点の局面に対しる評価関数での計算結果を表示するというものである。
▲7六歩△8四歩▲6八銀の局面に対し、このコマンドを使用し、その局面での評価値と指しての先の評価値を比較してみる。
実験結果
まずは▲6八銀まで進めた状態。この時点でやねうら王は、およそ700~800万局面を読み、3106という評価値をつけている。(赤枠参照) これまでの説明をもとにすると、この値は隣にある読み筋の△8八角成▲7九金△9九馬▲7七銀…という応酬の果てにある局面を示していることになる。
次に、この局面でevalコマンドを送った状態。-87という値が返されており(赤枠参照) 、この局面だけ見るのならば評価は-87ということがわかった。
最後に、先程の評価値3106の読み筋通りに進めた局面を示す。evalでの値は2796となっており、まあまあ近い値を示すことがわかった。
今回の実験では、やねうら王の拡張コマンドを用いることで、将棋プログラムが示す評価値が、その局面の評価値ではないということが明らかになった。
ただ、本実験でも、読み筋の先の局面の評価値が2796で、初期の3106と比較して400程度離れていることが気になった、
今後の予定としては、探索を制限させる、評価関数を変えてみるなどして、様々な局面(6八銀の局面/その他序盤/こまのぶつかりあった中盤/最終盤、盤上この一手や劇的逆転の局面など)でいろいろ試行錯誤したいところである。
以上
メモ:
値自体は静的評価値
読みと異なる手をさした場合、大幅に値が変動するが、序盤など選択肢が広い場合は、プログラムが探索してない局面に移行しても評価が大きく変動しない?
旅の記録ー人体実験(将棋ウォーズ編)
当時、千田先生の解説を読んでもいまいちわかったようなわからないような気分の私は、
実際に試して見たほうが早いと考え、幾つかの評価値の出る媒体で実験してみることにした。
今回は将棋ウォーズでの結果
方法は、▲7六歩△3四歩▲6八銀!と指し、その対局を棋神(2016Ponanza)グラフ解析と1手解析で解析するというもの
実際結果
解析による3手目の評価値、左は一局をグラフ解析した後3手目を表示した状態、右は3手目の局面から次の一手を1手解析して得られた結果となる。
左図での評価値2708は、4手目以降の8八角成となる展開を予想して算出された値だと予想できる。一方右図の1手解析では、Ponanzaは発狂でもしたのか、8八角成を読まずに、△6二銀と自陣に手をいれる手を読んでいる。その後は▲7七角△7四歩▲2六歩△7七角成▲同銀△2二銀▲6八銀△2五歩▲7三銀△2四歩と進み、この局面に進めば互角の30になると評価を下している。
実戦では△3五歩と進んだ、この場合、後手としては必勝手順である8八角成を逃し、先手側に8八角成を回避する猶予を与えてしまったため、グラフ解析による評価値は先程の2708から86にまで減少している。またこの局面の1手解析では、▲7八金で角を保護し、以下△8八角成▲同金△3二金▲7八金△4二飛▲6六歩△6二玉▲6七銀△4四歩と進み、この局面に進めば63になると計算している。
この場合は、グラフ解析における評価値と1手解析で示された手順での評価値が近いため、グラフ解析での評価値は1手解析の手順と近いものを探索し86という値を表示したのだと思われる。
実戦では次に5六歩と指し、再度8八角成を誘導した。その際の評価は下のようになった。
今度も1手前の局面同様、グラフ解析と1手解析での評価値が近い値を示しており、グラフ解析での評価値2583は1手解析での手順と近い手順を辿り計算されると想像できる。
なお、1手解析では△8八角成▲7七桂△9九馬▲7八金△8九馬▲5七銀△3二飛▲6八玉△6二玉▲2六歩の手順で2708となっている
実戦では今度こそ8八角成とされ、当然負け。
以上
旅の記録ーその他参考になったツイート
動画非公開の頃に、Twitterで調べたら、参考になる様々なツイートを見つけることもありました。
指す将の三岸さんによる説明
@kiiro_ki 現局面で評価値を出したら、そこから分岐しうる局面達の評価値を出してみて、評価値の高かった局面を最善の局面(=読み筋)として読み進めます。何手先まで読むかは設定次第ですが、最終的に表示される評価値は、読み筋の先にある局面の駒の位置関係とかを評価した値になります
— 三岸 健@指す将順位戦B5 (@migishiken81) 2017年2月10日
@kiiro_ki 現局面で評価値を出したら、そこから分岐しうる局面達の評価値を出してみて、評価値の高かった局面を最善の局面(=読み筋)として読み進めます。何手先まで読むかは設定次第ですが、最終的に表示される評価値は、読み筋の先にある局面の駒の位置関係とかを評価した値になります
— 三岸 健@指す将順位戦B5 (@migishiken81) 2017年2月10日
@kiiro_ki ソフトが読めていなかった手を人が指して、その手の良さにソフトが気づくと数値がバーンと上がる事はありますね。そういえば昨日スマホの将棋ソフトで検討してたら、詰みがあるのに3700点とか言ってました。一手指したら気づいてたけど。 pic.twitter.com/xtGSpM3EHA
— 三岸 健@指す将順位戦B5 (@migishiken81) 2017年2月10日
@kiiro_ki 無論スペックの高いPCを使えばこんな事は減るんですが、原理的には同じなのでどんなソフトでも読み抜けは発生します。
— 三岸 健@指す将順位戦B5 (@migishiken81) 2017年2月10日
アユムさんは実況で有名で、マイナー戦法とかで動画検索するとよく見る気がしますね
個人的メモ
— 元奨励会員アユムの将棋実況 (@ZpikT1) 2017年1月30日
棋譜並べにフリーソフト使う時の注意点
・序盤の評価値は無視(本の言うことや自分の感性を信じた方がいい)
・入玉含みの時の評価値は無視
・長手数の詰みや必至がありそうな時は、少し局面を進めてから読ませる(結構長手数の詰みは見落としがち)
最後から二番目のツイートに評価値関連の記述
で、最善手を指し続けるうちに相手がどこかで間違えたらそれを正確に咎めればその時ようやく勝つ事ができる。お互いにイーブンの条件で始める勝負なら「自分が良い手を指して勝つ」ってのは原理的にあり得ないんですよ。できる事は「負けないように最善手を指す」即ち「最善手=負けない手」なのです。
— 彫木・環(安倍首相ガンバレby塚本園児) (@CordwainersCat) 2014年12月19日
これ、「将棋に必勝法はあるのか」とかコンピュータ将棋の作り方とか考えたり調べたりして出た結論なんですけどねw
— 彫木・環(安倍首相ガンバレby塚本園児) (@CordwainersCat) 2014年12月19日
人間の棋士も基本的にはそうしてるわけです。だから「最善手」とはどちらかが一方的に良くなる手では無く、ほぼ「双方にとってベスト」な手、つまり負けない手になるわけです。あ、そう言う読み方をするから、多少評価関数が不正確でも深く読むとそれなりに強くなるのか。間違いを打ち消し合いそうだ。
— 彫木・環(安倍首相ガンバレby塚本園児) (@CordwainersCat) 2014年12月19日
盤デレ感想関連で参考になったもの
盤外のシンデレラ 『5四銀の見つけ方』 ~ソフトを用いた局面検討~ (19:55) https://t.co/mRnSlBMKAF #sm28458281
— さばかん (@sa_ba_ka_n) 2016年3月20日
ソフト検討に関する。留意点とか注意点とか、そもそもソフトの評価値を鵜呑みにしない為のエトセトラ
盤外のシンデレラ 『5四銀の見つけ方』 ~ソフトを用いた局面検討~ (19:55) https://t.co/1DfAfcSQJK #sm28458281
— SIM(シム)@予定調和 (@sim3simo3) 2016年4月2日
人間の補助を加えるとより、精度が増すって事はわかったですw
盤上のシンデレラの7話見た.あれはニコ生の将棋放送で評価値が大きく揺れ動くのを見て狂乱してる観る将はぜひ見るべきだな.自分で将棋指して自分の棋譜をソフトに検討させてる人なら常識なんだろうけど,観てるだけの人にはちゃんと説明しないとね.
— アーシェ@指す将順位戦B3 (@Ashe_is) 2015年12月20日
盤デレラ(番外編)新作きた。
— とーちか (@touchica) 2016年3月19日
ソフト検討初心者にオススメです。
とても分かりやすくまとまってます!
盤外のシンデレラ 『5四銀の見つけ方』 ~ソフトを用いた局面検討~ (00:19:55) #sm28458281 https://t.co/3YgkWH6Iod
『同一局面深く読ませるより数手自分で動かした方が速く正確な検討になりやすい』
— とーちか (@touchica) 2016年3月19日
はとても共感出来る
ちなみに最後のfloodgateでのApery系統のソフトの見分け方は
Apery(系統と分かったソフト)との対局で評価値推移がほぼ一致するかで大体分かると思うけどどうなのかな?
以上