TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼
羽生善治応援スレ264
[激震!] 依田九段 対局停止6カ月 Twitter執行部批判
将棋ウォーズ 不成厨を晒すスレ
杉本晶隆
24五段を目指すスレ
☆★名人戦中止で渡辺挑戦権剥奪へ★★
佐々木大地応援スレ 3
第90期ヒューリック杯棋聖戦 Part3
第4期叡王戦 Part19
第60期王位戦 Part27
▲コンピュータ将棋スレッド141
- 1 :2018/08/08 〜 最終レス :2018/08/18
- !extend:checked:vvvvv:1000:512
↑スレ立て時は1行目と2行目に「!extend:checked:vvvvv:1000:512」をコピペして立てて下さい
荒らし対策のために強制コテハン(ワッチョイ)を表示するコマンドです
第28回世界コンピュータ将棋選手権 参加チーム
https://www.apply.computer-shogi.org/wcsc28/team.html
詰将棋メモ コンピュータ将棋2018
http://toybox.tea-nifty.com/memo/2018/01/post-0205.html
世界コンピュータ将棋選手権参加ソフトリンク集
http://www.ne.jp/asahi/tetsu/toybox/soft/softlink.htm
floodgate 最新2週間レーティング
http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html
コンピュータ将棋協会
http://www.computer-shogi.org/
コンピュータ将棋
http://ja.wikipedia.org/wiki/%E3%82%B3%E3%83%B3%E3%83%94%E3%83%A5%E3%83%BC%E3%82%BF%E5%B0%86%E6%A3%8B
将棋フリーソフト rating on single machines(各ソフトのレーティング評価)
http://www.uuunuuun.com/
※前スレ
▲コンピュータ将棋スレッド140
http://mevius.2ch.sc/test/read.cgi/bgame/1530439639/
VIPQ2_EXTDAT: checked:vvvvv:1000:512:----: EXT was configured
- 2 :
- 948 名前:名無し名人 (ワッチョイ cf9f-10BI)[sage] 投稿日:2018/08/06(月) 23:43:43.82 ID:6HN23Pbb0
NNUEkai4をアップロードします
https://www.axfc.net/u/3927181
今回は、前回の反省を踏まえ、対illqha1.1に対して、1500万ノード、投了値3000、引き分け256手の設定で1500局対局しました
https://i.imgur.com/MlE6VFf.jpg
https://i.imgur.com/CkaNqbL.jpg
勝率は53.5%とほとんど強くなっておらず、透。さんなどと比べると残念な結果ですが、
有意確率0.2なので流石に有意差はあるのではないかと思ってます
上記評価関数には500局分の棋譜も添付しました
お暇な方はまた遊んでください
- 3 :
- 透。さんがブログ更新
- 4 :
- >>2
私の1050回の対戦結果では対illqha1.1に対して負けてしまいました。
https://i.imgur.com/I5SXcwZ.png
1028局 545勝 483敗
勝率: 0.5301556420233463
標準誤差: 0.015577552550149339
95% 信頼区間 [0.5, 0.5603112840466926]
相対イロレーティング: 20.97974861005213
標準誤差: 10.863909119450144
95% 信頼区間 [0, 42.11361944473197]
対局は双方1秒設定
https://i.imgur.com/rAsCwGo.png
エンジン設定はillqhaの作者が作成したdolphin版です。
https://i.imgur.com/5BC2RQs.png
illqhaはGW3に設定しています。
https://i.imgur.com/CWp2a8v.png
https://i.imgur.com/DTXjeFp.png
- 5 :
- >>4
細かいことを言うようだが、kai4が公開されたのが月曜日の23:30で、あなたの結果公開が水曜日の7:00なので、公開から113400秒しか経過してないことになる
113400/1050=108となり、平均108手で決着が付いていることになるが、最近のコンピュータ将棋でそんなに早い決着は稀だと思うのだけど…
- 6 :
- >>5
ノード数が超少なければ決着もそれなりに早くなる
- 7 :
- 投了値が1000とかなんじゃね?
- 8 :
- いやいや、そもそも公開と同時にダウンロードなんてありえん
捏造の可能性あるで
- 9 :
- >>4 の人みたいに一手ノード数3万とNNUEkaiの人の1500万ノードじゃ逆の結果になっても別に不思議ではない
ノード数が300万違うと勝率は大分変動する
- 10 :
- なんで一台で一局設定だも思ってるの
- 11 :
- だと思ってるの?
- 12 :
- >>11
一枚目の画像で分かるだろ
- 13 :
- 人はなぜNetworkDelayやMinumumThinkingTimeをそのままで1秒設定するのだろうか
- 14 :
- 開発者向けのビルドは全部0秒デフォルトにすればいいのにね
- 15 :
- kai4とillqhaを500局程テスト対局させて見ました
一手1秒なのでノード数が多少低いですが参考まで
kai4+dolphinとillqha1.1+dolphin
202-73-225(ノード5〜600万)
kai4+やね4.82とillqha1.1+dolphin
187-58-255 (ノード4〜500万)
- 16 :
- >>13
なるほど、それだ。1秒対局の謎が解けた
- 17 :
- イマイチだな〜
- 18 :
- kai4は長時間で実力を発揮するのか?
- 19 :
- 1分は考えさせたいな
- 20 :
- 初手のノード数が1500万からのロタ氏計測ではillqha1.1-dolphinはQQR-GW5.0.5に勝率52%と
あまり勝てないが、初手のノード数が1800万からの自分や他の人(前スレ他で3人いた)の計測によると
勝率65%程度だったので、数万ノードと1500万ノードの計測だと逆の結果になっても全然ふしぎではないよ
- 21 :
- uuunさんや透。さんも言ってるけど、NNUEはノード数でころころ勝率かわるみたいね
- 22 :
- uuunuuunさんが前にツイートしてたけどスレッド数でも結構変わるっぽいよね
- 23 :
- オープンソースのソフトの商用化は成功するのか?
http://yaneuraou.yaneu.com/2018/08/07/%E3%82%AA%E3%83%BC%E3%83%97%E3%83%B3%E3%82%BD%E3%83%BC%E3%82%B9%E3%81%AE%E3%82%BD%E3%83%95%E3%83%88%E3%81%AE%E5%95%86%E7%94%A8%E5%8C%96%E3%81%AF%E6%88%90%E5%8A%9F%E3%81%99%E3%82%8B%E3%81%AE%E3%81%8B/
- 24 :
- mtmt
@mtmtlife
やねうら王1秒指しにボコボコにされる。
- 25 :
- >>18
NNUEどうしの対戦なのでillqha1.1も同様に強くなる
その上kai4はi7-8700Kで5分持ち秒読み1手10秒で
GW5.0.5-QQR相手に5割位だがillqha1.1はQQRに6割
以上の戦績を残している
- 26 :
- 持ち時間12時間対決、時間かかりすぎ!
結果も、統計的に何も言えん!
10試合まであと3試合くらいかな、
面白棋譜ができて楽しんでくれると良いな。
お酒飲んでるからテンション高いんです〜〜〜〜〜
じゃあ、10試合終わったらまたよろしくね。
- 27 :
- >>4は最たるもんだが、新参の諸君
NetworkDelayの1と2は間違いなく0にするのだ
特にNetworkDelay2のデフォルトは1120で1秒以上となっているので
1秒設定で対局をさせようとしても究極の早指しになってしまうだけだぞ!
- 28 :
- 以前elmoの瀧澤さんがやねうら王の推奨設定例を紹介されてたよ
https://mk-takizawa.github.io/elmo/howtouse_elmo.html
- 29 :
- ライブラリ非使用者の優遇を検討されててライブラリ非使用者を少しでも救済したいっていう意図は分かるのだけど、
ライブラリ使用/非使用の判断って結局本人による申告で判断する事になるのだろうか?
それって結局開発者の性善説に基づいてるからそれはそれで賛否両論ありそうな。
そしてどこまでがライブラリ使用/非使用の境界となるのか。
ソース流用はライブラリ使用になりそうだけど、文献参照とかソースコードを見て真似たとかは
ライブラリ使用の範囲になるのか否か。
結局そういうのって明確な線引き自体が難しいように思えてならないな
- 30 :
- >>29
猿真似批判?
- 31 :
- MyShogiビルドしてみた。当然リソースもエンジンも無いので触りだけ
起動すると画面いっぱいに真っ黒な画面、赤いバツ印。ああ…リソースがないんだなと。少し寂しい気持ちになる。
しかしめげずに通常対局を選んでみる。対局条件を設定していざ対局!…またもや災難、『例外が発生しました』の文字。
なんてことだ…だが俺は負けない。次は検討モード…GUIソフトなら必ずチェックしたい所。『例外が発生しました…』
そうか。MyShogiがしっかりしてると将棋神やねうら王が売れないんだ。俺はようやくやねさんの意図に気付く。
8月31日の発売日まであと22日、スレは大いに盛り上がるだろう、更に発売後のアップデートも用意している筈。
その売上をしっかり確保するためには後2ヶ月ぐらいは必要ということ。つまりそれまでずっと黒い画面のままなのだろう。
- 32 :
- 意図も何もエンジン用意しなきゃそりゃ落ちるでしょ
- 33 :
- MyShogiの素材だけでも先にアップしてくれと
やねさんにお願いしてみては?
- 34 :
- 探索深さやノート数を固定する場合、
メモリの多少は強さに影響しますか?
- 35 :
- ロタ氏がノード数を変えて計測されていたが(以下がその計測結果)、このスレでも200万ノード以下で計測した結果の
書き込みをよく見かけるけど、結果を見ると低ノード数の計測はあてにならないのが分かる
以下 illqha1.1_dolphin vs QQR GW5.0.5による計測
一手0.1秒(18T) 150-200万ノード 総試合数500 245-17-238, 勝率50.70%, R+4.86
一手2秒(18T) 3000-4000万ノード 総試合数312 179- 7 -126, 勝率58.49%, R+59.60
- 36 :
- 30億から40億ノードでやったらまた変わるかもしれないじゃないか
きりがないけど
- 37 :
- NNUEkai4を試していただいている方、ありがとうございます
現在はkai5に向けて試行中です
評価関数はおそらく徐々に強くなっており、対QQRにR+100も夢ではないかもしれません
https://i.imgur.com/rWuaLkM.jpg
1手1秒(1500万ノード〜2000万ノード)、256手引き分け、投了値3000で対局しています
https://www.axfc.net/u/3927830
↑棋譜ファイルです
- 38 :
- >>36
じゃあ200万ノード以下で計測したらいいじゃん、その代わり計測結果をこのスレに書き込んでも誰もあてにしないけど
それから一手40億ノードとかキリがない話をしても意味ないんじゃないの、3000-4000万ノードだと普段使うことも多いので
そっちの話よりよっぽど現実的な話じゃん
- 39 :
- >>38
当てにならないとかいうから
じゃあ1000万のオーダーなら当てになるのかという反論やろ
お分かり?
- 40 :
- 測定時のノード数は難しい 物ですが測定サイトの1500万は一般的なPCの能力を考えると現時点ではよい感じと思いますね
で、先にも書き込ましたが1手約5〜600マンノードで対局させたkai4とillqha1.1を約2500〜3000万ノードで対局させています
途中経過はkai4から見て
43(47%)-14‐47(52%)
です。先の対局は
202(47%)-73-225(52%)
で対GW-QQRも少しやってみたのですが、kai4から見て
204(66%)-22-104(33%) ノード数5〜600万
246(51%)-26-228(48%) ノード数2〜300万
すべて定跡はオフです
対GW-QQRあたりの結果を見るとノード数の影響はある感じはします
- 41 :
- MyShogiのメニュー一覧
サルでも使えるほどシンプルではない
https://i.imgur.com/piBavNn.png
- 42 :
- >>37
期待して待ってます
でもillqha1.1も環境によってはQQR相手に勝率65%近く出るみたい
illqhaの人も今週中に新しいの投下するらしい
楽しみぃ〜
- 43 :
- >>30
ちげーよ。次のコンピュータ将棋選手権に向けての話だ
- 44 :
- >>23
>おまけに、今回の『将棋神やねうら王』では、GUIすらもオープンソース化しています。
やねうら王のソースコードってApery、技巧、読み太その他多数の強豪ソフトと違って
トップ部分にstockfish系列のGPL宣言からstockfish不使用だと思っていたんだけど、
商用化するためにはGUIのソースコードも公開しなければいけないのかな
- 45 :
- >>44
http://yaneuraou.yaneu.com/2018/06/15/pc%e5%b0%86%e6%a3%8b%e3%82%bd%e3%83%95%e3%83%88%e3%80%8c%e5%b0%86%e6%a3%8b%e7%a5%9e-%e3%82%84%e3%81%ad%e3%81%86%e3%82%89%e7%8e%8b%e3%80%8d%e3%81%ab%e9%96%a2%e3%81%97%e3%81%a6%e3%81%8a%e7%ad%94/
> Q) 売れると思わないのに、なぜ、商用版を出そうと思ったのですが?
> A) 私はかねてよりオープンソースの将棋用のGUIを作りたかったのですが、良いデザイナーさんに恵まれませんでした。
> 激指を販売しているマイナビさんなら、腕のいいデザイナーを擁しているはずですから、マイナビさんから発売するということで、そのへんご協力いただけるのではないかと考えたからです。
> また、棋譜読み上げの素材等についても同様です。
- 46 :
- ローソンLINEの将棋強いな
なんやあれ
- 47 :
- >>45
なるほど、さすがやねさんだ
どうもありがとう
- 48 :
- >>41
てんこ盛りになって面倒なパターンだな
シンプルモードとマニアモードみたいにメニューバー切り替えさせないと情弱は飽きてしまいそう
- 49 :
- ところでsuimonさんが質問を投稿したこの方も開発者の方ですか?
2年間粘着がどうとか
suimon@floodgate_fan
https://youtu.be/Kcy3ziIZH7s
- 50 :
- ローソンあきこはponaやな
調整してあるらしいが基本的に勝たせる気ない
- 51 :
- >>46
最新版のポナンザだからそりゃ強い
- 52 :
- illqhaに勝てるの?
- 53 :
- >>51
マジかよ道理で勝てんわけだ
- 54 :
- 24で5段あれば普通に勝てるよ
- 55 :
- 最新ソフトが0.1秒で九段相当というやねうら氏の発言が正しいかどうか調べてみた。
NNUE kai4- whale6をノード315000に固定し、相手は技巧2depth13
結果
NNUE kai4の65勝32敗3分
ちなみにの技巧2depth13の24推定レートは3479らしいのでレーティングでは九段相当はありそう。
- 56 :
- 【悲報】ニコニコプレミアム会員の減少が止まらない… [455679766]
https://leia.2ch.sc/test/read.cgi/poverty/1533811452/
- 57 :
- そりゃ今年の電王トーナメントの開催も危ぶまれるわけだ^^;
- 58 :
- 日本将棋連盟は棋士の先生方が将棋ソフトを利用して棋力向上に役立って恩恵を受けているはすなので、
恐らく資金問題で開催が危ぶまれるドワンゴがSDT開催できるように資金をもっと援助してあげてほしい
- 59 :
- TCEC 13は4部リーグ全28回戦が終了して、優勝が14勝2敗12分のLeelaChessZero、
2位が13勝4敗11分のDeusXで、NN勢2エンジンが3部昇格
ただ、3位のWaspも11勝3敗14分で2位とは0.5点差と、そこまで差はなかった。
- 60 :
- >>54
激指14と対戦させたが普通に激指が負けた
24の5段レベルじゃないわ
- 61 :
- 持ち時間12時間対決を
10試合行ったよ。
面白い棋譜かどうかも良く分からないし、多分もうやんないと思う。
興味があったらダウンロードしてみてね。
https://www.axfc.net/u/3928210
- 62 :
- >>60
腐っても鯛というからaperypaqぐらいの強さはあるだろう
- 63 :
- >>58
藤井七段他多くの棋士がソフトで対局して棋力向上に役立てている
棋士より強いソフトの登場で、棋士の出番がなくなったのも事実
将棋連盟の棋士先生に聞くよりも、ポケットに入っているスマホに聞いたほうが優れた答えが出るようになったw
連盟の棋士先生がやるとしたら解説になる
解説をして貫禄があることを示す
- 64 :
- 答えは出るけど解説はないからね
- 65 :
- >>56
スマホを使用して棋士とエンジンが組んでペア対局を
実施してネット中継したら視聴者が増えると思う
棋士が好みのエンジンを選択できるようにしたら
フリーの強豪エンジンが注目されるかも
プロ棋士は自尊心が高いからどれだけエンジンの
推奨する手を採用するか興味深い
- 66 :
- illqha2公開きた
- 67 :
- uuunさんのレート測定待ちだわ
- 68 :
- *2016-10-11_新人王戦決勝第2局 増田康宏_四段_vs_石田直裕_四段
*例の「ソフトの詰め課題局面」をillqha2でテスト
後手の持駒:角 金 銀 歩
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香 ・ ・ ・ ・ ・ ・ ・ 杏|一
| ・v玉v金 ・ ・ ・ ・ ・ ・|二
| ・v銀v桂 馬 ・v歩 とv歩 ・|三
|v歩v歩v歩v歩v歩 ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・ ・ 歩 ・|五
| 歩 歩 歩 歩 ・ ・ ・v龍 ・|六
| ・ 銀 桂 ・ ・ 玉 ・ ・ ・|七
| ・ ・ ・ ・ 歩 ・ ・ ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ ・|九
+---------------------------+
先手の持駒:飛 金二 銀 桂二 香 歩三
先手:増田康宏 四段
後手:石田直裕 四段
手数=104 △2六飛成 まで
低スペック(32ビット、4ギガ、1スレ)PCで
YaneuraOu-NNUE_V482+illqha2で検討。
2分ちょいでmate33!!
詰みを読みました!
感動!
*illqha1.1では10分でも詰まなかった
illqha2ありがとうございました。
- 69 :
- >『dolphin+illqha1.1』より少しだけ強くできたかなと思います。(超短時間ではillqha1.1に対して勝率56%、短時間では勝率54%程度でした、それ以上の時間でもおそらく負け越すことはないと推測します)
>基本的に短時間での計測しかしていないので中〜長時間での強さは謎です。
>対局における各評価関数との相性問題なども謎です。(少しのノード数の差で相性がころころ変わるようなので、あまり神経質に計測しても結局よくわからないということで気にしすぎない方向でいきます)
>Ryzen7 1700のPC1台(と少しだけ低スペノートPC)で作業しているので中々強くなりませんが、ちょっとずつ強くするので気長にお待ち下さい。
- 70 :
- おまけ4の公開早よ
- 71 :
- 振り飛車側がミレニアム囲いで居飛穴に勝利.こんなん前例ある?
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2018/08/10/wdoor+floodgate-300-10F+illqha1.1-ryzen+BURR+20180810193002.csa/50
- 72 :
- めきっと@鵺日々成長中@_illqha
https://drive.google.com/file/d/18lWusgxNdG1vXbY6GzXRHhA41pZovOtM/view
dolphin2+illqha2を公開します。
少ししか強くなっていないと思いますが、そこは許して頂けると幸いです。
今回は計測作業の一部を「ぷよ太郎@yorikone」さんに手伝って頂けました。ありがとうございます。
めきっと@鵺日々成長中@_illqha
透。さんのシリーズやなんとかちゃんねるのkaiシリーズの成長速度と張り合っていくのはかなりしんどいですが、頑張ります。
次回の公開まではかなり時間が空いてしまうと思われますが、ご了承ください
ツイッター見てない人がいるかもしれないから貼っときましょう
- 73 :
- dolphin/NNUEkai4 vs dolphin2/illqha2
46勝45敗9引き分け
持ち時間0、秒読み2秒
- 74 :
- いい勝負だな、スペックがわからんが
- 75 :
- >>73
すまん、訂正
dolphin2/illqha2からみて、46勝45敗9引き分け
- 76 :
- >>74
CPU i3-6100、MEM:8GBの貧環境
- 77 :
- ノード数少ないし対局数も少ないしでよくわからんけどイルカ2のほうが強いんだろうか
- 78 :
- >>77
対 dolphin/illqha1.1 なら対局数80くらいで打ち切ったけど、イルカ2の勝率58%くらいだった
只今イルカ2とGW5/QQRが対戦中だけど、今のペースだとイルカ2の勝率60%強と予想
ノード数はShogiGUIの表示を見ている限り、最大でも150万くらいかな
- 79 :
- 透。って人の作ったものはどこにあるの
- 80 :
- >>78
数百局やっても勝率58%だったらもしかしたらかなり強くなってるのかもな
- 81 :
- >>71
スレ違いです。
自分のスレに貼ってくださいよ、suimonさん。
suimon_feat.anti_suimon応援スレッド17
https://mevius.2ch.sc/test/read.cgi/bgame/1533862279/
- 82 :
- >>79
公開はしていない、親しい人にだけ検証してもらう目的で渡しいるけど、透のブログでillqha1.1-dolphinに勝率64%って自慢していたやつも
uuunuuun氏の計測では透が渡したものが結局illqha1.1-dolphinに負け越していて弱かった、前から同じことの繰り返しでブログ記事はあてにならい
- 83 :
- NNUEkaiの人みたいにさっさと公開しちゃうのが一番手っ取り早い
キメラもできないから公開しても電王トーナメントへの影響は少ない
- 84 :
- 透の評価関数を付き合いで検証してあげているuuunuuunさんも気の毒だな
勝率64%って渡されたものが負け越すんだからがっかりするだろ
- 85 :
- >>71
右ミレニアム囲いとか昔からあるやん
ググれカス
- 86 :
- suimonさんが見つけた形は全て最新なのだけれど、ブログに書くかどうか
- 87 :
- >>82
そうなんだね
- 88 :
- 評価関数単体だとNNUEkai4とどっちが強いのか気になる
最近はエンジンは強さよりも相性が重視されるから公平な計測条件が難しいけど
- 89 :
- >>86
suimonに興味があるならこっちに本スレがある
「suimonユキ_feat.mztn7応援スレッド17」
https://mevius.2ch.sc/test/read.cgi/bgame/1533482168/
- 90 :
- suimon関連の話題をこのスレでやり出したら、クエスト2分,アマ県棋戦,出版本の売れ具合,
他の指し手研究類似者とのTwitterでのやり取りがどうだとか、一般の将棋ソフト愛好家からしたら
どうでもいい話題なので本スレでやってくれ
- 91 :
- >>88
今、探索部をdolphin2に固定して、NNUEkai4とillqha2を対局させているけど、
対局数59 NNUEkai4が32勝(59%)、illqha2が22勝(40%)、引き分け5 となっている。
うちの貧環境では、NNUEkai4 が最強といえるかも。
- 92 :
- もう何日かして対局数とかノード数がまともな計測結果がいくつか出てこないとなんとも言えないよな
- 93 :
- >>89
suimon_feat.anti_suimon応援スレッド17
https://mevius.2ch.sc/test/read.cgi/bgame/1533862279/
こっちが本スレなんだよな
- 94 :
- とりあえず速報値が知りたかったから
1手100万ノード固定で300局計測、探索はGW6で固定
NNUE-kai4 145-6-149 illqha2
完全に互角、有意差を出すのは現実的な対局数では無理っぽい
- 95 :
- ロタ @Rota_JP
【結果から得られた考察】
1手0.1秒→150-200万ノード レート測定に不適 解像度が低い
1手0.5秒→750-1000万ノード 一定の勝率測定能あり
1手1秒→1500-2000万ノード uuunuuunさんサイト測定基準
1手2秒→3000-4000万ノード 時間を2倍にしても勝率に大きな変動はなし
https://twitter.com/Rota_JP/status/1027149612761505792
最低1000万ノードは必要
https://twitter.com/2chan_nel (2ch newer account)
- 96 :
- 探索エンジンの違いで勝率が変わると評価値の良さが
分からなくなるので制限を設けて計測することにした。
途中経過は以下の通り。
まだ10局なので断言するのは早計かもしれないが、Kai4
よりillqha2の方が評価値としてノードリミット100万なら優れてそうです。
https://i.imgur.com/xOJzWEj.png
- 97 :
- なんとなくエンジンとセットだからイルカにしようかなってなるわ
- 98 :
- elmo以降、数百万程度の低ノード測定は不正確で、1500万以上は必須というのが定説だったと思うが、何故みんなあえて低ノード?
nnueだと低ノードでも信頼性があったりするの?
- 99 :
- メモ floodgateは256手目に詰ませても引き分け
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2018/08/12/wdoor+floodgate-300-10F+illqha1.1-ryzen+BURR+20180812060001.csa
- 100 :
- 低ノードと高ノードで勝率に差が出てくるのは分かってるけど、
高ノードの結果の方が正解で、低ノードの結果は不正確って認識はなかったな
- 101 :
- >>100
さすがに深く読ませた同士の結果のほうが信頼性高いのでは?
- 102 :
- 低ノードだと金沢将棋'98がelmoに勝つこともある
- 103 :
- あるレギュレーションでの強さは、その条件で測定しなきゃわからん
高ノードだから正しいわけではない
そもそも正確性や信頼性ってなんだよってとこからの話になる
- 104 :
- ノード数が増えればRが上がることはわかってるんだから、指し手の精度はより高いのでは?
検討時に低スペで1秒しか読ませないなんてことはないしそこそこ多いノード数での計測を信用したいけどな
- 105 :
- >>104
高ノードで強くなるけど、問題は各ソフト毎にその曲線が異なるってことでしょ
あとはノード毎に出やすい戦型があれば、それによって相性問題が生じる可能性もある
- 106 :
- >>105本当はせめて3種類くらいのノード数でそれぞれ対局させたほうがいいんだろうけどね、計測班がキツすぎるわな
- 107 :
- 評価関数だけで比べたら、大樹の枝と最新ソフト比べたらどれくらいR上がってるの?
- 108 :
- 1ノードってどれくらいの強さなの?
- 109 :
- ノード数とかレートもいいけど、ソフトには解けないって言われてた詰将棋がイルカ2ならそれなりに解けるようになってたりしないのかな
さすがに長手数は無理だろうから50手くらいまでで
- 110 :
- 課題局面はったら俺含め誰か計測するよ
- 111 :
- 出先なんでurlでカンベン
ttp://www.ne.jp/asahi/tetsu/toybox/challenge/c1044.htm
こんなのはどうかな?
- 112 :
- >>109
成らずとか特殊な作為のは簡単なのでも解けない様な
- 113 :
- >>111
今試してみたけどmateでも詰むので、連続王手の筋を読まないみたいだな
- 114 :
- 詰将棋用じゃないからより短手数で勝てるならそっちを選ぶのは自然
- 115 :
- 特殊なのはさすがにだめか
特殊じゃないやつで難しい長手数ってどこに行けばあるんだろうか
- 116 :
- >>115
詰将棋選手権の問題
- 117 :
- 非詰将棋エンジンに詰将棋解かせて何がしたいんだか
- 118 :
- >>117
局面によっては正しく評価値が出ないから
- 119 :
- >>118
それやってなんか意味あんの?
- 120 :
- >>119
そんなの言い出したらコンピュータ将棋なんて意味ないじゃん
- 121 :
- 特定の局面が頻出するなら、それは結局レートにも反映されるわけだし、
そういうの気にし出したら切りないからなあ
もちろん興味として、そういう特殊な状況が気になるのは理解できる
- 122 :
- NNUEが万能にどんな局面でも評価できるようになるのか気になるんだよね
ttp://www.ne.jp/asahi/tetsu/toybox/challenge/c3005a.htm
持ち駒多いと3駒では厳しそうだけどどうだろう
- 123 :
- 万能にどんな局面でも評価できるか?無理に決まってるでしょ
枝刈りしなけりゃどんな評価関数だろうが詰ますし、
運悪く枝刈りに引っかかれば詰ませられない、そんだけだ
個々の局面評価を見てソフトの特徴を推し量ろうなんてどだい無理な話
- 124 :
- 昔はまず無理と言われてたことがどんどん実現してるから、どんな局面でもとはいかなくてもよっぽど変な局面以外は評価できるようになるんじゃないかと思うんだけど
- 125 :
- 詰みがある局面はGUIのアシスタント機能+詰将棋ソフトに任せておきましょう
- 126 :
- >>122
それは無理。
- 127 :
- 何回も言われているが
一番重要なのは対局数だからな
1000万ノードで50局しか計測出来ないなら
100万ノードに減らして500局計測した方が意味のあるデータになる
- 128 :
- テスト対局させてみました
1秒対局なのでノード数が少なめですが参考までに
定跡はオフです
illqha2+dolphin2とillqha1.1+dolphin
227-66-207 (ノード5〜600万)
illqha2+dolphin2とGW-QQR
288-18-194 (ノード4〜500万)
次はdolphin2固定で、illqha1.1やkai4と対局させてみます
- 129 :
- >>96
> 探索エンジンの違いで勝率が変わると評価値の良さが
> 分からなくなるので制限を設けて計測することにした。
> 途中経過は以下の通り。
> まだ10局なので断言するのは早計かもしれないが、Kai4
> よりillqha2の方が評価値としてノードリミット100万なら優れてそうです。
>
> https://i.imgur.com/xOJzWEj.png
もうやめようと思うが一応まで途中経過報告になります。
Kai4より若干強いかなといった感じです。
https://i.imgur.com/6b4cabC.png
対局数104
Kai4 GW3 L10^6 47勝
illqha2 GW3 L10^6 53勝
引き分け 4
=========================
illqha2からみたレイティング差は20ぐらい
100局 53勝 47敗
勝率: 0.53
標準誤差: 0.050288507734394784
95% 信頼区間 [0.43, 0.62]
相対イロレーティング: 20.87120466602866
標準誤差: 35.070287293772225
95% 信頼区間 [-48.96256003716197, 85.04323715257749]
- 130 :
- 今度はGW5.0.5 QQRとの対戦を開始しました。
同様にノードリミット100万で対戦するように設定しました。
まだ10局程度ですがKai4との対戦では見られなかった
逆転勝ちが早くも生じています。
60勝40敗ペースを達成しそうですね。
https://i.imgur.com/cRkZ0s0.png
- 131 :
- NPSかわるしノード固定よりも秒数固定のほうがいい
ヒトが検討するのにも研究するのにも長時間かけるし、コンピューター将棋の大会にしても一手に4000万ノード程度はかけてる
100万ノードの結果貼ってると開発者が失笑する
- 132 :
- そのとおりだ
- 133 :
- Core i9-9900Kが10月1日って噂
メインストリームも16スレッドになるな。NNUEだとRYZEN2よりNPS出そう。
- 134 :
- 対局数が最優先
ノード数を増やして結果が変わるかどうかは調べたい奴が調べればいい
もちろん最低300局な
- 135 :
- フラゲ見てる限り2は長時間は1.1より微妙そうに見える
- 136 :
- 1.1はまだ消さない方がいいか
- 137 :
- そんなに微妙そう?いまいちわからないんだけど
- 138 :
- ThreadRipper32コア64スレッド本日発売
25万くらい
- 139 :
- 相雁木が千日手という結論は個人的には違うのではないかと考えています(キリッ
じゃあお前先手から上手く打開してみろと。
- 140 :
- イルカ2はレート表には載らない感じなのかな
- 141 :
- uuunuuunさんは最近自分では計測しない
Rotaさん頼みだけど、対illqha1.1しか計測してない(+有意差出てない)から
さらなるRotaさんの計測結果待ちでしょう
- 142 :
- 別アカウントで千田さんに絡むことしかしてないあの人も廃スペPC回して計測したら色んな人から尊敬されるのにね
- 143 :
- なんか他との対局はせずに大体こんな感じですってくらいで終わる空気なのかと思ってしまったわ
ハイスペPC持ってれば計測手伝うんだけどなあ
- 144 :
- 低スペックPCで計測しているけど、
最低ノード数がどうのこうのいう輩がいるので
恥ずかしくて結果を晒す気がしない
- 145 :
- 低スペでも時間かけて計測すれば問題なし
10人集まればハイスペにもまさるぞ
- 146 :
- ノード数は多いほうが価値があるとは思うけど、対局数さえある程度多ければ充分に立派なデータだと思う
- 147 :
- >>145 >>146
ありがとう。
これまでの計測結果はもう捨ててしまったので、今後がんばる
- 148 :
- エンジンをdolphin2に固定して対局させてみました
定跡はオフです
illqha2+dolphin2とillqha1.1+dolphin2
203-66-231(ノード5〜600万)
illqha2+dolphin2とkai4+dolphin2
220-49-231(ノード4〜500万)
illqha1.1+dolphin2の組み合わせが意外と良い結果でした
次はillqha1.1+dolphin2をkai4+dolphin2及びGW+QQRと対局させてみます
- 149 :
- >>142
千田ショーがキレてるのはsuimon=suiseihuman
PVパクってるだけだから出力しないようにすればいいよ
Incineratorのひともキレてたし追放でいいでしょ
- 150 :
- 千田に絡んでたのはantisuimonだろう。つまり同一人物
複垢での粘着攻撃だし将棋ソフト開発者界隈もなんか対策できないかな?
- 151 :
- 低スペPCだけど、計測について教えてください。
指し手2秒で1000局(ピーク時ノード数で160万くらい)と、
指し手5秒で400局(ピーク時ノード数750万くらい)では、
どちらに意味があると思いますか?
指し手10秒だと200局(ピーク時ノード数は軽く1000万を超えると思うけど)はやる気は全く起こらない。
- 152 :
- 400局あるなら5秒がいいと思う
- 153 :
- 自分も400できるなら5秒で
100と40なら前者
- 154 :
- >>152 >>553
ありがとう。
最低でも100は対局させるけど、
大まかな目安で以下の条件を満たしたら、
時間の無駄だと思うから対局を打ち切ることにしている
対局数 勝数
100 66以上
200 123以上
300 178以上
400 232以上
500 266以上
:
今は指し手2秒と5秒の結果の違いを調べるために対局させているけど、
結果が大して変わらないのなら、「あくまでも自分の環境」では、
指し手2秒で十分という判断を下すかも。
- 155 :
- >>154
すまん。553ではなく、>>153だった。m(_ _;)m
- 156 :
- >>154
さらに訂正
誤:500 266以上
正:500 286以上
重ね重ねスマン。m(_ _;)m
- 157 :
- 100局以上で明らかな有意差があるなら打ち切ってもいいよね
他との対局数を揃えたいとかじゃなければ
- 158 :
- >>157
信頼区間95%で最低勝率が0.5以上が一般的らしいけど(当方は統計学に無知w)
自分は信頼区間99.99%で最低勝率が0.5以上の勝数で判断してる。
ソフトの相性とか、ノード数とかも関係するかもしれんけど、
当方は自分のPC環境で最も強いソフトを探すのが目的で、
計測すること自体が目的ではないので、これでいいのだw
- 159 :
- >>130
> 今度はGW5.0.5 QQRとの対戦を開始しました。
> 同様にノードリミット100万で対戦するように設定しました。
>
> まだ10局程度ですがKai4との対戦では見られなかった
> 逆転勝ちが早くも生じています。
> 60勝40敗ペースを達成しそうですね。
>
> https://i.imgur.com/cRkZ0s0.png
もうやめようかなと思うけど再び
マイナス評価からの逆転パターンが生じてました。
https://i.imgur.com/ur7qSFm.png
247局 142勝 105敗
勝率: 0.5748987854251012
標準誤差: 0.03155121733698077
95% 信頼区間 [0.5141700404858299, 0.6356275303643725]
相対イロレーティング: 52.439618125247335
標準誤差: 22.427284170889855
95% 信頼区間 [9.848989963332782, 96.66285718796355]
- 160 :
- >>158
早期打ち切りの判断は厳しめでいいと思う
- 161 :
- >>158
すまん。また訂正
誤:99.99%
正:99.9%
m(_ _;)m。
- 162 :
- 切り捨て目的ならともかく
欲しい結論に対してのデータなら、途中打切りはありえない
- 163 :
- >>162
切り捨て目的ってなんですか?おっしゃる意味がわからない。
自分の欲しい結論とは、自分のPC環境で最強のソフトが知りたい。
だから最大で1000局を目標としていても、途中で統計的に有意な差が出たら、
その時点で対局を打ち切る。
何が問題ですか?
- 164 :
- >>163
途中で打ち切るってことは多重検定してるのに近いから
- 165 :
- >>164
ごめん。多重検定とか意味わからないので、もうちょっと詳しく説明してくれるとありがたいです。
では、最初から対局数を例えば100とか、500とか決めてその対局数を完遂した結果で判断すれば
問題ないことですか?
対局数を1000と決めて、途中の100とか500で有意差が出たら、そこで打ち切るのとどう違うのかよくわかりません。
例えば、途中で100とか500で打ち切ったとしても、それが最初から100とか500とか決めていたのと、どう違うのですか?
無知で申し訳ないけど。
- 166 :
- >>165 ごめん。書き間違い。
誤:例えば、途中で100とか500で打ち切ったとしても、
正:例えば、対局数を1000と決めていたとして、途中で100とか500で打ち切ったとしても、
m(_ _;)m
- 167 :
- >>164
では、もうひとつお尋ねします。
>自分の欲しい結論とは、自分のPC環境で最強のソフトが知りたい。
どういう対局をすれば、「統計的に」私の求める結果が得られますか?
指し手2秒、対局数1000でも自分の環境では重すぎる検証です。
- 168 :
- マジレスすると人に頼むのが最善手
- 169 :
- >>168
人って誰?
PC環境も違うのに。
- 170 :
- はぁ、ShogiGUIに保存してた棋譜バグってて使い物にならなくなっててワロタ...
- 171 :
- 横レスだけど、こういう事じゃない?
http://www.igaku-shoin.co.jp/paperDetail.do?id=PA02941_06
途中で気に入った結果が出たところで打ち切ったデータ群を、いくつも収集する
って事になるなら、5%の間違いがあるデータを効率的に集めてしまう事になる
ので注意が必要。
- 172 :
- >>171
ありがとうございます。
リンクを熟読しましたが、統計学に無知な私にはほとんど理解できませんでした。
自分の検証で言えることは、対局するどちらのソフトにも肩入れしないこと、
信頼区間99.9%の有意差で打ち切りを判断していることです。
1000局対戦しても統計的な有意差が出ない場合は、
単純に勝数の多さ(プラマイ13〜14%ぐらい?)という主観的な判断になります。
- 173 :
- 学習棋譜の質に直結するから
低ノードでの正確な棋力は今では超重要情報だぞ
短時間で強いソフトを喉から手が出るほど欲しい層が存在する
- 174 :
- >>172
あ、
>プラマイ13〜14%ぐらい?
というのは変ですね。m(_ _;)m
- 175 :
- 藤井七段の振り駒の後手番の多さは統計学的には有意に多そうだからな
先後が決まっている順位戦入れてもかなり後手が多いくらいだから
- 176 :
- >>159
とりあえずQQRとの相対レーティング差が判明しそうな雰囲気になってきたので
今晩まで続けることにしました。
https://i.imgur.com/q5e2fO2.png
339局 202勝 137敗 引き分け6 (対局数から取り除く)
勝率: 0.5958702064896755
標準誤差: 0.026711567948078614
99.9% 信頼区間 [0.5073746312684366, 0.6814159292035398]
相対イロレーティング: 67.45232091608678
標準誤差: 19.269530974741368
99.9% 信頼区間 [5.124790303986275, 132.0752897620778]
- 177 :
- ふと思ったが、
バイナリを配布するなら、NetworkDelayの初期値は0にした方がいいと思う
- 178 :
- >>165
有意差ってのは確率的にしか判定できない
5%とか1%とかは、差がなくても差があると判定されてしまう
仮に有意水準95%で10回同じ検定を繰り返せば、40%は差があると判定されてしまう
打切りって手法の場合は、前の結果を引き継いでいくからそこまでの影響はないだろうけど(99.9%ならなおさら)、
「統計的には有意水準◯◯%です」ってのは間違ってるので、得られた結論は統計的な後ろ盾が得られない
統計に基づいた有意差あるデータが欲しいなら、それこそ有意水準甘くして、試行回数も数百回くらいに落とせばいいんでは?
- 179 :
- 論文に使うデータでもあるまいし、200局以上で有意水準99.9%を軽く超えてるようなものは打ち切っても構わないと思うが
- 180 :
- ちゃんとしたレート差を知りたいのか、それともレーティングが少しでも上かどうかを知りたいだけなのかで
必要な対戦数は全然違う
- 181 :
- >>170
他の棋譜ソフトは?
テキストで見るとどうなってる?
- 182 :
- 両方dolphin,illqha1.1-kai4だと互角で両方dolphin2,illqha2-kai4だとkai4のほうが強いらしい
1500万と3000万で200局の合計400局 kai4側が55%
- 183 :
- これが噂の相性ってやつなのかね
- 184 :
- 統計ちょっとかじった奴の方が試行回数にうるさい
- 185 :
- ロタさんはGW+QQRとdolphin2+illqha2の計測はやらないのかな
結構ロタさんの計測いつも楽しみにしてるんだけど
- 186 :
- スレの流れ変えるけど
https://i.imgur.com/tAJ3XuM.jpg
MyShogiにこれに近い機能搭載できないかな?
例えば棋譜のフォルダを指定すると解析してこのような感じに表示する(指された手の割合などもあると尚いい)
使い道として、
・24などで自分の棋力に近い人の棋譜を集めて定跡の末端局面でどのように指すかを調べ研究に活かす
・大会で当たる対戦相手の棋譜をぶちこんで人対策
製品版限定でもいいから搭載してくれたら将棋神やねうら王買います
- 187 :
- 話を戻すけど、相性問題があるからやはり複数とやらないと正確なレートが出せんな
- 188 :
- >>186
やねさんはまともな意見だったら結構実現させてくれるイメージあるから直接お願いしてみたら?
- 189 :
- シャイだから直接お願いするのは照れるv(*^-^*)v
誰か、いい考えだと思ったら代わりにお願いしてきてくれ!
- 190 :
- illqha2とkai4がほぼ互角くらいのレートだとするとやっぱり開発環境の差でkaiシリーズのほうが有利なのかな
illqha3が出る頃にはkai6が出てそうなペースだし
- 191 :
- 勝手にやってくれそうな気がw
- 192 :
- >>190
kai5強くなってると作者の方の書き込みありましたね
ペーストしてはkaiのがペース早いですからね
- 193 :
- 貧弱環境でも健気に頑張るillqhaはすごいがそろそろ差がつき始めてもおかしくないわな
- 194 :
- やねさんは何とかちゃんねる見てるからね
iPhone版、音声認識対応も頼みますよ
- 195 :
- あとillqhaは色々公開してるのが不利っちゃ不利なのかな
- 196 :
- >>195
ソフト全体が強くなるように公開してくれているので
- 197 :
- illqhaはdolphin探索開発にも手を出してるから大変そう
kai4がレート高かったとしても劣るって事は全くない
2990WXがシネベン5000程度らしいので1950Xとの比較からnps算出すると7980xよりnps出そう
- 198 :
- 今のgithubに入ってるMyShogi
コンパイルの仕方わかってる人だったらもうこれ使えるの?
- 199 :
- スリッパもすごいけど来年5月には16コアのCPUが5万円弱で買えるという予想のほうがすごいよな
- 200 :
- kaiの開発者ってどなた?
- 201 :
- このスレの住民でCore i9-7960X使いでfloodgate1位の人
- 202 :
- 7960Xってシネベン余裕で3000オーバーの化け物だよな、16コアの3800X(?)はどこまで迫れるか
- 203 :
- >>186
ShogiGUIの定跡機能で似たようなことできるよ
- 204 :
- >>203
棋譜上で表示してるか盤上で表示してるかの違いだと思うけど、
盤上のほうがパッと見わかりやすい。
編集は棋譜上のほうがやりやすいからできれば両方欲しいけどなー。
- 205 :
- >>204
盤面上に矢印表示をできるんだが
- 206 :
- 矢印表示はそうだけど少し違くないか?
- 207 :
- yaselmoの頃のように
SDT6ではkaiシリーズやillqhaよりも強い評価関数は
1〜2個だけという展開になったりして
- 208 :
- suiseihuman強いな
Dolphin6950Xに勝ってるな
- 209 :
- Dolphin6950Xに勝てる人間とか完全にニュータイプだろ
- 210 :
- suiseihumanoid
- 211 :
- これを正しく評価できたのが今のとこillqha2だけなんだが
後手の持駒:角二 金 銀 歩三
9 8 7 6 5 4 3 2 1
+---------------------------+
|v香v桂v銀 ・ ・ ・ ・ ・v香|一
| ・ ・v玉 ・v金 と ・ ・ ・|二
| ・v歩v歩v歩v歩 ・ ・ ・v歩|三
|v歩 ・ ・ ・ ・ ・ ・ ・ ・|四
| ・ ・ ・ ・ ・ ・v歩 ・ ・|五
| 歩 ・ ・ ・ ・ ・ ・ ・ ・|六
| ・ 歩 桂 歩 歩vと ・ 飛 歩|七
| ・ ・ 玉 銀 ・ ・ 金 ・ ・|八
| 香 ・ ・ ・ ・ ・ ・ ・ 香|九
+---------------------------+
先手の持駒:飛 金 銀 桂二 歩
後手番
- 212 :
- 先手有利?って事なら別にQQRでもillqha1でも正しく評価するがそういう事ではなくて?
- 213 :
- お前らってオーディオマニア
- 214 :
- みたいなもんだな
音楽そのものには興味なくて
機器の性能だけに関心がある
- 215 :
- レーティング測定で、1手何秒で固定とか、ノード数を固定したりするけど
持ち時間制にしたらどうなるか気になる。
というか、持ち時間10分切れたら1手10秒で測定してみてるけど、
時間かかっちゃって大変。
- 216 :
- そらオーディオマニアにも音楽そのものが好きな人もいれば音響機器が好きな人もいる
楽器好きもいるしね
- 217 :
- 自分の場合、
将棋の棋士や、戦ってる姿が好きだったり、
コンピュータ将棋なら、同じように、開発者の考えとか人柄とかが好きですね。
将棋自体は超弱かったりするけども。
- 218 :
- やっぱり探索部をdolphin2に統一すると、illqha と illqha2で差がないみたいね。
- 219 :
- illqha1.1が異常なレベルでdolphin2と相性いいのかillqha2がそれほど強くないのかが気になるところ
- 220 :
- めきっとさん気にしてるけど弱いんじゃなくてillqha1.1が長時間向けなのかもしれない
どちらにせよ凄い強いんだから気にする事はないと思うけど
- 221 :
- 厳しい意見を言う人も多いから気にしてしまうんだろうなあ、かわいそうに
- 222 :
- ある特定のソフトにやや強いのが出来ても、相性問題で他のソフト全般に強くなるとは限らないので開発するのも大変だな
- 223 :
- 探索は強さではなく相性の時代だから調査が難しい。
色々な組み合わせを試してみないと何が最強かは判断出来ないね。
- 224 :
- >>213
鉄オタなんてもっと細分化されているぞw
- 225 :
- テスト対局させてみました
定跡はオフです
illqha1.1+dolphin2とGW+QQR
293-22-185(ノード5〜600万)
illqha1.1+dolphin2とkai4+dolphin2
223-56-221(ノード4〜500万)
テストしたノード数だとdolphin2との相性はillqha1.1やkai4のほうが良いのかもしれません
次はノード数を少し上げてテスト対局させてみます
- 226 :
- illqhaの人はいつ頃、次出すなんて必要ないと思うんだ
気長にしこしこやって、これはだいぶ伸びたかもってなったら出してみたらいい
口だけで強いのできたって言ってるだけの人とは違うので、応援してます
- 227 :
- そういうモチベの保ち方なんだろ
俺らが口出しする事でもないと思う
- 228 :
- なんとなく締め切りないとやる気出ない気持ちはわからんでもない
- 229 :
- もう少し続けてみることにした・・・
https://i.imgur.com/JyO4Wlj.png
502局 299勝 203敗 11引き分け
勝率: 0.5956175298804781
標準誤差: 0.021937031308189702
99.9% 信頼区間 [0.5239043824701195, 0.6673306772908366]
相対イロレーティング: 67.2700601644867
標準誤差: 15.822035905833712
99.9% 信頼区間 [16.623139016648043, 120.93133435570473]
- 230 :
- やっぱりillqha2短時間だと普通に強いよな
偶然丁度1500万ノードらへんが苦手な仕上がりになっちゃったのかな
- 231 :
- 短時間で強いなら学習の棋譜作りに向いているから良いんじゃないかな
- 232 :
- ってか1500万ノードの方が時間短いんじゃね
- 233 :
- >>232
?
- 234 :
- 少なくとも一手30秒は考えさせたい
- 235 :
- 珍形マニア向け
http://wdoor.c.u-tokyo.ac.jp/shogi/view/2018/08/12/wdoor+floodgate-300-10F+Dolphin2_6950X+suiseihuman+20180812103004.csa/60
- 236 :
- >>235
自分のスレに帰れ
- 237 :
- 言葉にできない
AI将棋編
- 238 :
- NNUEの力ならひたすら根気よく振り飛車しか学習させなければめちゃくちゃ強い振り飛車評価関数ができるのかな?
- 239 :
- ハニワの活躍は気になるところ
- 240 :
- 飛車の位置が2八限定なのが居飛車
飛車の位置を3八〜8八まで6か所から選ぶのが振り飛車
つまり、少なくとも居飛車の6倍学習させないといけない。
- 241 :
- なるほど
頭いいな
- 242 :
- 袖飛車と右四間は居飛車の仲間って聞いたけど
- 243 :
- 対抗形になってからの中終盤はそれほど大きな違いはなくなってくるだろうし6倍はないんじゃないかな
- 244 :
- ハニーワッフルは名前がダサい
誰かかっこいい振り飛車ソフト作って
- 245 :
- BURR
- 246 :
- 振り飛車のBURRは序盤から評価値が悪いな、やはりソフト間では振り飛車は勝率が低くなる
居飛車が王道なのをBURRが証明してくれている
- 247 :
- >>246
最序盤はそうだね。
ただ、展開によっては振り飛車いける展開になるときもあるし、明らかにダメパターンもあるね。
ダイレクト向かい飛車とかもやっててまだ可能性があるんだなと
- 248 :
- でも中盤の評価値をみると結構振り飛車側を良く評価しててそのまま勝ったりしてるから、うまく学習すれば強いのかも?
- 249 :
- ただし人間同士ではソフトほど深く読まないし、悪手疑問手も普通に指すのでソフトほど差が付かないから
振り飛車も十分戦えるのは間違いない
- 250 :
- そうだね
プロ間で振り飛車がなくなることはないだろう
- 251 :
- suimon=名無し名人 (スップ Sd8a-bhxm)
- 252 :
- >>245
ブルww
だせぇww
- 253 :
- NNなら居飛車も振り飛車も強い評価関数は可能そうだよな
- 254 :
- >>253
可能に思える
結局、明らかにダメな序盤を取り除けば決勝ラウンドには振り飛車党ソフトでもいけそう
その前に将棋電王トーナメントがあるかどうかだが
- 255 :
- 優勝までしてしまったら大事件だが流石に難しいか
- 256 :
- 現在入手出来る最強の振り飛車評価関数はtttakさんのnn_furibisha2(R4118) だと思うが
R4118はあくまでロタ氏計測QQR-GW505との対局だけの勝率からレート換算したもので、
この評価関数は定跡なしでも9割方あらゆる場所に飛車を振るので振り飛車党の練習には良いかも
- 257 :
- 気のせいかも知れないけどillqha2やNNUEkai4の序盤を見ていると矢倉が多くなり雁木が減った気がする
- 258 :
- godwhale_child5.05のNNUE評価関数版をベースに
NPSを落とさずDitto化する事に成功したので投下
https://i.imgur.com/9xvh4io.jpg
https://1.bitsend.jp/download/bf8c56350f3c25bd3948dbb51161dcfb.html
やねうら王の最新の変更も取り込んでいるから
エンジンと同じフォルダにengine_options.txtを置けば設定をまとめて適用できるようになってる
NPSは殆ど落ちないから、良さげなパラメータがあったらengine_options.txtだけ入れ替えればOK
Dolphin2のパラメータを再現できるengine_options.txtも同梱済み
上記の測定結果は付属のengine_options.txtを適用した状態での計測
NPSを落とさせない都合上設定項目が少し減っていて
NNUE-whaleのバージョンの選択肢が3,6,7だけで0は選べなくなっているので注意
7は超短時間でほんのり強いかな?程度で有意差までは出し切れていないので
検討用途なら実績のある6か3が無難かと
一番上のスクショは一応NNUE-whale7に設定しての対局結果
- 259 :
- >>258
これはいいね、使わせてもらいます
- 260 :
- NNUEkai5作成中です
現在、illqha2に対して300戦(1500万ノード、両者dolphin)で
157-18-125(勝率55%、有意確率2.5)となっています
https://i.imgur.com/NiMDkRT.jpg
QQR/GWにkai5/dolphin2で挑んで、いい感じであれば公開します
- 261 :
- >>258 + >>260の組み合わせが最強になるかもしれないなこれは
- 262 :
- また、課題局面の結論が変わるのか
ソフトに踊らされるだけとも言えるな
- 263 :
- まあ先手よし後手よしとかはソフトがない時代でも研究で変わるものだったしそういうもんでしょ
- 264 :
- 結局、自分が強くないと、そして自分の中での判断基準がないとイタチごっこなだけだな
増田みたいにelmoで貫き通すのも1つの考え方だけど
俺は彼のように天才ではないからやはりソフトは差し替えるが
- 265 :
- >>257
俺も走らせてて同じ事を思った
矢倉多いよな?
- 266 :
- >>260
明日あたり公開してもらえますか?
- 267 :
- >>258 の SSE4.2版です
https://1.bitsend.jp/download/9a43aed2947860a315935566adafe9fe.html
engine_options.txt は入っていないので、注意してください
- 268 :
- ShogiGUI使ってて思ったんだけど一回勝ち負け決まるまで対局したやつはちゃんと保存出来るのに
本とかの定跡の変化をちょっとなぞったりしたのはちゃんと保存されないんだけどなんか使い方間違えてる?
- 269 :
- FUTILITY_AT_PARENT_NODE_GAMMA2 の値が 157 になっているのは
編集漏れですかね?
(dolphin2 は 150)
- 270 :
- >>257
銀櫓から千日手模様を雁木に組み替えて打開した奴を見た。
銀櫓が良さげに思えた。
- 271 :
- >>260
見切りでいいから公開して欲しいよ。
まずはillqha2に大幅に勝ち越したんならそれを確認したい。
勝率55%なら決定的な差だと思う。
- 272 :
- kaiとillqhaの一進一退がいい感じだね
- 273 :
- >>262
結論が変わっているというより
曖昧だった部分がドンドンドンドン結論が出て
ドンドンドンドン限定的になっている感じなんだよな
- 274 :
- ああ、なんかShogiGUI意味わかんなくなってるな
もう棋譜保存しても5手目で途切れてるじゃん...
一回アンインストールするべき
- 275 :
- ああ、なんかShogiGUI意味わかんなくなってるな
もう棋譜保存しても5手目で途切れてるじゃん...
一回アンインストールするべき?
- 276 :
- ノード数100万で探索エンジンをGW3でやったら圧倒的に
illqha2の優位だった・・・
https://i.imgur.com/XwkzlUU.png
これから仕事だけど探索エンジンをdolphin2に変えて再度
試行してみる。
- 277 :
- 今日明日くらいにはkai5公開されるみたいだしこのタイミングでkai4の計測はどうなの
- 278 :
- illqha2.1はkai5に勝てるのだろうか
- 279 :
- QQR/GWに対して250局で勝率62%(一手1秒32T、有意確率0.0)でした
https://i.imgur.com/YpvXV7A.jpg
NNUEkai5をアップします(対QQRの棋譜250局が添付されています)
https://www.axfc.net/u/3929870
今回のkai5の主な修正点は、序盤の差し回しです。例えば、後手横歩を回避するようになったので、QQRの青野流(勇気流)を受けなくなりました
floodgateにも流しているので興味があれば対局お願いします
また、QQRに対する勝率も上がってきたので、ツイッターを始める準備もしようかと思っています
- 280 :
- >>279
ありがとうございます。いつも楽しみにしています。
- 281 :
- >>279
超強そう、ありがとうございます
でもillqha1.1も1800万ノードとかだと65%だったらしいし実はそんなにレート離れてなかったりするのかな
- 282 :
- >>279
一手1秒というのは強さを比べる上で十分な長さなんでしょうか?
- 283 :
- 強さを比べる上で一番大事なのは対局数
とにかく対局数が最優先であって
持ち時間を増やすとしても絶対に対局数は減らしてはいけない
- 284 :
- >>282
7960Xの1秒だからそこらの1秒とはレベルが違うぞ
- 285 :
- >>284
そうなんですね
- 286 :
- kaiはしばらくillqhaにあまり勝ち越せない日々が続いていたけどこれはまた逆転したかな
- 287 :
- >>258
illqha2とillqha1.1を使用して試した Dolphin2に対してもWD3に対しても
6割以上勝ち越す 素晴らしい
- 288 :
- ウエスタンデジタルに6割勝ち越してどうするんだ
- 289 :
- WDはお世話になってるわ
- 290 :
- >>287
公開からたった2時間半で何をどれだけ試せたんだ・・・?
- 291 :
- しばらく前はWDばかりだったが
さいきんはSGばかりやな
- 292 :
- いま一番つおいのインストールしたいんだけど。エンジンと評価関数それぞれ教えてください
- 293 :
- 今Hotなのは>>258,279
- 294 :
- >>258は良い感じの名前が求められる
- 295 :
- kai5のレート測定するとしてエンジンはどうするんだろう
- 296 :
- そこはやっぱりGodwhalekaiで
- 297 :
- 今のソフトって、NPSがヤバいだけで評価関数はうんこだよな
NPSが人間の数百倍だとしても初段レベルの強さしかない
- 298 :
- 評価関数はいつもだいたい最新のものが最強じゃん
- 299 :
- kai5が本当に圧倒的強さだったらillqhaの人はどうするんだろう
- 300 :
- 数手から数十手を読んであとは局面だけで評価する人間はかなり優秀
ノード数少なくても、depth浅くてもそれなりに強いDeepLearningが人に近いかもしれない
- 301 :
- めきっと@鵺日々成長中@_illqha
ついに某掲示板のシリーズ最新作が出てきてしまいました。
どうやらめちゃくちゃ強いらしいですね。
次に公開するもので抜くことはちょっと無理かもしれないです。
illqha1.1への再学習が究極的に上手く行ってもR+50は無理だと思うのでしばらくは追いつけない感じでしょうかね。
めきっと@鵺日々成長中@_illqha
高確率で弱くなりそうだけれども、もしかしたら結構強くなる可能性もあるんじゃないかと思っているアイデアを試さざるを得ないですかね。
illqhaの人も諦めへんで〜
>>260,279について、後手横歩避けるようになったとはいえ、先手も後手も勝率が変わらないことがちょっと気になる
NNUEは環境によって結果が結構変わってくるのでこのスレの住民の追試も必要だぞ、がんばれ君たち
- 302 :
- 強いソフトがほしいけど、そういう知識がない俺みたいな人ってほかにもいると思うのよ
だから前にエイプリーがやってたみたいに学習の一部を手伝えるようにしてくれれば、少しは足しにならない?
- 303 :
- kai5とillqha2で1手30秒で対局させてる
どちらも探索はdolphin2
のんびり眺めるのが楽しい
ちなみに1局目は角換わりから先手のillqha2が勝った
- 304 :
- こんな感じで有志によってどんどん評価関数が強くなっていってillqhaの人の計画通りだな
- 305 :
- しばらくは評価関数はNNUEkaiシリーズで決まりか
- 306 :
- >>302
教師作り手伝いましょうか?ってillqhaの人にDMしてみたら?計算資源かなりきつそうだし
- 307 :
- 2局目も後手のillqha2が勝ったわ
illqha2強いぞ
- 308 :
- 297>>
それはあると思う
最近のソフトは序盤がややアレなのと評価値の乱高下が激しい。
棋譜分析用に使ってたが、2の足を踏む
で、4月までの王者ソフトAperypaqを復権させてみた
短時間で本筋の手を指す。
大局観がいい。評価値がブレにくい。人間が見てわかりやすく参考になる
なかなかいいんで最新ソフトと対局させてみた
チープな4GBで32ビットPC環境w。
一手5秒で意外にもほぼ全勝
qqr,illqha1.1,kai5にも
もちろんしょぼい環境のせいですw(検索やねうら)
パワーが出せない4G環境なんで
棋譜分析用にはAperypaqに戻したね
それはそれとして
kaiとillqhaのレートがどれくらい伸びるかは楽しみです.
ロマンではあります
- 309 :
- >>308
NNUEって32ビットでも動くんだ 初耳
- 310 :
- しょぼい環境ほどNNUEが強そうだけど、そもそも32bitのOSで動くの?
- 311 :
- 話題にならなかったがやねうらさんが最近NNUE版を公開したようです
2018年7月29日
やねうら王 NNUE型評価関数ビルド V4.82公開しました
http://yaneuraou.yaneu.com/2018/07/29/%E3%82%84%E3%81%AD%E3%81%86%E3%82%89%E7%8E%8B-nnue%E5%9E%8B%E8%A9%95%E4%BE%A1%E9%96%A2%E6%95%B0%E3%83%93%E3%83%AB%E3%83%89-v4-82%E5%85%AC%E9%96%8B%E3%81%97%E3%81%BE%E3%81%97%E3%81%9F/
リリースされた
YaneuraOu-2018-Otafuku-nosse.exe
が32ビットPC版で、NNUEが動きました
やねうらさんに感謝
- 312 :
- レスアンカすらまともにつけられない奴の評など聞くに値せん
メモリ4GBで32bitOSってチープどころか化石中の化石でスマホにも劣る性能だろ
- 313 :
- >>258
解凍して出てきたYaneuraOu.slnをvisual studioで再ビルドしようとしたら失敗してしまったのですが、どのようにしたらビルドできましたか。
Release2018TNKで構成しビルドをしてみたら、C2672, C2780, C1083 のエラーが出て失敗しました。
- 314 :
- 32bit nosseはehash周り手に入れないとマルチスレッドで正常動作しないと思ったけど
大丈夫なんかね
- 315 :
- >>312
ご本人もしょぼい環境って言ってるのに何にキレてるの?
- 316 :
- >>311ってT.N.Kのやつとほぼ一緒だよね?
- 317 :
- >>307
私の所でもillqha2強いです。
- 318 :
- 自分の感覚とこの板の情報に違和感があったので、自分で対戦させてみました。
探索部は whale7 Ditto2 (157→150修正済み)で固定。
illqha2 VS Kai5 の結果。
12-1-7
でした。
時間は1秒。NPSは2000kN/sくらい。 (ノード数は1秒なので同じです)
illqha2の方が強いと思うけど、同じような人いますか?
- 319 :
- 2700X買ったので報告
やねベンチでV4.82 TOで5800NPS
やっぱり8700KのがNPS出るOCしてどっこいどっこい
NNUE系ならIntelのが良いはず?
- 320 :
- RyzenはAVX2分のブーストがないからね
- 321 :
- >>319
値段こなれている2700はCPは高いかも
今度出る2950Xは供給が落ち着いたら買うかな
- 322 :
- NNUEkai5の作者様Twitter開設お待ちしております
- 323 :
- 設定ファイルを作ったので配布します
既存のエンジンのパラメータを手軽に再現するための設定ファイルです
Dolphinの設定ファイルはGAMMA2の記入ミス(>>269氏指摘)を修正済みです
最初に同梱した設定ファイルもそのままの状態(ミスがあるまま)で同梱してあります
https://1.bitsend.jp/download/c56f50c243fdf9f6fe4530e49edaa9bc.html
engine_options.txtは後から入れ替えをしても
既に登録済みのエンジンの設定パラメータは変化しないので気を付けてください
新規登録の際に、ファイルを設置してからエンジンを登録するというのが主な使い方となります
また、Ditto2はベースとなるエンジンが
やねうら王ではなくGodwhale_childのNNUE評価関数版なので
設定ファイルでパラメータを揃えてもオリジナルと完全に同一にはならない点にも注意して利用してください
>>313
MSYS2でclangを使ってコンパイルしました、visual studioではビルドが通るかは未確認です
- 324 :
- もう一度ベンチ
V4.82 TO 6400NPS
V4.82 SSE4.2 6500NPS
う〜ん
- 325 :
- >>324
illqhaの人も言ってたけどやっぱりSSE4.2の方がNPS出るんだな
- 326 :
- >>315
しょぼい環境+わけのわからん独自指標でソフトの優劣をつけてるのが気になったんだよ
あと無駄長文うぜぇとかもある
Apery推ししたいが為に他のソフトを不当に貶めてるのも気になる所だな
- 327 :
- 検証は秒読みではなくノード数制限でやって欲しいなあ
これならスペックの違いはほぼ問題にならないし
新参がやりがちなNetworkDelayやMinumumThinkingTimeの未設定も気にしなくていいでしょ
- 328 :
- >>327
NPS出るような改善とかが全部無意味になるからそれは同エンジンでしか通用しない
- 329 :
- >>327
ソフトごとにnps違うからノード数制限では駄目みたいよ
- 330 :
- 新参だけどその設定絶対してないわ…
- 331 :
- >>328
あーそうか、
なんならエンジン配布者が予めそのパラメータを0に設定しておいてほしい
- 332 :
- 逆に言えば同エンジンならノード数で制限しても構わないと言えるな
- 333 :
- 開発者の人もそこら辺の設定がイマイチわからない人がどんどん検証に参加し始めるなんて思わなかったんだろ
- 334 :
- >>324
Ryzen買うなら絶対来年の3800Xでしょ
5万円そこそこで16コアは価格破壊レベル
- 335 :
- >>334
来年はIntel買うから
- 336 :
- >>335
ほう、来年のIntelよさげなの?
- 337 :
- RyzenはAVX2周りの特許をIntelに持たれてるのがつらい
- 338 :
- kaiとかダウンロードしてなかったけど、検証時点でQQRに勝率62%ってのは本当っぽいねぇ
8月の勝率として順調そうでなにより
- 339 :
- >>328>>329
そこずっと疑問に思ってたわ
- 340 :
- よくわからん話が常識みたいな語りになっているのが不思議だ。
NodesLimitを仮に100万としたらどんな探索エンジン使おうが100万超えた時点でストップするとおもうんだが?
- 341 :
- >>340
だからそれが問題って話じゃ?
100万読むのに10秒のエンジンと1秒のエンジンがあったとしてそれを100万制限で比較していいのか?まずいだろってこと
そんなやり方したらDL勢の圧勝だし
- 342 :
- ノード数で切っちゃうと、エンジンによって枝刈りの有無だとか最適化してNPS確保とかの技が全部消えちゃうじゃん
- 343 :
- https://twitter.com/tayayan_ts
NNUEKAIの作者さんのアカウントがあった。
https://twitter.com/2chan_nel (2ch newer account)
- 344 :
- >>325
雑に全コア4.2GHzOC
V4.82 TO 6800〜7000NPS CUP温度69℃
V4.82 SSE4.2 6500〜6700NPS CUP温度75℃
TNK_WCSC28 TO 6200NPS CUP温度88℃
TNK_WCSC28 TO SSE4.2 5800NPS CUP温度90℃
- 345 :
- >>344
一応AVX2版のほうがさすがに少しだけ速いのか
- 346 :
- >>345
定格だとSSE4.2のが速いか同等だったんだけど、よく分かんね
雑にOCしてるのもあるけど
ryzenでもやっぱりNNUEは熱くなる
- 347 :
- >>343
おお〜
- 348 :
- >>346
まあそれほど大きな差はないってとこか
熱さはもう線型の評価関数と比べたら結構計算複雑そうだから仕方ないっちゃ仕方ない
- 349 :
- >>341
いまみんなが注目しているのはillqha2やkai5の評価関数としてどちらが最強かということ。
それを客観的に評価するためには探索エンジンの要素を外して調べたいわけ。
秒数でやると探索数に違いが出る可能性があるので厳密にNodesLimitでやることで
どちらの評価関数が優れているのかわかると思うんだが?
- 350 :
- エンジンと評価関数はワンセットなのが最新の常識でしょう
それぞれの評価関数が一番実力を発揮できるエンジンにして計測しないと意味がない
- 351 :
- illqha2はdolphin2より1.1の方が相性がよく勝率が高いって結果も出たみたいだし、
エンジンと評価関数ではっきり分けて計測するのはどうかなって思うんだよな
- 352 :
- 逆だった
illqha1.1とdolphin2が相性が良いだった
- 353 :
- >>337
俺はZen2待ちだがレートとか観る限りRyzenの性能悪くなさそうだけどなぁ
- 354 :
- >>349
みんなはそんなことに注目してないよ
どの探索と評価関数のセットが強いかを気にしてるんだぞ
- 355 :
- >>353
いや別にRyzenが悪いって言ってるわけじゃないよ、かなりコスパいいし
ただAVX2がもっと有効に使えたらいいのになってこと
- 356 :
- >>355
ソフト側がryzenに寄せれば良い
- 357 :
- >>356
確かにRyzen専用に最適化すれば多少速くはなると思うけど256bitで持ってるほうがやっぱり有利じゃない?
- 358 :
- Intelまた脆弱性見つかったそうだな
Intel CPUの「SGX」機能に新たな脆弱性、仮想マシンなどにも影響
http://www.itmedia.co.jp/news/spv/1808/15/news037_0.html
- 359 :
- 脆弱性やばすぎてi7のHTTなくなるんだっけか
- 360 :
- >>359
脆弱性というよりかはi9との差別化
- 361 :
- i9はそこそこいい値段しそうだしいよいよRyzenが一時代を築くか
- 362 :
- 既に旧バージョンのソフトでも、あのポナンザに勝率81%か
R差258 勝率81.54%
dolphin/illqha1.1 R4307
Ponanza-wcsc27 R4049
- 363 :
- 脆弱性パッチ当ててベンチマーク25%低下するCPUとかいらん
- 364 :
- 残念ながらKai5はillqha2よりも強いとは思えない・・・
あとノードリミット100万で対局させると持ち時間1秒設定でも
100万まで読み込んだあとで着手しているように見える。
そしてそれにかかる時間はGW3<dolphin2で随分違っている。
結局探索エンジンの読み込みの速さがいいエンジンの第一要素
なんじゃないだろうか?
ここ1か月? ちかく対戦させてきたがGW3の方が常に良い成績を
収めてきた(秒数制限の場合)
https://i.imgur.com/YHO0FWE.png
- 365 :
- >>364
早く読めるにこしたことはないけど、それだけじゃないと思う
dolphinはもう少し超時間のほうが向いてるんじゃない?
- 366 :
- 探索深さやノード数を設定すると、
持ち時間は無視するのが仕様
- 367 :
- >>366
基本的な事だよなあ
そんなん分からない輩がドヤッて結果だけ貼ると不正確になる
- 368 :
- ドヤってとかいうのは不必要だぞ
- 369 :
- つか>>349を主張しておきながら何でエンジンと評価関数バラバラで検証してんだ
- 370 :
- それなりに時間かけていい計測してる人達はもう少し時間かかるかな
- 371 :
- NNUEKAI5とQQRやqhapaqを1手2秒で対戦させているが、
illqha 2より強くなっていると思う。
- 372 :
- 3すくみって奴だろう
定跡オフだと戦型が偏るから
他の戦型に誘導された時にレーティングがブレるのかもしれないね
- 373 :
- >>349
同じノード数にしてもスレッド数が異なるとLazySMPが露骨に効いて
多スレッドの方が有意に強くなるというのがuuunuuunさんの調査で出てる
だから「コア数の違い」を考慮してノード数を同じにする、というのは
一見意味がありそうで実はない
- 374 :
- >>371
illqhaって対河童の勝率めちゃくちゃ高くなかったっけ?
- 375 :
- 法人で多コアサーバ利用する優位性が分かるなぁ
機械学習系は物量優位だな
- 376 :
- NNUEkai5、作者がテストで使われたdolphin2との組み合わせがよさそうだな。
昨日はGodwhele Ditto2と組み合わせたが、それよりも安定して強そう。
あくまで数局観戦しての印象です。あしからず。
- 377 :
- 水門のillqha2_6950Xって偽物だろ
流石に1コアの技巧2にそう簡単に負けるはずがない
レートで言ったら軽く1500以上離れてると思うんだが
- 378 :
- illqha2もkai5も評価値暴れすぎじゃない?
6950xのillqha2が技巧に負けてるし
そもそも探索の調整ってチョイチョイ弄って本家より精度あがるんかな
レートの算出に使うノードに特化させてるだけで枝刈りとか変になってないのかね
illqha1.1がfloodgate見る限りでは安定してそうだけど
- 379 :
- >>377
忘れたけど前にも技巧が一発入れたのあったから嘘じゃないと思うけど
- 380 :
- >>379
前にもとは?
- 381 :
- >>380
思い出せなくて申し訳ないけど3か月以内くらいの出来事だったと記憶
技巧の妙手?みたいなの読めなくて盛大に逆転されたのがこのスレでも話になってた
多分あとで誰かが貼ってくれると思うけど
- 382 :
- >>378
開発者がNNUE用にチューニングした本家の探索は今のところ存在しないよ
iillqha2はillqhaの人も微妙そうだから修正版出すみたいに言ってたし修正版を待とう
- 383 :
- >>381
ほーそうなのか
ただそんな前にはillqhaはまだ出ていないような・・・
- 384 :
- >>375
そういう中で、絶芸や星陣には及ばないけどその次くらいに個人で来てる
山口さんの凄さが際立つ
電王トーナメント開催されてほしいなあ
- 385 :
- >>364
kaiシリーズはともかくillqhaシリーズはGodwhele Ditto2と
組み合わせた方がGW3やdolphin2よりも強いと思う
- 386 :
- >>344
追記
ちょっと煮詰めて
NNUEでも4,2GHzで70度以下で動作
- 387 :
- NNUEの評価関数の場合dolphinよりgodwhaleのNNUE 版の方が強いって意見も前のスレで見た気がする
- 388 :
- >>386
いい感じだね
やっぱりソルダリングなのが効いてる気がする
- 389 :
- >>387
どれそれのエンジンが強い気がするってのはたまに見るけど、1500万ノードで数百局やってみたわって人はなかなか現れないよな
- 390 :
- ロタ@Rota_JP
illqha1.1_dolphin1 vs NNUEkai5_dolphin1
141-30-135
総試合数: 306, 勝率(引分0.5勝換算): 50.98%, ΔR(引分0.5勝換算): +6.81, 引分率: 9.80%
一手1秒(24T)
Hash=1GB,NoBook,PonderOff,Resign3000,Draw256 #コンピュータ将棋検証 #shogi #CSAlive
棋譜:https://t.co/U2tIBY7Ixr 👀
Rock54: Caution(BBR-MD5:b73a9cd27f0065c395082e3925dacf01)
- 391 :
- 300局で55%って結構有意差に関してはギリギリだから
どうやらツモってしまったっぽいな
- 392 :
- 55じゃなくて51%やぞ
どう見ても互角
- 393 :
- 55%は>>260のことでしょう
- 394 :
- illqha1.1は安定の強さだな
- 395 :
- テスト対局させてみました
エンジンはdolphin2です
定跡はオフです
結果が微妙だったので、再検証はしてみたいと思います
ファイルは各PCで個別にDLしました
dolphin2+kai5とdolphin2+illqha2
186-65-249(ノード5〜600万)
38-17-45(ノード2000〜2500万)
- 396 :
- >>367
基本的なこととか言ってるけどどこにその記述があるの?
将棋GUIのマニュアルにでもあるのかい?
それともやねうら王のパラメター説明に記述でもあるの?
あなたにとっては基本的かもしれないけど具体的に
どこに記述があるか教えて欲しいよ。
- 397 :
- >>396
やねうら王系のエンジン使うならソースのdocsの中のUSI拡張コマンドっての読むといいよ、大体のことはそれに書いてあるから
- 398 :
- >>369
同じ物での評価はすでにやったんだよ。GW3同士でね。
でもdolphin2がいいと皆が評価してるからKai5を変えてたら
成績が逆転するかと思ったわけだ。
しかし結果は同じだったというわけだ。
そこで探索エンジンは探索スピードが一番重要なんじゃないかと
思ったわけだ。
- 399 :
- 低ノードや短時間で計測してる人はdepth固定(教師局面はdepth10とかdepth12で作ってる)で計測した方が開発者の人のためになるかと
強いからといっていい教師になるとは言い切れないけど、100万ノードの計測結果は使い道も信頼性もなさ気
- 400 :
- 測定の精度は対局数で決まるのということを理解してない奴が多すぎる
ノード数があろうとなかろうと対局数を重ねることが最優先
一番無駄なのは最近多い100局未満の結果
あれマジでなんの参考にもならない
- 401 :
- suimonさん鍵垢って何か事件あったんですか?
- 402 :
- 他人のやってることにケチつけるのはどうなのかね
- 403 :
- >>323のファイルは書式を間違えていたので再アップ
設定値そのものは適用されるものの
オプションファイルを置いている状態ではGUI上での設定変更が効かなくなってた
あくまで設定ファイルのミスなのでエンジンはそのままで無問題
https://1.bitsend.jp/download/0a089154a1820aea85a4b2fb22772d05.html
kai5でDolphin2/illqha2に対して
1700局で勝率52%の設定ファイルも同梱(ほぼDolphin2)
https://i.imgur.com/FfA7xTV.jpg
計測データも少し入っているので興味のある人はどうぞ
エンジンと設定ファイルをワンセットにしたダウンロードURL
https://www.axfc.net/u/3930268
- 404 :
- >>403
兎に角試してみるよ。
- 405 :
- どんなにインパクトのある結果であっても、検証手法が間違っていれば全くの無意味
科学的な検証を行う際の基本中の基本だ
- 406 :
- >>405
何を偉そうに言ってるの?
インパクトのある結果が間違っているのなら、それを指摘して正しい検証方法でやり直せば本当に間違った結果か
どうかわかるんだから何も問題ないよ。何を指してインパクトのある結果といってるのか
今一つ伝わらないけど・・・
- 407 :
- >>403
力作ですね!!!
- 408 :2018/08/18
- >>403
なるほどmax値とmin値が設定されていなかったのね
検証によるとR+15くらいか
第45期棋王戦 Part25
佐々木勇気と藤井聡太どこで差がついた?
食事・おやつ総合スレ ありがとうみろく庵餅93個追加
将棋YouTuberが連盟に公開質問状 提訴も言及★3
オタとじじい
竜王失冠でカンニングの真犯人は渡辺明に確定へ
第78期順位戦 Part80
藤井無双は将棋界のレベルが低いからじゃね?
西山朋佳 19
谷口由紀女流二段 Part38
--------------------
木村昇吾とかいう日本のFAに関する認識を改めた男
小屋暮らし総合ウォッチスレ38
【今日の旭日旗】 グリーン・デイも「旭日旗」を使用? 韓国のファンが問題提起 [12/16]
老人利権に反対する市民の会
干支に猫が無いなら作ればいいんだよ
【MHW】チャージアックススレ チャージ59回目
箱入り娘
スーパー特撮大戦2001 第3話
江戸時代に飛んでもやってける現代の職業って何 ? [324064431]
観光名所の少ない政令市
パイパンのワカメ酒ってワカメ酒じゃないじゃん?
遊戯王OCGデュエルモンスターズPart.10478
【中古大好き】伴貞良★26【ヌードも撮りたい】
NIKE JAPAN に抗議しよう!!
【30代】人生の岐路→誰かが相談に乗るスレ
高機動型ザクU後期型 VS ジムカスタム
一般人の世界観に影響を与えられる物理の話
【新型肺炎】オリエンタルランド、ディズニーでもマスク着用認める
年中オフシーズンの集い
50ccエンジンのある生活 原付をまたーり楽しく179
TOP カテ一覧 スレ一覧 100〜終まで 2ch元 削除依頼