編集者からの画像
堅実な元チェスプレイヤー (ジュニアチャンピオン、ELO 2000+) および NLP データサイエンティストとして、私はしばらくの間、この記事を書こうと計画していました。
ChatGPT のチェス能力について初めて聞いたのは、同僚の 1 人からでした。博士号そしてとても賢い男です。彼は自分の考え通り、ChatGPT と対戦できる Web ページへのリンクを私に送ってくれました。残念ながら、それは純粋な ChatGPT ではなく、内部に別のチェス エンジンが組み込まれていました。彼はだまされました。まだここで試すことができます: https://parrotchess.com/
この記事の目的のために、ChatGPT と 2 つのゲームをプレイしました。私たちが始めた経緯は次のとおりです。
何が起こったのか見てみましょう。
簡単なチェス記譜コース / リマインダー (スキップ可能):
K = キング、Q = クイーン、R = ロック、B = ビショップ、N = ナイト、0–0 = キャスリング王側。 0–0–0 = キャスリングクイーン側、x = 駒を取る。ポーンの場合は、ポーンがキャプチャするときを除いて、ポーンが着地するマス目を書き込むだけです。その場合は、前にポーンがあったマスの文字と、もう一方の駒を取った後にポーンが進むマスの文字と番号を書きます。たとえば、exd4。
ニコラ・グレブ vs. ChatGPT 4、7 年 2024 月 XNUMX 日
1. e4 e5 2. Nf3 Nc6 3. d4 exd4 4. Nxd4 Nf6 5. Nc3 Bb4 6. Nxc6 bxc6 7. Bd3 O-O 8.
O-O d5 9. e5 Ne4 10. Nxe4 Bc5 11. Nxc5 Qe7 12. Qh5 g6 13. Qh6 f6 14. exf6 Qxf6
15. Bg5 Qf7 16. Rae1 Bf5 17. Re7 Qxe7 18. Bxe7 Rae8 19. Bxf8 Rxf8 20. Bxf5 Rf7
21. Re1 1-0
e5 までは、ChatGPT 4 は非常に優れたチェスプレイヤーのようにプレイしていました。 GMのように言えます。しかし、私が不正確ではあるが攻撃的な手をプレイしたとき (exd5 が最良の動きでした)、共通点を失い、Ne4 をプレイしているポーンを失敗させてしまいました。
私は騎士を騎士(10.Nxe4)と一緒に連れて行きました、そして最初の幻覚が起こりました:
Bc5 はまたしても間違いであり、明らかな失敗でした。ゲームの残りの部分にはチェスの価値がないので、要約します。 ChatGPT 4 は私を不可能な動きだと非難し、ゲームを放棄する代わりに幻覚に陥って (不可能な動きを提案する) しまいました。
私が黒の駒をプレイしたゲーム 2 で何が起こったのか見てみましょう。
ニコラ・グレブ vs. ChatGPT 4 (手数 1 ~ 9) および ChatGPT 3.5 (手数 10 ~ 12)、7 年 2024 月 XNUMX 日
1. e4 c5 2. Nf3 Nc6 3. d4 cxd4 4. Nxd4 e5 5. Nb5 d6 6. c4 f5 7. N1c3 Nf6 8. Bg5 Be7 9. Bd3 Nxe4 10. Bxe4 fxe4 11. Nxe4 Bxg5 12. Nec3 0–1
以下のポジションまでは、Chat GPT 4 は非常にうまく機能し、本物のグランドマスター (マスター候補であっても) やチェス エンジンに対してすぐに負ける大幅に良いポジションを構築しました。白が Bf6 をプレイした場合、黒はポーンを失います。それでも、ChatGPT は Bd3 を再生しました。
私が Ne4 で応答すると、ChatGPT はバージョン 3.5 に切り替えて Bxe4 を再生することで応答しました。
数手動かした後、私が決定的に有利になったので(私が素晴らしいことをしたのではなく、ChatGPT のプレーが悪かったため)、変則的な動きで相手をテストすることにしました。私はこの位置で黒の Ne6 を提案しました。
ChatGPT 3.5 は私の動きにはまったく関係ありませんでした。私の幻覚に対して、それは新たな幻覚で反応しました。
1. ChatGPT 4 は非常に弱いチェス プレイヤーで、非常に奇妙なプレイをします。序盤は非常に優れていますが、後半はひどいものです。これは、チェスのゲームが進むにつれて選択肢が増えるためです。私は彼の全体的な ELO が 1500 未満であると評価します。3.5 についても同様です。
2. ルールの暗黙的な学習は発生しません - チャット GPT 4 は依然としてチェスで幻覚を起こし、幻覚についての警告の後も幻覚を続けます。これは人間には起こり得ないことです。
3. 繰り返しのある非常に長いエンドゲームや、異常なオープニングをプレイする可能性などの特殊なケースのため、データが増えても問題はほとんど解決されません。 LLM はチェスをプレイするために構築されておらず、局面を評価することもできません。そのための AlphaZero と Stockfish がすでにあります。
4. LLM がチェスのプレイ中に行う幻覚の数の減少を追跡することは、LLM の論理的推論の可能性を理解するための良い方法になる可能性があります。しかし、パラドックスは依然として残っています。LLM はチェスのルールを「知っている」にもかかわらず、ひどい幻覚を持っていますか? ML の将来は、ユーザーと通信し、特定のユースケースに合わせて調整された ML アーキテクチャを持つ特殊なエージェントを呼び出す第 XNUMX レベルのエージェントとして LLM に組み込まれる可能性があります。
5. LLM は科学研究に役立つ可能性があり、他の機械学習アルゴリズムと組み合わせると興味深いレベルの創造性を示します。最近の例は、DeepMind によって開発された FunSearch アルゴリズムで、LLM と評価器を組み合わせて数学で発見を行います。局面の評価が最も難しいタスクであるチェスとは対照的に、数理科学の問題の多くは「通常は解決するのが難しいにもかかわらず、評価するのは簡単」です。
私は、トランスフォーマー アーキテクチャに基づいて優れたパフォーマンスのチェス プレイ プログラムを構築することには懐疑的ですが、外部評価/チェス プログラムと組み合わせた特殊な LLM は、すぐにチェス トレーナーの良い代替品になるかもしれません。 DeepMind は、LLM と特殊な AI モデルを組み合わせた好例となる別のクールなモデル、AlphaGeometry を作成しました。これは、幾何学問題におけるオリンピックの金メダリストの標準に非常に近く、数学における AI 推論を進歩させます。
6. LLM はまだ新しく、この分野は非常に若いため、誤解を招く間違った結論に裏付けられた誇大宣伝が多すぎます。 「大規模言語モデルを使用したプログラム検索からの数学的発見」の著者は次のように述べています。
「…私たちの知る限り、これはLLMを使用した最初の科学的発見、つまり悪名高い科学的問題に関する検証可能な新たな知識を示しています。」 (加速プレビューは 14 年 2023 月 XNUMX 日に公開されました)。
7. Joe Rogan と 2 人のゲストによる「これを学ぶまでは AI を恐れていませんでした」というタイトルのクリップは、YouTube で 2,8 万人に視聴されました。ゲストの XNUMX 人は、ChatGPT はチェスの遊び方を知っていると言っていますが、これは明らかに真実ではありません。この種のコンテンツが人々、特に教育を受けていない人々や情緒的に不安定な人々にどのような影響を与えるかは想像できます。良い意味ではありませんが、それは確かです。
結論として、データ サイエンスとソフトウェア開発は、知識、精度、真実の追求に基づいて構築されています。データサイエンティストや開発者として、私たちは真実と知恵を持った人間であるべきであり、AI に関してマスメディアが生み出した狂気を煽るのではなく、鎮静化させなければなりません。 ChatGPT を含むトランスフォーマーは言語タスクにおいて大きな可能性を秘めていますが、AGI からはまだ遠く離れています。私たちは楽観的であるべきですが、それは正しいことです。
ガイドラインとして、爆弾を投下する前に、次のことを自問する必要があります。もし他の誰かが私の発言に基づいて行動したらどうなるでしょうか?あなたはどんな世界に住みたいですか?
参考文献とさらなる調査
- 一般的な強化学習アルゴリズムを使用したセルフプレイによるチェスと将棋のマスター: https://arxiv.org/pdf/1712.01815.pdf
- FunSearch: 大規模言語モデルを使用して数理科学で新しい発見を行う: https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large- language-models/
- 大規模な言語モデルを使用したプログラム検索からの数学的発見: https://www.nature.com/articles/s41586-023-06924-6
- AlphaGeometry: オリンピックレベルの幾何学 AI システム: https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/
- これを知るまでは AI を恐れていませんでした: https://www.youtube.com/watch?v=2yd18z6iSyk&ab_channel=JREDailyClips
- ChatGPT とチェスを対戦する方法 (そしておそらくそうすべきではない理由): https://www.androidauthority.com/how-to-play-chess-with-chatgpt-3330016/
- チャット GPT でチェスをプレイできますか?: https://towardsdatascience.com/can-chat-gpt-play-chess-4c44210d43e4
- ChatGPT はチェスに関してどれくらい優れていますか? (ネタバレ: きっと感動するでしょう): https://medium.com/@ivanreznikov/how-good-is-chatgpt-at-playing-chess-spoiler-youll-be-impressed-35b2d3ac024a
- Full conversation with ChatGPT: https://chat.openai.com/share/a1ff82b5-6210-4f7b-807c-220052de232c
- 一般的な強化学習アルゴリズムを使用したセルフプレイによるチェスと将棋のマスター: https://arxiv.org/pdf/1712.01815.pdf
ニコラ・グレブ 彼は 4 年以上コーディングを行っており、過去 2 年間は NLP を専門にしていました。データ サイエンスに転向する前は、営業、人事、執筆、チェスの分野で成功を収めていました。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.kdnuggets.com/does-chatgpt-have-the-potential-to-become-a-new-chess-super-grandmaster?utm_source=rss&utm_medium=rss&utm_campaign=does-chatgpt-have-the-potential-to-become-a-new-chess-super-grandmaster
- :持っている
- :は
- :not
- :どこ
- $UP
- 10
- 11
- 12
- 13
- 14
- 視聴者の38%が
- 16
- 17
- 19
- 20
- 2023
- 7
- 7
- 8
- 9
- a
- 能力
- 私たちについて
- それについて
- 加速された
- 告発された
- 行為
- 調整
- 前進
- 利点
- 恐れて
- 後
- 再び
- に対して
- エージェント
- エージェント
- 積極的な
- AGI
- AI
- アルゴリズム
- アルゴリズム
- すべて
- 既に
- an
- および
- 別の
- 建築
- です
- 記事
- AS
- 頼む
- 評価する
- At
- 著者
- 離れて
- b
- 支持された
- ひどく
- ベース
- BE
- になる
- き
- さ
- 以下
- BEST
- より良いです
- より良い位置
- ブラック
- 建物
- 内蔵
- 焙煎が極度に未発達や過発達のコーヒーにて、クロロゲン酸の味わいへの影響は強くなり、金属を思わせる味わいと乾いたマウスフィールを感じさせます。
- by
- コール
- 缶
- 候補者
- キャプチャ
- 場合
- 例
- チャンピオン
- チャット
- AI言語モデルを活用してコードのデバッグからデータの異常検出まで、
- チェス
- 閉じる
- コーディング
- 同僚
- 組み合わせた
- 組み合わせ
- 結合
- コマンドと
- 心配
- 結論
- コンテンツ
- 逆に
- 会話
- クール
- 正しい
- ここから
- 作成した
- 創造性
- データ
- データサイエンス
- データサイエンティスト
- 12月
- 決定しました
- 決定的な
- ディープマインド
- にもかかわらず
- 発展した
- 開発者
- 開発
- 発見
- do
- ありません
- すること
- ダウン
- Drop
- 落ちる
- 原因
- 早い
- エッジ(Edge)
- ほかに
- 終わった
- エンジン
- 特に
- エーテル(ETH)
- 評価する
- 評価
- さらに
- 例
- 除く
- 外部
- 余分な
- 遠く
- 少数の
- フィールド
- 発射
- 名
- 初回
- 4
- 新鮮な
- から
- さらに
- 未来
- ゲーム
- Games
- GM
- ゴエス
- 良い
- 素晴らしい
- 陸上
- ゲスト
- ガイ
- 持っていました
- 起こる
- が起こった
- ハード
- 持ってる
- he
- 聞いた
- 重く
- こちら
- 彼の
- フード
- 認定条件
- How To
- hr
- HTTPS
- 人間
- 誇大広告
- i
- if
- 絵
- 不可能
- 感銘を受けて
- in
- 含めて
- の増加
- 個人
- を取得する必要がある者
- 興味深い
- IT
- 1月
- ジョー
- ジョー・ローガン
- ただ
- KDナゲット
- 種類
- 神様です。
- 騎士
- 知識
- 知っている
- 土地
- 言語
- 大
- 後で
- 学んだ
- 学習
- 手紙
- レベル
- ような
- LINK
- ライブ
- 論理的な
- 長い
- 見て
- 失う
- 失われます
- 失われた
- 下側
- 機械
- 機械学習
- make
- 作成
- 多くの
- 質量
- マスメディア
- マスター
- math
- 数学的
- 数学
- me
- メディア
- かもしれない
- 百万
- 誤解を招く
- ミス
- ML
- モデル
- 他には?
- 移動
- ずっと
- my
- 自然
- 新作
- NLP
- いいえ
- また
- 悪名高いです
- 数
- 明白
- 発生した
- of
- 頻繁に
- on
- ONE
- OpenAI
- 開設
- 開口部
- 楽観的
- オプション
- or
- その他
- 私たちの
- 自分自身
- 全体
- パラドックス
- 特定の
- 過去
- path
- のワークプ
- 実行する
- ピース
- ピース
- 計画
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレイ
- 演奏
- プレイヤー
- 再生
- 演劇
- 位置
- 可能性
- 潜在的な
- 精度
- プレビュー
- 多分
- 問題
- 問題
- 生産された
- 演奏曲目
- 提案された
- 提案
- 公表
- 目的
- すぐに
- R
- リアル
- 最近
- 強化学習
- 残っている
- リマインダー
- 研究
- REST
- 岩
- ルール
- s
- セールス
- 同じ
- 言う
- 言う
- 科学
- 科学
- 科学的な
- 科学研究
- 科学者
- 科学者たち
- を検索
- 送信
- すべき
- 表示する
- 作品
- 側
- 著しく
- 単に
- から
- 懐疑的な
- スマート
- So
- ソフトウェア
- ソフトウェア開発
- 固体
- 解決する
- 一部
- 誰か
- 何か
- すぐに
- 専門の
- 広場
- 標準
- 開始
- 都道府県
- 文
- まだ
- 成功した
- 合計
- スーパー
- 確か
- T
- 取る
- 取得
- 仕事
- タスク
- ひどい
- test
- より
- それ
- 未来
- その後
- そこ。
- 彼ら
- この
- 考え
- 時間
- タイトル
- 〜へ
- あまりに
- 取った
- 追跡
- トランスフォーマー
- 真実
- 試します
- ターニング
- 2
- 一般的に
- 下
- 理解する
- 無学の
- 残念ながら
- まで
- 珍しいです
- に
- つかいます
- 便利
- ユーザー
- 値
- 検証できる
- バージョン
- 非常に
- vs
- 欲しいです
- 警告
- ました
- だった
- 仕方..
- we
- WELL
- この試験は
- いつ
- which
- while
- 白
- 誰
- なぜ
- 意志
- 知恵
- 世界
- でしょう
- 書きます
- 書き込み
- 間違った
- X
- 年
- まだ
- 貴社
- 若い
- ユーチューブ
- ゼファーネット