2025年10月17日 掲載

こんなタスクで Chat GPT 5 Thinking と Gemini 2.5 pro を比較してみました.ちなみに,上の画像はGeminiで生成したもの(の一部を切り抜いたもの)です.
下記の画像はホテルに宿泊した際にハウスキーピングの方がチップへのお礼として書かれていたメッセージです.

最後に書かれているお名前を何と読むべきかについて,人間であれば以下のような推論ができると思います.
そこで,同じタスクを Chat GPT 5 Thinking と Gemini 2.5 pro にやらせてみました.
まず,Chat GPT 5 Thinking です.少し誘導してみましたが,Miriam という結論にはなりませんでした.「z」に見える字が「a」であろうということは言っているのですが,そのわりには名前の5文字目を「a」と考えて候補を挙げるということを最初はしていません.名前の3文字目を「n」だと思っているようなので,そのせいもあるのかもしれませんが.日本や韓国の名前を挙げているので,もしかしたら,日本のIPアドレスから聞いているというのが影響しているのでしょうか?そうならないように英語で聞いてみたのですが.

続いて Gemini 2.5 pro です.「thzn」の3文字目と名前の5文字目を同じと推論しているかは,はっきりしませんでしたが,最初から Miriam という結論に達しています.

そもそも,このタスクの「正解」が何であるか自体は不明なのですが,どちらも「zに見える字は実はaであろう」という人間なら行うであろう推論の最初のところは模倣できているように見えます.