しぃアンテナ(*゚ー゚)

2025年8月12日火曜日

GPT-5が4oよりナーフされてることを証明してみた|まはー

いきなり結論まとめGPT-5とGPT-4oに同じ問題を100回ずつ投げ、4oのほうが正答率が高いという結果が出た(4o:98%、5:71%)。 つまりGPT-5はGPT-4oの上位互換ではない。劣化している部分は間違いなく存在する。 読者の皆様はこちらの記事の実験を覚えているだろうか。……え?初見? 今回は上記記事における問いA(下記)を...

Posted from: this blog via Microsoft Power Automate.

0 件のコメント:

コメントを投稿