AI・機械学習18min readGPT-5.2ベンチマーク比較|SWE-Bench 55.6%・AIME 100%の実力と料金【2026年最新】GPT-5.2のInstant/Thinking/Proの性能差をベンチマーク(SWE-Bench 55.6%・AIME 100%・GDPval 70.9%)で徹底比較。400kコンテキスト、API料金$1.75〜、Gemini 3との違いまで解説。2025年12月25日