2024年12月21日、OpenAIが発表した最新生成AIモデル「o3」は、従来のAIの限界を大きく超える性能を示し、AI業界に衝撃が走りました。
Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3 pic.twitter.com/e4dQWdLbAD
— OpenAI (@OpenAI) December 20, 2024
o3は人間の専門家レベルの問題解決能力を実現し、AGI(汎用人工知能:人間のような汎用的な知能を持ち課題を解決できるAI)への大きな一歩となる可能性を秘めています。
この記事では、o3とその派生モデルo3 miniの特徴について、そして早期アクセスの方法について解説します。
(前モデルo1について解説した「OpenAIの新AIモデル「o1」登場!前モデルGPT-4oとの思考力を比較」記事も是非併せてお読みください。)
OpenAIが発表したo3は、これまでのAIが抱えていた課題を大幅に乗り越えた最新の生成AIモデルであり、現在最もAGIに近いモデルと言えます。
従来のAIは大量のデータから規則性や傾向を見つけ出す「パターン認識」に依存していました。しかし、o3では段階的な推論を積み重ねる「思考プロセス」をシミュレートする仕組みが採用されたことにより、専門家レベルの問題解決を実現可能にしています。
つまり、o3は従来のAIとは違い、人間のように順を追って考えを深めていく「思考の仕組み」を取り入れました。o3が専門家と同じように難しい問題を解けるようになったのはこれが理由です。
さらに、o3を軽量化した「o3 mini」モデルも登場しました。o3 miniは、高性能かつ柔軟な推論能力を持ちながら、より小規模な環境でも活用できるように設計されています。
o3 miniの特徴的な機能が「アダプティブ・シンキング・タイム」です。与えられた問題や文脈に応じて考える時間を最適化し、不要な処理を省くことで無駄な計算を減らしつつ、複雑な問題には必要な思考ステップを丁寧に踏むというアプローチを可能にしています。
なお、前モデルのo1からいきなりo3という名称になった理由は、すでに「o2」の名前を持つ企業に配慮したためだとされています。
OpenAI o3は、先代のo1と比較しても圧倒的な性能向上を遂げています。コーディング能力を評価する「Codeforces」では、o1のELO(レーティング)が1891だったのに対し、o3は最大で2727に到達。競技プログラミングの世界でもトップクラスの実力を示しました。
(引用:OpenAI)
数学分野でもo3は驚異的な結果を残しています。国際数学オリンピックの予選問題「AIME 2024」では96.7%の正答率を記録し、博士レベルの科学問題を扱う「GPQA Diamond」でも87.7%という高得点を叩き出しました。
(引用:OpenAI)
さらに、AIにとって最難関とされる「ARC-AGI」ベンチマークにおいて、o3は低推論設定で75.7%、高推論設定では人間の平均(85%)を上回る87.5%を達成。5年間破られなかった記録を塗り替える快挙となりました。
(引用:OpenAI)
ARC-AGIは、AIが「初めてみるタイプの問題」をどの程度解決できるかを評価するテストで、人間にとっては簡単なパズル形式の問題ですが、AIにとっては非常に難しいとされています。
2024年12月24日時点ではまだo3は利用できませんが、2024年12月20日から2025年1月10日まで研究者を対象とした早期アクセスの申請が可能です。このプログラムでは、研究者がo3の能力を探索し、AIの安全性や脅威に関する洞察を提供することが期待されています。
(引用:OpenAI)
2025年1月末には「o3 mini」が一般公開され、ChatGPT上で利用できるようになる予定です。
o3は今後、研究者向けの早期アクセスプログラムを経て、企業向けの導入が進む見込みです。AIモデルがここまで「人間のような思考」に近づいてきたことで、ビジネスの常識も大きく変わるかもしれません。
o3やo3 miniが普及すれば、AI導入のハードルが下がり、多くの業種で業務プロセスの最適化が進むでしょう。今後の生成AI、特にOpenAIのo3の動向からは目が離せません。