1. MetaStep TOP
  2. ビジネス活用を学ぶ
  3. ChatGPTの新たな推論特化型モデル「o3-mini」が登場!特徴を解説し前モデルo1との性能を比較

2025.02.10

ChatGPTの新たな推論特化型モデル「o3-mini」が登場!特徴を解説し前モデルo1との性能を比較

OpenAIが2025年2月1日(日本時間)にリリースした新モデル「o3-mini」が、大きな注目を集めています。2024年9月にリリースしたo1モデルに匹敵する推論能力を持ちながら、より高速かつ低コストで利用できる点が最大の特徴です。

本記事では、o3-miniの概要や魅力、上位版となる「o3-mini-high」との違いについて詳しく解説していきます。特に、技術系の活用例を中心に紹介しますので、AIをビジネスや学習に役立てたい方は、ぜひ参考にしてみてください。

(前モデルo1については過去に掲載した「OpenAIの新AIモデル「o1」登場!前モデルGPT-4oとの思考力を比較」記事もぜひ併せてお読みください)

推論特化型の小型AIモデル「o3-mini」とは?

o3-miniは、OpenAIが「推論(reasoning)シリーズ」として開発した小型言語モデルです。数学やコーディングといった論理的思考力を必要とするタスクに強く、o1と同等の精度を低遅延・低コストで実現できるのが特徴です。

さらに、o1モデルと軽量化が施されており、ほぼ待ち時間なしで回答が得られるほどのスピードを実現しています。リアルタイムのWeb検索にも対応しており、最新のニュースや技術トレンドを踏まえた回答が可能です。o1シリーズではWeb検索機能が利用できなかったため、より情報鮮度が高い回答結果が得られます。

また、o3-miniは「チェイン・オブ・ソート(Chain of Thought)」と呼ばれる手法を活用しており、人間が論理的に考えるように筋道を立てて回答を導き出すことができます。そのため、博士課程レベルの数学問題や複雑なコード修正にも対応可能です。

o3-miniは無料ユーザーにも機能が解放されており、1日のメッセージ上限150回まで利用可能です。なお、以前まで利用できていたo1-miniは、o3-miniの登場により利用できなくなっています。

上位版「o3-mini-high」とは?

o3-miniには、より高度な推論力を持つ「o3-mini-high」が存在しており、より深い思考プロセスを踏むことが求められるタスクに適しています。ただし、2024年2月時点では、o3-mini-highは有料プラン(ChatGPT PlusやPro)に登録しているユーザー限定で公開されています。

特に難解な数理問題や複雑な設計課題に対して、高精度な回答を提供できます。

国際数学オリンピックの予選問題であるAIME2024では、o3-mini-highはo1のスコアを超える87.3を記録。

また、博士レベルの科学問題であるGPQA Diamondでもo1モデルを超える79.7を記録しています。

この結果をみると、o3-mini-highはo1を超える性能かつ、回答スピードが速いモデルだということがわかります。ただし、2024年2月時点でo3-miniは画像やPDFファイルなどをアップロードした上で回答を生成することはできません。

画像などをアップロードした上で高度な推論回答が必要であれば、引き続きo1モデルを利用する必要があります。

日常的なやり取りや簡単な質問にはo3-miniが十分な性能を発揮しますが、より専門的なタスクを確実にこなしたい場合には、o3-mini-highを選択するのが適しているでしょう。

o3-miniとo1の性能を比較

実際に無料版で使えるo3-miniとo1の性能を、出力結果から比較してみましょう。どちらのモデルも基本的なメール文章の作成など、単純作業においては高い性能を持ちます。

そこで今回は、やや難易度の高いプログラミングを、簡単な指示だけで出力できるかを検証してみたいと思います。

以下のプロンプトを使います。

プロンプト

Create a p5.js simulation where 50 colorful balls bounce inside a slowly rotating square box. Each ball should leave behind a fading trail that shows its recent path. Implement precise collision detection to ensure that the balls never leave the box.

日本語訳:

p5.js を使って、ゆっくり回転する四角い箱の中で、50個のカラフルなボールが跳ね回るシミュレーションを作成してください。各ボールは、最近の軌跡がフェードアウトするトレイルを残します。また、ボールが箱の外に出ないよう、正確な衝突判定を実装してください。

o3-miniの生成結果

o3-miniの生成結果は、以下のようになりました。(生成時間:11秒)

シンプルではありますが、回転する六角形の内側で正しくボールが跳ね返っていることがわかります。

しかし、「50個のボール」と指示したのにもかかわらず出力されたボールの数は1個だけ。また、「リアルに跳ね返る」と指示したので、欲を言えば重力の影響まで表現してほしかったところ。

o1の生成結果

続いて、前モデルo1の生成結果を見てみましょう。(生成時間:21秒)

ボールが正しく六角形の内側に入っておらず、衛星のように図形の周りを回転する様子が生成されてしまいました。また、o3-miniの生成結果と同様、「50個のボール」と指示したにもかかわらず、1つしか出力されていません。

「ボールが六角形の外側に出てしまっているので、修正してください。」と修正を指示したところ、o3-miniと同様の結果が出力されました。

修正には25秒かかったため、o1では正しいコードを生成するために、プロンプト入力時間を除いて、合計46秒かかった計算です。

o3-miniでは11秒で正しいコードが生成されていることから、o1と比較すると4倍以上早く、正確だということがわかりました。

まとめ

ChatGPT o3-miniは、o1モデルに迫る論理思考力を持ちながら、高速な応答と低コストを両立した小型LLMです。とにかく速く回答を得たい場合は通常のo3-mini、より深い推論が求められる場面ではo3-mini-highと、用途に応じた使い分けが可能です。

無料版ChatGPTでも利用できるため、一度試してみれば、その利便性と性能の高さに驚くはずです。興味を持った方は、ぜひo3-miniを利用してみてください。

研究開発、業務効率化、学習支援など、さまざまなシーンで活躍することでしょう。