OpenAIが2026年4月23日に発表した「GPT-5.5」は、チャットAIとしての賢さを競う時代から、実際の業務を自律的にやり遂げる「実務AI」への転換点となるモデルです。
コーディング・PC操作・ナレッジワーク・科学研究の4領域で大幅に進化し、同時に「GPT-5.5 Instant」がChatGPTの新しいデフォルトモデルとして全ユーザーに展開されました。
この記事では、GPT-5.5の全体像からベンチマーク性能、料金体系、実務での使い方まで、専門知識がなくても理解できるよう丁寧に解説します。
GPT-5.5とは――OpenAI最新フラグシップモデルの全体像

GPT-5.5は、OpenAIが2026年4月23日(日本時間4月24日)に発表した最新のフラグシップモデルです。
一言でいうと、「チャットの賢さを競うAI」から「ツールを使い、自分で検証しながらタスクを最後までやり遂げるAI」への転換を体現したモデルです。
前モデルのGPT-5.4と同等の応答速度(レイテンシ)を維持しながら、ほぼすべての評価指標で性能が向上しています。
さらに、同じ作業を完了するために必要なトークン数(AIが処理する文字・単語の単位)が大幅に削減され、コスト効率も高まっています。
GPT-5.5ファミリーのモデル構成
GPT-5.5は単一のモデルではなく、用途に応じた複数のバリアントで提供されています。
呼び名が似ているため、まず整理しておきましょう。
| モデル名 | 主な用途 | 対象ユーザー |
| GPT-5.5(標準版) | コーディング・調査・データ分析などの実務タスク全般 | ChatGPT Plus / Pro / Business / Enterprise、Codex各プラン |
| GPT-5.5 Pro | 法務・金融分析・科学研究など高難度・長期タスク | ChatGPT Pro / Business / Enterprise のみ |
| GPT-5.5 Thinking | 深い推論が必要な高度タスク(ChatGPT上での推論強化モード) | Plus以上のプランでモデル選択から利用可能 |
| GPT-5.5 Instant | 日常的な会話・情報検索・要約などの高速汎用タスク | 全ChatGPTユーザー(デフォルトモデル) |
GPT-5.5 Proは「反復的なリサーチパートナー」として早期テスターから高く評価されており、ドキュメントや各種ツールと組み合わせて長時間かけて深掘りする系のタスクで真価を発揮します。
一方、GPT-5.5 Instantは2026年5月5日からChatGPTのデフォルトモデルとして全ユーザーに自動展開されました。
GPT-5.5以前のモデルとの位置づけの違い
ここ数ヶ月のOpenAIのモデル展開を振り返ると、GPT-5.5の立ち位置がよく見えてきます。
- GPT-5.3 Instant:高速応答に特化した日常会話向けモデル
- GPT-5.4:推論・コーディング・PC操作・ツール連携を統合したオールインワン型モデル
- GPT-5.5(今回):GPT-5.4の統合構造を踏襲しつつ、「実務で最後までやり切る力」を大幅に強化したモデル
GPT-5.5は、単なる5.4の延長線上ではなく、「チャット応答の賢さを追うフェーズは終わった」というOpenAIのメッセージそのものといえる存在です。
GPT-5.5の主要な進化ポイントとベンチマーク性能

GPT-5.5がGPT-5.4からどのように進化したのか、重要なポイントとベンチマーク(AIの性能を客観的に測るテスト)の数値を使って解説します。
数値を見ると、特に「長時間・複数ステップの自律的なタスク実行」において顕著な改善が確認できます。
エージェントコーディング(自律的なプログラミング)の強化
GPT-5.5で最も顕著に伸びているのが、エージェント的コーディング(AIが自分でコードを書き、テストし、修正まで行う能力)の領域です。
コマンドライン上で複雑なタスクをどこまで自走できるかを測る「Terminal-Bench 2.0」では、GPT-5.5は82.7%を記録しました。
GPT-5.4の75.1%から7.6ポイント向上しており、競合のClaude Opus 4.7(69.4%)とも大きな差をつけています。
また、人間の作業完了時間の中央値が20時間と推定される長期コーディングタスクを評価する「Expert-SWE」では73.1%(GPT-5.4は68.5%)を達成しました。
Cursorという開発ツールを手がける企業のCEO、Michael Truell氏は「GPT-5.5は早期停止が減り、複雑で長時間動く委任タスクに最も効く」とコメントしています。
PC操作・ツール活用能力の向上
GPT-5.5は、実際のPCの画面を見てアプリを操作する能力も大幅に向上しています。
これにより、AIが人間の代わりに画面を操作してタスクを完了する「エージェント」としての活用がより現実的になります。
| ベンチマーク名 | GPT-5.5 | GPT-5.4 | Claude Opus 4.7 | 測定内容 |
| OSWorld-Verified | 78.7% | 75.0% | 78.0% | 実際のPC環境でのクリック・入力・ナビゲーション操作能力 |
| GDPval | 84.9% | 83.0% | 80.3% | 44職種にわたる実務タスクへの対応力 |
| BrowseComp | 84.4% | 82.7% | 79.3% | Web調査・情報収集の精度 |
| Tau2-bench Telecom | 98.0% | 92.8% | — | 複雑な顧客サービスのワークフロー処理能力 |
GDPvalの84.9%という数字は、44の職種にわたる実務タスクにおいて、AIの成果物が業界プロフェッショナルの成果物と同等以上と評価された割合を示しています。
つまり、多くの職種でAIが専門家と肩を並べるレベルのアウトプットを出せるようになってきたことを意味します。
科学研究・推論能力の進化
学術・研究系の指標でも大きく伸びており、GPT-5.5は単なるビジネスツールにとどまらず、科学研究の補助ツールとしての可能性も広げています。
| ベンチマーク名 | GPT-5.5 | GPT-5.4 | 測定内容 |
| GeneBench | 25.0% | 19.0% | 遺伝学・定量生物学における多段階科学データ分析 |
| BixBench | 80.5% | 74.0% | 実務に近いバイオインフォマティクス・データ分析 |
| FrontierMath Tier 4 | 35.4% | 27.1% | 数学研究の最難関層の問題 |
| ARC-AGI-2 | 85.0% | 73.3% | 抽象的推論能力 |
実際に、カスタムハーネスを備えたGPT-5.5の内部版が、非対角ラムゼー数に関する漸近的事実の証明発見に関与し、「Lean」という数学検証ツールで検証された事例も報告されています。
応答速度維持とトークン効率の改善
GPT-5.5はGPT-5.4と同等の応答速度(1トークンあたりの生成時間が同水準)を維持したまま、ほぼすべての評価で性能向上を達成しています。
「賢くなったモデルは遅くなる」というこれまでの常識を覆した点は、実務利用において非常に重要です。
さらに、同じタスクを完了するのに必要なトークン数も大幅に削減されています。
GPT-5.5自身がCodexを使って自社の推論インフラを最適化し、トークン生成速度を20%以上向上させたというエピソードも公開されており、AIがAIの基盤を改善する時代が現実になっています。
GPT-5.5 Instant――全ユーザー向けデフォルトモデルの改善点

2026年5月5日、OpenAIはChatGPTのデフォルトモデルを「GPT-5.5 Instant」に順次アップデートすると発表しました。
これはすべてのChatGPTユーザーに自動適用されるアップデートで、日常的なやり取りの質を底上げするものです。
GPT-5.3 Instantからの改善は、大きく「事実の正確性向上」「パーソナライズ強化」「応答スタイルの簡潔化」の3点に集約されます。
ハルシネーション(誤情報生成)の大幅削減
「ハルシネーション」とは、AIが事実と異なる情報を自信満々に答えてしまう現象のことです。
GPT-5.5 Instantでは、医療・法律・金融など正確性が特に重要な分野での誤情報が、GPT-5.3 Instant比で52.5%削減されました。
また、ユーザーが事実誤認を指摘した難しい会話でも、不正確な主張が37.3%削減されています。
ただし、この数値はOpenAI社内評価に基づくものである点に注意が必要です。
独立した評価機関「Artificial Analysis」のベンチマーク(AA-Omniscience)では、GPT-5.5系列のハルシネーション率として86%という数値も計測されており、OpenAIの公表値とは測定方法が異なります。
つまり、ハルシネーションが大幅に改善されたのは事実ですが、医療・法律・金融の業務判断で利用する場合は、引き続き人間によるファクトチェックを組み込む運用設計が必要です。
数学推論(AIME 2025)では65.4点から81.2点へと15.8ポイント向上しており、単純な文章生成の改善にとどまらず、推論能力の底上げも確認できます。
パーソナライズ機能の強化と「メモリソース」の導入
GPT-5.5 Instantでは、過去のチャット履歴・アップロードファイル・接続済みのGmailなどのコンテキストをより効果的に活用できるようになりました。
これにより、同じ説明を繰り返す手間が減り、個別のニーズに合わせた提案や作業の再開がスムーズになります。
また、新機能「メモリソース」が導入されました。
これは、モデルが回答を生成する際に参照したコンテキスト(過去のチャット・保存メモ・アップロードファイルなど)をユーザーに可視化する機能です。
- 参照されたメモリの内容を確認できる
- 古い情報や不要な情報は削除・修正できる
- 共有チャットでは、メモリソースは他のユーザーには表示されない
ただし、OpenAI自身が認めているとおり、「モデルが参照したすべての会話がメモリソースとして表示されるわけではなく、一部のみが表示される」という制限があります。
プライバシー管理の補助ツールとして活用する分には有効ですが、完全な監査ログとしての利用は想定されていません。
応答スタイルの変化――より簡潔で読みやすく
GPT-5.5 Instantでは、応答の語数が平均30.2%、行数が29.2%削減されています。
冗長な表現や過剰な書式設定が減り、不要な追加質問や絵文字の装飾も抑えられることで、実用的な情報がより分かりやすく提示されます。
APIで「chat-latest」というエイリアスを使用している開発者の方は、GPT-5.5 Instantへの自動切り替えが既に完了していることに注意が必要です。
出力の長さや形式を前提とした下流処理がある場合は、出力フォーマットの検証を行うことをお勧めします。
Codexとの連携で広がるGPT-5.5の実力

GPT-5.5と同時に、コーディング専門エージェント「Codex」側にも大きなアップデートが入りました。
モデル本体だけでなく、それを動かす実行環境もまるごと一段上に引き上げられたイメージです。
これにより、「AIにコードを書いてもらう」から「AIがプロジェクト全体を管理して完成させる」へと、使い方のステージが変わります。
Auto-reviewモード――長時間タスクを途切れず自動実行
今回のCodexアップデートで最もインパクトが大きいのが「Auto-review」モードです。
これまでのCodexは、「このファイルを変更しますか?」「このコマンドを実行しますか?」と頻繁にユーザーに確認を求めて止まっていました。
Auto-reviewモードでは、別のエージェントが「高リスクな手順」を事前にチェックし、危険な手順の前だけユーザーに通知する仕組みになります。
これにより、深夜にコードベースを整備させたり、数時間かかる検証タスクを任せたりと、長時間の自動化タスクが現実的になります。
ブラウザ操作・画像生成・ファイル生成の強化
Codexは今回のアップデートで、WebアプリをCodex自身が直接操作できるようになりました。
- ページ内のクリック・スクロール・入力の自動化
- テストフローの自動実行とスクリーンショット取得
- 画像生成モデル「gpt-image-2」との連携(UIモック・挿絵の生成・編集)
- Microsoft Office(Word・Excel・PowerPoint)とGoogle Drive向けのファイル生成品質向上
「コードを書く→UIモックを生成する→それを元にまたコードを書く」という往復作業が、Codex一つで完結するイメージです。
「ChatGPTに資料を作ってもらい、Officeに手動で移して整える」という面倒な行き来も、大幅に減らせるようになります。
GPT-5.5の料金・提供プラン

GPT-5.5がどのプランで使えるのか、料金はどうなっているのかを整理します。
2026年4月24日時点の公式情報をもとにまとめています。
ChatGPT・Codexのプラン別提供状況
| プラン | 月額料金(目安) | GPT-5.5(標準) | GPT-5.5 Pro | Codex利用 |
| Free | 無料 | ×(GPT-5.5 Instantのみ自動適用) | × | × |
| Plus | $20/月 | ○(モデルピッカーから選択) | × | ○ |
| Pro | $200/月 | ○ | ○ | ○ |
| Business | $25/月/ユーザー | ○ | ○ | ○ |
| Enterprise | 要問い合わせ | ○ | ○ | ○ |
Plusプラン(月額$20)でもGPT-5.5が使えるのは大きなポイントです。
ChatGPTの有料プランを使っていれば、追加課金なしで最新モデルにアクセスできます。
API料金(開発者向け)
APIとは、自社のアプリやシステムにGPT-5.5を組み込む際に使う仕組みのことです。
2026年4月24日からAPIでの提供も開始されました。
| モデルID | 入力料金(100万トークンあたり) | 出力料金(100万トークンあたり) | コンテキストウィンドウ |
| gpt-5.5 | $5.00 | $30.00 | 約105万トークン |
| gpt-5.5-pro | $30.00 | $180.00 | 約105万トークン |
| gpt-5.4(参考) | $2.50 | $15.00 | 約27万トークン |
GPT-5.5の単価はGPT-5.4の約2倍ですが、「同じタスクを完了するのに必要なトークン数が減った」という効率化を考慮すると、実質的な総コストは逆転する場合があります。
コスト試算は「単価」だけでなく「総トークン量×単価」で行うのが実務的です。
なお、バッチ処理(Batch・Flex)は標準の半額、優先処理(Priority)は2.5倍の料金になります。
急ぎでない処理はバッチ化することで大幅なコスト削減が可能です。
GPT-5.5を実務で活用する3つのシナリオ

ベンチマーク数値を踏まえて、GPT-5.5が最も活きる実際の使い方を紹介します。
どのシナリオも「AIが最後まで作業を完走する」という点が共通しています。
シナリオ①:Codexと組み合わせたコーディング自動化
Terminal-Bench 2.0で82.7%、Expert-SWEで73.1%という数値が示すとおり、GPT-5.5はエンジニアリング業務の自動化に最も力を発揮します。
Auto-reviewモードとブラウザ操作強化が加わったことで、「明日までにこのリポジトリの全テストを通して、依存関係を最新化して、プルリクエスト作成まで済ませておいて」という依頼が、一晩で現実的になります。
エンジニア個人の生産性向上というより、「プロジェクトのメンテナンス工数を大幅に圧縮する」使い方が特に有効です。
シナリオ②:リサーチ・データ分析のパートナーとして
BrowseComp 84.4%、FrontierMath Tier4 35.4%という数字が示すのは、ネット上の情報を自分で集めて裏付けを取りながら分析できる能力です。
競合調査・業界トレンド分析・技術リサーチなど、これまで数時間かかっていた調べ物を、GPT-5.5 Proに任せれば数十分で質の高いアウトプットに変えられる可能性があります。
特にGPT-5.5 Proは「反復的なリサーチパートナー」として、長時間かけて深掘りするタスクで真価を発揮します。
シナリオ③:定型PC作業の自動化
OSWorld-Verified 78.7%という数値は、実際のPC画面を見てアプリを操作できる能力を示しています。
「このExcelファイルを開いて、特定の集計をして、別のシステムに入力する」といった定型業務を、RPAのような専用ツールなしにAIに任せられる未来が見えてきました。
RPA(ロボティック・プロセス・オートメーション)とは、従来はPC操作を録画・再生して自動化していた専用ツールのことですが、GPT-5.5+Codexの組み合わせがその代替になりつつあります。
職場の中で「人間がPCの前で同じ操作を繰り返している定型タスク」を1つ洗い出して試してみることをお勧めします。
GPT-5.5の安全性評価と注意点

高い能力を持つGPT-5.5には、それに見合った安全管理の仕組みも設けられています。
特にサイバーセキュリティ能力の大幅な向上が、新たな安全上の課題をもたらしています。
Preparedness Frameworkでの「High」評価
OpenAIは自社モデルのリスクを「Preparedness Framework(プリペアドネス・フレームワーク)」という社内基準で段階評価しています。
GPT-5.5は、サイバーセキュリティと生物/化学の両カテゴリで「High(高リスク)」レベルに分類されました。
これはCyberGym 81.8%(GPT-5.4: 79.0%)という高いサイバー能力を受けての判断です。
この評価を受けて、不適切な利用を防ぐための制御機能が強化され、高リスクなサイバー活動や機密性の高いサイバーリクエストへの制限が厳しくなっています。
Trusted Access for Cyber――正当な防御業務向けの特別枠
セキュリティ診断やインシデント対応など、正当な防御業務にGPT-5.5を使いたい場合、通常のプロンプトでは制限に引っかかる可能性があります。
そのため、OpenAIは「Trusted Access for Cyber」という枠組みを2026年2月から提供しています。
- 検証済みの個人・組織ユーザーが対象
- Codex経由でサイバー制限を緩和した「cyber-permissive」バージョンが提供される
- 申請はchatgpt.com/cyberから可能(所属・用途・実績の提出が必要)
セキュリティ系の検証でGPT-5.5を使いたい場合は、事前にOpenAIの利用規約・使用ポリシーを確認しておくことをお勧めします。
GPT-5.3 Instantへの切り戻し手順と期限
ChatGPTのデフォルトが自動的にGPT-5.5 Instantに変わったことで、「以前のモデルに戻したい」と感じる方もいるかもしれません。
有料ユーザー(Plus/Pro等)は2026年8月頃まで、設定からGPT-5.3 Instantへ戻すことができます。
- ChatGPTのWeb版またはアプリを開く
- チャット画面上部のモデル名(「GPT-5.5 Instant」と表示)をクリックする
- ドロップダウンから「GPT-5.3 Instant」を選択する
ただし、GPT-5.3 Instantは2026年8月頃に廃止予定です。
業務プロセスをGPT-5.3の挙動に合わせて最適化している場合は、この期間内にGPT-5.5 Instantへの切り替え確認を終えることをお勧めします。
なお、Freeプランのユーザーはモデルの切り替えオプション自体がなく、GPT-5.5 Instantのみを使用する形になります。
まとめ
GPT-5.5は、OpenAIが2026年4月23日に発表した最新フラグシップモデルです。
「チャットの賢さを競うAI」から「実務をツールを使いながら最後まで自律的にやり遂げるAI」への転換点となるリリースであり、エージェント的コーディング・PC操作・ナレッジワーク・科学研究の4領域で前モデルGPT-5.4を大幅に上回る性能を発揮しています。
主なポイントをまとめると、以下のとおりです。
- 性能面:Terminal-Bench 2.0で82.7%、GDPvalで84.9%など、多くの指標でGPT-5.4やClaude Opus 4.7を上回る
- 効率面:GPT-5.4と同等の応答速度を維持しながら、同じタスクに必要なトークン数を大幅削減
- モデル構成:標準版・Pro版・Thinking版・Instant版(デフォルト)の4系統で用途に応じた使い分けが可能
- 料金:API標準版(gpt-5.5)は入力$5.00・出力$30.00(100万トークンあたり)。
Plusプランから追加課金なしで利用可能 - GPT-5.5 Instant:全ユーザーにデフォルト適用済み。
ハルシネーション52.5%削減、応答語数30.2%削減、メモリソース機能の新導入 - 安全性:サイバー・生物/化学領域でPreparedness Framework「High」評価。
正当な防御業務向けにはTrusted Access for Cyberの申請が推奨
GPT-5.4を使っている方は、まず長時間コーディング・大規模ドキュメント分析・科学研究など「差が出やすい領域」で並走評価をしてみてください。
短いQ&Aや翻訳など日常的な用途が中心であれば、GPT-5.5 Instantが自動適用されているので、まずは日々の使い勝手の変化を確認するところから始めてみましょう。

