画像生成も音声入力もこなす万能AIエージェント「Codex」を整理する
こんにちは。開発二部の箕浦です。
このブログでは Claude Code を何度か取り上げてきました。
今回はその流れで、OpenAIの 「Codex(コーデックス)」 を整理してみます。
Codexというと「コーディング特化のツール」という印象が強いかもしれませんが、最近触ってみたら機能が一気に増えていて、 画像生成・音声入力・スライド作成・簡単な動画作成まで こなす“万能AIエージェント”に化けていました。
発表当初に比べると話し方や実行時間といった弱点もかなり改善されていて、今は一般的な業務にもおすすめしやすいツールになっています。情報量が多いので、現時点(2026年6月)の全体像をカテゴリーごとに整理しておきます。
Codexとは何か
Codexは、コーディングだけでなく さまざまなタスクをこなすOpenAIのAIエージェント です。ざっくり言うと「デジタル上のほとんどの仕事を自分で考えて完遂してくれるツール」という立ち位置です。
主にできることは以下のとおりです。
- 表計算ソフトでの データ集計・グラフ作成・スライド作成
- 高性能な画像生成機能 「GPT Image 2」 による画像づくり
- 簡単な動画作成
- さまざまな形式のデータを読み込み、 自ら思考して新しいデータを生成
単にテキストを返すだけでなく、与えられたデータをもとに考え、成果物としてアウトプットまで持っていける汎用性の高さが特徴です。
料金とOS対応
| 項目 | 内容 |
|---|---|
| 無料プラン | 利用は可能だが制限が厳しく、賢いモデルが使えない |
| Goプラン(月額8ドル〜) | 軽めのコーディング向けの低価格プラン |
| Plusプラン(月額20ドル〜) | 実用ラインとして推奨。まずはここから |
| Proプラン(月額100ドル〜) | Plus比5倍/20倍の利用制限に加え、高速モデル GPT-5.3-Codex-Spark(リサーチプレビュー)が使える |
| 対応OS | Windows / Mac。ただし一部機能(後述のAppshotなど)はMacのみ |
PlusとProの主な違いは 利用制限(レート) です。
まずはPlusプランで使い勝手を確かめて、制限に物足りなさを感じたらProを検討する、という流れが無難だと思います。
他のAIエージェントと比べたときの強み
Codexならではの強みとして、digestや実際に触った感触で挙がってくるのは次のあたりです。
- レート制限が緩め ─ 他社製品と比べて利用量の上限が緩やかで、ガンガン回しやすい
- 最強クラスの画像生成「GPT Image 2」(
GPT-Image-2) ─ 低価格でこの品質はかなりお得。複数画像を一度の指示でまとめて生成できる - 高精度な音声入力 ─ 音声入力ソフトとしても使える
- 「Computer Use」が優秀 ─ デスクトップアプリを操作できる(リスクは伴う / 後述)
- GPT-5.5 + エージェント性能 ─ 複雑な要件のタスクでもミスなくこなす安心感がある
一方で、 ClaudeとCodexは使い分けるのが現実的 です。
Claude Codeで数時間かかったタスクがCodexであっさり解決したこともあれば、その逆もあります。UIデザインや文章の自然さではClaudeのほうが好まれる場面もあります。
タスクの性質によって得意・不得意が分かれるので、両方を持っておいて使い分けるのが良さそうです。とはいえ画像生成のコスパまで含めると、Codexは特に「人にすすめやすい」ツールだと感じます。
デスクトップアプリの基本
ここからは、Codexデスクトップアプリの使い方を整理していきます。
インストールとプロジェクト
- 指定ページからインストーラーをダウンロードし、指示に従ってインストール
- 最後に ChatGPTアカウントでログイン
- 作業の単位となる 「プロジェクト」 を作成する(左上のフォルダーアイコン →「最初から始める」→ フォルダー名を入力)
プロジェクトはフォルダーのようなもので、 作業履歴がそこに蓄積 されていきます。

基本的なタスク実行の流れ
実際の使い方は、チャット欄に自然文で指示を出すだけです。たとえばこんな流れが組めます。
- リサーチ → Markdown化
「Codexデスクトップアプリの現状の機能を網羅的にリサーチし、Markdownファイルに結果をまとめてください」と入力すると、Web検索を踏まえた解説を.mdで生成してくれます。 - Markdown → スライド化
チャット欄で@ファイル名を指定して先ほどのMarkdownを読み込ませ、「この資料をもとにスライドをHTMLで作成して」と指示すると、HTML形式のスライドを生成してブラウザで開いてくれます。 - スライドに画像を生成して差し込み
「画像を足すページを指定して、そのページに合った画像を生成してスライドに差し込んで」と頼めば、画像生成まで一気通貫でやってくれます。
Codexの動作原理
Codexの仕事の流れは、AIエージェントの基本パターンそのものです。
人間の指示(プロンプト) → 思考(情報収集・作業) → 結果確認 → 再思考 → 完了判断
このループを回しながら、Web検索やPC内のファイルから情報を集め、MarkdownやHTMLとして成果物を出力します。
機能群も、この流れに沿って 「指示の出し方」「考え方・進め方」「情報の取得先・作業対象」「成果物の確認しやすさ」 の4カテゴリーで捉えると見通しが良くなります。以降はこの観点で各機能を見ていきます。
チャット欄の機能
指示出しの起点となるチャット欄には、地味に便利な機能が詰まっています。
ファイル添付とAppshot
- PCからのファイルアップロード、チャット欄への画像・ファイルの コピペ渡し が可能
- Appshot … 直前に使っていたアプリのスクリーンショットを撮って渡せる機能。Webサイトの内容なども正確に把握させられます。 現状はMacのみ 対応で、ショートカットキー(左+右コマンドキー)からも呼び出せます
権限とサンドボックス
Codexが操作できる範囲は サンドボックス で制御されます。デフォルトでは「開いているプロジェクト内のみ読み書き可、範囲外の操作は承認が必要」という安全側の設定です。
権限モードは3種類あります。
| モード | 挙動 |
|---|---|
| 承認を求める | サンドボックス内は自動実行、範囲外は都度承認を求める |
| 代理で承認 | 上記に加え、承認が必要なコマンドをレビュー用AIが確認し、リスクの低いものは自動承認 |
| フルアクセス | サンドボックスを超えてどこでも実行可能になる |
繰り返しの承認(認証疲れ)を避けつつ安全性も保てる 「自動レビュー」が一番バランスが良い とされています。

インテリジェンス・モデル・速度
- インテリジェンス(思考レベル) … 低 / 中 / 高 / 非常に高い の4段階。高いほど賢いが時間もかかる。普段は 「高」か「中」、複雑な設計時に「非常に高い」が有効
- モデル … 基本は
GPT-5.5を選んでおけばOK - 速度 … 標準 / 高速の2種類。高速は作業が1.5倍速になる代わりに 利用制限の消費が2.5倍。レートに余裕があり速さを優先したいときだけ選ぶ

音声入力と作業場所
- 音声入力 … チャット欄のボタンから高精度な音声入力が使える。ショートカットを設定すればCodex以外のアプリでも利用可能
- 作業場所 … 実行するプロジェクトや、 ローカル(PC) / クラウド環境 の切り替え、ブランチの切り替えが可能。クラウドやブランチを使うにはGit / GitHubの知識が必要
知っておくと便利な小技
- ステア / キュー … AIが作業中にメッセージを送ったときの挙動を選べる。 ステア は割り込ませて現行作業に反映(成果物の途中修正に便利)、 キュー は保留して作業完了後に自動送信。デフォルトはステア
- 会話の分岐 … メッセージにホバーして表示される分岐アイコンから、特定の時点を起点に新しいセッションを作れる
- スラッシュコマンド … チャット欄で
/を入力すると各種機能を呼び出せる
Codexを賢く働かせる機能
ここからは、より高度・効率的に動かすための機能です。
プランモードとゴールモード
- プランモード … 着手前に綿密な計画を立てる機能。プラスボタンからオンにして指示を送ると要件確認の質問が来て、回答をもとに詳細なプランを作成 → 人間がレビュー・修正できます。認識ズレを防ぎたい大きめの仕事に有効です
- ゴールモード … 設定したゴールを達成するまで 数日間でも稼働し続ける モード。
Codex Features Enableコマンドで有効化し、プラスボタンから「目標を目指す」を選択。長時間タスクや、明確な終了基準があって自己検証できる仕事に向きますが、 利用制限の消費は増えやすい ので注意

メモリーとAGENTS.md
Codexに“記憶”を持たせる方法は2系統あります。
- メモリー … 過去の作業から役立つ情報(繰り返しの手順、プロジェクトの癖、過去の落とし穴など)を 自動で記憶・持ち越す 機能。デフォルトはオフで、設定画面から有効化します。中身はユーザーが直接コントロールはできません
- AGENTS.md … プロジェクトの“取扱説明書”として ユーザーが明示的に書く ファイル。構成や必ず守ってほしい事項を記述しておきます。これはClaude CodeのSkillsで扱った「手順を明文化して読み込ませる」発想に近く、 絶対に守らせたいルールはこのファイルに書く のが定石です
コンパクション(会話履歴の要約)
会話が長くなると、AIが一度に読めるメッセージ長の制限に当たります。これに対応するのが コンパクション です。
- 一定量を超えると 自動で要約 が走り(「コンテキストを圧縮中」と表示)、重要な情報を保ったままセッションを継続できる
- スラッシュコマンドの「圧縮」から 手動で強制実行 することも可能
サイドパネルによる作業補助
サイドパネルは、人間がCodexの作業を理解し、自分の作業を進めるための機能群です。
- ファイル確認 / サイドチャット … プロジェクトのフォルダー・ファイルを確認でき(アプリ内では閲覧のみ・編集は不可)、内容をチャットに追加可能。メイン作業とは別に 並列でやり取りできるサイドチャット もあり、ステアで本筋を止めずに進捗確認などができます
- アプリ内ブラウザ / 注釈 … アプリ内ブラウザでサイトを開け、Codexの生成物確認や検索に使えます。ブラウザ内の要素を選んで 注釈 を付ければ、「このタイトルを小さく」のようにピンポイントで指示でき、ボタン一つでスクリーンショットも撮れます
- レビュー / ターミナル … Codexが加えた 変更点だけ を表示して箇所を指定したフィードバックができ、アプリ内のターミナルから開発サーバーの起動などのコマンド操作も可能です
能力拡張:プラグインとスキル
Codexは、外部サービスとの連携や業務マニュアルの付与によって能力を拡張できます。
プラグイン
外部サービス連携やアプリ連携をまとめたものが プラグイン です。アプリ左上のプラグイン一覧から選んでインストールし、チャット欄で @プラグイン名 を指定して使います。
代表的なものとして、
- Computer Use … Codexが他のデスクトップアプリを操作できる機能。自動化に強力ですが、操作権限の付与・ 機密情報の漏えい・悪意ある指示の実行といったリスクがあるため慎重に
- Remotion … プログラミングで動画を作成できるツール。スライドを元に動画を作る例が紹介されています
スキル
スキル は、AIエージェント向けの“業務マニュアル”です。仕事の手順や品質基準を書いておくと、Codexがそれを読み込んで作業します。画像生成・スキル作成・ブラウザ操作などが標準で用意されています。
- 作成 … スキル用のディレクトリにスキルごとのフォルダーを作り、手順を書いたMarkdownを置きます。全プロジェクト共通の グローバル と プロジェクト固有 の置き場所があり、Codex自身が「スキルを作るスキル」を持っているので、フォーマットどおりに作成を依頼できます
- 利用 … 生成したスキルを読み込めば同じ手順を再現でき、スラッシュコマンドでスキル名を明示すると確実に呼び出せます
このあたりは、Claude CodeのSkillsとほぼ同じ思想で、 「人に仕事を教えるようにAIへ手順を渡す」 流れが各ツールで共通になってきているのが面白いところです。
操作の起点を増やす:自動化とモバイル
最後に、Codexを動かす“きっかけ(トリガー)”を増やす機能です。
- オートメーション(定期実行) … 指定時刻にタスクを自動実行。たとえば「毎朝10時にAI関連ニュースを集めて楽しく読める感じでまとめて」と設定すれば、毎日その時間に収集・要約してくれます。ただし 実行時にPCとCodexアプリが起動している必要がある ため、自分が起きている・働いている時間帯にセットするのが現実的です
- Codexモバイル … スマホからPC上のCodexを操作する機能。ChatGPTアプリで同じアカウントにログイン → QRコードで認証 → PCが緑マークになれば接続完了で、外出先から画像生成などの指示をPC側で実行できます。 PCが常時稼働している前提 の機能です
外出先からPC作業を進められるのは便利な反面、digestでは「人間として大事な何かを失う可能性がある」という(半分冗談まじりの)注意喚起もありました。便利さと“常時つながり続けること”のバランスは、各自で意識しておきたいところです。
まとめ
かつてのCodexは「コーディング性能は高いが、話し方や実行時間にクセがある」ツールでした。
それが今では弱点が大きく改善され、 画像生成・音声入力・スライド作成といった一般ユーザー向けの機能まで充実した万能AIエージェント になっています。
特に、
- レート制限が緩く ガンガン使える
- GPT Image 2 による低価格・高品質な画像生成
- プランモード / ゴールモード / スキル / プラグインといった エージェントを賢く働かせる仕組み が一通りそろっている
あたりは、Claude CodeやCopilotと並べて持っておく価値が十分にあると感じます。
ClaudeとCodexは得意分野が分かれるので、 「タスクごとに使い分ける」 のが今の正解だと思います。
弊社でも実案件で回してみて、知見がたまったらまた続報をお届けします。
