「Codex CLI、Factory CLI、Claude Code──結局どれを使えばいいのか?」
この問いに、 2日間で6000行のコードを生成した実践的検証結果が答えを出しました。
Ian Nuttall氏(フォロワー72,164人)が、OpenAI Codex CLIを徹底的に使い込み、Factory CLI・Claude Codeと詳細比較したレビューが大きな反響を呼んでいます( 16,080閲覧、184いいね、136ブックマーク)。
Ian Nuttallの結論:
「私はやっぱりFactoryの方が好きです。なぜなら、必要な『必須』機能がより多く揃っていて、速くて、プラン機能がとても優れているからです。Claude、Gemini、GPT-5の間で行ったり来たりするためにCLIツールを切り替えたくありません」
– Ian Nuttall @iannuttall(16,080閲覧、184いいね)
この記事では、3つのAIコーディングツールの 真の実力を、実践データに基づき徹底解説します。
OpenAI Codex CLI実践レビュー──2日間6000行コーディングで見えた真の実力
2025年10月、AI開発ツールの最前線で戦う開発者が、Codex CLIの実力を徹底検証しました。
検証者プロフィール:Ian Nuttall氏
- 経歴:連続起業家、複数の6桁・7桁Exit経験
- 専門:AIを使ったソフトウェア開発、インターネットビジネス構築
- SNS影響力:X(Twitter)フォロワー72,164人
- 開発経験:Claude Code、Factory CLI、Cursor、Windsurf等の主要AIツールすべてを実務使用
検証概要:
項目 | 詳細 |
---|---|
検証期間 | 2日間の集中開発 |
生成コード量 | 約6,000行 |
使用モデル | GPT-5 High、Codex High |
コスト | Plus(20ドル)→ Pro(200ドル) |
比較対象 | Factory CLI、Claude Code |
開発内容 | shadcnコンポーネント含むフルスタック開発 |
X(Twitter)での反響:
- 閲覧数:16,080(投稿から数日)
- いいね:184
- ブックマーク:136(高いエンゲージメント率)
- 返信:28(活発な議論)
このレビューが注目される理由は、「実際に2日間使い倒した」実践データに基づく点です。表面的な機能比較ではなく、リアルな開発フローでの使用感が詳細に記録されています。
結論:Factory > Codex > Claude Code──プラン機能が分ける決定的な差
Ian Nuttall氏のTLDR(結論)は明確です:
総合評価ランキング:
- 🥇 Factory CLI:必須機能充実、高速、プラン機能優秀、マルチモデル対応
- 🥈 Codex CLI:コード生成品質はFactory並、コスパ最強、ただしプラン機能欠如
- 🥉 Claude Code:ほとんど使用せず(Claudeデスクトップアプリは使用)
Factory CLIが選ばれた3つの決定的理由:
- 「必須機能」の充実
- プラン機能(計画→実装の明確な分離)
- マルチモデル対応(Claude、Gemini、GPT-5を1つのツールで切替)
- サブエージェント機能(タスクの委譲と報告)
- 速度の優位性
- レスポンスが高速
- ツール切替不要でワークフロー途切れない
- プラン機能の完成度
- GPT-5 Highで計画立案
- Codex Medium/Autoで実装
- この分業が最も効率的
コード出力品質はCodex = Factory:

Ian氏は重要な指摘をしています:
「実際のコード出力は、おそらく同等レベルです。これは主にGPT-5が素晴らしいモデルだからです!」
つまり、差を分けるのは生成AIモデル性能ではなく、ツールの機能設計です。GPT-5を使える両ツールでは、コード品質はほぼ同じ。Factoryが勝つのは「プラン機能」「マルチモデル対応」といった開発体験(DX)の差なのです。
評価項目 | Factory CLI | Codex CLI | Claude Code |
---|---|---|---|
コード品質 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
プラン機能 | ⭐⭐⭐⭐⭐ | ❌ なし | ⭐⭐⭐ |
マルチモデル | ⭐⭐⭐⭐⭐ | ⭐⭐⭐(GPT系のみ) | ❌(Claudeのみ) |
速度 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
コスパ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
UI生成 | ⭐⭐⭐⭐ | ⭐⭐(苦手) | ⭐⭐⭐ |
Codexの圧倒的な5つの強み──Rust製UIとキューイング機能の中毒性
Codex CLIには、他のツールにない独自の強みが5つあります。
1. 絶対的な働き者──無駄のない効率性
Ian氏の評価:
「Codexはまさに絶対的な働き者です。派手さやおしゃべりもなく、ただひたすら効率的に仕事をこなします。本当にタスクを次々と(そしてさらに次々と)処理し続けます」
他のAIコーディングツールは、説明的なメッセージを多く出力し、「今何をしているか」を逐一報告します。これは親切ですが、画面が流れて邪魔になることも。
Codexはchatty(おしゃべり)ではない──必要最小限のメッセージで、黙々とコードを生成し続けます。
2. ミニマリストなUI──ツール呼び出しをリスト表示
「UIは本当に私のミニマリストな性格に合っています。とてもクリーンで、コンパクトで、ツール呼び出しをきちんとしたリストにまとめて、邪魔になりません」
Codex CLIのUIは、ツール呼び出し(ファイル読み込み、編集、実行など)をコンパクトなリスト形式で表示。スクロールバックして確認しやすく、ターミナルが散らかりません。
3. Rust製の安定性──画面ちらつきゼロ、クラッシュなし
「Rustで作られているため、他のCLIとは違い、画面のちらつきが全くなく、結局ターミナルやVS Codeをクラッシュさせることもありません」
多くのAI CLIツールは、Node.js/Pythonベースで、長時間使用すると:
- 画面のちらつき(rendering flicker)
- メモリリーク
- ターミナルクラッシュ
CodexはRustで実装されており、これらの問題が一切ありません。2日間の集中開発でも安定動作。
4. キューイング機能──「フロー状態」への没入感
これが最も中毒性の高い機能です:
「作業中にプロンプトをキューに追加できる機能は、本当に中毒性があり、フロー状態に入りやすいです。アプリを行き来しながら、さらに変更をキューに追加する感覚は、他のCLIでは味わえないものです」
キューイング機能の仕組み:
- Codexがタスクを実行中
- ユーザーは待たずに次のプロンプトを入力
- Codexは現在のタスク完了後、自動的に次のプロンプトを処理
- ユーザーは途切れることなく次々と指示を出せる
この機能により、思考のフロー状態を維持したまま開発できます。「AIの応答を待つ」という時間がなくなり、アイデアを次々と形にできるのです。

5. 実質無限のコンテキストウィンドウ──大量データでも減らない
「コンテキストウィンドウは正直、永遠に続くように感じます。大量のデータを投げ込んで、何度も何度も繰り返しても、ほとんど減りません」
GPT-5のコンテキストウィンドウは128K~200Kトークンですが、Codex CLIはこれを効率的に管理。長時間のセッションでも、コンテキスト不足に陥ることがほぼありません。
Codexの5つの致命的な弱点──プラン機能欠如、UI生成苦手、説明不足
一方で、Codex CLIには深刻な弱点も5つあります。
1. おしゃべり不足──何をしているか分からない問題
「絶対的な働き者」の裏返しです:
「そのおしゃべりの少なさが、ときどき問題になることがあります。何をしているのか、なぜそうしているのかを把握していないと困るんです。私は何が作られているのかを正確に理解したい!」
Codexは説明をほとんどせず、黙々とコードを生成します。これは効率的ですが、意図しない実装が進むリスクがあります。
Claude CodeやFactoryの優位性:
- 「〇〇を実装します」という明確な宣言
- 「なぜこのアプローチを選んだか」の説明
- 実装前の確認プロンプト
Codexにはこれらがなく、開発者が常に監視する必要があります。
2. サンドボックス実行の問題──許可を求めて作業停止
「サンドボックスでコマンドを実行するのに時々問題があって、『それはできませんでした』と返ってくることがあります。強く促すと、許可を求めてくることもあり、これが作業の進捗を遅らせることがあります」
Codexのサンドボックスは、セキュリティを重視しすぎて、時に過剰に制限的です:
- npm installが失敗
- ファイル書き込みが拒否
- 再試行すると許可を求める(一貫性がない)
この問題は、Ian氏の作業フローを何度も中断させました。
3. UI生成が苦手──shadcnコンポーネントで苦戦
「UIに関してはまだあまり得意ではありません。私のせいかもしれませんが、shadcnコンポーネントで苦労しました。llms.txtのURLや多くのドキュメントURLを渡してもです」
Codexはロジック・アルゴリズム重視で、UI/UX生成は苦手です:
- shadcn/ui、Tailwind CSSの適切な使用ができない
- ドキュメントURLを渡しても改善されない
- デザインシステムの理解が浅い
Ian氏の対策:
「コンポーネントへのリンクを取得して、それを使う方法を指示するのが好きだからです。GPT-5は、正確に何をすべきか伝えると本当に優れています」
明確な指示を与えれば、GPT-5は優秀です。ただし、「shadcnを使ってダッシュボードを作って」という曖昧な指示では失敗します。
4. プラン機能の欠如──最大の弱点
これがIan氏が「Factory > Codex」と結論づけた最大の理由です:
「プラン機能がないのは私にとって大きな問題です。私はFactory CLIのプラン機能をGPT-5 Highでよく使って計画を立て、Codex Medium/Autoで実装しています」
プラン機能とは:
- 実装前に「何を作るか」を明確化
- ファイル構成、アーキテクチャ、タスク分解を提示
- ユーザーが承認してから実装開始
Factoryはこの機能が優秀で、GPT-5 Highで計画→Codexで実装というハイブリッドワークフローを可能にします。
Codex単体では、この計画フェーズがなく、いきなり実装が始まるため、方向性の確認が困難です。
(注:Ian氏はGitHub上でプラン機能追加のPRを確認しており、近日中に実装される可能性があります)
5. MCP設定の互換性問題──config.toml独自形式
「mcpサーバーはconfig.tomlに追加されます。この構文は実は結構好きですが、Claude CodeやFactoryの既存のmcp.jsonファイルをシンボリックリンクで使ったり、直接使ったりできないので、移行する必要があります」
Codexはconfig.toml形式、Claude Code/Factoryはmcp.json形式。互換性がなく、ツール切替時に設定を移行する手間が発生します。
ただし、Ian氏は「エージェントに頼めば移行は簡単」と述べており、実害は小さいようです。

Factory CLIが選ばれる3つの理由──マルチモデル対応とプラン機能の完成度
Ian氏が最終的にFactory CLIを選んだ理由を詳細に解説します。
1. 必須機能の充実──開発者が本当に必要とする機能
Ian氏がFactoryを「必須機能が揃っている」と評価した具体的機能:
機能 | Factory CLI | Codex CLI |
---|---|---|
プラン機能 | ✅ 優秀 | ❌ なし(近日追加予定) |
マルチモデル対応 | ✅ Claude、Gemini、GPT-5 | ⚠️ GPT系のみ |
サブエージェント | ✅ あり | ❌ なし(希望あり) |
バックグラウンド実行 | ✅ npm run dev等を管理 | ❌ なし(希望あり) |
モデル切替 | ✅ 簡単 | ⚠️ /model経由 |
2. 速度の優位性──マルチモデル切替で途切れないフロー
Ian氏の重要な指摘:
「Claude、Gemini、GPT-5の間で行ったり来たりするためにCLIツールを切り替えたくありません」
実務では、タスクによって最適なモデルが異なります:
- Claude Sonnet 4.5:複雑なリファクタリング、アーキテクチャ設計
- Gemini 2.5 Pro:大量ファイルの一括処理、長大コンテキスト
- GPT-5 High:プラン作成、数学・アルゴリズム
Factoryは1つのCLIで全モデルを切替可能。Codexは切り替えるたびにツール自体を変える必要があり、作業が途切れます。
3. プラン機能の完成度──Factory(計画)× Codex(実装)
Ian氏の最適ワークフロー:
- Factory CLI(GPT-5 High)でプラン作成
- プランをレビュー・承認
- Codex CLI(Medium/Auto)で実装
この分業により、思考と実行を分離できます:
- Factory:「何を作るか」を明確化
- Codex:「どう作るか」を高速実装
Factory単体でも実装可能ですが、Codexの「絶対的な働き者」性能を活用する方が効率的です。
Claude Codeの現在地──デスクトップアプリは使うがCLIは使わない理由
Ian氏のClaude Code評価は厳しいものでした:
「今はClaude Codeをほとんど使っていませんが(Claudeのデスクトップアプリはよく使います)」
Claude Codeが使われなくなった3つの理由:
1. 単一モデル制約──Claudeしか使えない
Claude Codeは、その名の通りClaudeモデル専用です:
- Claude Sonnet 4.5
- Claude Haiku 4.5
- Claude Opus 4(将来)
GPT-5やGemini 2.5 Proを使いたい場合、ツール切替が必須。これがIan氏の「ツールを切り替えたくない」という要望と衝突します。
2. プラン機能の質──Factoryに劣る
Claude Codeにもプラン機能はありますが、Factoryほど洗練されていないとIan氏は評価します。具体的な差は記載されていませんが、FactoryのGPT-5 Highによるプラン作成の方が優れているようです。
3. 速度──FactoryやCodexより遅い
比較表からも明らかですが、Claude Codeは応答速度で劣ります。長時間の開発セッションでは、この差が蓄積し、生産性に影響します。
Claude Desktopアプリは使用──なぜか?
興味深いのは、Ian氏がClaude CLI は使わないがDesktopアプリは使う点です。理由は明示されていませんが、推測されるユースケース:
- アイデア出し:長文の会話形式でアーキテクチャ議論
- ドキュメント作成:技術仕様書、README等の執筆
- コードレビュー:大量のコードを貼り付けてフィードバック取得
これらはコーディング以外のタスクであり、CLIよりGUI(Desktopアプリ)の方が適しています。

コスト分析:20ドルで6000行──GPT-5 Highの驚異的なコスパ
Ian氏の2日間開発の詳細コストデータを分析します。
使用プラン:Plus(20ドル)→ Pro(200ドル)
項目 | Plus(20ドル/月) | Pro(200ドル/月) |
---|---|---|
達成コード量 | 約6,000行(2日間) | 制限到達直後アップグレード |
使用モデル | GPT-5 High、Codex High | 同上 |
制限 | 「非常に寛大」と評価 | 週制限あり(10分で復活) |
コスパ | 1行あたり約0.33円 | 未検証 |
コスト効率の詳細分析:
「制限は非常に、非常に寛大に感じます。GPT-5 HighとCodex Highを使って2日間ガッツリと重いコーディングをしましたが、20ドルで約6000行のコードを複数のセッションで処理して、ようやく制限に達しました」
計算:
- Plus(20ドル)で6,000行生成
- 1行あたり約0.33円(20ドル ÷ 6,000行)
- 人間開発者が同量のコードを書く時間:2-3週間(推定)
- 時給換算すると数千円/時間の価値
これは驚異的なコストパフォーマンスです。

Pro(200ドル)へのアップグレード問題:
Ian氏はPlusの制限到達後、Proにアップグレードしましたが:
「Plusプランの制限に達したのでProにアップグレードして200ドル払いましたが、それでも週の制限に達したと言われ、2日待たないとまた作業ができないと言われました :((注:約10分後には復活して作業を再開できました!)」
この問題は一時的なバグだったようで、10分後に解決しました。ただし、アップグレード直後にこの問題が起きるのはUX上の課題です。
他のCLIとのコスト比較:
ツール | プラン | 月額 | 制限感 |
---|---|---|---|
Codex CLI Plus | Plus | 20ドル | ⭐⭐⭐⭐⭐ 非常に寛大 |
Codex CLI Pro | Pro | 200ドル | ⭐⭐⭐⭐⭐ さらに寛大 |
Factory CLI | 不明 | 不明 | ⭐⭐⭐⭐ 寛大 |
Claude Code | Pro | 20ドル | ⭐⭐⭐ 普通 |
Codex CLIは、コスパで他を圧倒しています。
最適なワークフロー──Factory(計画)× Codex(実装)のハイブリッド戦略
Ian氏の実践から導かれる最適解は、単一ツール使用ではなく、ハイブリッド戦略です。
推奨ワークフロー:
- Factory CLI(GPT-5 High)でプラン作成
- タスク分解
- ファイル構成設計
- アーキテクチャ決定
- 実装順序の最適化
- プランをレビュー・調整
- 開発者が要件を確認
- 必要に応じて修正指示
- Codex CLI(Medium/Auto)で実装
- プランに従って黙々とコード生成
- キューイング機能で連続指示
- フロー状態で高速開発
- 必要に応じてClaude Desktopアプリでレビュー
- 生成コードの品質確認
- リファクタリング提案
- ドキュメント作成
このハイブリッドが最強な理由:
フェーズ | 最適ツール | 理由 |
---|---|---|
計画 | Factory(GPT-5 High) | プラン機能の完成度、GPT-5の計画力 |
実装 | Codex(Medium/Auto) | 高速、chattyでない効率性、キューイング |
レビュー | Claude Desktop | 長文レビュー、GUI操作の快適さ |
UI調整 | 手動 or Factory | CodexのUI苦手を補完 |
今後のCodex改善に期待:
Ian氏が指摘した「欲しい機能」:
- プラン機能:GitHubにPRあり、近日実装予定
- サブエージェント:タスク委譲と報告機能
- バックグラウンドコマンド:npm run devを別プロセスで管理
- モデル切替ショートカット:/model不要でキーボードショートカット対応
これらが実装されれば、Codex単体での完結も可能になります。
Ian Nuttallからの最終アドバイス:
「実際のコード出力は、ツールではなくモデル(GPT-5)の品質で決まる。差を分けるのは『プラン機能』『マルチモデル対応』『開発体験』だ。今はFactory(計画)× Codex(実装)のハイブリッドが最強だが、Codexのプラン機能追加後は状況が変わる可能性がある」
まとめ:2025年AI CLIツール選択ガイド──あなたに最適なツールは?
Ian Nuttall氏の2日間6000行検証から得られた結論をまとめます。
この記事の要点:
- Factory CLIが総合1位:プラン機能、マルチモデル対応、速度で優位
- Codex CLIは実装特化:コスパ最強、キューイング機能が中毒性、ただしプラン機能欠如
- Claude Code CLIは使用せず:単一モデル制約、速度で劣る(Desktopアプリは使用)
- 最適ワークフロー:Factory(計画)× Codex(実装)× Claude Desktop(レビュー)
- コスパ王者:Codex CLI Plus(20ドルで6000行)
ツール選択フローチャート:
優先事項 | 推奨ツール |
---|---|
計画→実装の明確な分離が必要 | Factory CLI |
Claude、Gemini、GPT-5を使い分けたい | Factory CLI |
とにかく安く大量のコードを生成 | Codex CLI Plus(20ドル) |
キューイングでフロー状態重視 | Codex CLI |
Rust製の安定性が必須 | Codex CLI |
UI/UX開発がメイン | Factory CLI(CodexはUI苦手) |
Claude専用で十分 | Claude Code |
今後の展望:
- Codexプラン機能追加でFactory不要になる可能性
- マルチモデル対応が進めば、ツール統一が進む
- コスト競争が激化し、さらに低価格化
- UI生成能力の改善が各ツールの課題
2027年には、単一ツールで全て完結する時代が来るかもしれません。しかし2025年現在は、ハイブリッド戦略が最も効率的です。
コメント