【Codex CLI徹底検証】Factory・Claude Code比較──2日間6000行開発で見えた決定的な差

「Codex CLI、Factory CLI、Claude Code──結局どれを使えばいいのか?」

この問いに、 2日間で6000行のコードを生成した実践的検証結果が答えを出しました。

Ian Nuttall氏(フォロワー72,164人)が、OpenAI Codex CLIを徹底的に使い込み、Factory CLI・Claude Codeと詳細比較したレビューが大きな反響を呼んでいます( 16,080閲覧、184いいね、136ブックマーク)。

Ian Nuttallの結論:

「私はやっぱりFactoryの方が好きです。なぜなら、必要な『必須』機能がより多く揃っていて、速くて、プラン機能がとても優れているからです。Claude、Gemini、GPT-5の間で行ったり来たりするためにCLIツールを切り替えたくありません」

– Ian Nuttall @iannuttall(16,080閲覧、184いいね)

この記事では、3つのAIコーディングツールの 真の実力を、実践データに基づき徹底解説します。

目次

OpenAI Codex CLI実践レビュー──2日間6000行コーディングで見えた真の実力

2025年10月、AI開発ツールの最前線で戦う開発者が、Codex CLIの実力を徹底検証しました。

検証者プロフィール:Ian Nuttall氏

  • 経歴:連続起業家、複数の6桁・7桁Exit経験
  • 専門:AIを使ったソフトウェア開発、インターネットビジネス構築
  • SNS影響力:X(Twitter)フォロワー72,164人
  • 開発経験:Claude Code、Factory CLI、Cursor、Windsurf等の主要AIツールすべてを実務使用

検証概要:

項目 詳細
検証期間 2日間の集中開発
生成コード量 約6,000行
使用モデル GPT-5 High、Codex High
コスト Plus(20ドル)→ Pro(200ドル)
比較対象 Factory CLI、Claude Code
開発内容 shadcnコンポーネント含むフルスタック開発

X(Twitter)での反響:

  • 閲覧数:16,080(投稿から数日)
  • いいね:184
  • ブックマーク:136(高いエンゲージメント率)
  • 返信:28(活発な議論)

このレビューが注目される理由は、「実際に2日間使い倒した」実践データに基づく点です。表面的な機能比較ではなく、リアルな開発フローでの使用感が詳細に記録されています。

結論:Factory > Codex > Claude Code──プラン機能が分ける決定的な差

Ian Nuttall氏のTLDR(結論)は明確です:

総合評価ランキング:

  1. 🥇 Factory CLI:必須機能充実、高速、プラン機能優秀、マルチモデル対応
  2. 🥈 Codex CLI:コード生成品質はFactory並、コスパ最強、ただしプラン機能欠如
  3. 🥉 Claude Code:ほとんど使用せず(Claudeデスクトップアプリは使用)

Factory CLIが選ばれた3つの決定的理由:

  1. 「必須機能」の充実
    • プラン機能(計画→実装の明確な分離)
    • マルチモデル対応(Claude、Gemini、GPT-5を1つのツールで切替)
    • サブエージェント機能(タスクの委譲と報告)
  2. 速度の優位性
    • レスポンスが高速
    • ツール切替不要でワークフロー途切れない
  3. プラン機能の完成度
    • GPT-5 Highで計画立案
    • Codex Medium/Autoで実装
    • この分業が最も効率的

コード出力品質はCodex = Factory:

Codex vs Factory vs Claude Code 総合比較表

Ian氏は重要な指摘をしています:

「実際のコード出力は、おそらく同等レベルです。これは主にGPT-5が素晴らしいモデルだからです!」

つまり、差を分けるのは生成AIモデル性能ではなく、ツールの機能設計です。GPT-5を使える両ツールでは、コード品質はほぼ同じ。Factoryが勝つのは「プラン機能」「マルチモデル対応」といった開発体験(DX)の差なのです。

評価項目 Factory CLI Codex CLI Claude Code
コード品質 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐
プラン機能 ⭐⭐⭐⭐⭐ ❌ なし ⭐⭐⭐
マルチモデル ⭐⭐⭐⭐⭐ ⭐⭐⭐(GPT系のみ) ❌(Claudeのみ)
速度 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐
コスパ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐
UI生成 ⭐⭐⭐⭐ ⭐⭐(苦手) ⭐⭐⭐

Codexの圧倒的な5つの強み──Rust製UIとキューイング機能の中毒性

Codex CLIには、他のツールにない独自の強みが5つあります。

1. 絶対的な働き者──無駄のない効率性

Ian氏の評価:

「Codexはまさに絶対的な働き者です。派手さやおしゃべりもなく、ただひたすら効率的に仕事をこなします。本当にタスクを次々と(そしてさらに次々と)処理し続けます」

他のAIコーディングツールは、説明的なメッセージを多く出力し、「今何をしているか」を逐一報告します。これは親切ですが、画面が流れて邪魔になることも。

Codexはchatty(おしゃべり)ではない──必要最小限のメッセージで、黙々とコードを生成し続けます。

2. ミニマリストなUI──ツール呼び出しをリスト表示

「UIは本当に私のミニマリストな性格に合っています。とてもクリーンで、コンパクトで、ツール呼び出しをきちんとしたリストにまとめて、邪魔になりません」

Codex CLIのUIは、ツール呼び出し(ファイル読み込み、編集、実行など)をコンパクトなリスト形式で表示。スクロールバックして確認しやすく、ターミナルが散らかりません。

3. Rust製の安定性──画面ちらつきゼロ、クラッシュなし

「Rustで作られているため、他のCLIとは違い、画面のちらつきが全くなく、結局ターミナルやVS Codeをクラッシュさせることもありません」

多くのAI CLIツールは、Node.js/Pythonベースで、長時間使用すると:

  • 画面のちらつき(rendering flicker)
  • メモリリーク
  • ターミナルクラッシュ

CodexはRustで実装されており、これらの問題が一切ありません。2日間の集中開発でも安定動作。

4. キューイング機能──「フロー状態」への没入感

これが最も中毒性の高い機能です:

「作業中にプロンプトをキューに追加できる機能は、本当に中毒性があり、フロー状態に入りやすいです。アプリを行き来しながら、さらに変更をキューに追加する感覚は、他のCLIでは味わえないものです」

キューイング機能の仕組み:

  1. Codexがタスクを実行中
  2. ユーザーは待たずに次のプロンプトを入力
  3. Codexは現在のタスク完了後、自動的に次のプロンプトを処理
  4. ユーザーは途切れることなく次々と指示を出せる

この機能により、思考のフロー状態を維持したまま開発できます。「AIの応答を待つ」という時間がなくなり、アイデアを次々と形にできるのです。

Codex CLIの圧倒的な5つの強み

5. 実質無限のコンテキストウィンドウ──大量データでも減らない

「コンテキストウィンドウは正直、永遠に続くように感じます。大量のデータを投げ込んで、何度も何度も繰り返しても、ほとんど減りません」

GPT-5のコンテキストウィンドウは128K~200Kトークンですが、Codex CLIはこれを効率的に管理。長時間のセッションでも、コンテキスト不足に陥ることがほぼありません。

Codexの5つの致命的な弱点──プラン機能欠如、UI生成苦手、説明不足

一方で、Codex CLIには深刻な弱点も5つあります。

1. おしゃべり不足──何をしているか分からない問題

「絶対的な働き者」の裏返しです:

「そのおしゃべりの少なさが、ときどき問題になることがあります。何をしているのか、なぜそうしているのかを把握していないと困るんです。私は何が作られているのかを正確に理解したい!」

Codexは説明をほとんどせず、黙々とコードを生成します。これは効率的ですが、意図しない実装が進むリスクがあります。

Claude CodeやFactoryの優位性:

  • 「〇〇を実装します」という明確な宣言
  • 「なぜこのアプローチを選んだか」の説明
  • 実装前の確認プロンプト

Codexにはこれらがなく、開発者が常に監視する必要があります。

2. サンドボックス実行の問題──許可を求めて作業停止

「サンドボックスでコマンドを実行するのに時々問題があって、『それはできませんでした』と返ってくることがあります。強く促すと、許可を求めてくることもあり、これが作業の進捗を遅らせることがあります」

Codexのサンドボックスは、セキュリティを重視しすぎて、時に過剰に制限的です:

  • npm installが失敗
  • ファイル書き込みが拒否
  • 再試行すると許可を求める(一貫性がない)

この問題は、Ian氏の作業フローを何度も中断させました。

3. UI生成が苦手──shadcnコンポーネントで苦戦

「UIに関してはまだあまり得意ではありません。私のせいかもしれませんが、shadcnコンポーネントで苦労しました。llms.txtのURLや多くのドキュメントURLを渡してもです」

Codexはロジック・アルゴリズム重視で、UI/UX生成は苦手です:

  • shadcn/ui、Tailwind CSSの適切な使用ができない
  • ドキュメントURLを渡しても改善されない
  • デザインシステムの理解が浅い

Ian氏の対策:

「コンポーネントへのリンクを取得して、それを使う方法を指示するのが好きだからです。GPT-5は、正確に何をすべきか伝えると本当に優れています」

明確な指示を与えれば、GPT-5は優秀です。ただし、「shadcnを使ってダッシュボードを作って」という曖昧な指示では失敗します。

4. プラン機能の欠如──最大の弱点

これがIan氏が「Factory > Codex」と結論づけた最大の理由です:

「プラン機能がないのは私にとって大きな問題です。私はFactory CLIのプラン機能をGPT-5 Highでよく使って計画を立て、Codex Medium/Autoで実装しています」

プラン機能とは:

  • 実装前に「何を作るか」を明確化
  • ファイル構成、アーキテクチャ、タスク分解を提示
  • ユーザーが承認してから実装開始

Factoryはこの機能が優秀で、GPT-5 Highで計画→Codexで実装というハイブリッドワークフローを可能にします。

Codex単体では、この計画フェーズがなく、いきなり実装が始まるため、方向性の確認が困難です。

(注:Ian氏はGitHub上でプラン機能追加のPRを確認しており、近日中に実装される可能性があります)

5. MCP設定の互換性問題──config.toml独自形式

「mcpサーバーはconfig.tomlに追加されます。この構文は実は結構好きですが、Claude CodeやFactoryの既存のmcp.jsonファイルをシンボリックリンクで使ったり、直接使ったりできないので、移行する必要があります」

Codexはconfig.toml形式、Claude Code/Factoryはmcp.json形式。互換性がなく、ツール切替時に設定を移行する手間が発生します。

ただし、Ian氏は「エージェントに頼めば移行は簡単」と述べており、実害は小さいようです。

Codex CLIの5つの致命的な弱点

Factory CLIが選ばれる3つの理由──マルチモデル対応とプラン機能の完成度

Ian氏が最終的にFactory CLIを選んだ理由を詳細に解説します。

1. 必須機能の充実──開発者が本当に必要とする機能

Ian氏がFactoryを「必須機能が揃っている」と評価した具体的機能:

機能 Factory CLI Codex CLI
プラン機能 ✅ 優秀 ❌ なし(近日追加予定)
マルチモデル対応 ✅ Claude、Gemini、GPT-5 ⚠️ GPT系のみ
サブエージェント ✅ あり ❌ なし(希望あり)
バックグラウンド実行 ✅ npm run dev等を管理 ❌ なし(希望あり)
モデル切替 ✅ 簡単 ⚠️ /model経由

2. 速度の優位性──マルチモデル切替で途切れないフロー

Ian氏の重要な指摘:

「Claude、Gemini、GPT-5の間で行ったり来たりするためにCLIツールを切り替えたくありません」

実務では、タスクによって最適なモデルが異なります

  • Claude Sonnet 4.5:複雑なリファクタリング、アーキテクチャ設計
  • Gemini 2.5 Pro:大量ファイルの一括処理、長大コンテキスト
  • GPT-5 High:プラン作成、数学・アルゴリズム

Factoryは1つのCLIで全モデルを切替可能。Codexは切り替えるたびにツール自体を変える必要があり、作業が途切れます。

3. プラン機能の完成度──Factory(計画)× Codex(実装)

Ian氏の最適ワークフロー:

  1. Factory CLI(GPT-5 High)でプラン作成
  2. プランをレビュー・承認
  3. Codex CLI(Medium/Auto)で実装

この分業により、思考と実行を分離できます:

  • Factory:「何を作るか」を明確化
  • Codex:「どう作るか」を高速実装

Factory単体でも実装可能ですが、Codexの「絶対的な働き者」性能を活用する方が効率的です。

Claude Codeの現在地──デスクトップアプリは使うがCLIは使わない理由

Ian氏のClaude Code評価は厳しいものでした:

「今はClaude Codeをほとんど使っていませんが(Claudeのデスクトップアプリはよく使います)」

Claude Codeが使われなくなった3つの理由:

1. 単一モデル制約──Claudeしか使えない

Claude Codeは、その名の通りClaudeモデル専用です:

  • Claude Sonnet 4.5
  • Claude Haiku 4.5
  • Claude Opus 4(将来)

GPT-5やGemini 2.5 Proを使いたい場合、ツール切替が必須。これがIan氏の「ツールを切り替えたくない」という要望と衝突します。

2. プラン機能の質──Factoryに劣る

Claude Codeにもプラン機能はありますが、Factoryほど洗練されていないとIan氏は評価します。具体的な差は記載されていませんが、FactoryのGPT-5 Highによるプラン作成の方が優れているようです。

3. 速度──FactoryやCodexより遅い

比較表からも明らかですが、Claude Codeは応答速度で劣ります。長時間の開発セッションでは、この差が蓄積し、生産性に影響します。

Claude Desktopアプリは使用──なぜか?

興味深いのは、Ian氏がClaude CLI は使わないがDesktopアプリは使う点です。理由は明示されていませんが、推測されるユースケース:

  • アイデア出し:長文の会話形式でアーキテクチャ議論
  • ドキュメント作成:技術仕様書、README等の執筆
  • コードレビュー:大量のコードを貼り付けてフィードバック取得

これらはコーディング以外のタスクであり、CLIよりGUI(Desktopアプリ)の方が適しています。

Factory×Codex ハイブリッドワークフロー図

コスト分析:20ドルで6000行──GPT-5 Highの驚異的なコスパ

Ian氏の2日間開発の詳細コストデータを分析します。

使用プラン:Plus(20ドル)→ Pro(200ドル)

項目 Plus(20ドル/月) Pro(200ドル/月)
達成コード量 約6,000行(2日間) 制限到達直後アップグレード
使用モデル GPT-5 High、Codex High 同上
制限 「非常に寛大」と評価 週制限あり(10分で復活)
コスパ 1行あたり約0.33円 未検証

コスト効率の詳細分析:

「制限は非常に、非常に寛大に感じます。GPT-5 HighとCodex Highを使って2日間ガッツリと重いコーディングをしましたが、20ドルで約6000行のコードを複数のセッションで処理して、ようやく制限に達しました」

計算:

  • Plus(20ドル)で6,000行生成
  • 1行あたり約0.33円(20ドル ÷ 6,000行)
  • 人間開発者が同量のコードを書く時間:2-3週間(推定)
  • 時給換算すると数千円/時間の価値

これは驚異的なコストパフォーマンスです。

Codex CLI Plus コスト分析グラフ

Pro(200ドル)へのアップグレード問題:

Ian氏はPlusの制限到達後、Proにアップグレードしましたが:

「Plusプランの制限に達したのでProにアップグレードして200ドル払いましたが、それでも週の制限に達したと言われ、2日待たないとまた作業ができないと言われました :((注:約10分後には復活して作業を再開できました!)」

この問題は一時的なバグだったようで、10分後に解決しました。ただし、アップグレード直後にこの問題が起きるのはUX上の課題です。

他のCLIとのコスト比較:

ツール プラン 月額 制限感
Codex CLI Plus Plus 20ドル ⭐⭐⭐⭐⭐ 非常に寛大
Codex CLI Pro Pro 200ドル ⭐⭐⭐⭐⭐ さらに寛大
Factory CLI 不明 不明 ⭐⭐⭐⭐ 寛大
Claude Code Pro 20ドル ⭐⭐⭐ 普通

Codex CLIは、コスパで他を圧倒しています。

最適なワークフロー──Factory(計画)× Codex(実装)のハイブリッド戦略

Ian氏の実践から導かれる最適解は、単一ツール使用ではなく、ハイブリッド戦略です。

推奨ワークフロー:

  1. Factory CLI(GPT-5 High)でプラン作成
    • タスク分解
    • ファイル構成設計
    • アーキテクチャ決定
    • 実装順序の最適化
  2. プランをレビュー・調整
    • 開発者が要件を確認
    • 必要に応じて修正指示
  3. Codex CLI(Medium/Auto)で実装
    • プランに従って黙々とコード生成
    • キューイング機能で連続指示
    • フロー状態で高速開発
  4. 必要に応じてClaude Desktopアプリでレビュー
    • 生成コードの品質確認
    • リファクタリング提案
    • ドキュメント作成

このハイブリッドが最強な理由:

フェーズ 最適ツール 理由
計画 Factory(GPT-5 High) プラン機能の完成度、GPT-5の計画力
実装 Codex(Medium/Auto) 高速、chattyでない効率性、キューイング
レビュー Claude Desktop 長文レビュー、GUI操作の快適さ
UI調整 手動 or Factory CodexのUI苦手を補完

今後のCodex改善に期待:

Ian氏が指摘した「欲しい機能」:

  1. プラン機能:GitHubにPRあり、近日実装予定
  2. サブエージェント:タスク委譲と報告機能
  3. バックグラウンドコマンド:npm run devを別プロセスで管理
  4. モデル切替ショートカット:/model不要でキーボードショートカット対応

これらが実装されれば、Codex単体での完結も可能になります。

Ian Nuttallからの最終アドバイス:

「実際のコード出力は、ツールではなくモデル(GPT-5)の品質で決まる。差を分けるのは『プラン機能』『マルチモデル対応』『開発体験』だ。今はFactory(計画)× Codex(実装)のハイブリッドが最強だが、Codexのプラン機能追加後は状況が変わる可能性がある」

まとめ:2025年AI CLIツール選択ガイド──あなたに最適なツールは?

Ian Nuttall氏の2日間6000行検証から得られた結論をまとめます。

この記事の要点:

  • Factory CLIが総合1位:プラン機能、マルチモデル対応、速度で優位
  • Codex CLIは実装特化:コスパ最強、キューイング機能が中毒性、ただしプラン機能欠如
  • Claude Code CLIは使用せず:単一モデル制約、速度で劣る(Desktopアプリは使用)
  • 最適ワークフロー:Factory(計画)× Codex(実装)× Claude Desktop(レビュー)
  • コスパ王者:Codex CLI Plus(20ドルで6000行)

ツール選択フローチャート:

優先事項 推奨ツール
計画→実装の明確な分離が必要 Factory CLI
Claude、Gemini、GPT-5を使い分けたい Factory CLI
とにかく安く大量のコードを生成 Codex CLI Plus(20ドル)
キューイングでフロー状態重視 Codex CLI
Rust製の安定性が必須 Codex CLI
UI/UX開発がメイン Factory CLI(CodexはUI苦手)
Claude専用で十分 Claude Code

今後の展望:

  1. Codexプラン機能追加でFactory不要になる可能性
  2. マルチモデル対応が進めば、ツール統一が進む
  3. コスト競争が激化し、さらに低価格化
  4. UI生成能力の改善が各ツールの課題

2027年には、単一ツールで全て完結する時代が来るかもしれません。しかし2025年現在は、ハイブリッド戦略が最も効率的です。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次