【Codex CLI徹底検証】Factory・Claude Code比較──2日間6000行開発で見えた決定的な差

2025年10月18日

「Codex CLI、Factory CLI、Claude Code──結局どれを使えばいいのか？」

この問いに、 2日間で6000行のコードを生成した実践的検証結果が答えを出しました。

Ian Nuttall氏（フォロワー72,164人）が、OpenAI Codex CLIを徹底的に使い込み、Factory CLI・Claude Codeと詳細比較したレビューが大きな反響を呼んでいます（ 16,080閲覧、184いいね、136ブックマーク）。

Ian Nuttallの結論：

「私はやっぱりFactoryの方が好きです。なぜなら、必要な『必須』機能がより多く揃っていて、速くて、プラン機能がとても優れているからです。Claude、Gemini、GPT-5の間で行ったり来たりするためにCLIツールを切り替えたくありません」

– Ian Nuttall @iannuttall（16,080閲覧、184いいね）

この記事では、3つのAIコーディングツールの 真の実力を、実践データに基づき徹底解説します。

OpenAI Codex CLI実践レビュー──2日間6000行コーディングで見えた真の実力

2025年10月、AI開発ツールの最前線で戦う開発者が、Codex CLIの実力を徹底検証しました。

検証者プロフィール：Ian Nuttall氏

経歴：連続起業家、複数の6桁・7桁Exit経験
専門：AIを使ったソフトウェア開発、インターネットビジネス構築
SNS影響力：X（Twitter）フォロワー72,164人
開発経験：Claude Code、Factory CLI、Cursor、Windsurf等の主要AIツールすべてを実務使用

検証概要：

項目	詳細
検証期間	2日間の集中開発
生成コード量	約6,000行
使用モデル	GPT-5 High、Codex High
コスト	Plus（20ドル）→ Pro（200ドル）
比較対象	Factory CLI、Claude Code
開発内容	shadcnコンポーネント含むフルスタック開発

X（Twitter）での反響：

閲覧数：16,080（投稿から数日）
いいね：184
ブックマーク：136（高いエンゲージメント率）
返信：28（活発な議論）

このレビューが注目される理由は、「実際に2日間使い倒した」実践データに基づく点です。表面的な機能比較ではなく、リアルな開発フローでの使用感が詳細に記録されています。

結論：Factory > Codex > Claude Code──プラン機能が分ける決定的な差

Ian Nuttall氏のTLDR（結論）は明確です：

総合評価ランキング：

🥇 Factory CLI：必須機能充実、高速、プラン機能優秀、マルチモデル対応
🥈 Codex CLI：コード生成品質はFactory並、コスパ最強、ただしプラン機能欠如
🥉 Claude Code：ほとんど使用せず（Claudeデスクトップアプリは使用）

Factory CLIが選ばれた3つの決定的理由：

「必須機能」の充実
- プラン機能（計画→実装の明確な分離）
- マルチモデル対応（Claude、Gemini、GPT-5を1つのツールで切替）
- サブエージェント機能（タスクの委譲と報告）
速度の優位性
- レスポンスが高速
- ツール切替不要でワークフロー途切れない
プラン機能の完成度
- GPT-5 Highで計画立案
- Codex Medium/Autoで実装
- この分業が最も効率的

コード出力品質はCodex = Factory：

Ian氏は重要な指摘をしています：

「実際のコード出力は、おそらく同等レベルです。これは主にGPT-5が素晴らしいモデルだからです！」

つまり、差を分けるのは生成AIモデル性能ではなく、ツールの機能設計です。GPT-5を使える両ツールでは、コード品質はほぼ同じ。Factoryが勝つのは「プラン機能」「マルチモデル対応」といった開発体験（DX）の差なのです。

評価項目	Factory CLI	Codex CLI	Claude Code
コード品質	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
プラン機能	⭐⭐⭐⭐⭐	❌ なし	⭐⭐⭐
マルチモデル	⭐⭐⭐⭐⭐	⭐⭐⭐（GPT系のみ）	❌（Claudeのみ）
速度	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐
コスパ	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
UI生成	⭐⭐⭐⭐	⭐⭐（苦手）	⭐⭐⭐

Codexの圧倒的な5つの強み──Rust製UIとキューイング機能の中毒性

Codex CLIには、他のツールにない独自の強みが5つあります。

1. 絶対的な働き者──無駄のない効率性

Ian氏の評価：

「Codexはまさに絶対的な働き者です。派手さやおしゃべりもなく、ただひたすら効率的に仕事をこなします。本当にタスクを次々と（そしてさらに次々と）処理し続けます」

他のAIコーディングツールは、説明的なメッセージを多く出力し、「今何をしているか」を逐一報告します。これは親切ですが、画面が流れて邪魔になることも。

Codexはchatty（おしゃべり）ではない──必要最小限のメッセージで、黙々とコードを生成し続けます。

2. ミニマリストなUI──ツール呼び出しをリスト表示

「UIは本当に私のミニマリストな性格に合っています。とてもクリーンで、コンパクトで、ツール呼び出しをきちんとしたリストにまとめて、邪魔になりません」

Codex CLIのUIは、ツール呼び出し（ファイル読み込み、編集、実行など）をコンパクトなリスト形式で表示。スクロールバックして確認しやすく、ターミナルが散らかりません。

3. Rust製の安定性──画面ちらつきゼロ、クラッシュなし

「Rustで作られているため、他のCLIとは違い、画面のちらつきが全くなく、結局ターミナルやVS Codeをクラッシュさせることもありません」

多くのAI CLIツールは、Node.js/Pythonベースで、長時間使用すると：

画面のちらつき（rendering flicker）
メモリリーク
ターミナルクラッシュ

CodexはRustで実装されており、これらの問題が一切ありません。2日間の集中開発でも安定動作。

4. キューイング機能──「フロー状態」への没入感

これが最も中毒性の高い機能です：

「作業中にプロンプトをキューに追加できる機能は、本当に中毒性があり、フロー状態に入りやすいです。アプリを行き来しながら、さらに変更をキューに追加する感覚は、他のCLIでは味わえないものです」

キューイング機能の仕組み：

Codexがタスクを実行中
ユーザーは待たずに次のプロンプトを入力
Codexは現在のタスク完了後、自動的に次のプロンプトを処理
ユーザーは途切れることなく次々と指示を出せる

この機能により、思考のフロー状態を維持したまま開発できます。「AIの応答を待つ」という時間がなくなり、アイデアを次々と形にできるのです。

5. 実質無限のコンテキストウィンドウ──大量データでも減らない

「コンテキストウィンドウは正直、永遠に続くように感じます。大量のデータを投げ込んで、何度も何度も繰り返しても、ほとんど減りません」

GPT-5のコンテキストウィンドウは128K～200Kトークンですが、Codex CLIはこれを効率的に管理。長時間のセッションでも、コンテキスト不足に陥ることがほぼありません。

Codexの5つの致命的な弱点──プラン機能欠如、UI生成苦手、説明不足

一方で、Codex CLIには深刻な弱点も5つあります。

1. おしゃべり不足──何をしているか分からない問題

「絶対的な働き者」の裏返しです：

「そのおしゃべりの少なさが、ときどき問題になることがあります。何をしているのか、なぜそうしているのかを把握していないと困るんです。私は何が作られているのかを正確に理解したい！」

Codexは説明をほとんどせず、黙々とコードを生成します。これは効率的ですが、意図しない実装が進むリスクがあります。

Claude CodeやFactoryの優位性：

「〇〇を実装します」という明確な宣言
「なぜこのアプローチを選んだか」の説明
実装前の確認プロンプト

Codexにはこれらがなく、開発者が常に監視する必要があります。

2. サンドボックス実行の問題──許可を求めて作業停止

「サンドボックスでコマンドを実行するのに時々問題があって、『それはできませんでした』と返ってくることがあります。強く促すと、許可を求めてくることもあり、これが作業の進捗を遅らせることがあります」

Codexのサンドボックスは、セキュリティを重視しすぎて、時に過剰に制限的です：

npm installが失敗
ファイル書き込みが拒否
再試行すると許可を求める（一貫性がない）

この問題は、Ian氏の作業フローを何度も中断させました。

3. UI生成が苦手──shadcnコンポーネントで苦戦

「UIに関してはまだあまり得意ではありません。私のせいかもしれませんが、shadcnコンポーネントで苦労しました。llms.txtのURLや多くのドキュメントURLを渡してもです」

Codexはロジック・アルゴリズム重視で、UI/UX生成は苦手です：

shadcn/ui、Tailwind CSSの適切な使用ができない
ドキュメントURLを渡しても改善されない
デザインシステムの理解が浅い

Ian氏の対策：

「コンポーネントへのリンクを取得して、それを使う方法を指示するのが好きだからです。GPT-5は、正確に何をすべきか伝えると本当に優れています」

明確な指示を与えれば、GPT-5は優秀です。ただし、「shadcnを使ってダッシュボードを作って」という曖昧な指示では失敗します。

4. プラン機能の欠如──最大の弱点

これがIan氏が「Factory > Codex」と結論づけた最大の理由です：

「プラン機能がないのは私にとって大きな問題です。私はFactory CLIのプラン機能をGPT-5 Highでよく使って計画を立て、Codex Medium/Autoで実装しています」

プラン機能とは：

実装前に「何を作るか」を明確化
ファイル構成、アーキテクチャ、タスク分解を提示
ユーザーが承認してから実装開始

Factoryはこの機能が優秀で、GPT-5 Highで計画→Codexで実装というハイブリッドワークフローを可能にします。

Codex単体では、この計画フェーズがなく、いきなり実装が始まるため、方向性の確認が困難です。

（注：Ian氏はGitHub上でプラン機能追加のPRを確認しており、近日中に実装される可能性があります）

5. MCP設定の互換性問題──config.toml独自形式

「mcpサーバーはconfig.tomlに追加されます。この構文は実は結構好きですが、Claude CodeやFactoryの既存のmcp.jsonファイルをシンボリックリンクで使ったり、直接使ったりできないので、移行する必要があります」

Codexはconfig.toml形式、Claude Code/Factoryはmcp.json形式。互換性がなく、ツール切替時に設定を移行する手間が発生します。

ただし、Ian氏は「エージェントに頼めば移行は簡単」と述べており、実害は小さいようです。

Factory CLIが選ばれる3つの理由──マルチモデル対応とプラン機能の完成度

Ian氏が最終的にFactory CLIを選んだ理由を詳細に解説します。

1. 必須機能の充実──開発者が本当に必要とする機能

Ian氏がFactoryを「必須機能が揃っている」と評価した具体的機能：

機能	Factory CLI	Codex CLI
プラン機能	✅ 優秀	❌ なし（近日追加予定）
マルチモデル対応	✅ Claude、Gemini、GPT-5	⚠️ GPT系のみ
サブエージェント	✅ あり	❌ なし（希望あり）
バックグラウンド実行	✅ npm run dev等を管理	❌ なし（希望あり）
モデル切替	✅ 簡単	⚠️ /model経由

2. 速度の優位性──マルチモデル切替で途切れないフロー

Ian氏の重要な指摘：

「Claude、Gemini、GPT-5の間で行ったり来たりするためにCLIツールを切り替えたくありません」

実務では、タスクによって最適なモデルが異なります：

Claude Sonnet 4.5：複雑なリファクタリング、アーキテクチャ設計
Gemini 2.5 Pro：大量ファイルの一括処理、長大コンテキスト
GPT-5 High：プラン作成、数学・アルゴリズム

Factoryは1つのCLIで全モデルを切替可能。Codexは切り替えるたびにツール自体を変える必要があり、作業が途切れます。

3. プラン機能の完成度──Factory（計画）× Codex（実装）

Ian氏の最適ワークフロー：

Factory CLI（GPT-5 High）でプラン作成
プランをレビュー・承認
Codex CLI（Medium/Auto）で実装

この分業により、思考と実行を分離できます：

Factory：「何を作るか」を明確化
Codex：「どう作るか」を高速実装

Factory単体でも実装可能ですが、Codexの「絶対的な働き者」性能を活用する方が効率的です。

Claude Codeの現在地──デスクトップアプリは使うがCLIは使わない理由

Ian氏のClaude Code評価は厳しいものでした：

「今はClaude Codeをほとんど使っていませんが（Claudeのデスクトップアプリはよく使います）」

Claude Codeが使われなくなった3つの理由：

1. 単一モデル制約──Claudeしか使えない

Claude Codeは、その名の通りClaudeモデル専用です：

Claude Sonnet 4.5
Claude Haiku 4.5
Claude Opus 4（将来）

GPT-5やGemini 2.5 Proを使いたい場合、ツール切替が必須。これがIan氏の「ツールを切り替えたくない」という要望と衝突します。

2. プラン機能の質──Factoryに劣る

Claude Codeにもプラン機能はありますが、Factoryほど洗練されていないとIan氏は評価します。具体的な差は記載されていませんが、FactoryのGPT-5 Highによるプラン作成の方が優れているようです。

3. 速度──FactoryやCodexより遅い

比較表からも明らかですが、Claude Codeは応答速度で劣ります。長時間の開発セッションでは、この差が蓄積し、生産性に影響します。

Claude Desktopアプリは使用──なぜか？

興味深いのは、Ian氏がClaude CLI は使わないがDesktopアプリは使う点です。理由は明示されていませんが、推測されるユースケース：

アイデア出し：長文の会話形式でアーキテクチャ議論
ドキュメント作成：技術仕様書、README等の執筆
コードレビュー：大量のコードを貼り付けてフィードバック取得

これらはコーディング以外のタスクであり、CLIよりGUI（Desktopアプリ）の方が適しています。

コスト分析：20ドルで6000行──GPT-5 Highの驚異的なコスパ

Ian氏の2日間開発の詳細コストデータを分析します。

使用プラン：Plus（20ドル）→ Pro（200ドル）

項目	Plus（20ドル/月）	Pro（200ドル/月）
達成コード量	約6,000行（2日間）	制限到達直後アップグレード
使用モデル	GPT-5 High、Codex High	同上
制限	「非常に寛大」と評価	週制限あり（10分で復活）
コスパ	1行あたり約0.33円	未検証

コスト効率の詳細分析：

「制限は非常に、非常に寛大に感じます。GPT-5 HighとCodex Highを使って2日間ガッツリと重いコーディングをしましたが、20ドルで約6000行のコードを複数のセッションで処理して、ようやく制限に達しました」

計算：

Plus（20ドル）で6,000行生成
1行あたり約0.33円（20ドル ÷ 6,000行）
人間開発者が同量のコードを書く時間：2-3週間（推定）
時給換算すると数千円/時間の価値

これは驚異的なコストパフォーマンスです。

Pro（200ドル）へのアップグレード問題：

Ian氏はPlusの制限到達後、Proにアップグレードしましたが：

「Plusプランの制限に達したのでProにアップグレードして200ドル払いましたが、それでも週の制限に達したと言われ、2日待たないとまた作業ができないと言われました :(（注：約10分後には復活して作業を再開できました！）」

この問題は一時的なバグだったようで、10分後に解決しました。ただし、アップグレード直後にこの問題が起きるのはUX上の課題です。

他のCLIとのコスト比較：

ツール	プラン	月額	制限感
Codex CLI Plus	Plus	20ドル	⭐⭐⭐⭐⭐ 非常に寛大
Codex CLI Pro	Pro	200ドル	⭐⭐⭐⭐⭐ さらに寛大
Factory CLI	不明	不明	⭐⭐⭐⭐ 寛大
Claude Code	Pro	20ドル	⭐⭐⭐ 普通

Codex CLIは、コスパで他を圧倒しています。

最適なワークフロー──Factory（計画）× Codex（実装）のハイブリッド戦略

Ian氏の実践から導かれる最適解は、単一ツール使用ではなく、ハイブリッド戦略です。

推奨ワークフロー：

Factory CLI（GPT-5 High）でプラン作成
- タスク分解
- ファイル構成設計
- アーキテクチャ決定
- 実装順序の最適化
プランをレビュー・調整
- 開発者が要件を確認
- 必要に応じて修正指示
Codex CLI（Medium/Auto）で実装
- プランに従って黙々とコード生成
- キューイング機能で連続指示
- フロー状態で高速開発
必要に応じてClaude Desktopアプリでレビュー
- 生成コードの品質確認
- リファクタリング提案
- ドキュメント作成

このハイブリッドが最強な理由：

フェーズ	最適ツール	理由
計画	Factory（GPT-5 High）	プラン機能の完成度、GPT-5の計画力
実装	Codex（Medium/Auto）	高速、chattyでない効率性、キューイング
レビュー	Claude Desktop	長文レビュー、GUI操作の快適さ
UI調整	手動 or Factory	CodexのUI苦手を補完

今後のCodex改善に期待：

Ian氏が指摘した「欲しい機能」：

プラン機能：GitHubにPRあり、近日実装予定
サブエージェント：タスク委譲と報告機能
バックグラウンドコマンド：npm run devを別プロセスで管理
モデル切替ショートカット：/model不要でキーボードショートカット対応

これらが実装されれば、Codex単体での完結も可能になります。

Ian Nuttallからの最終アドバイス：

「実際のコード出力は、ツールではなくモデル（GPT-5）の品質で決まる。差を分けるのは『プラン機能』『マルチモデル対応』『開発体験』だ。今はFactory（計画）× Codex（実装）のハイブリッドが最強だが、Codexのプラン機能追加後は状況が変わる可能性がある」

まとめ：2025年AI CLIツール選択ガイド──あなたに最適なツールは？

Ian Nuttall氏の2日間6000行検証から得られた結論をまとめます。

この記事の要点：

Factory CLIが総合1位：プラン機能、マルチモデル対応、速度で優位
Codex CLIは実装特化：コスパ最強、キューイング機能が中毒性、ただしプラン機能欠如
Claude Code CLIは使用せず：単一モデル制約、速度で劣る（Desktopアプリは使用）
最適ワークフロー：Factory（計画）× Codex（実装）× Claude Desktop（レビュー）
コスパ王者：Codex CLI Plus（20ドルで6000行）

ツール選択フローチャート：

優先事項	推奨ツール
計画→実装の明確な分離が必要	Factory CLI
Claude、Gemini、GPT-5を使い分けたい	Factory CLI
とにかく安く大量のコードを生成	Codex CLI Plus（20ドル）
キューイングでフロー状態重視	Codex CLI
Rust製の安定性が必須	Codex CLI
UI/UX開発がメイン	Factory CLI（CodexはUI苦手）
Claude専用で十分	Claude Code

今後の展望：

Codexプラン機能追加でFactory不要になる可能性
マルチモデル対応が進めば、ツール統一が進む
コスト競争が激化し、さらに低価格化
UI生成能力の改善が各ツールの課題

2027年には、単一ツールで全て完結する時代が来るかもしれません。しかし2025年現在は、ハイブリッド戦略が最も効率的です。

関連記事：

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

【Codex CLI徹底検証】Factory・Claude Code比較──2日間6000行開発で見えた決定的な差

OpenAI Codex CLI実践レビュー──2日間6000行コーディングで見えた真の実力

結論：Factory > Codex > Claude Code──プラン機能が分ける決定的な差

Codexの圧倒的な5つの強み──Rust製UIとキューイング機能の中毒性

Codexの5つの致命的な弱点──プラン機能欠如、UI生成苦手、説明不足

Factory CLIが選ばれる3つの理由──マルチモデル対応とプラン機能の完成度

Claude Codeの現在地──デスクトップアプリは使うがCLIは使わない理由

コスト分析：20ドルで6000行──GPT-5 Highの驚異的なコスパ

最適なワークフロー──Factory（計画）× Codex（実装）のハイブリッド戦略

まとめ：2025年AI CLIツール選択ガイド──あなたに最適なツールは？

コメント

コメントするコメントをキャンセル

【Codex CLI徹底検証】Factory・Claude Code比較──2日間6000行開発で見えた決定的な差

OpenAI Codex CLI実践レビュー──2日間6000行コーディングで見えた真の実力

結論：Factory > Codex > Claude Code──プラン機能が分ける決定的な差

Codexの圧倒的な5つの強み──Rust製UIとキューイング機能の中毒性

Codexの5つの致命的な弱点──プラン機能欠如、UI生成苦手、説明不足

Factory CLIが選ばれる3つの理由──マルチモデル対応とプラン機能の完成度

Claude Codeの現在地──デスクトップアプリは使うがCLIは使わない理由

コスト分析：20ドルで6000行──GPT-5 Highの驚異的なコスパ

最適なワークフロー──Factory（計画）× Codex（実装）のハイブリッド戦略

まとめ：2025年AI CLIツール選択ガイド──あなたに最適なツールは？

コメント

コメントする コメントをキャンセル

コメントするコメントをキャンセル