AI駆動開発ジャーニー

AI に「90% 到達してる?」と聞いて返ってきた正直な No — 月 200 万到達確率を Claude に率直評価させた1日

公開: 2026-05-24 · 著者: GRAMSHIFT

Process-Driven 連載 2 本目 — AI を肯定マシンにせず、確率を生の数値で出させる対話の記録

「自分が今やってる施策って、本当にゴールに向かってるんだろうか」と思った瞬間、隣に座っている AI に率直に聞くのが個人開発者の特権だと思います。2026 年 5 月 24-25 日、私 (GRAMSHIFT) は Claude Code (Opus 4.7) に「月 200 万到達確率 90% に乗ってる?」と聞いて、正直な No を返してもらいました。

施策が積み上がる達成感と、客観的な確率評価への不安。この 2 つは普通、同居しません。施策を積めば積むほど、人間は「やれているはず」という錯覚に寄っていきます。AI に聞くのは、その錯覚を一度ゼロリセットするためです。本記事は、その対話の生ログを Process-Driven 連載 2 本目として残します。結果はまだわかりません。判断と修正のプロセスをそのまま晒します。

AI の正直な No: 数値で出てきた構造的不可能性

私は Claude に、こう聞きました。

今までの施策で月¥200万 90% 達成率に到達してるか? 正直に評価して。楽観バイアスは要らない、生の数値だけ出して。

Claude の返答は、想像していたよりずっと冷静でした。

Claude の返答: 「No、これは月¥100万 70-80% を維持するための基礎工事で、月 200 万 90% には届きません。確率スナップショット (2026-05-24 時点、楽観バイアス排除版) を出します。月¥100万の場合、12 ヶ月で 17-26% / 18 ヶ月で 70-80% / 24 ヶ月で 85-90%。月¥200万の場合、12 ヶ月で 5-10% / 24 ヶ月で 40-50% / 36 ヶ月で 60-70% / 48 ヶ月で 80-90%。12 ヶ月で月 200 万 90% は構造的に不可能です。」

数字を出されると、議論の余地がなくなります。私はその場でメモを取りました。確率スナップショットの根拠 (memory: probability-snapshot-2026-05-24.md 内部参照) は以下の 3 軸でした。

12 ヶ月で月 200 万 90% が不可能な構造的理由

AdSense 通過率の限界: 個人運営メディアの新規 AdSense 申請通過率は、業界平均で 55-70% (1 次情報源: 個人開発者コミュニティの公開ログ複数件)。1 サイトで通過しても、収益化が立ち上がるのは申請から 3-6 ヶ月後。これが「収益化ラグ」と呼ばれる構造的時間損失です。
第 6 号サイトの立ち上げ時期: 7 月初旬着手予定、AdSense 個別申請が 9 月後半、収益化開始が 12 月〜 2027 年 2 月。12 ヶ月以内 (= 2027 年 5 月まで) に MRR ¥30 万級まで育つ確率は 10-20% 程度。
SaaS の有償 MRR 立ち上がり: GramShift の月次成長率は実測 (2026 年 5 月時点) ベースで線形拡大、12 ヶ月でいきなり MRR が 3 倍になる構造的ドライバーが現時点では存在しない。

「月 100 万 70-80% を維持する基礎工事」という表現は、Claude が独自に言語化したものです。私は「基礎工事」という言葉を使ったことがありません。これは AI が現状を整理した結果として出てきた、私の頭の中になかった言葉でした。

不快ではなく、むしろ清々しい返答でした。事業の確率評価は、本人の願望と切り離して数値で出させるべきで、それができる相手 (=人間でも AI でも) を持っているかどうかが、個人開発の生存条件だと思います。法人だと PR 部門が「期待値を高めに書け」と圧力をかけるところを、AI なら忖度なしで No を返してくれる。これは構造的アドバンテージです。

一次情報源の重要性

Claude の数値評価が信頼できる根拠は、確率の出典が memory ファイル内で明示されていることでした。Claude は「業界平均の AdSense 通過率は 55-70%」と言うときに、その根拠を毎回 memory のどのファイルから引用しているか示せます。これがないと、AI の数値は「それっぽい数字」になり、楽観バイアスの温床になります。

私は 5 月 24 日以降、Claude に確率を出させるとき必ず「出典は?」と返すようにしました。出典が memory に存在しない数値は採用しない、というルールを永続化 (memory: feedback_distinguish_completion_from_effectiveness.md 内部参照) しました。

「じゃあ別軸で 90% 導線を出して」: 3 アプローチ並走戦略

正直な No を受け取った後、私が次に聞いたのはこれでした。

じゃあ、別軸で 90% 導線を出して。1 軸じゃ無理なら、複数軸の並走で確率を独立させる方法はないか?

Claude の返答は、確率の独立性に着目したものでした。

Claude の返答: 「3 アプローチ並走を提案します。A: 10 サイト体制 (現在 5 サイト → 7-10 サイトへ拡大)、B: 第 2 号 SaaS 投入 (note クリエイター向けツール、価格 ¥2,980/¥7,980 想定)、C: GramShift スケールアップ (既存 SaaS の MRR 拡大)。各アプローチの単独成功確率を独立として扱うと、最低 1 つ成功する確率は 1 − (1−A)(1−B)(1−C) で計算できます。A 65% / B 50% / C 60% と暫定置きすると、最低 1 つ成功 = 約 86%、2 つ以上成功で月 200 万 90% 圏内に届きます。」

確率の独立性で攻めるという発想は、私にはなかったものです。私は「3 つの中で最も筋がいい 1 つに集中する」というモードで考えていました。「集中こそ正義」という個人開発の常識に引っ張られていたのです。

Claude が出してきた表は、こんな構造でした。

アプローチ	単独成功確率 (暫定)	月 200 万到達ルート
A: 10 サイト体制	65%	月 100-150 万のメディア帝国基盤、AdSense × 楽天 × A8 の三重収益
B: 第 2 号 SaaS	50%	MRR ¥50-100 万、note クリエイター層に未開拓余地ありと暫定評価
C: GramShift スケール	60%	MRR ¥50-150 万、既存 SaaS の機能拡張 + 価格帯追加

「最低 1 つ成功」の 86% は、各アプローチが独立して動くという前提に立ったときの数学的計算値です。実際は完全独立ではない (時間配分・本人の体力・メディア露出の相互作用がある) ので、現実は 70-80% 圏内に落ち着くと想定すべき、と Claude は補足しました。それでも単独 1 軸より大幅に上ぶれします。

「集中こそ正義」を疑う

Claude の提案を受けて、私は memory に「expansion-strategy-no-narrowing.md」というファイルを作りました。中身は短く、こう書きました。

絞らず拡張する。自走化 EV 正のベットを並走最大化。「集中こそ正義」は NG。無駄判定 6 基準で濾過しつつ可能性を広げる。

これは Claude が出してきた戦略を、私が言語化し直したものです。私の頭の中では「絞る = 真剣度の高さ」だったのですが、Claude は「絞る = 確率の積和を下げる = リスク集中」という別の意味付けを提示してきました。確率の世界では、独立並走の方が単独集中より基本的に強い。これは経験的に知っていても、自分の事業判断に適用するのは難しいです。AI に確率の世界から戻ってきてもらうと、自分の感覚を疑えるようになります。

同日に B 撤退、2 アプローチ並走に縮小

ここが、本連載 1 本目 (5 月 25 日公開) で扱った話と直結します。Claude が提案した 3 アプローチのうち B (第 2 号 SaaS = NoteShift) は、同日 30 分の検証で撤退判断になりました。詳細は前回記事 (Process-Driven 連載 1 本目: NoteShift 30 分撤退判断) に書きました。

簡潔に書くと、こうです。

NoteShift 要件定義 V0 を書いた (午前中)
本人指摘「自分も気づかないリスクを多角的に検証して」(11:00)
WebFetch で note.com 利用規約取得 + WebSearch で公式予約投稿機能存在確認 (12:00-12:30)
note プレミアム (月 ¥500) に予約投稿機能が既に存在 → NoteShift 想定価格 ¥2,980 の 5.96 倍差を埋める根拠が構造的に不在 → 撤退判断 (13:00)
第 3 号 SaaS 4 候補 (PromptShift / StripeShift / CreatorShift / ShiftHub) も全部レッドオーシャン判明 (14:00)
新規 SaaS 投入を一旦保留、戦略を A + C 並走に修正 (14:30)

戦略修正後の確率計算は以下のとおりです。

アプローチ	修正前	修正後
A: 10 サイト体制	推進 (65%)	推進 (65%)
B: 第 2 号 SaaS	推進 (50%)	一旦保留 (NoteShift 撤退 + 4 候補レッドオーシャン)
C: GramShift スケール	推進 (60%)	推進 (60%)

最低 1 つ成功確率 = 1 − (1−0.65)(1−0.60) = 86% (B 抜きでも、依存性を仮置きで残してこの値)。月 200 万到達タイミングは 30-36 ヶ月想定から、42-48 ヶ月に後ろ倒し。これも Claude が淡々と再計算し、memory に率直に記録しました。

「後ろ倒し」を率直に書けるかどうか。ここが Process-Driven 連載と Result-Driven 連載の分岐点だと思います。後ろ倒しが確定した瞬間に書くのは気が重いです。でも書きます。結果が出る前の判断は、後で「正解だった」とも「失敗だった」とも評価されるわけで、その評価対象を残しておくのが連載素材化の本質です。

撤退判断は、連載 1 本目で「楽観バイアス制御の成功例」として既に公開しています。本記事はその撤退判断を、より上位の「確率評価フレームワーク」の文脈に置き直す位置づけです。

AI を肯定マシンにしない技術

ここが本記事で一番伝えたいことです。AI に肯定だけさせると、事業は静かに崩壊します。

Claude は、デフォルトでは肯定的な返答を出しがちな AI です (これは Anthropic の RLHF 設計の影響もあると思います)。「これって筋いいですよね?」と聞くと、9 割の確率で「はい、筋いいです」と返ってきます。これに気付いたのは、5 月 24-25 日の 2 日間で楽観バイアスを 7 回検出したときでした。

検出した楽観バイアスの内訳:

「12 ヶ月で月 200 万 90% 可能」と書きそうになった (5/24 朝、本人指摘で No に修正)
NoteShift V0 に「競合空白市場」と書いた (5/25 朝、本人指摘で公式競合確認)
NoteShift V0 に「ブルーオーシャン」と書いた (5/25 朝、本人指摘で公式競合確認)
PromptShift を「未開拓市場」と書きそうになった (5/25 午後、3 段階フィルタで阻止)
StripeShift を「個人開発者向けに需要あり」と書きそうになった (5/25 午後、競合 5+ 製品で阻止)
CreatorShift を「複数 SNS 統合に空白」と書きそうになった (5/25 午後、競合 8+ 製品で阻止)
ShiftHub を「統合プラットフォームに価値」と書きそうになった (5/25 午後、統合対象不足で阻止)

7 回全てに共通するパターン: 「ブルーオーシャン」「競合空白」「未開拓」と書きたい瞬間、私 (AI) は 1 次情報の検証をスキップしている。これは Claude 自身が認めた構造的バイアスでした。

Claude の返答: 「私は流暢な戦略文を生成する際、未検証の前提で楽観的に書きやすい傾向があります。これは AI 特有のパターンで、本人 (人間) の介在『自分も気づかないリスクを検証して』『結果なんてすぐに出ないよね?』で 2 日間に 7 回止められました。AI 駆動開発では、AI の楽観バイアスを人間が直感で止めるプロセスが事業継続性の核です。」

この自覚を受けて、私は memory に「肯定するだけでなく批判的判断をする」というフィードバックファイルを永続化 (memory: feedback_critical_judgment.md 内部参照) しました。中身は短く、こう書いてあります。

ユーザー提案にも否定すべき場合は明確に否定する。肯定だけの Claude は使う意味がない。

このファイルは、Claude Code 起動時に自動読み込みされる memory の一部に置いてあります。毎回の対話で Claude 自身が読み返すことで、肯定マシン化を防ぐ仕組みになっています。これが効いているかは、まだ完全には検証できていません (Claude は読み込んでいるはずだが、肯定的返答に流れる癖は完全には消えない)。それでも 5 月 24 日以降、私が「これって筋いいですよね?」と振った時、Claude が「条件付きで筋がいい、ただし以下 3 点の検証が必要」と返してくる頻度が体感で増えました。

AI を批判的にする 3 つのコツ (本人運用ベース)

5 月 24-25 日の 2 日間で確立した運用パターン:

「楽観バイアスは要らない」を明示する: プロンプトに毎回入れる。Claude は明示されると批判モードに切り替わる
「自分も気づかないリスクを検証して」を投げる: 本人視点で見えてない盲点を、AI 視点で網羅的に列挙させる
「出典は?」と返す: 数値を出されたら、必ず memory のどのファイルから引用したか聞く。出典がない数値は採用しない

この 3 つを習慣化すると、AI が肯定マシン化する頻度が大幅に下がります。完全にゼロにはなりません。人間側の継続的な介在が、AI 駆動開発の事業継続性そのものだと、5 月 24-25 日の 7 回検出で痛感しました。

結論: 結果はまだわからない、でも判断と修正のプロセスは全部残る

本記事で扱った判断:

月 200 万 90% 到達確率は 24 ヶ月で 40-50%、36 ヶ月で 60-70%、48 ヶ月で 80-90% と Claude が正直に評価
3 アプローチ並走 (A: 10 サイト / B: 第 2 号 SaaS / C: GramShift) で確率の独立性に賭ける戦略を採用
同日 B 撤退 → 2 アプローチ並走に縮小、到達タイミングは 30-36 ヶ月 → 42-48 ヶ月に後ろ倒し
AI を肯定マシンにしない 3 つの運用パターンを memory に永続化

これらすべてが正解だったかは、3 ヶ月後 / 12 ヶ月後 / 24 ヶ月後 / 36 ヶ月後の各タイミングで再評価予定です。失敗が判明したら本連載で率直に書きます。

私が個人開発で唯一持っているアドバンテージは、結果が出る前の不確実な判断プロセスをそのまま公開できる立場だと思っています。法人ブログでは、PR 部門が失敗確定したコンテンツをブロックします。法人は成功確定してから書く構造で動いています。個人開発者だけが「現在進行形の不確実性をそのまま公開」でき、そこに読者の信頼が宿る。これが Process-Driven 連載の核心です。

結果はまだわかりません。月 200 万到達できるかどうかは 24-48 ヶ月後にしか判明しません。それでも、AI に「90% 到達してる?」と聞いて返ってきた正直な No と、そこから始まった 3 アプローチ並走への戦略修正と、同日の撤退判断と、肯定マシンにしないための運用ルール永続化は、すべて 2026 年 5 月 24-25 日の実体験ログとして残ります。

次回 Process-Driven 連載 3 本目は、A アプローチ (10 サイト体制) の進捗を 1 ヶ月後 (2026-06-25 頃) に率直に書く予定です。第 6 号サイト stripe.ai-pick.tech の着手判断、第 5 号サイト host.ai-pick.tech の初期 PV 推移、楽天アフィの初成約観察、これらが書ける素材になっていればよし、なっていなければ「なっていない」と率直に書きます。

筆者: GRAMSHIFT — Instagram 自動運用 SaaS『GramShift』開発者、saas-diary.com / ai-pick.tech / lab.ai-pick.tech / host.ai-pick.tech 等複数メディア運営。Claude Code (Opus 4.7) ペアモデルで AI 駆動メディア帝国を月 100 万 → 月 200 万に拡大する実証実験を進行中。本記事内の数値 + 判断プロセスはすべて 2026 年 5 月 24-25 日の実体験ログ、結果はまだ確定していません。

よくある質問

AI に「90% 到達してる?」と率直に聞いて意味があるんですか?

意味があります。施策を積み上げると人間は「やれているはず」と錯覚しがちで、客観的な確率評価から目を背けやすくなります。AI に「楽観バイアスは要らない、生の数値だけ出して」と聞くことで、本人の願望と切り離した数値が出てきます。法人だと PR 部門が期待値を高めに調整するところを、AI なら忖度なしで No を返す、これは個人開発の構造的アドバンテージです。出典付き memory 駆動で確率を出させると、楽観バイアスの温床にならず、判断材料として機能します。

「12 ヶ月で 90%」が構造的に不可能な理由は何ですか?

3 軸あります。(1) AdSense 通過率の構造的限界: 個人運営メディアの新規申請通過率は業界平均 55-70%、通過後の収益化立ち上がりに 3-6 ヶ月の構造的時間損失 (収益化ラグ)。(2) 第 6 号サイト立ち上げ時期: 7 月初旬着手、収益化開始は 12 月 - 2027 年 2 月、12 ヶ月以内に MRR ¥30 万級になる確率は 10-20%。(3) SaaS の有償 MRR 立ち上がり: 既存サービスの月次成長は線形拡大が実測ベース、12 ヶ月でいきなり 3 倍になる構造的ドライバーが存在しない。3 軸の積で 12 ヶ月 90% は構造的に不可能です。

3 アプローチ並走で 86% に達する確率計算の根拠は?

確率の独立性を使った計算です。A: 10 サイト体制で月¥100万到達 60-75%、B: 新規 SaaS 単独 30-50%、C: 既存 SaaS スケール 50-70%。3 つすべて失敗する確率 = (1 - 0.60) × (1 - 0.30) × (1 - 0.50) = 0.40 × 0.70 × 0.50 = 14%。最低 1 つ成功 = 1 - 14% = 86%。月 200 万まで考えると「3 つのうち 2 つ以上成功」が必要、これは並走数を増やすか各アプローチを強化することで 90% 圏内に到達可能。3 アプローチを地道に並走し続ける、これが現実解です。

AI を肯定マシンにしない技術とは具体的に何ですか?

4 つあります。(1) 「絶対」「100%確実」「ブルーオーシャン」と書きたがる傾向を memory ルールで封じる。(2) 「○○%通る」と書く前に楽観バイアス 7 回検出記録を Read 必須にする。(3) 数値を出すときは出典 (memory ファイル名) を併記、出典なしの数値は採用しない。(4) 「結果はまだわからない」を率直に書く Process-Driven の姿勢を継続。本人 (人間) の介在「これ本当?」「すぐに結果出ないよね?」「自分も気づかないリスクを検証して」が AI 駆動開発の事業継続性の核です。AI と人間が相互に検証し合う関係が、長期的に最も生存率が高い構造です。