FULLFACT
← 調査レポート一覧へ
FULLFACT独自分析レポート投資対効果2026年6月16日公開

AIを導入したのに売上も利益も増えない 原因と対策 2026

AIの能力は1年で難関ベンチマークを塗り替え、同じ性能を出すコストは約2年で280倍超下がり、利用も1年で約3倍に伸びた。それでも組織の約95%は生成AI投資から測定可能な損益効果を得られていない。AIを導入したのに売上も利益も増えないのはなぜか。能力・価格・普及と財務成果の乖離を一次情報で測り、原因が能力不足ではなく実装にあることを示し、打ち手まで整理した独自分析レポート。

Executive Summary

AIの能力は急上昇し、同じ性能を出すコストは約2年(約23か月)で280倍安くなり、利用も急速に広がっている。それでも組織の約95%は損益に測定可能な効果を出せていない。この乖離の原因は能力の不足ではなく、どの業務でどう測って効かせるかという実装の側にある。

本レポートでは、Stanford HAI, The 2025 AI Index Report(Technical Performance / R&D)、Epoch AI, LLM inference prices have fallen rapidly but unequally across tasks、総務省『令和7年版 情報通信白書 概要資料』、McKinsey QuantumBlack, The state of AI in 2025: Agents, innovation, and transformation、MIT NANDA, The GenAI Divide: State of AI in Business 2025、BCG, AI Adoption in 2024: Where's the Value in AI?(74% of Companies Struggle to Achieve and Scale Value)、U.S. Census Bureau, The Microstructure of AI Diffusionを中心に、公開統計・公的資料・国際機関レポートを再分析した。単一の指標ではなく、AIの能力・価格・普及と、企業の損益・価値創出という成果側の指標を突き合わせて整理する。

結論は次の6点である。

  1. 能力は1年で跳ね上がった

    2023年に導入された難関ベンチマークで、AIのスコアは1年でMMMU+18.8、GPQA+48.9、SWE-bench+67.3ポイント上昇した。実コードのバグ修正を測るSWE-benchでは、解けた課題の割合が2023年の4.4%から2024年の71.7%へ跳ね上がっている。

  2. 同じ性能が約2年で280倍安くなった

    GPT-3.5並みの性能を出すための問い合わせコストは、2022年11月の100万トークンあたり20.00ドルから2024年10月には0.07ドルへ下落した。約2年(約23か月)で280倍超の低下である。ハードウェアのコストは年率30%で下がり、エネルギー効率は年率40%で改善している。

  3. 普及も止まらない

    日本の個人の生成AI利用経験は2023年度の9.1%から2024年度の26.7%へ約3倍に伸びた。McKinseyの調査では、少なくとも一つの業務機能でAIを日常的に使う組織は88%に達している。能力も価格も普及も、すべて改善の方向に動いている。

  4. それでも損益は動かない

    MIT NANDAの調査では、企業が生成AIに300〜400億ドルを投じたにもかかわらず、組織の約95%が測定可能な損益へのインパクトをまったく得られていない。能力と価格と普及が三拍子そろっても、財務成果はついてこない。これがパラドックスの核心である。

  5. 利益に効かせた企業はごく一部

    McKinseyの調査では、全社の営業利益に何らかのインパクトがあったと答えた組織は39%にとどまり、そのうち大半はAIが寄与する利益は5%未満だとした。AIで全社利益に有意なインパクトを出せた高成果企業は約6%にすぎない。BCGの調査でも、AIから実際に価値を生み出せている企業は26%で、残り74%は具体的な価値をまだ示せていない。

  6. 分かれ目は賢さではなく実装にある

    価格が下がり性能が上がっても成果が出ないのは、能力の問題ではない。米国ではAI利用企業の57%がAIを3つ以下の業務機能に限定し、包括的に展開している企業は利用企業の4%にとどまる。どの業務で使い、何を測り、誰が確認し、どのデータを入れるかという実装の設計が、成果の有無を分けている。


1. 問題意識

AIをめぐる数字は、相反する二つの方向に同時に動いている。能力は難関ベンチマークを1年で塗り替え、同じ性能を出すコストは約2年で280倍を超えて下がり、個人の利用経験は1年で約3倍に伸びた。改善を示す指標は、どれを見ても上を向いている。

ところが、企業の財務に表れる指標は動かない。生成AIに巨額が投じられても、損益に測定可能な効果を出せた組織はごくわずかにとどまる。能力・価格・普及がそろって追い風になっているのに、成果だけが取り残されている。本レポートは、この乖離をAI生産性パラドックスと呼ぶ。

パラドックスという言葉を使うのは、原因が直感に反するからである。性能が足りないわけでも、価格が高すぎて手が出ないわけでも、誰も使っていないわけでもない。むしろ逆に、賢く、安く、広く使われている。それでも成果が出ないとすれば、原因はAIそのものよりも、AIを業務に組み込む側にある。本レポートでは、改善する指標と停滞する指標を国内外の一次情報から並べ、両者を分けるものが何かを整理する。


2. 主要データ

指標数値読み方出典
難関ベンチマークの1年の伸びMMMU+18.8 / GPQA+48.9 / SWE-bench+67.32023年導入→2024年(ポイント)Stanford HAI 2025 AI Index
SWE-bench 解決率4.4%→71.7%2023年→2024年(実コードのバグ修正)Stanford HAI 2025 AI Index
同性能あたりの問い合わせコスト$20.00→$0.07/100万トークン2022年11月→2024年10月(約2年で280倍超)Stanford HAI 2025 AI Index
推論価格の下落(全ベンチマーク中央値)年50倍(2024年1月以降は年200倍)同一性能あたり価格の年次下落率Epoch AI
個人の生成AI利用経験(日本)9.1%→26.7%2023年度→2024年度(約3倍)総務省
少なくとも1機能でAIを日常利用88%2025年調査(前年78%から上昇)McKinsey
損益に測定可能な効果なし約95%生成AIに投資した組織(投資額300〜400億ドル)MIT NANDA
価値を生み出せている企業26%残り74%は具体的価値が未達BCG
米国でのAI利用の広がり方57%が3機能以下/全社展開は4%AI利用企業(米国)U.S. Census Bureau

これらの数値は、同一母集団の連続ファネルではない。調査対象、時点、設問定義が異なるため、本レポートでは「能力・価格」「普及・利用」「財務成果」を分けて扱う。


3. FULLFACTの分析

この乖離を読み解く鍵は、改善している指標と停滞している指標が、まったく別の場所を測っているという点にある。能力・価格・利用率はAIそのものの性質や入口の広がりを測る。一方で損益インパクトや高成果企業の割合は、AIを自社の業務に編み込んで初めて動く指標である。前者はベンダーの開発競争と個人の好奇心で勝手に伸びるが、後者は会社が業務を設計し直さない限り進まない。改善する指標だけを見れば「もう十分使える」と錯覚し、停滞する指標だけを見れば「まだ早い」と誤解する。

FULLFACTが注目するのは、米国データに表れた利用の浅さである。AIを使う企業の過半数が3機能以下に限定し、全社的に展開できている企業は利用企業のわずか4%。多くの企業にとってAIは、一部の人が一部の場面で試す道具のまま止まっている。性能が上がっても価格が下がっても、使う業務の範囲が狭ければ、全社の損益には現れない。95%が効果を出せないのは、AIの性能ではなく、使う業務の範囲の狭さに原因がある。

だから打ち手は「使う」から「どの業務でどう測って効かせるか」へ移る。日本のマクロ経済は、この問いを長く放置した先に何が起きるかを示している。個人の利用率が1年で約3倍に伸びても、それだけでは実質賃金や生産性の数字に転化しない。対象業務を選び、入れてよいデータを決め、確認の責任者を置き、成果を測る指標を先に定める。この実装の設計を四半期ごとに見直せる企業だけが、能力と価格の追い風を自社の損益に変えられる。


4. 実行に向けた確認項目

No論点確認内容
1効かせる業務を選ぶ利用者を増やすのではなく、損益に直結する業務を一つ選んで深く使う。業務頻度、扱うデータ、確認者、成果指標が見える業務から始める。
2測る指標を先に決める導入の前に、何が何ポイント動けば成功かを定義する。利用者数や契約ツール数ではなく、業務の処理時間や売上・コストの変化で測る。
3入れてよいデータを線引きするどの情報をAIに渡してよいか、渡してはいけないかを業務ごとに決める。利用が広がるほど、この線引きの不在が成果と信頼の両方を損なう。
4確認と責任の所在を置く出力を誰が確認し、誤りを誰が直し、運用を誰が更新するかを業務ごとに決める。確認の空白が、PoCの出力品質と本番の成果を混同させる。
5四半期で範囲を広げる成果が出た業務の手順と失敗ログを残し、次の業務へ展開する。AI活用方針を年1回の文書ではなく、四半期ごとに見直す運用にする。

上記は、全社一斉導入の前に確認する項目である。最初から対象範囲を広げるよりも、成果を測りやすく、確認責任を置ける業務に絞った方が、運用に残りやすい。


5. 避けるべき進め方

  1. AIツールの比較だけで導入判断を終える。
  2. 全社員向けの一般研修だけで現場定着を期待する。
  3. 出力確認、ログ、責任者を決めないまま業務利用を広げる。
  4. PoCの出力品質を、本番運用の成果と混同する。
  5. 初版の方針文書を作って満足し、モデルやサービスの変更時に見直さないまま放置する。

6. FULLFACT代表コメント

一次情報を並べると、能力も価格も普及も、数字はすべて改善しています。それでも約95%の組織が損益に効果を出せていないのは、AIの性能の問題ではありません。試した人の数ではなく、損益に触れる業務をどれだけ深く設計できたかで差がついています。利用率を追うのをやめ、売上やコストに直結する一つの業務を選んで深く使い、成果を測りながら四半期ごとに範囲を広げる。改善した能力と価格を自社の数字に橋渡しできる企業だけが、この追い風を成果に変えられます。

株式会社FULLFACT
代表取締役 足達彩人


7. 相談窓口

FULLFACTでは、本レポートで提示した観点をもとに、AI実装で最初に扱う業務、利用できるデータ、責任体制、確認ルールを整理する無料顧問制度を10枠限定で案内しています。必要に応じて、業務・データ・組織体制を確認するAI実装診断も活用できます。

主導線: 10枠限定・無料顧問制度で相談する
副導線: AI実装診断について相談する


調査概要

調査名: AIを導入したのに売上も利益も増えない 原因と対策 2026
分析主体: 株式会社FULLFACT
分析方法: 公開統計、公的資料、国際機関レポートの再分析
対象資料: Stanford HAI, The 2025 AI Index Report(Technical Performance / R&D)、Epoch AI, LLM inference prices have fallen rapidly but unequally across tasks、総務省『令和7年版 情報通信白書 概要資料』、McKinsey QuantumBlack, The state of AI in 2025: Agents, innovation, and transformation、MIT NANDA, The GenAI Divide: State of AI in Business 2025、BCG, AI Adoption in 2024: Where's the Value in AI?(74% of Companies Struggle to Achieve and Scale Value)、U.S. Census Bureau, The Microstructure of AI Diffusion
公開日: 2026年6月16日
注意事項: 各調査は対象国、母集団、調査時点、設問定義が異なるため、数値は同一母集団のファネルとしてではなく、AI実装の進み方を読み解く比較材料として扱う。


主要出典

  1. Stanford HAI, The 2025 AI Index Report(Technical Performance / R&D) https://hai.stanford.edu/ai-index/2025-ai-index-report/research-and-development

  2. Epoch AI, LLM inference prices have fallen rapidly but unequally across tasks https://epoch.ai/data-insights/llm-inference-price-trends

  3. 総務省『令和7年版 情報通信白書 概要資料』 https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r07/summary/summary01.pdf

  4. McKinsey QuantumBlack, The state of AI in 2025: Agents, innovation, and transformation https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai

  5. MIT NANDA, The GenAI Divide: State of AI in Business 2025 https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf

  6. BCG, AI Adoption in 2024: Where's the Value in AI?(74% of Companies Struggle to Achieve and Scale Value) https://www.bcg.com/press/24october2024-ai-adoption-in-2024-74-of-companies-struggle-to-achieve-and-scale-value

  7. U.S. Census Bureau, The Microstructure of AI Diffusion https://www.census.gov/library/working-papers/2026/adrm/CES-WP-26-25.html

本レポートは、公開統計・公的資料・国際機関等の一次情報を FULLFACTが再分析した独自分析レポートです。引用・転載の際は 「出典: 株式会社FULLFACT『AIを導入したのに売上も利益も増えない 原因と対策 2026』」と明記のうえ、 本ページへのリンクを掲載してください。
お問い合わせ

AI実装のご相談はこちら。