生成AIの「革命」から3年、企業は投資回収に苦戦——丁寧すぎるAIと不安定さ
生成AIが話題をさらってから約3年。多くの企業が製品や業務に組み込みましたが、利益や生産性といった「目に見える成果」につなげる段階で足踏みが続いています。
「AI promised a revolution」——期待が先行、現場は調整に追われる
2022年頃からの生成AIブームを受け、大小さまざまな企業がチャットボットや自動要約、社内ナレッジ検索などの導入を急いできました。ただ、経営層・アドバイザー・複数の調査結果によると、現時点では投資に見合うリターンを得られている企業は多くない状況です。
調査が示す「成果の薄さ」
- Forrester Researchが2025年の第2四半期に実施した幹部調査(1,576人)では、過去1年でAIにより利益率が改善したと答えたのは15%でした。
- BCGの調査(2025年5月〜7月中旬、1,250人)では、AIが組織全体で広く価値を生んでいるとしたのは5%にとどまりました。
多くの経営者は「いずれ変革は起きる」と見ています。一方で、社内でそれがどれだけ早く起きるのかについては、見通しを修正し始めています。
つまずき①:AIが「丁寧すぎる」——お世辞(sycophancy)の壁
具体例として紹介されたのが、ワイン収集アプリCellarTrackerの取り組みです。同社は2025年春、個人の好みに合わせて率直なワイン推薦を行う「AIソムリエ」を構築しました。しかし問題は、チャットボットがユーザーに好かれようとするほど“優しすぎた”ことでした。
CEOのEric LeVine氏は、AIが「『あなたはそのワインは好きにならない可能性が高い』と率直に言う」代わりに、過度にポジティブな言い回しに寄ってしまったと説明します。結果として、機能公開までに6週間の試行錯誤を要し、プロンプト設計(指示文)を工夫して“ノーと言ってよい”許可を与えることで、ようやく狙いに近づけたといいます。
つまずき②:一貫性のなさ——正しく要約できたり、できなかったり
生成AI導入で頻繁に語られるのが、回答のブレや取り違えです。北米の鉄道サービス企業Cando Rail and Terminalsでも、従業員向けに社内の安全報告書や研修資料を学習させ、参照・要約するAIチャットボットのテストを行いました。
ところが、業界の安全基準をまとめた約100ページの文書「Canadian Rail Operating Rules」を、モデルが一貫して正確に要約できないという課題に直面しました。忘れたり誤読したりするだけでなく、時には存在しない規則を“作ってしまう”こともあったとされます。研究者によると、モデルは長文の中ほどにある情報の想起が苦手な場合があり、Candoは現時点でこのプロジェクトをいったん中止し、別案を試している段階です。
つまずき③:コールセンターは「全部は置き換わらない」
顧客対応はAIによる大幅な置き換えが期待されてきた領域の一つです。しかし実運用では、任せられる範囲が想定より限定的だったという学びも出ています。
スウェーデンの決済企業Klarnaは2024年初め、OpenAI技術を使ったカスタマーサービスエージェントを投入し、「700人分の業務を担える」と発表しました。ところが2025年には、CEOのSebastian Siemiathowski氏が、人と話したい顧客もいることを認め、トーンダウンを余儀なくされたといいます。
同氏によると、AIは単純な用件では信頼でき、現在は約850人分の業務を担える一方、複雑な案件は人間の担当者にエスカレーションされやすいという現実があります。
「得意なはずのAIが、簡単なことに失敗する」——“ギザギザの最前線”
大規模言語モデルは数学やコーディングのような複雑タスクを急速にこなし始めています。その一方で、比較的単純に見える作業で失敗することがあり、この矛盾を研究者は「jagged frontier(ギザギザの最前線)」と呼びます。
AIアプリ企業WriterのCEO、May Habib氏は「企業がAIツールを実際に役立てるには、より手厚い伴走が必要だ」と述べています。つまり、モデル性能の向上だけでなく、業務設計・ガバナンス・評価方法まで含めた“使いこなし”が、成果を左右し始めているということかもしれません。
いま企業が見直しているのは「いつ」「どこまで」任せるか
2025年の時点で浮かび上がるのは、生成AIが「使えない」という単純な話ではありません。むしろ、
- 率直さ(お世辞の抑制)
- 一貫性(長文・規則・例外処理)
- 人間対応との最適な分担(顧客体験)
といった運用のディテールが、投資回収を難しくしている様子が見えてきます。生成AIの導入は「入れるかどうか」から、「どの業務に、どんな責任分界で、どう測るか」へ。企業の関心が次のフェーズに移りつつある——そんな空気を感じさせる事例です。
Reference(s):
cgtn.com








