第12章: AI社員の限界を知る

講演スライドをAI社員にゼロから作らせたことがあります。

プログラムを使ってPowerPoint（パワーポイント）ファイルを自動生成する方法を試しました。テンプレートの選定、テキストの配置、配色の指定。すべてAI社員に任せて、一気に60枚のスライドを出力しました。

ファイルを開いた瞬間、言葉を失いました。背景画像が全部消えている。テンプレートに設定していた書式が吹き飛び、白い背景にゴシック体の文字だけが並んでいる。色使いはチグハグ。レイアウトはガタガタ。率直に言えば、中学生の発表資料のほうがまだましでした。

原因を調べてみると、プログラムでスライドを複製する際に、背景画像や書式情報がコピーされない技術的な制約がありました。つまり、AI社員の能力の問題ではなく、「丸ごと自動で作らせる」というアプローチ自体が間違っていたのです。

そこで、発想を変えました。

「スライドを作れ」ではなく、「スライドの設計書を作れ」と指示したのです。

各スライドに何を載せるか。どの情報をどの順番で提示するか。どんな図解が効果的か。AI社員はこうした「設計」の仕事が驚くほど得意でした。その設計書に従って、人間がプロのテンプレートを使ってスライドを仕上げると、聴講者300名の講演会で「満足度100%」の評価を得られる資料が完成しました。

料理に例えるなら、こういうことです。AIは「献立を考える」のが得意。でも「盛り付け」はまだ人間がやったほうがきれいに仕上がる。レシピの設計はAIに任せて、最後の仕上げは人間がやる。この役割分担が、今の時点では最も良い結果を生みます。

この「役割の逆転」が、この章で最もお伝えしたいことです。

あなたの現在地を確認する

以下の問いに答えてみてください。

AI社員に任せている業務をすべて列挙できる
各業務で「AIが得意な部分」と「人間がやるべき部分」を分けている
AI社員が苦手な業務には、人間がフォローする仕組みがある
「AIに設計させて人間が仕上げる」パターンを実践している業務がある
AI社員に任せる範囲を、失敗を経て意図的に調整した経験がある

全部チェックが付いた方: AI社員との役割分担がすでに設計されています。この章の「予測マシンの経済学」の視点から、自社の判断を再点検してみてください。

1〜3個の方: AI社員は動いているが、任せる範囲が「なんとなく」で決まっている状態です。この章で判断基準を明確にしましょう。

チェックがゼロの方: まだAI社員を導入していないか、導入直後の段階です。この章で「何を任せるべきか」の全体像を手に入れてください。

「全部任せる」から「役割を分ける」へ

冒頭のスライドの失敗には続きがあります。

「設計書を作らせる」方式に切り替えた後も、別の壁にぶつかりました。スライドに挿入する図解画像をAIに生成させたところ、英語のテキストが入った図解は見事な仕上がりでした。構図も配色もプロフェッショナル。ところが、日本語テキストを含む画像を生成すると、文字がおかしい。漢字の画数が足りなかったり、存在しない文字が混じっていたり。しかも画像なので「この一文字だけ直す」ことができません。生成し直すと、今度は別の文字がおかしくなる。

結局、画像の中に日本語テキストを入れることは諦めました。テキストはスライドのテンプレート側で人間が入れ、AIには「テキストを含まないイメージ画像」だけを生成させる。こうすることで、品質が安定しました。

この経験から見えてきたのは、AI社員の能力は「全部できるか、全部できないか」の二択ではないということです。同じ「画像生成」という仕事の中にも、AIが得意な部分と苦手な部分がある。その境界線は、実際に任せてみて初めてわかります。

川島さん（第1章から登場している、中堅メーカーの事務職の方です）も似た経験をしていました。会議の議事録を「完成形まで作って」とAI社員に頼んだところ、箇条書きのメモとしては完璧な出来でした。しかし、社内の正式フォーマットに合わせた体裁に整えようとすると、段落構成がグダグダになる。上司から「前回の議事録と書き方が違う」と指摘されてしまったそうです。

そこで川島さんは「箇条書きメモだけ作って」に切り替えました。AIが出した要点メモを見ながら、自分で社内フォーマットに整える。作業時間は10分から5分に半減しました。「全部任せる」より「分担する」ほうが速かったのです。

指示書の質で結果が5倍変わる

川島さんの経験には、もうひとつ重要な気づきがあります。

ある日、同僚に「AI社員って結局使えなくない？」と聞かれました。その同僚は、AI社員に「議事録作って」と一言だけ指示して、出てきた結果に落胆していたのです。

川島さんは自分のやり方を見せました。会議の目的、参加者の役職、決定事項と未決事項の区別、次回までのアクション。これらを育成マニュアルに書いておくと、AIの出力が見違えるように変わったのです。同僚は「同じAIなのに、こんなに違うの？」と驚いていました。

この違いを式で表すと、こうなります。

元の力 × AI倍率 = 成果

「元の力」とは、あなたがAI社員に渡す指示の質です。育成マニュアルの充実度、手順書の具体性、合格基準の明確さ。これらが「元の力」です。「AI倍率」とは、AIがその指示をどれだけ増幅できるかという係数です。

元の力が 10（詳細な育成マニュアルあり）なら、成果は 10 × 10 = 100
元の力が 2（「議事録作って」の一言だけ）なら、成果は 2 × 10 = 20

同じAI、同じ倍率でも、元の力の差で成果に5倍の開きが出ます。「AIを使ったけど大したことなかった」という感想の多くは、AI側の能力不足ではなく、入力の質が十分でなかったことが原因です。

Harvard Business Review（ハーバードビジネスレビュー）の調査（Wilson & Daugherty, 2018 "Collaborative Intelligence"）でも、人間とAIが協業する場合、「AIだけ」や「人間だけ」より高い成果を出すことが報告されています。ただし条件があります。人間側が「AIに何をどう任せるか」を設計できていること。つまり、元の力が高いことです。

CC Company（シーシーカンパニー）では、この法則を体感してから育成マニュアルの改善に力を入れるようになりました。第4章で育成マニュアルの書き方をお伝えしましたが、あのマニュアルの質こそが、AI社員の出力品質の上限を決めているのです。

失敗から生まれた「役割分担の設計図」

スライド制作での4回の失敗と試行錯誤を経て、CC Companyでは「AI社員にどこまで任せるか」の判断基準が自然にできていきました。

最初の変化は「任せ方」でした。「AIにスライドを作らせよう」という発想から、「AIに設計させて、人間がテンプレートで仕上げよう」に変わりました。限界を知らなければ、「AIが作ったスライドがひどい。やっぱりAIは使えない」で終わっていたかもしれません。限界を正確に知ったからこそ、「ここまでは任せられる。ここからは人間」という線が引けたのです。

次に変わったのは「品質チェックの設計」でした。AI社員にチェックを任せることで人間の負荷は下がります。CC Companyでは別のAIツールを「ゲートキーパー（門番）」として第三者検証に使っています。実際にこのゲートキーパーが、私自身が見落としていた数字の不整合を検出したことがあります。レビューで「表が6つ」と書いたのに、実際のファイルには5つしかなかった。人間もAIも間違える。だからこそ、チェックする側とチェックされる側を分ける設計が必要です。ただし、ゲートキーパーの判定も最終的には人間が確認します。責任は常に人間が持つ。この設計は、AIの限界を前提にして初めて成立するものです。

そして最後に変わったのは「期待値」でした。AIに100点を求めなくなりました。80点を安定して出してくれれば十分です。残りの20点は人間が仕上げる。CC Companyのnote記事は100点満点の評価基準で80点以上を合格としていますが、最初から80点が出ることは稀です。AIが出した70点の原稿を、人間が手を入れて85点にする。この「協業」の感覚が身についたのは、限界を正確に理解してからでした。

コラム: 提案書をAIに「設計」させて人間が「仕上げた」話

スライドと同じ「役割の逆転」を、提案書で試したことがあります。

AI社員導入プログラムの提案書を作る必要がありました。最初は「提案書を作って」と丸投げしたところ、内容は網羅的でしたが、体裁がどうにもビジネス文書らしくない。フォントの使い分け、余白のバランス、セクション間の区切り。こうした「見た目の品格」は、AI社員だけでは安定しませんでした。

そこで、AI社員には「構成設計と本文作成」だけを任せ、体裁の仕上げは人間が専用のツールで行いました。AI社員が作った構成案をベースに、12ページのプロフェッショナルな提案書が完成しました。

面白いのは、構成の質はAIのほうが高かったということです。私が1からアウトラインを考えると、どうしても自分の得意分野に偏ります。AI社員は「読み手が知りたい順番」で情報を並べてくれる。設計はAI、仕上げは人間。この分担パターンは、スライドに限らず多くの業務で有効です。

規模に応じた実践

個人（AI社員1〜2人）の場合

まずは1つの業務で「全部任せる」を試してください。うまくいかない部分が出てきたら、そこが「人間がやるべき部分」です。議事録、メール下書き、データ整理など、日常の業務から始めるのがおすすめです。失敗しても影響が小さい業務で、AIの得意・苦手を体感することが最初のステップです。

チーム（AI社員3〜5人）の場合

各AI社員の得意領域が見えてきたら、「この業務のこの部分はAI社員Aに、仕上げは人間が」という役割分担表を作ります。CC Companyでは、記事の執筆はマーケティング部のAI社員が設計し、最終チェックと投稿は人間がやる、という分担が定着しています。

組織（AI社員6人以上）の場合

組織全体で「AIに任せてよいこと・人間がやるべきこと」の判断基準を明文化します。CC Companyの判断基準はシンプルです。「対外的に出すものの最終判断は人間。社内で完結するものはAIの自律度を上げる」。この一文だけで、各部署が自分で判断できるようになりました。

LLM（Large Language Model：大規模言語モデル）知識: 予測マシンの経済学

AI社員の限界を経済学の視点から理解するために、アグラワル（Agrawal）、ガンズ（Gans）、ゴールドファーブ（Goldfarb）の共著「Prediction Machines」（予測マシンの世紀）（University of Toronto, 2018）の考え方を紹介します。

AIとは「予測」のコストを劇的に下げる技術である。

ここでいう「予測」とは、天気予報のような狭い意味ではありません。「次に来る単語は何か」「このデータのパターンは何か」「この画像に写っているものは何か」など、不確実な情報を補完する行為すべてを指します。AI社員が文章を書いたり画像を生成したりできるのは、この「予測」が高速かつ安価にできるようになったからです。

予測が安くなると、興味深いことが起こります。予測を前提にした「何を選ぶか」という判断の価値が、相対的に高まるのです。

スライドの例で考えてみましょう。「このテーマならこの順番で話すと効果的だ」という予測はAIが得意です。しかし「この講演会では、聴講者の年齢層を考えて文字を大きくしよう」「この企業の社風に合わせてトーンを柔らかくしよう」といった判断は、現場を知る人間にしかできません。

もちろん、AIが判断の一部を担う場面は確実に増えています。マッキンゼー（McKinsey）の調査「The state of AI」（AI活用の現状、2024）でも、AI導入企業の約65%が生産性の向上を報告しています。どこまでAIに任せ、どこから人間が関与するかは、タスクの性質とリスクの大きさで変わります。

重要なのは、AIの進化によって「予測」と「判断」の境界線が動き続けているということです。1年前は人間にしかできなかった予測が、今はAIで十分な精度が出る。その境界線を見極め、自社にとって最適な役割分担を設計し続けること。それが、AI社員を活かす経営者の仕事です。

まとめ

AI社員は万能ではない。しかし「使えない」のではなく、「任せ方」を間違えていることが多い
「AIに作らせる」より「AIに設計させて人間が仕上げる」。この役割の逆転が、多くの場面で最善の結果を生む
出力品質は「元の力 × AI倍率」で決まる。育成マニュアルの質を高めることが成果への最短ルート
限界を正確に知ることで、任せ方・品質チェック・期待値の3つが変わる
AIは予測のコストを下げる技術。人間は判断の価値を発揮する存在。この協業が最も強い

AI社員の限界を知り、役割分担が設計できました。しかし、作った仕組みは放っておくと劣化します。次の章では、仕組みを長期間健全に維持する方法をお伝えします。

← 前の章第11章: 放っておいても動く仕組みを作る次の章 → 第13章: AI社員を定期的に健康診断する