第7章: 小さな専門家をたくさん育てる

「全部やります」と引き受けた結果、全部60点だった

品質サイクルが回り始めて、ようやくAI社員の仕事に合格ラインが見えてきた頃のことです。

CC Company（シーシーカンパニー）のマーケティング部門には、最初「マーケティング担当」のAI社員が1人いるだけでした。note記事の執筆、X（エックス）投稿の作成、Facebook（フェイスブック）投稿への展開、パフォーマンス分析。全部この1人に任せていました。AI社員は疲れません。文句も言いません。何を頼んでも「わかりました」と引き受けてくれます。だから、つい欲張りました。

最初の異変は、note記事の品質スコアに現れました。記事だけを書かせていた頃は80点前後で安定していたのに、X投稿やFacebook投稿の業務を追加した途端、記事のスコアが65点に落ちたのです。「誰に向けて書いているのか」がぼやけた記事が増え、毎回3〜4回の修正が必要になりました。X投稿は記事の要約をそのまま140字に縮めただけで切れ味がない。Facebook投稿は記事のコピーにしか見えない。パフォーマンス分析は数字を並べるだけで、示唆がない。どの仕事も「60点」で、どれも合格ラインに届かない状態でした。

町の何でも屋さんに、水道工事も電気工事もペンキ塗りも全部頼んでいるようなものです。引き受けてはくれるけど、どれも専門業者の仕上がりには遠く及ばない。

川島さんにも同じことが起きていました。1つのAI社員に「メール対応もやって、議事録もまとめて、経費精算の下書きもやって」と全部任せていたのです。結果、メール対応はまずまずでしたが、議事録は要点が抜け、経費精算はフォーマットがバラバラ。上司に出した議事録で「決定事項が抜けている」と指摘されて初めて、問題の深刻さに気づいたそうです。

原因は技術的な特性にあります（詳しくはLLM知識セクションで解説します）。ここでは結論だけ先にお伝えします。AI社員は、1つの領域に集中させたときに最も高い品質を出す。だから、「万能な1人」を育てるのではなく、「小さな専門家をたくさん」育てるのが正解でした。

あなたの現在地を確認する

1人のAI社員に3つ以上の異なる業務を任せている
AI社員の育成マニュアル（CLAUDE.md）や業務手順書（SKILL.md）が500行を超えている
成果物の品質が業務によってばらつく（記事は80点だがSNS投稿は50点、など）
AI社員に新しい業務を追加するたびに、既存業務の品質が下がる気がする
「この業務はうまくいくのに、あの業務はダメ」という領域差がある

3つ以上チェックが付いた方: あなたのAI社員は「何でも屋」になっています。この章で専門分化の方法を学びましょう。

1〜2個の方: まだ深刻ではありませんが、業務が増える前にこの章の考え方を知っておくと予防になります。

チェックがゼロの方: すでに専門分化ができているか、AI社員がまだ1つの業務しか担当していない状態です。将来の拡張に備えて、判断基準だけ頭に入れておいてください。

「書いたはずの指示が消える」問題

最初に異変に気づいたのは、クリエイティブ部門でした。

講演スライドの制作を任せていたAI社員の育成マニュアルが、273行まで膨れていました。配色ルール、テンプレートの使い方、画像生成の指示、ブランドガイドライン。1人に全部持たせていたのです。すると、「配色は白背景に濃紺の文字」と書いてあるのに、薄いグレーの文字で出力してくる。「テンプレートを使え」と書いてあるのに、ゼロから作り始める。マニュアルの中ほどに書いてあるルールが、まるで「見えていない」かのように無視されていました。

人間でも、100ページの業務マニュアルを渡されたら、最初と最後は読んでも途中を読み飛ばしてしまいます。AI社員にも同じことが起きます。第3章で紹介した「Lost in the Middle」（長い文書の中間が見落とされる現象）です。文書が長くなるほど、中間部分への注意が構造的に低下します。

Anthropic（アンソロピック。Claude Code（クロードコード）の開発元）の公式ガイドでは、指示ファイルを約500行以内に保つことが推奨されています。しかしCC Companyの実運用では、200〜300行あたりから「書いたはずの指示が反映されていない」という現象が出始めました。500行に達してから慌てるのではなく、200〜300行を超えたあたりで「この1人に持たせすぎていないか」を確認する習慣をつけることをお勧めします。

これが最初の発見でした。指示書が長くなりすぎたら、分けるタイミングです。

得意な仕事と苦手な仕事の差が開いていく

指示書の長さだけが問題ではありませんでした。

マーケティング担当AI社員の品質スコアを業務ごとに見ると、はっきりとした傾向がありました。note記事は修正2回で合格する日が多いのに、X投稿は8本中3〜4本が不合格。Facebook投稿に至っては、note記事をそのまま貼り付けたような文章が出てくる。「あなたは記事を書くのは得意だけど、SNSは苦手なんだね」と言いたくなるような状況です。

人間の社員でも、経理と営業を兼務させたら、得意な方は問題なくても苦手な方の品質が下がります。AI社員も同じです。第5章で設定した合格基準を使って業務ごとのスコアを比較すると、差が一目瞭然でした。

川島さんの場合はもっと分かりやすかったそうです。AI社員に任せていたメール対応は90点。でも同じAI社員に任せた経費精算の下書きは、金額の端数処理がバラバラで「信用できない」レベルだった。メール対応と経費精算では、必要な知識がまったく違う。同じ社員に両方やらせる意味がなかったのです。

ここで2つ目の発見がありました。業務によって品質に差が出たら、分けるタイミングです。

「同じ知識を使っているか」で判断する

では、どこまで分けるべきか。何でもかんでも分ければいいわけではありません。

たとえば、note記事の執筆とデータ分析を考えてみてください。記事を書くには「読者に響く文章の構成」を知っている必要がありますが、データ分析には「数字の読み方と改善提案の出し方」が必要です。この2つに共通する専門知識はほぼありません。同じ人に任せても、それぞれの専門性が高まるわけではないので、分けた方がいい。

一方、note記事の執筆とnote記事のSEO（Search Engine Optimization：検索エンジンで上位に表示されるための対策）チェックはどうでしょう。どちらも「noteというプラットフォームの特性」と「読者がどんな言葉で検索するか」という共通の専門知識を使います。この場合は、同じAI社員に任せても問題ありません。

この判断は、アダム・スミス（Adam Smith）が1776年の「国富論」で示した分業の原理とも一致しています。ピン工場の例で有名な話ですが、針金を伸ばす人、切る人、先を尖らせる人と工程を分けたら、1人が全部やるより240倍の生産性になった。ただし、スミスも指摘しているように、分業には「連携コスト」が伴います。分けすぎると、今度は受け渡しに時間がかかる。だから「共通する知識があるなら分けない」という判断が大切なのです。

迷ったら、「この2つの業務をやるとき、同じ知識を使っているか？」と自問してみてください。答えがノーなら、3つ目の判断基準に該当します。2つの業務に共通する専門知識がなければ、分けるタイミングです。

1人を10人に分けたら、全員が合格ラインを超えた

3つの判断基準を使って、CC Companyのマーケティング部門は「1人のマーケティング担当」を段階的に解体していきました。

ただし「1プラットフォーム＝1人」と機械的に分けたわけではありません。「作る」と「チェックする」で専門家を分けるという設計にしました。この区別が重要でした。

まず、「作る」専門家。

note記事専門家: noteの特性、読者層、記事構成のベストプラクティスだけを深く知っている。執筆から品質チェックまで一気通貫で担当する
SNS投稿専門家: note記事をもとに、X、Facebook、Threads（スレッズ）の投稿文をまとめて生成する。3つのプラットフォーム分を1人が作るのは、元ネタ（note記事）が共通しているから。先ほどの「共通する知識があるなら分けない」という判断です
分析専門家: パフォーマンス指標の読み方、改善提案の出し方だけを知っている

次に、「チェックする」専門家。ここが面白いところです。SNS投稿文は1人の専門家がまとめて作りますが、品質チェックはプラットフォームごとに分けました。作成には「元ネタの記事をどう要約するか」という共通のスキルが必要ですが、品質チェックには「このプラットフォームでは何が良い投稿か」というプラットフォーム固有の知識が必要だからです。

X品質チェッカー: Xのアルゴリズム（SNSで「どの投稿を多くの人に見せるか」を決めるルールのこと）の特性と、エンゲージメント（「いいね」やリポストなど読者の反応）が高い投稿パターンだけを知っている
FB品質チェッカー: Facebookの投稿フォーマットと、ビジネス層へのリーチの仕方だけを知っている
Threads品質チェッカー: Threads（Meta（メタ）社が提供するテキスト中心のSNS）の投稿特性だけを知っている

さらに、支援系の専門家。

SEO専門チェッカー: noteのSEO（検索結果で記事を上位に表示させるための対策）だけを専門にチェックする
サムネイル専門家: 記事のサムネイル画像（記事一覧に表示される小さな画像）の生成指示だけを担当する
ネタ評価専門家: 記事を書く前に「このネタは書く価値があるか」を点数で評価する
投稿管理専門家: 記事の下書きから投稿完了までの全工程を追跡、管理する

こうして、マーケティング部門は最終的に10人の専門家体制になりました。結果、note記事の品質スコアは平均65点から82点に上昇。ほとんどが1〜2回の修正で合格するようになり、修正サイクルの回数が半減しました。SNS投稿もほとんどが3回以内の修正で合格するようになり、頼む側としては安心して任せられる状態です。

なぜこれほど差が出たのか。1人体制のとき、育成マニュアルと全業務の手順書を合わせると約1,500行に達していました。300行でも中間部分が脱落しやすくなるのに、1,500行では大半の指示が「見えていない」のと同じ状態です。専門家体制に分けた後は、部署の育成マニュアルが約190行、各専門家の業務手順書も最大で160行程度に収まっています。

専門家は「何をやるか」だけでなく「何をやらないか」が明確な存在です。note記事専門家はSNS投稿のことを考えません。X品質チェッカーはFacebookのルールを知りません。だからこそ、自分の領域に集中できるのです。

一気に10人にしたわけではない

「10人体制」と聞くと大がかりに聞こえますが、最初から10人を設計したわけではありません。約2週間の運用を経て、段階的に到達した形です。

段階1: まず1人の専門家を育てる。CC Companyでは、最初に育てたのは「note記事の専門家」でした。毎日1本投稿するという方針があり、最も頻度が高かったからです。この1人が安定して合格ラインを超えるようになるまで、次の専門家には手を出しませんでした。

段階2: 品質が安定したら次を切り出す。note記事専門家が安定した後、SNS投稿の品質が課題になったため「SNS投稿専門家」「X品質チェッカー」「FB品質チェッカー」を一気に切り出しました。XとFacebookでは最適な書き方がまったく違うため、品質チェッカーは最初からプラットフォーム別に分けています。

段階3: 必要に応じて追加する。Threadsへの投稿を始めたタイミングで「Threads品質チェッカー」を追加しました。既存のFB品質チェッカーの手順書に「Threadsのルール」を追加するのではなく、新しい専門家を1人追加するだけ。これが「小さな専門家」方式の強みです。既存の専門家には一切影響がありません。その後もSEOチェッカー、サムネイル専門家、ネタ評価専門家、投稿管理専門家と、必要に応じて段階的に追加していきました。

無理に増やす必要はありません。専門家が増えるほど連携コストも増えるため、「分けた方が品質が上がる」と確信できる場合にだけ追加します。

専門家が増えたら「窓口」を置く

専門家を増やした途端にぶつかったのが、「誰に頼めばいいかわからない」問題です。

これは人間の組織でも同じです。大きな会社に電話して「担当者につないでください」と言ったら、3回たらい回しにされた経験はありませんか。専門家が増えると、頼む側の負担が増えるのです。

CC Companyでは秘書室が窓口を担当しています。オーナーからの依頼はまず秘書室が受け、CEO（Chief Executive Officer：意思決定担当）が内容に応じて適切な専門家に振り分ける。オーナーは秘書室とだけ話せばよく、裏側で何人の専門家が動いているかを意識する必要がありません。

専門家同士の連携は、ファイルを介した引き継ぎで実現しています。note記事専門家が記事を完成させたら所定のフォルダに保存する。SNS投稿専門家はそのフォルダを参照して投稿文を作成する。明示的な「引き継ぎ」は不要で、ファイルの存在自体が引き継ぎになります。

ただし、正直にお伝えしておきます。連携設計は、専門家が3人を超えたあたりから急に複雑になりました。最初から完璧な設計を作ろうとする必要はありません。まず最低限の連携ルール（誰が誰にどのフォルダでファイルを渡すか）だけ決めて動かし、引き継ぎミスが起きたらその都度ルールを足していく。第6章の品質サイクルと同じ考え方です。連携の詳しい設計方法は第14章「AI社員同士を連携させる」で解説します。

では、「全体として整合性が取れているか」は誰が確認するのか。CC Companyでは、数値化できるルール（文字数、構成、チェックリスト項目など）は仕組みでカバーし、「この言い回しはうちのトーンに合っているか」といった感覚的な判断はオーナー（人間）が行っています。仕組みで土台を固めた上で、人間が最後に全体を見渡す設計です。この考え方は第9章で詳しく解説します。

規模に応じた実践

個人の場合

自分の仕事を3〜5個の専門領域に分け、それぞれにAI社員を配置するところから始めます。たとえば営業部門の管理職なら、「提案書作成の専門家」「リサーチの専門家」「報告書作成の専門家」の3人体制で十分です。

個人で始める場合のコツは、最初から5人を一気に立ち上げようとしないことです。まず1人の専門家を育て、品質が安定したら次の専門家を追加する。この順番が大切です。

チームの場合（同じ部署の仲間同士）

チームレベルで最も価値があるのは、1人が育てたAI専門家のマニュアルをチーム全員で共有できることです。

川島さんの会社では、営業チームのAさんが「提案書作成AI」を育てました。合格基準を設定し、品質サイクルを回して、安定して80点以上の提案書が出るようになった。このマニュアルをBさんやCさんにも渡したら、チーム全員が同じ品質の提案書を作れるようになったそうです。Aさんが体で覚えていた「うちの提案書はこう書く」というノウハウが、チーム共有のマニュアルになったのです。

組織の場合（部署を超えた連携）

組織レベルで新たに必要になるのは、部署間の成果物の受け渡し設計です。

CC Companyでは、マーケティング部で育てた「サムネイル画像の生成指示を作る専門家」が、クリエイティブ部の講演スライドの挿絵作成にもそのまま活用されています。1つの部署で磨いたスキルが、別の部署でも使える。これは個人やチームの段階では起きない、組織レベルならではの効果です。

コラム: 1つのスキルに2つのスタイルを混ぜたら、両方ダメになった

マーケティング部門だけでなく、クリエイティブ部門でも「分ける」判断が必要になった場面があります。

講演スライドの制作スキルに、「久原スタイル」（白背景に濃紺の文字、テンプレートベース）と「kintone（キントーン）スタイル」（ゴールドと白の配色、画像生成ベース）の2つのデザイン方針が混在していた時期がありました。1つの手順書の中に「久原スタイルの場合はこうする」「kintoneスタイルの場合はこうする」と条件分岐が増え、手順書が複雑化していきました。

結果、どちらのスタイルでスライドを作っても中途半端な仕上がりになりました。久原スタイルなのにkintoneの配色が混ざったり、kintoneスタイルなのにテンプレートの使い方が久原式になったり。

解決策は、2つのスタイルを完全に別のスキルに分離することでした。「久原スタイルディレクター」と「マーシー式スライドディレクター」という2人の専門家に分けたところ、それぞれの品質が安定しました。1つのスキルを2つに分ける作業は1日で終わりましたが、品質の改善は劇的でした。

マーケティングの「作る人」と「チェックする人」の分離と同じ原理です。共通する知識がないものを1つにまとめると、両方の品質が下がる。

LLM（Large Language Model：大規模言語モデル）知識: なぜ専門分化で品質が上がるのか

第3章で解説した「Lost in the Middle」が、専門分化の技術的根拠です。長い文書の中間部分は注意が低下し、正答率が最大20ポイント以上落ちるという研究結果でした。

1人に全業務のマニュアルを持たせると、この中間部分への注意低下がもろに効いてきます。1,500行の指示のうち、先頭と末尾の数百行は守られても、中間のルールが脱落する。これが「書いたはずの指示が反映されていない」の正体です。

専門家ごとにファイルを分ければ、各ファイルは100〜200行程度に収まります。ファイルが短く焦点が絞られているため、中間部分の情報脱落が起きにくくなります。つまり、「小さな専門家をたくさん育てる」というアプローチは、Lost in the Middleを構造的に回避する設計なのです。

これは人間の組織でも同じです。「何でも屋」は器用貧乏になりがちですが、「この領域だけは誰にも負けない」という専門家は深い仕事ができます。人間の組織が長い歴史の中で到達した「専門分化」という知恵が、AI社員の運用にもそのまま当てはまるのは、偶然ではないでしょう。

専門家を分けたことで、「誰が何を担当するか」が明確になり、品質が安定しました。しかし、同じ専門家に同じ作業を頼んでいるのに、「昨日は良かったのに今日はダメ」という日ムラが残っています。原因は、指示の出し方が毎回微妙に違うことでした。専門家を分けても、毎回の手順が標準化されていなければ品質はばらつきます。

← 前の章第6章: 合格するまで繰り返す次の章 → 第8章: 業務手順書を作る