Apr 29 2026 ビジネスコラム

生成AIの限界5つ——東大首席超えなのに「描けない」仕事の境界線

Contents

AIが作った企画書、地図の店舗位置が「海の上」
東大首席超え。それでも描けない図形
なぜ「描けない」のか——構造的な理由
経営者が引くべき5つの境界線
今すぐできる1st Step——「3行の指示書」を作る
ただし、この境界線は永久ではない
まずは、明日の会議資料から
引用元・参考資料

AIが作った企画書、地図の店舗位置が「海の上」

月曜の朝。経営会議。プロジェクターに映る企画書。「これ、AIに作らせました」。役員のひとりが言う。資料はきれい。論点も整っている。数字も揃っている。

しかし、グラフの軸がずれている。地図上の店舗位置が一つ、海の上にある。図解の矢印は、どこから出てどこへ向かうのか分からない。

会議室がしんと静まる。「AIなのに、なぜ?」——その違和感の正体を、本稿で解き明かします。

東大理三にも京大医学部にも、合格最高点を超えて受かるレベルの生成AI。それでも、明確にできない仕事が残っています。経営者がいま知るべきは、その境界線。今日はそこを5つに整理してお届けします。

東大首席超え。それでも描けない図形

まず、衝撃の事実から。

株式会社LifePromptと河合塾講師による2026年度入試の検証では、ChatGPT 5.2 Thinkingが東京大学理科三類で503.59点（550点満点）、京都大学医学部医学科で1176.38点（1275点満点）を獲得。いずれも合格者最高点を超過した。

参考までに、2026年度の東大理三合格者最高点は453.60点、京大医学部医学科は1098.25点。人間の首席を、AIが超えたということです。Gemini 3 Pro Previewも同様に超過、Claude 4.5 Opusも同水準で挑戦しています。

東進ハイスクールの別調査でも結論は同じでした。Claude Opus 4.6、Gemini 3.1 Pro、GPT-5.2の3種すべてが「理科三類にも余裕で合格できる極めて高い水準」に到達。文系数学にいたっては3種全員が満点。最高点はClaude Opus 4.6で、9割に迫る成績だったと報告されています。

「もう、AIに任せていいんじゃないか」——そう思いますよね。あなたの会社でも、同じ議論が出ていませんか?

しかし、ここからが本題です。

同じ調査が、はっきりと弱点を指摘しています。図形を描けない。地図を読めない。グラフの構造を捉えきれない。たとえ計算式までたどり着いても、それを図に起こす一歩ができない。これが、首席超えAIのいまの限界です。

なぜ「描けない」のか——構造的な理由

少しだけ背景を解説します。

生成AIの中身は、ざっくり言えば「次に来る言葉を予測する仕組み」。文字や記号の並びを、過去の膨大な学習データから推測して出力します。テキストの世界では、これが恐ろしいほどうまく機能する。だから論述試験で満点近くを取れる。

ところが、図形・グラフ・地図は事情が違います。これらは空間の中での関係性で意味が決まる。「Aの右にB、Bの上にC、AとCを結ぶ三角形の面積は」——この位置と関係を内部で正しく組み立てる力が、いまのAIにはまだ弱い。

たとえるなら、料理のレシピは完璧に暗唱できるけれど、フライパンの中で具材を実際に動かす手を持っていない料理人。手順書としては最強。手元の作業は不器用。そんなイメージです。

東進調査でも、Claudeでさえ「計算式までは到達できたが、実際に図示することはできなかった」と記録されています。日本史の史料問題では「具体的な史料に影響されるのか、ただの要約に終始してしまう傾向」が出た。地理の字数制限問題では、Claudeが17点と低成績。出力量のコントロールに弱点が露呈しました。

整いすぎた答案の中に、特定の穴がある。これが、いまの生成AIの輪郭です。

経営者が引くべき5つの境界線

ここからが本題。明日からの仕事の出し方を変える、5つの境界線です。

境界1: 図解・地図・チャートの「最終形」をAIに任せない

提案書の構成案、文章ドラフト、要点整理——ここまではAIに任せていい。任せてはいけないのは、図解と地図の最終出力。

たとえば、店舗網の地図、組織図、業務フロー図、データの分布チャート。AIが出してきたものを、そのまま会議に出していませんか? 軸のずれ、矢印の不整合、位置の間違い——人間の最終チェックが、いま一番効くポイントです。

「図がきれいに見える」=「正しい」ではない。見た目の整いに騙されない目を、経営者が持つ必要があります。

境界2: 文字数・分量の厳密な制御は人間がやる

地理の字数制限問題で、首席超えAIが17点。これ、ビジネス文書でも同じことが起きます。

500字の社外向け告知、3スライドで完結するエグゼクティブサマリー、200文字のSNS投稿。AIに「○○字で」と指示しても、しれっとオーバーする。逆にスカスカで返ってくることもある。

分量の厳密な制御は、まだ人間の役割。AIに下書きさせて、最終の「削る・足す」は人間が握る。これが現実解です。

境界3: 因果関係の「具体的な提示」は人間が補強する

LifePromptの調査ではこう指摘されています。文章の論理関係・因果関係の提示に弱さ。

「Aが起きた。だからBになった」——AIはこの形式を組めます。問題は、なぜAがBに繋がったのか、その間にあった具体的なメカニズムを埋めるところ。ここが薄くなりがち。

経営判断の資料、取締役会への報告、トラブル原因の説明。「だから何が言えるのか」を最後に詰めるのは、依然として人間の仕事です。

境界4: 史料・一次資料の「批判的読解」を任せない

東進調査の日本史で出た弱点。「具体的な史料に影響されるのか、ただの要約に終始してしまう」。

これ、ビジネス文脈では契約書、調査レポート、現場の議事録を扱うときに直結します。AIは表面の言葉を上手にまとめる。でも、書かれていない裏の意図、矛盾点、抜け落ちている論点——ここを掘る作業は、まだ人間の領域。

ただの要約屋にAIを使うなら最強。批判的に読む仕事は、自分の手で。

境界5: 「現場の手触り」が必要な判断は人間が握る

そもそもAIは、現場に立っていません。倉庫の匂い、店舗の混雑、顧客の声のトーン、社員の表情——身体で感じる情報が、AIには入ってきません。

数字とテキストだけで語れる仕事はAIに寄せていい。手触りで判断する仕事は、人間が握り続ける。この線引きを曖昧にすると、判断を間違えます。

今すぐできる1st Step——「3行の指示書」を作る

明日からやれることを一つだけ。

AIに仕事を出すときの「3行の指示書」を、社内テンプレートにしてください。

AIに任せる範囲(例: 構成案・初稿・要約)
人間が必ずチェックする範囲(例: 図表・数字・因果の核心)
AIに絶対やらせない範囲(例: 最終分量制御・現場判断)

たったこれだけ。たかが3行、されど3行。役割分担が言語化された瞬間、AIへの仕事の出し方が一段上がります。

少し脱線しますが、「AIに任せすぎて、若手が育たなくなった」——これは多くの企業で語られ始めている問題です。境界線を引くことは、AIを抑えるためではなく、人間の仕事を残すためでもある。そう思います。

ただし、この境界線は永久ではない

ここは公平に書きます。

LifePromptの検証では、昨年（2025年）時点で東大理系数学のスコアは38点だった最新モデルが、今年は満点を取りました。1年で38点→満点。進化のスピードは、私たちの想像を超えています。

進化幅: 2025年検証時の最新モデル東大理系数学スコアは38点。2026年検証時は満点。たった1年。

つまり、いま挙げた5つの境界線は、永久に有効ではないかもしれません。半年後、1年後、図形も地図も完璧に処理する世代が来る可能性は十分にあります。

だから経営者に必要なのは、「いまの境界線を知り、定期的に引き直す」習慣。AIへの仕事の出し方は、固定したら負け。四半期に一度、境界線を更新するくらいの感覚が、ちょうどいい。

まずは、明日の会議資料から

東大首席を超えるAIでも、図が描けない。地図が読めない。字数が守れない。因果の核心を詰めきれない。現場の手触りを持たない。

この5つを覚えて、明日の会議資料からAIへの指示の出し方を変えてみてください。何を任せ、何を握るか。境界線が引けた瞬間、AIは敵でも脅威でもなく、あなたの最強の右腕になります。

あなたの会社では、どこまでAIに任せていますか? その境界線、言語化されていますか?

引用元・参考資料

逆パワハラが経営者に告げる3つの組織サイン——吹田市47歳職員「減給処分」の本質

YUSUKE HORI

複数社を運営する経営者。上場企業の代表者取締役経験もあり。自らも様々な事業を手掛ける一方で、多数の会社の支援も行う。AIがもたらす経営のインパクトは巨大。だからこそ組織でのAI活用方法を提案したい。

生成AIの限界5つ——東大首席超えなのに「描けない」仕事の境界線

AIが作った企画書、地図の店舗位置が「海の上」

東大首席超え。それでも描けない図形

なぜ「描けない」のか——構造的な理由