Driving the AI Agent
車は、エンジンの構造を知らなくても走らせられる。
でも、中身の癖を知っている人は、運転がうまい。
AIエージェントも、たぶん同じだ。
覚えるべきは、
コマンド集ではない。
車は、エンジンの構造を知らなくても運転できる。アクセルを踏めば進むし、ハンドルを切れば曲がる。AIエージェント——たとえば Claude Code も同じで、コマンドをいくつか覚えれば、とりあえず動く。
けれど、長く乗っていると差が出る。同じ車でも、エンジンの癖を知っている人は坂道でのギアの使い方が違う。「なぜそうするのか」が腹に落ちているから、初めての道でも応用が効く。
AIで言えば——コマンド(魚)をいくつ覚えても、釣り方(原理)を知らなければ、状況が変わるたびに詰まる。この記事は、魚の配り方ではなく、釣り方の話をする。覚えるのではなく、握る。握ってしまえば、コマンドは後からついてくる。
この記事が握らせる「釣り方」
AIがどういう生き物かを知れば、
握る手すりは、自然と3本に絞られる。
先に結論を置く。AIは 「記憶喪失の天才バイト」 だ。優秀だが、毎朝すべてを忘れて出勤し、知らないことも自信満々に答える。この一行さえ腹に落ちれば、握るべき手すりは コンテキスト・検品・戻せる の3本に絞られ、できることは 3段 に整理できる。順に降りていこう。
Ch.01
エンジンを開ける
記憶喪失の天才バイト
Ch.02
3本の手すり
どの段でも握る物は同じ
Ch.03
どこまで握るか
話す/任せる/仕組みにする
Ch.04
モヤモヤ処方箋
症状から引く
Chapter 01
AIの挙動は、たった2つの性質でほとんど説明がつく。これが「中身」だ。ここを押さえると、あとに出てくる手すりが「なぜ必要なのか」が、いちいち腹に落ちる。
AIは「覚えている」のではない。毎回ゼロから、いま目の前にある材料を端から端まで 読み直して 答えを作っている。だから前回の会話も、見せたファイルも、その場の机に乗っているあいだだけ有効で、机を片付ければ何も知らない人に戻る。
しかも机に物を積むほど、毎回読み直す量が増える。だから会話が長くなると 重く、ぼやける。長い机では最初と最後は目に入りやすい一方、真ん中に置いた指示ほど見落とされやすい——これも、毎回ざっと読み直すからこそ起きる癖だ。「さっき言ったのに」が通じないのは不親切なのではなく、そもそも記憶という仕組みを持っていないからだ。
AIは「正しい答え」を引き出しているのではなく、「次に来そうな言葉」を選び続けて 文章を組み立てている。膨大な文章を読んできたので、たいていは正しい。だが内部に「正しさを確かめる装置」があるわけではない。
だから知らないことも、知っているのとまったく同じ口調で、堂々と間違える。優秀なバイトが、わからない仕事も「できます!」と笑顔で受けてしまう感じに近い。悪意ではなく、それが生成の仕組みなのだ。
この2つは欠陥ではなく 仕様 だ。直そうとするのではなく、前提として付き合う。なぜ「らしさ」を出すだけで賢く振る舞えるのか——その仕組みの中身は別の記事(「次の単語を選んでいるだけ」の先にあるもの)に譲る。ここでは、運転に必要なぶんだけ握っておけばいい。
第1章の結論。AIは「毎回読み直す」「らしさを出す」だけ。——では、この2つの性質から、握るべき手すりがどう導かれるのか。
Chapter 02
次の章で「3段」のレベルを上がっていくが、どの段に上がっても 握る物は変わらない。同じ手すりが3本。しかもこの3本は、さっきのエンジンから自動的に導かれる。覚える必要はない。性質を思い出せば、毎回その場で再発明できる。
← 性質①「記憶喪失」から導かれる
AIにとって、会話は 作業台(机) だ。机に乗せた物しか見えないし、それが毎ターン積み上がっていく。だから打ち手は3つに尽きる。
図 — 机は毎ターン積み上がり、片付けでゼロに戻る
AIは積もった机を毎回読み直す(覚えているのではなく、読み直すだけ)。積もるほど重く・ぼける。だから定期的に片付け、残したい前提は貼っておく。
応用 — 机を増やして分担させる
「まとめ役(PM)を立てて分担させるといい」という言い方を、聞いたことがあるかもしれない。仕組みとしては サブエージェント がそれにあたる。「調べ役」「書き役」のように担当を分けると、担当ごとに 専用の机(コンテキスト) が割り当てられる。一つの机に全部積むより、各自の物量が減るぶん、軽く・ぼけにくくなる。やっていることは結局、この手すり①の「机を分ける」と同じだ——握る物が分かっていれば、新しい言葉が出てきても迷わない。
← 性質②「天才バイト」から導かれる
AIは 確信を持って間違える。口調では正誤を見分けられない。だから完成度がどれだけ高く見えても、最後は必ず人が確かめる。これは性能の問題ではなく、生成の仕組みそのものに由来するので、モデルが賢くなっても消えない。
特に 数字・事実・固有名詞 は鵜呑みにしない。経理や集計のように「合っていること」が価値の中心になる仕事ほど、任せてよいが検品は外せない。逆に、壁打ちや下書きのように 後で人が直す前提 の作業なら、多少のズレは気にせず速く回せる。検品の重さは、間違いのコストで決める。
← 「らしさ」は毎回少し揺れる=試行錯誤が前提だから
AIは同じ指示でも毎回まったく同じ答えを返すわけではない。一発で決まる前提のほうが間違い で、本来は「試して、ダメなら戻す」を軽く繰り返すものだ。だから戻せる仕組みが要る——失敗したら巻き戻す(Claude Code なら /rewind)、不安なら 本体に触らずコピーで試す。本体は無傷のまま、安心して何度でも試せる。
手すりが2本(コンテキスト+検品)だと、できるのは 「正しく使う」 まで。3本目(戻せる)が加わって初めて 「怖がらず触れる」 になる。非エンジニアにとっての壁は、知識ではなく 恐怖 だ。戻せるという確信は、行動の許可証になる。
第2章の結論。コンテキスト・検品・戻せる——3本とも、エンジンの2つの性質から素直に出てくる。だから丸暗記はいらない。——次に、この手すりを握ったまま、どこまでAIに任せられるのか。
Chapter 03
AIにできることは、自律度で3段に整理できる。上がっていくのは 「どこまで任せるか」だけ。握る手すりは3段とも同じ3本だ。自分が今どの段にいるかが分かれば、次の一手は見える。
※ ここでの3段は「自分がどこまで任せるか」の目安。製品そのものの自律度を5段階で見る地図は AIエージェントとは何か にある(番号体系は別物)。
考える・調べる・壁打ち。ファイルには触らない。多くの人はここで止まる。だが入口として一番安全で、コンテキストの感覚を掴むには最良の場所だ。
実際に成果物を作らせて受け取る。ここは車のAT/MTと同じで、どこまで自分が手綱を握るか の違いがある。
丸ごと委任(AT=Cowork)
あまり考えず、目的を渡して任せたいとき。調査やまとめなど、手順が安定した仕事に向く。
一手ずつ承認(MT=Code)
細かく調整したいとき。変更を一つずつ確認して進める。ツール作りや、壊したくないファイル向き。
どちらか迷う・振り分けが面倒なら Dispatch という手もある。1つの会話の中で「これはCowork向き/Code向き」をAI側が切り替えてくれる(現時点ではベータで、挙動は変わりうる)。
二度と同じ作業をゼロからやらない。一度うまくいった段取りを、形にして残す。
「同じ手順を 厳密に 繰り返したい」なら、AIにプログラムを書かせて ツール化・スクリプト化 する(毎回まったく同じ結果になる)。「大枠は同じだが、要所で 融通 を利かせたい」なら スキル化 が手っ取り早い。どちらも狙いは同じ——なんでもCLAUDE.mdに書いて机を重くするのを避け、必要なときだけ呼び出すこと。ここでも効いているのは、手すり①の「机を軽く保つ」だ。
第3章の結論。段を上げるほど自律度は上がるが、握る物は同じ3本。——では実際、いま自分が詰まっている「あの感じ」は、どの段・どの手すりの話なのか。
Chapter 04
理屈が分かっても、現場では「なんか噛み合わない」が先に来る。よくある症状から、どの手すり・どの段の話かを引けるようにしておく。これが「中身を知っている人」の引き出しだ。
「作業を足すと、前にできていたものが崩れる」
→ 会話=作業台。仕事ごとに机を分ける(片付け=/clear)。毎回必要な前提は CLAUDE.md に貼る。手すり①
「新しいことを足したいが、壊れそうで怖い」
→ 本体に触らず コピーで小さく試す。良ければ広げる。失敗は /rewind で戻る。怖さは「戻せる」で溶ける。手すり③
「準備や定型作業の時間を削りたい」
→ 丸ごと任せる(AT)。よく使う自己紹介や前提は一度書いて使い回し、毎日の繰り返しは 仕組みにする。LV2〜3
「経理や数字の処理を任せたい」
→ 任せてOK。ただし 必ず検品。数字は鵜呑みにしない。合っていることが価値の仕事ほど、最後の確認は人が持つ。LV2+手すり②
「画像や文章を作りたい」
→ 道具は違っても 「良い指示=良いコンテキスト」 は同じ。何を見せ、何を例に出すかが結果を決める。手すり①
Conclusion
ここまでを一本の線にすると、こうなる。AIは「記憶喪失の天才バイト」(エンジン)。だから握る手すりは コンテキスト・検品・戻せる の3本。任せる深さは 話す/任せる/仕組みにする の3段。これだけだ。
新しいコマンドや新しいツールが出てきても、慌てなくていい。「これはどの手すりの話だろう」 と当てはめれば、たいてい読める。実際この記事に出てきた /compact も、サブエージェントも、スキルも、ばらばらの新機能ではなかった。どれも〈机を軽く保つ〉か〈どこまで任せるか〉の言い換えだ。釣り方を握っているから、魚の種類が増えても困らない。画像でも、文章でも、コードでも、結局は 「良い指示=良いコンテキスト」——見せ方が結果を決める、という一点に戻ってくる。
コマンドは、覚えなくていい。
握る物さえ分かれば、
応用が効く。
「奥義」と銘打ったが、中身は拍子抜けするほど地味だ。魔法のコマンドなどなく、地味な3本の手すりを握り続けること が奥義だった。そして中身を知っても、免許皆伝になるわけではない。運転が少しだけ上手くなるだけだ。——でも、その「少し」が毎日積もる。それが、中身を知っている人の運転だ。