「質とスピード」のトレードオフは存在しない——AI時代に本当に削られているもの

この記事でわかること

✓t-wada「質とスピード」論の核心と、AI時代における読み替え
✓DORA・SPACE・TDD研究が「質と速度の同時達成」をどう支持するか
✓AI生産性データの矛盾——「+55.8%」と「−19%」の正体
✓個人とチームで「教育を削らない」ための5原則

第1章

命題——「削られているのは教育である」

2020年2月、Developers Summitで和田卓人(t-wada)氏は『質とスピード』という講演を行った。当時のスライドは短く、結論は明快だった。品質を犠牲にしても、スピードは上がらない。マーティン・ファウラーの "Is High Quality Software Worth the Cost?"(2019)とDORA State of DevOpsの定量データを引きながら、内部品質への投資の損益分岐点はせいぜい数週間以内であることを示した。

しかし、その2020年版の末尾に、それまでのバージョンになかった一行が追加されていた。

スピードおよび質と
トレードオフされているのは、
教育・成長・多様性への投資である。

これがt-wada論のもうひとつの核心であり、本稿が深掘りするテーマである。命題はその後も再演や議論を通じて磨かれ、生成AI時代には「AIに作業を手伝わせることはできても、能力そのものは代わりに育ててもらえない」という形で読み替えられるようになった。

AI時代版としての要旨

「質とスピードを支えているのは能力であり、教育に投資することは将来の質とスピードを作ること。作業はAIに手伝わせられるが、能力そのものは代わりに育ててもらえない。これまでの開発には教育が自然に組み込まれていた。コードレビューがそうでしたし、ペアプログラミングがそうでした。コードレビューをやらなくなると、教育の場が一つなくなってしまう」

一見すると当たり前のことを言っているように聞こえる。しかし、この命題が強力なのは、「品質と速度のトレードオフ」という長年の通説に対する反証として機能しながら、同時にでは何が削られているのかという問いに答えていることにある。品質・費用・納期だけを見ていると見落とすが、実際には教育や成長の時間が削られている——というのが、この論の全体像である。

公開スライドから見える変遷

2019/10/31

初版（EOF2019）

「内部品質を犠牲にすると速度は上がらない」が中心。教育論点はまだ無し。

2020/02/13

2020春版（デブサミ2020）

末尾に「教育・成長・多様性への投資が削られている」を初めて明記。

2020/11/20

2020秋100分拡大版（JaSST'20九州）

DORAの数値を前半に移動。リファクタ投資で開発期間が大幅短縮した事例を追加。

2022/05/09

2022春 rev.3

SQuaRE品質モデル導入。DORA 2021版に更新で差はさらに拡大。

2025/07

AI時代版（Findy 2025-07 Edition）

METR論文を引用、「予測+24%短縮 vs 実測-19%遅延」のギャップを紹介。

第2章

学術的裏付けは、思っているより強い

「質とスピードは両立する」という主張は、感覚論ではない。ここ20年で蓄積されてきた実証研究が、強く支持している。

DORA: 11年・約4万回答の累積データ

『State of DevOps Report』は2014年から継続的に実施され、累計で39,000人以上の回答を集めている。最大の発見は、高パフォーマンス組織と低パフォーマンス組織の間に、信じがたいほどの差があるということだ。しかも速度と安定性は同時に向上し得る——これが繰り返し示されている。

973×

リードタイム差

6,570×

MTTR差

208×

デプロイ頻度差

1/3

変更失敗率

— DORA State of DevOps Report / Forsgren, Humble, Kim『Accelerate』(IT Revolution Press, 2018) をもとにt-wadaスライドで整理された数値。208×（デプロイ頻度）は最も広く引用される代表値。

『Accelerate』はShingo Publication Awardを受賞しており、高パフォーマンスなソフトウェアデリバリ能力と組織成果の相関も示している。速度と安定性は二律背反ではない——むしろ、両方達成しているチームこそが速い。

SPACE: ひとつの数字だけで測ると、行動が歪む

2021年、Forsgren・Storey・Maddila らは ACM Queue 誌に "The SPACE of Developer Productivity" を発表した。要点は容赦ない。開発者の生産性は、ひとつの数字では測れない。ひとつの数字だけで評価しようとすると、人はその数字だけをよく見せる方向に動き、開発者自身もチームも傷つく。たとえばPR数だけを追えば、小さなPRを量産したくなる。チケット消化数だけを追えば、難しい改善や教育は後回しになる。SPACEは、満足度・成果・活動量・協働・効率のような複数の観点を、緊張関係のまま見ることを勧めている。活動量だけを追えば、学習時間は必ず削られる。

TDD: 短期コストと中長期回収の構造

Nagappan ら（Empirical Software Engineering誌, 2008）は、TDD適用と非適用のペア比較で次を観測している。

リリース前の欠陥

−40〜90%

バグ密度の減少

開発時間

+15〜35%

開発時間の増加

つまりTDDには短期コスト（開発時間+15〜35%）が確かに存在する。これは正直に認めるべきだ。t-wada論は「短期で速くなる」とは言っていない。数週間〜数ヶ月の地平線で初めて回収されると言っている。1日で出荷したい局面では、命題は成立しない。

心理的安全性: 教育の前提条件

Edmondson 1999（Administrative Science Quarterly、製造業51チーム調査）は、心理的安全性 → 学習行動 → チームパフォーマンスという媒介モデルを実証した。Google Project Aristotle（180+チーム調査、2015）も5因子のうち心理的安全性を最重要としている。「教育を削らない」は精神論ではなく、心理的安全性という具体的な土台がなければ起こらない——これが学術的合意だ。

⚠ 反証として併記すべき点

リファクタリングの実効性を調べた研究（Cedrim et al. 2017など）は、個々のリファクタリング操作がコードスメルの除去に寄与する割合は低く、逆に新たなスメルを生む場合もあることを示している。単発の「お掃除」は効かない。t-wada論は「数週間以上の地平線」「継続的実践」を前提条件にした命題であり、無条件には成立しない。

第3章

AI生産性データの逆説——+55.8%と−19%は両方とも本当である

AIコーディング生産性の研究は、結果の振れ幅が大きい。一方は劇的な向上を、もう一方は停滞や悪化を報告している。

+55.8%

Peng et al. 2023（arXiv:2302.06590）

GitHub内部のランダム化比較実験、HTTPサーバ実装、参加者95人。Copilot使用で完了時間が55.8%短縮。単一の定型タスクで、品質は測っていない。

+26%

Cui-Demirer et al. 2024

Microsoft / Accenture / F100の3企業で行われた現場実験、参加者4,867人。週次完了タスク+26%。経験浅・在職短ほど効果大、シニアはほぼ効果なし。

−19%

METR 2025（arXiv:2507.09089）

OSS現場でのランダム化比較実験、平均5年経験、参加者16人（246タスク）。予測+24%短縮 / 自己評価-20% / 実測-19%（遅延）。予測と実測の差は43ポイント。

−7.2%

DORA 2024

2024年調査。AI採用が25%増えるごとに、デリバリの処理量 -1.5%、安定性 -7.2%という推定。個人指標は上がる一方、ソフトウェアデリバリには副作用が出た。

+441%

Faros AI 2026

Farosのベンダーレポート。22,000開発者の利用データで、エピック完了+66.2%、PRレビュー時間+441%と報告。レビューが新しい詰まりどころになり得る。

本人は速くなった気がする。でも全体では遅くなることがある

METR論文の発見は強烈だ。事前予測+24%短縮 / 事後自己評価-20%短縮 / 実測-19%遅延。つまり開発者は、自分がAIでどれくらい速くなったかを過大評価しやすい。Simon Willisonはこの結果について「AIから本当に生産性向上を得るには、ほとんどの人が思うよりはるかに急な学習曲線がある」と書いている。

AIは70%を素早く生むが、
残り30%（エッジケース・本番統合・
セキュリティ）は依然として時間がかかる。

— Addy Osmani "The 70% Problem"（2024）

ここに整合的な解釈がある。個人としては速くなった気がする。しかし、経験豊富な開発者では実測で遅くなる場合があり、チーム全体ではレビュー負荷が増え、安定性やコードの健全性が悪化することがある。つまり、個人の体感とチーム全体の結果は、同じ方向に動くとは限らない。

第4章

なぜAIは「教育」を削るのか

t-wada論をAI時代に読み替えると、論点はこう整理できる。

AIは書くスピードを上げますが、
学習の時間とはぶつかりやすい。
教育の強度を維持し、学習に時間を
かけさせることへの覚悟が問われます。

従来の開発には、教育が自然に組み込まれていた——コードレビュー、ペアプログラミング、新人がエラーで詰まって先輩に聞く時間、書きながら考える時間。これらは生産性の「無駄」のように見えながら、実は能力という資本を蓄積していた。

教育が削られる3つの仕組み

仕組み 01

ジュニアの「実装で詰まる時間」が消える

AI効果は経験浅・在職短の開発者で大きく、シニアでは小さいという報告がある（Cui-Demirer 2024）。これはジュニアの「底上げ」と同時に、本来経験すべき定型実装での躓きと回復のサイクルがスキップされることを意味する。つまり、短期の出力は上がっても、ミドル層へ育つための摩擦が薄くなる可能性がある。

仕組み 02

コードレビューが「教育の場」から「詰まりどころ」に変わる

Faros AI 2026のレビュー時間+441%という報告が示すように、AI生成PRはレビューワーへの負荷を増やし得る。レビュー待ちが詰まると、教育的なやり取りが入る余地が物理的に消え、「承認するか、差し戻すか」だけになりやすい。

仕組み 03

「コードと理解の乖離」が指数関数的に広がる

技術的負債の本質を「書かれているコードと人間の理解の乖離」と捉えるなら、生成AIはその乖離を広げやすい。GitClearなどのコード分析レポートも、AI利用拡大に伴う重複・変更過多への懸念を示している。

これらは個別には小さく見える。しかし合算すると組織の中に能力がたまらない構造になる。作業はAIに手伝わせられるのに、判断力や設計力がチームの中に育たない経路ができてしまう。

個人的には、ここで守りたい「教育」は研修制度のことだけではない。レビューで一度立ち止まること、なぜその実装にしたのかを言語化すること、失敗した変更を自分の手で直すこと。そういう小さな摩擦の積み重ねが、エンジニアとしての判断力を作ってきた感覚がある。AIで労力を減らすのは歓迎したい。ただし、判断力が育つ摩擦まで全部消してしまうと、あとで自分たちが何を失ったのか分からなくなる。

第5章

教育を削らない5原則

個人と小規模チームの両方で、すぐ試せる形に落とした実践案。

原則 01

写経をAIに代行させない

新言語・新フレームワーク習得時、最初の数週間は意図的にAIをオフにする。t-wadaの「手元にバージョン管理を用意する → 本を固定する → ひたすら写経する → 実行するたびにコミットする → 章ごとにタグを打つ」を踏襲する。骨格を体に入れる時間は、AIに代わってもらえない。

原則 02

AIエージェントを「教師」ではなく「同僚」として扱う

「自分の名前で出すPRの責任は、最終的に自分が持つ」を内面化する。AIに教えてもらうのではなく、判断責任を引き受ける関係性で運用する。自動化バイアス、見せ方による判断の歪み、最初の案に引っ張られる癖への自覚的抵抗が、教育機会を保つ実装になる。

原則 03

手戻り率と生成PR割合を計測する

METRが示した予測と実測の43ポイント差は、「速くなった気がする」と実際の結果は違うという証拠だ。git logから週次でPR数・手戻り回数・AI生成PR割合をスプレッドシート化するだけでも、自分の思い込みを補正できる。

原則 04

異常に気づける設計にする

Birgitta Böckelerの式 影響度 × 発生確率 ÷ 検知しやすさ をプロジェクトに適用する。テスト整備・型付け・ログ出力・PR小サイズ化・フィーチャーフラグが、AI時代の差別化要因になる。「AIが書いたコードを、仕事は速いがまだ信用しきれない協力者からのPRとして扱え」——Martin Fowler。

原則 05

公開・検証アクションを学習サイクルに組み込む

t-wada論の核心が「コードレビューやペアプログラミングという、仕事の中で学ぶ場を意図的に保つ」ことなら、それを社外で補う手段が公開と検証だ。ブログ・GitHub・登壇・LT。書いたコードと考えを外に出すことが、削られた教育機会の補填になる。

個人運用の即実装項目

•CLAUDE.md は肥大化させず、短く検証可能なルールに保つ（目安として200行以下）
•確定的に必要な動作は Hooks（決定的に動く仕組み）に置く。CLAUDE.mdの注意書きだけに頼らない
•「t-wada流TDDで進めて」 を1行プロンプトに加え、進め方の前提をはっきりさせる
•docs/番号駆動構成（10_WHY → 20_WHAT → 30_HOW）で思考順序を強制
•サブエージェントで書く役と見る役を分離し、レビューの場を人工的に作る
•週次でDORA指標（リードタイム・変更失敗率）を自分で記録する

第6章

最後の聖域

t-wada論の中核命題は、AI時代にもこう言える。

質とスピードを支えているのは能力であり、
教育に投資することは
将来の質とスピードを作ること。

この読み方は、Peng 2023の+55.8%とMETR 2025の-19%、DORA 2024の安定性 -7.2%、GitClearなどの重複・変更過多への警告——という矛盾して見えるデータ群を、「個人では速くなった気がする一方で、能力育成・コードの健全性・システム安定性は悪化し得る」という形で説明できる。

学術的な「質と速度の同時達成」（DORA・Accelerate・Nagappan・Edmondson）は依然として成立する。ただし条件は、「学ぶ機会・心理的安全性・小さな変更・自動テスト・継続的リファクタリング」が保たれる場合のみである。

そしてAIエージェントは、これらの条件を自動的には強化しない。むしろレビュー疲れ・PRサイズ肥大・コード重複増という形で、教育を削る方向に圧力をかける。

AIを使い倒しながら、写経の場を意図的に残し、同僚として扱い、自分の指標を計測し、異常に気づける設計にして、公開・検証アクションで学習サイクルを閉じる。

生成AIの恩恵は最大限取りに行きながら、教育という最後の聖域だけは自分の手元に残す——これが「質とスピード」論のAI時代版が指し示す運用原則だ。

作業はAIに手伝わせられる。けれど、判断力や設計力まで代わりに育ててもらうことはできない。その境界線をどこに引くかが、これからの差別化要因になる。

主要参考文献

・和田卓人「質とスピード」シリーズ（speakerdeck.com/twada）

・ Forsgren, Humble, Kim『Accelerate』（IT Revolution Press, 2018）

・ DORA State of DevOps Report 2014–2024（dora.dev）

・ Google Cloud Blog "Announcing the 2024 DORA report"（2024）

・ Forsgren et al. "The SPACE of Developer Productivity"（ACM Queue, 2021）

・ Nagappan et al. "Realizing Quality Improvement Through TDD"（Empirical Software Engineering, 2008）

・ Peng et al. "The Impact of AI on Developer Productivity"（arXiv:2302.06590, 2023）

・ METR "Measuring the Impact of Early-2025 AI on Experienced OSS Developer Productivity"（arXiv:2507.09089, 2025）

・ Faros AI Engineering Report 2026（Faros AI, 2026）

・ Martin Fowler "Is High Quality Software Worth the Cost?"（martinfowler.com, 2019）

・ Edmondson "Psychological Safety and Learning Behavior in Work Teams"（ASQ, 1999）