10年稼働するコードを作る『単体テストの考え方/使い方』完全要約

私はかつて、テストコードを書くことを「単なる二度手間」だと感じていました。開発の締め切りに追われる中、プロダクトコードと同じ分量のテストを書くことに、何の価値も見出せなかったのです。

当時はカバレッジ100%を目指して必死にモックを量産していましたが、いざリファクタリングを始めると、機能は壊れていないのにテストだけが真っ赤に染まる惨状に直面しました。テストを直すために開発が止まる本末転倒な状況です。

多くのエンジニアが抱える「テストを書いているのに、なぜか開発が楽にならない」という不安や不満。その正体は、テストの質を「網羅率」だけで判断している点にあります。

質の低いテストは資産ではなく、将来の自分を縛る負債でしかありません。この記事は、単体テストの世界的名著『単体テストの考え方/使い方』のエッセンスを凝縮し、私が実務で血を流しながら学んだ知見を交えて解説します。

この記事を読めば、保守コストを下げつつバグを確実に防ぐ「真に価値のあるテスト」の書き方が分かります。リファクタリングが怖くなくなるだけでなく、10年先もメンテナンス可能な強固な設計スキルが手に入るはずです。

単体テストとは何か

単体テストを導入する最大の目的は、ソフトウェア開発の成長を持続可能なものにする点にあります。開発の初期段階では、テストがなくても機能追加は容易です。

しかし、プロジェクトが成長しコードが複雑化するにつれて、既存機能への影響を恐れて開発速度は劇的に低下します。単体テストは、この「開発速度の減速」を食い止めるためのセーフティネットとして機能します。

単体テストの役割は、単にバグを見つけることに留まりません。優れたテストスイートは、システムの振る舞いを示す仕様書となり、さらにはコード設計の良し悪しを映し出す鏡にもなります。テストが書きにくいと感じるなら、それは設計に問題があるサインです。

私が過去に参加したプロジェクトでは、テストがない恐怖から誰も核心部分のコードに触れられず、継ぎ足し秘伝のタレのようなコードが量産されていました。単体テストを正しく運用すれば、こうした技術的負債の蓄積を防ぎ、常にクリーンな状態を維持できます。

単体テストが解決する3つの問題（バグ・変更・品質）

単体テストは、バグの早期発見、変更の容易性、そして設計品質の向上という3つの難題を一気に解決します。開発者がコードを書き終えた直後に実行されるため、修正コストが最も低い段階でミスを特定できるのです。

後工程で発覚するバグの修正コストは、開発時の10倍から100倍に膨れ上がることを考えれば、このスピード感は圧倒的な利益をもたらします。

また、既存の機能を壊さずに新しいコードを追加できる保証が得られるため、大胆なリファクタリングが可能になります。結果として、コードの可読性が維持され、長期的な品質管理が実現する仕組みです。

「単体」とはどこまでを指すのか

「単体」の定義には、大きく分けて「ロンドン学派」と「古典学派（デトロイト学派）」の2つの流派が存在します。ロンドン学派は、クラスやメソッドといった個別のコード単位を単体と見なし、依存関係をすべてモックに置き換える手法を取ります。

: 単体テストのロンドン学派と古典学派、2つの流派を比較する
「テストを書いたせいで、コードの修正が何倍も大変になった」。以前の私は、締め切り間際に叫びたい衝動を必死で抑えていました。単体テストを導入して品質が上がるどころか、テストの修正作業に追われて進捗が止ま ...

あわせて読む

一方で古典学派は、複数のクラスが関わっていても、1つの「振る舞い」や「ビジネスケース」を検証する単位を単体と呼びます。

本書および私は、後者の古典学派を支持します。なぜなら、実装の詳細ではなく振る舞いをテストする方が、リファクタリング時にテストが壊れにくく、保守性が高まるからです。

結合テスト・E2Eテストとの違い

単体テストは、他のテスト手法と比較して実行速度が非常に速く、失敗した際の原因特定も容易です。結合テストは複数のコンポーネント間の通信を検証し、E2Eテストはユーザーの視点でシステム全体を網羅します。ただし、これらは実行コストが高く、壊れやすい欠点があります。

単体テストでロジックの細部を固め、結合テストで境界を検証し、重要なユーザーシナリオだけを少数のE2Eテストで守る。このバランスが、開発効率を最大化する秘訣です。

本書『単体テストの考え方/使い方』が伝える核心

単体テストの考え方/使い方プロジェクトの持続可能な成長を実現するための戦略 [ Vladimir Khorikov ]

posted with カエレバ

楽天市場

Amazon

Yahooショッピング

本書が伝える最も重要なメッセージは、「テストの価値は、そのテストを維持するためにかかるコストを上回らなければならない」という極めて現実的な視点です。多くの現場では、カバレッジを上げることそのものが目的化し、価値の低いテストが大量生産されています。

価値のあるテストとは、将来のバグを防ぎ、かつリファクタリングを妨げないものを指します。逆に、実装の詳細に密結合したテストは、コードを少し変更するだけで失敗するため、開発の足を引っ張る「偽陽性」の温床となります。

私は本書を読んでから、テストコードをプロダクトコードと同等、あるいはそれ以上に慎重に扱うようになりました。テストを資産として育てる意識を持つだけで、開発環境のストレスは驚くほど軽減されます。

良いテストと悪いテストの違い

良いテストは、システムが何をするか（What）を記述し、悪いテストはどう実装されているか（How）を記述します。例えば、内部のメソッド呼び出し回数をチェックするテストは、実装が変わればすぐに壊れるため「悪いテスト」の典型例です。

対照的に、特定の入力に対して期待される出力が得られるかを確認するテストは、内部構造が変わっても有効であり続けます。

この違いを理解しないままテストを書き続けると、リファクタリングのたびにテストの修正に追われる苦行が始まります。

テストを書く目的は「バグ発見」だけではない

テストの真価は、バグの発見よりも「回帰（デグレ）」の防止にあります。新機能を追加した際に、1年前に書いた機能が今も正しく動いているかを確認する作業を、人間が手動で行うのは不可能です。自動テストがあれば、コマンド1つで全機能の生存確認が完了します。

この安心感こそが、エンジニアに心理的な安全をもたらし、クリエイティブな開発に集中できる環境を作ります。

保守性の高いテストがプロジェクトを救う理由

保守性の高いテストスイートがあれば、開発メンバーが入れ替わってもコードの意図が正しく伝わります。テスト自体がドキュメントとして機能するため、新参者が既存のロジックを破壊するリスクを最小限に抑えられるのです。

逆に、読みづらく壊れやすいテストは、次第に無視されるようになり、最終的には実行すらされなくなります。そうなればプロジェクトは崩壊への道を辿るしかありません。

単体テストの3つの性質

テストの質を評価するために、本書では4つの柱を提唱していますが、ここでは特に重要な3つの性質に絞って解説します。これらの基準を満たしているかを確認するだけで、無意味なテストを排除できます。

回帰に対する保護（Regression Protection）
リファクタリング耐性（Refactoring Resistance）
迅速なフィードバック（Fast Feedback）

これらはトレードオフの関係にある場合が多いですが、長期的なプロジェクトで最も重視すべきは「リファクタリング耐性」です。

回帰を防ぐ（Regression Protection）

回帰に対する保護とは、コード変更によってバグが混入した際、それを正しく検知できる能力を指します。複雑なロジックや、ビジネス上の重要な計算を行うコードほど、この保護が必要です。

テストがカバーしている範囲の広さだけでなく、そのテストがどれだけバグを逃さないかが評価のポイントとなります。

リファクタリング耐性（Refactoring Resistance）

リファクタリング耐性は、コードの内部構造を書き換えてもテストが失敗しない性質です。これが欠けていると、いわゆる「偽陽性」が発生します。コードは正しく動いているのにテストが落ちる状態です。

私は以前、メソッド内のプライベート変数の状態を無理やりモックで書き換えるテストを書いていました。リファクタリングのたびにテストが全滅し、結局テストをすべて捨てる羽目になった苦い経験があります。リファクタリング耐性のないテストは、開発のスピードを奪う最大の敵です。

迅速なフィードバック（Fast Feedback）

どんなに優れたテストでも、実行に1時間かかるようでは誰も使いません。単体テストは数秒、長くても数分以内で終わる必要があります。素早いフィードバックが得られるからこそ、開発者はコードを1行書くたびにテストを走らせ、リズム良く開発を進められます。

遅いテストは統合テストのレイヤーに回し、単体テストは徹底的に高速化する。この使い分けが重要です。

テストを書く前に知っておきたい設計の考え方

テストのしやすさは、設計の良し悪しと直結します。テストが書きにくいと感じる場合、それはコードが「密結合」になっているか、あるいは「責務が多すぎる」証拠です。テストコードを無理に書く前に、まずはプロダクトコードの構造を見直す必要があります。

特に、外部システムやデータベースへの依存がロジックの中に直接書かれていると、テストの難易度は跳ね上がります。これらを切り離し、純粋なビジネスロジックだけを抽出する設計思想が求められます。

テストしやすいコードの特徴

テストしやすいコードは、入力が明確で出力が決定的な「純粋関数」に近い形をしています。同じ引数を与えれば常に同じ結果が返り、外部の状態（グローバル変数やDB）に依存しません。こうしたコードは、複雑なセットアップなしに最小限のコードで検証できます。

依存関係を減らす「疎結合」の重要性

コンポーネント間の結びつきを弱くする「疎結合」は、テスト容易性の要です。インターフェースを活用し、依存対象を外部から注入（依存性の注入：DI）できるように構成します。これにより、テスト実行時に重い外部システムを軽い代替オブジェクトに差し替えられるようになります。

テストが難しいコードに共通するパターン

「プライベートメソッドのテストを書きたい」「静的メソッドが至る所で呼ばれている」「コンストラクタ内で外部通信を始めている」。これらはすべて、設計が不適切なサインです。

特に、隠蔽されるべき内部実装をテストしようとする誘惑には注意しなければなりません。公開されているAPIを通じて振る舞いを検証できないなら、そのコードの切り出し方に問題があるはずです。

モックはいつ使うべきか｜誤解されやすいポイント

モック（Mock）は非常に便利な道具ですが、使いどころを間違えるとテストを破壊する劇薬になります。本書のスタンスは明確で、「外部の共有依存（メールサーバー、メッセージブローカーなど）に対してのみモックを使用し、内部のクラス間連携には使用しない」というものです。

何でもかんでもモックに置き換えてしまうと、システム全体の繋がりが検証できず、リファクタリング耐性がゼロになります。モックを使うべきは、テストの実行速度を極端に落とすものや、副作用を発生させる外部境界だけです。

モック・スタブ・フェイクの違い

これらは「テストダブル」と呼ばれますが、役割は異なります。

モック: 呼び出しを検証するもの。「メールが1回送信されたか」を確認する。
スタブ: データを供給するもの。「DBからこのユーザー情報を返したことにする」といった準備に使う。
フェイク: 簡略化された実装。インメモリDBなどが該当する。

これらを混同して「スタブ」に対して呼び出し検証を行うのは、よくある間違いの一つです。

モックを使いすぎるとテストが壊れやすくなる理由

モックを使用するということは、実装の詳細（どのメソッドが呼ばれたか）をテストに記述することに他なりません。例えば、内部の計算アルゴリズムを改善してメソッド名を変えただけで、最終的な結果は同じなのにモックの検証が失敗します。

これが偽陽性の正体です。モックは「最終的な結果」を確認できない場合にのみ、最小限に使用すべきです。

「状態ベーステスト」と「振る舞いベーステスト」

状態ベーステストは、処理実行後のオブジェクトやDBの状態を確認します。一方、振る舞いベーステストは、処理の途中でどのオブジェクトがどう動いたかを検証します。本書が推奨するのは、圧倒的に状態ベーステストです。

ユーザーにとって大切なのは「期待した結果が得られたか」であり、「中でどの部品が動いたか」ではないからです。

テストピラミッドと現実的なテスト戦略

理想的なテスト構成として有名な「テストピラミッド」ですが、現実のプロジェクトではその形状を維持するのが難しい場面もあります。基本的には単体テストを土台として大量に用意し、結合テスト、UIテストと上がるにつれて数を減らすのが定石です。

しかし、ビジネスロジックが薄く、外部APIとの連携が中心のシステムでは、単体テストよりも結合テストの方が価値を生む場合もあります。教条主義的にピラミッドを守るのではなく、プロジェクトの性質に合わせて投資対効果の高い層に注力する柔軟さが必要です。

テストピラミッドの基本構造

ピラミッドの下層（単体テスト）は高速で安価、上層（E2E）は低速で高価です。下層で細かなエッジケースを潰し、上層ではハッピーパス（正常系の一連の流れ）が通ることを確認します。この構造を維持することで、全テストの実行時間を抑えつつ、高い信頼性を確保できます。

単体テスト・統合テスト・E2Eの役割分担

単体テストは「複雑なアルゴリズム」や「ドメインロジック」を守ります。統合テストは「DBとの接続」や「外部サービスとの不整合」をチェックします。E2Eは「ユーザーが実際にブラウザを開いて注文できるか」という最後の関門を担います。

各層に明確な役割を持たせ、テストの内容が重複しすぎないように管理するのが、効率的なチームの共通点です。

プロジェクトでバランスを取るコツ

「全てのコードにテストが必要」という考えは捨ててください。1回限りの使い捨てスクリプトや、あまりに単純なゲッター・セッターにテストを書くのは時間の無駄です。ビジネス上の価値が高く、変更頻度が高いエリアにテスト資源を集中させるのが、賢い戦略です。

実務で使える単体テストの書き方

良いテストは、読んだ瞬間に「何をテストしているか」が分からなければなりません。そのためには、一貫した構造と明確な命名規則が不可欠です。私が推奨する標準的なパターンは AAA（Arrange, Act, Assert）パターンです。

このパターンに従うだけで、テストコードの可読性は劇的に向上します。準備、実行、検証の3つのブロックを意識的に分けることで、テストの意図が明確になり、メンテナンスも容易になります。

Arrange / Act / Assert パターン

[Fact]
public void Purchase_succeeds_when_inventory_is_enough()
{
    // Arrange: 準備
    var store = new Store();
    store.AddInventory(Product.Shampoo, 10);
    var customer = new Customer();

    // Act: 実行
    bool isSuccess = customer.Purchase(store, Product.Shampoo, 5);

    // Assert: 検証
    Assert.True(isSuccess);
    Assert.Equal(5, store.GetInventory(Product.Shampoo));
}

各セクションの間に空行を1つ入れるのがコツです。これにより、視覚的に構造を把握しやすくなります。

テストケースを考えるシンプルな思考法

テストケースを洗い出す際は、「同値分割」と「境界値分析」という古典的な手法が今でも最強です。全ての数値を試す必要はありません。有効な範囲、無効な範囲、そしてその境界線（0や最大値など）を重点的に攻めるだけで、バグの8割はあぶり出せます。

失敗しにくいテスト命名ルール

MethodName_StateUnderTest_ExpectedBehavior（メソッド名_状態_期待される振る舞い）のような形式が一般的ですが、もっとシンプルに「何ができるべきか」を自然な文章で書く形式もおすすめです。

重要なのは、テストが失敗した時のレポートを見て、コードを読まずとも「どの仕様が満たされていないか」が即座に分かる点にあります。

単体テストがうまくいかない原因

テストを導入しても、かえって開発が苦しくなるプロジェクトには共通点があります。その筆頭が「テストのメンテナンスを怠っている」点です。プロダクトコードをリファクタリングするように、テストコードも常に磨き続けなければなりません。

また、チーム全体で「テストの価値」が共有されていない場合、締め切り間際にテストがスキップされる不遇な扱いを受けます。テストを書く時間は「開発時間の一部」であり、オプションではないという文化の醸成が必要です。

テストが壊れやすいプロジェクトの特徴

テストが実装の詳細に深く入り込んでいるプロジェクトは、非常に脆いです。エンジニアが「テストがあるから安心」ではなく「テストがあるから変更が面倒」と感じ始めたら、それはテストの書き方が間違っている危険信号です。

モックの多用や、プライベートメンバーへのアクセスを今すぐ見直すべきでしょう。

テストを書く文化が定着しない理由

多くの場合、テストを「追加の仕事」と捉えているのが原因です。テストを書くことで、結果的にデバッグ時間が減り、リリース後の障害対応が激減する成功体験をチームで共有できていないのです。

まずは小さな、しかし重要なロジックからテストを書き始め、その恩恵を実感するステップが必要です。

テストコードをリファクタリングする重要性

テストコード内の重複は、プロダクトコードの重複よりも厄介な場合があります。テストを読みやすく保つために、共通の準備処理をヘルパーメソッドに切り出すなどの工夫が求められます。ただし、やりすぎてテストの意図が隠れてしまわないよう、バランス感覚が問われる作業でもあります。

『単体テストの考え方/使い方』の要点まとめ｜明日から活かすために

本書を通じて学べる最も深い教訓は、テストは「目的」ではなく「手段」であるという点です。私たちの目的は、ユーザーに価値あるソフトウェアを素早く、継続的に届けることです。そのための強力な武器が単体テストであり、使いこなすには相応の知恵が必要です。

もし、今のあなたのテストがあなたを苦しめているなら、勇気を持ってそのテストを捨てるか、本書の原則に則って書き換えてみてください。テストを正しく制御できるようになった時、あなたのエンジニアとしての生産性は異次元のレベルに到達します。

本書から学べる重要ポイント

項目	内容
テストの目的	持続可能な開発を実現すること
良いテストの基準	リファクタリング耐性が高く、偽陽性が少ないこと
モックの扱い	外部依存との境界に限定し、内部の通信には使わない
設計との関係	テストしにくいコードは、設計を改善すべきサイン

単体テストを実務で活かす3つのアクション

カバレッジ目標を捨てる: 数字を追うのをやめ、ビジネス上重要なロジックから「壊れにくいテスト」を書くことに注力します。
モックを半分に減らす: 安易なモック化をやめ、実際のオブジェクト同士を組み合わせた「古典学派」のテストを試してみてください。
AAAパターンを徹底する: テストコードの見た目を整えるだけで、チーム内のレビュー効率は劇的に向上します。

かつての私のように、テストを「重荷」と感じているエンジニアが、一人でも多くこの「解放感」を味わえるようになることを願っています。10年後も誇れるコードを書くために、今日からテストの書き方を変えてみませんか。