「Claude CodeもOpenClawもHermesも、なんか似たようなことできそうじゃない?」と思って2週間くらい迷っていませんか。私もまさにそうでした。結局3つ全部試して、毎月のAPI請求書を眺めてやっと気づいたんですが、悩むべきはツール選びではなく「どのタスクにどのモデルを使うか」でした。
3つのエージェントは競合ではなく役割が違うレイヤーで、しかもどれもバックエンドのLLMを差し替えできます。つまり本当のレバーは「ツール×モデル」の組み合わせです。
大事なタスクだけOpus、それ以外はSonnetやHaiku、と振り分けるだけで体感品質はそのままに月額が半分になりました。
この記事では、AIエージェント選びで迷っている個人開発者・在宅ワーカーに向けて、Claude Code・OpenClaw・Hermesの役割整理と、Opus/Sonnet/Haikuの使い分けルール、そして実際の組み合わせ早見表までを一気に解説します。
結論:AIエージェントは「役割で分けて、モデルで絞る」
結論を先に書きます。AIエージェントは1つに統一しようとせず、ツールは役割で分けて、モデルだけタスクの重さで切り替えるのが最も合理的です。ここを混同すると、毎月のAPI代が無駄に膨らみます。
ツール選びとモデル選びは別レイヤーの問題
Claude Code・OpenClaw・Hermesはどれも「LLMを動かす器」であって、頭脳の中身は別物として差し替えられます。器の違いは「どこで動くか、何が得意か」で、頭脳の違いは「どれだけ賢いか、いくらかかるか」です。
つまりエージェント選びは「器の役割」、モデル選びは「頭脳の重さ」と分けて考えると一気に整理できます。私が迷っていた2週間は、この2軸を1軸にして悩んでいたから無限ループしていただけでした。
大事なタスクだけ高性能モデルに振る運用が最適解
OpusとHaikuでは出力トークン単価に最大15倍の差があります。全件Opusで安心を買うのは、ファミレスのドリンクバーを4人前頼むようなもの。実際にやってみると、9割のタスクはSonnetやHaikuで十分です。
私の場合、設計・レビュー・難しいバグ調査だけOpusに振り、残りをSonnetとHaikuに任せる運用に変えたら、月額が約58%減りました。「大事なときだけ高い方」の徹底だけで体感品質はほぼ変わらないです。
Claude Code・OpenClaw・Hermesの正体を整理する
「どれも似てる」と感じる原因は、3つともターミナルやチャットから動くからです。でも触れば分かりますが、得意分野は完全にズレています。まず素性を3行で押さえます。
Claude Code:コーディング特化のCLIエージェント
Claude CodeはAnthropic公式のターミナル常駐エージェントです。プロジェクト全体を読む・import関係を辿る・テストを書いて直すまでを1ウィンドウで回せます。要するに「コードを書くために生まれてきた」性格です。
逆に、日常タスクや雑談、リマインダーには向きません。エディタを開いてターミナルでコマンドを叩くという作業文化に乗っかる前提なので、外出先からスマホで使う用途は完全に守備範囲外です。
OpenClaw:チャット中心の生活密着型エージェント
OpenClawはWhatsApp・Telegram・Discordなど普段使いのチャットアプリから呼べるオープンソースエージェントです。ClawHubというスキル市場に3,200個以上の即戦力スキルが並んでいて、非エンジニアでも使い始められます。
「ChatGPTをそのままLINEから話しかけられるようにした感覚」が一番近いです。コードを書かせるよりも、家計簿入力・買い物リスト・日々の自動化に向きます。
Hermes Agent:永続記憶で育つセルフホスト型
HermesはNous Researchの永続記憶エージェント。セッションをまたいで好みやプロジェクトを覚えて、解いた問題を勝手にスキル化してくれます。長く使うほど自分専用のWikiが育つイメージです。
記憶と自動化が強い反面、IDE統合やコードベース横断はClaude Codeに一歩譲ります。3か月以上使う前提で価値が出るタイプなので、お試し1日で判断するとピンと来ないかもしれません。
3つのエージェントを役割で使い分ける基準
「結局どれを選ぶか」ではなく「どのシーンでどれを呼ぶか」で整理します。1ツール統一は無理だし、しなくていいです。
| シーン | 第一候補 | 理由 |
|---|---|---|
| コードを書く・直す | Claude Code | コードベース理解とテスト実行が一体 |
| 外出先からタスク投げ | OpenClaw / Hermes | チャットアプリ経由で呼べる |
| 長期の記憶や自動化 | Hermes | 永続記憶+スキル自動生成 |
| 非エンジニアと共有 | OpenClaw | スキル市場が充実 |
コードを書く・直すならClaude Code一択
プログラミングタスクは迷わずClaude Codeでいいです。理由は「コードベースを丸ごと読んで、テストを走らせて、失敗したら直す」までを1ループで回せるツールが他にないから。私はリポジトリ単位の作業はClaude Code以外触らなくなりました。
日常タスクの自動化はOpenClawかHermes
家計簿・読書ログ・スケジュール調整みたいな「毎日の細かい用事」はOpenClawかHermesに振ります。Telegramで一言投げれば家のサーバーが処理してくれる感覚は、生活体験そのものを変えます。家族と共有したいならOpenClaw、自分用ならHermesが私の中の基準です。
長く付き合うパートナー用途はHermes
「私のことを覚えて、私の文脈で動いてくれる相棒」が欲しいならHermesです。永続記憶+スキル自動生成の組み合わせは他にない強み。半年使えば、もう手放せません。逆に短期実験には不向きなので、長く付き合う前提で選んでください。
大事なタスクだけOpusに振る「モデル使い分け」の発想
ここからが本記事の核心です。ツールを役割で分けたら、次は頭脳側のモデルをタスクの重さで切り替えます。これが効きます。
Opus・Sonnet・Haikuのコスト差は最大15倍
3モデルのざっくりした性格と単価感を表にします。料金は時期で変わるので、目安として読んでください。
| モデル | 得意 | 苦手 | 出力単価の目安 |
|---|---|---|---|
| Opus 4.7 | 高度推論・長時間エージェント | コスト | 高(基準×15) |
| Sonnet 4.6 | 万能・コーディング | 大量処理 | 中(基準×5) |
| Haiku 4.5 | 速度・大量処理・分類 | 複雑推論 | 低(基準×1) |
OpusとHaikuの15倍差は、1日100リクエストの個人開発者でも月数千円〜数万円の違いになります。「全部Opusで安心」はカード会社を喜ばせるだけです。
タスクの複雑度でモデルを切り替える3つのルール
私の運用ルールは以下の3つです。これだけ守れば9割の判断は迷いません。
- Opus行き:設計・アーキテクチャ検討・本番リリース前レビュー・難しいバグ調査
- Sonnet行き:日常の実装・テスト追加・ドキュメント生成・要約タスク
- Haiku行き:分類・タグ付け・大量データの一次処理・チャット応答
判断軸は「やり直しが効くか」と「品質劣化のコストが大きいか」の2点。やり直しが効かない・劣化したらマズいタスクだけOpusに上げる、と覚えておけば外しません。
各エージェントでのモデル指定方法
3ツールとも設定ファイルや専用コマンドでバックエンドモデルを切り替えられます。代表的なやり方を並べます。
# Claude Code はセッション内で /model コマンド or 起動オプション
claude --model claude-opus-4-7
# Hermes は対話型ウィザード
hermes model
# OpenClaw はチャット内で /model 指定
# 例: Telegram で「/model haiku」を送信ポイントは「重いタスクの直前だけOpusに切り替える」運用を癖づけること。毎セッション全体でOpusにすると、思考の試行錯誤分まで全部高単価で課金されます。
ツール×モデルのおすすめ組み合わせ早見表
ここまでをマトリクスにまとめます。迷ったら表の通りにやれば9割うまくいきます。
| 用途 | ツール | モデル | 狙い |
|---|---|---|---|
| 新機能の設計 | Claude Code | Opus | 後戻り防止 |
| 日常実装・テスト | Claude Code | Sonnet | 速度と精度のバランス |
| 外出先タスク投げ | OpenClaw | Haiku | 軽量・即応 |
| 家計簿入力 | OpenClaw | Haiku | 大量・単純 |
| 議事録要約 | Hermes | Sonnet | 文脈保持+精度 |
| ジャーナリング保存 | Hermes | Haiku | 頻度高くコスト圧縮 |
| 契約書レビュー | Claude Code | Opus | 誤読が致命的 |
開発タスク:Claude Code × Sonnet/Opus
開発の8割はSonnetで十分です。Sonnet 4.6はOpus級の精度をOpusの約60%価格で出せるので、デフォルトはSonnet。大規模リファクタや設計判断のときだけOpusに切り替える運用が体験上ベストでした。
日常雑務:OpenClaw × Haiku
家計簿・買い物メモ・天気確認・タスク追加など、ChatGPTの会話履歴を眺める間もない処理はHaikuで十分です。レスポンスも速いので、Telegramで送って3秒以内に返ってくる感覚が手に入ります。
長期記憶系:Hermes × Sonnet
ジャーナリングやプロジェクトログのように「正しく文脈を踏まえて要約させたい」タスクはSonnetが最適です。Haikuだと文脈の解像度が落ち、Opusまで持ち上げるほどの難度はない、というちょうど中間の領域です。
運用で失敗しないための3つの注意点
使い分け運用には落とし穴もあります。私が3か月で踏んだ罠を共有します。同じところでこけないでください。
全部Opusにすると月額が一気に跳ねる
「迷ったらOpus」で1か月過ごしたら、API代が3万円を超えました。同じ作業量をSonnet主体で組み直したら1.2万円。差額1.8万円分の品質向上は、正直体感ゼロでした。「Opusじゃないと困るタスク」がどれくらい少ないかを一度可視化すべきです。
ツールを1つに絞ろうとしない
「全部Claude Codeで完結したい」と頑張ると、結果的にコーディング以外の体験が劣化します。エディタを開かないと使えない=外出先で困る、家族と共有できない、というデメリットが見えてきます。役割を分ける前提で考えた方が早いです。
メイン用途を1つ決めてから広げる
3ツール同時に学ぶと挫折します。私の体感だと「まずClaude Codeだけ2週間→次にHermes→必要ならOpenClaw」の順番が最も挫折率が低い導入パスです。一気にスタックを組み上げない方が、結果的に早く運用に乗ります。
ツール×モデル運用のよくある質問
個人開発者でも3ツール併用は現実的?
現実的です。ただし全部一気に入れる必要はなく、Claude Code+Hermesの2つから始めるのを推奨します。月額の追加はLLM API代のみで、ツール自体は2つともサブスク不要。困った時にOpenClawを足す順序が安全です。
GPT-5系やGemini系とも併用すべき?
「ベンチマーク用」と割り切るなら併用OKです。ただし複数プロバイダのキーを管理し、出力フォーマットの揺れも吸収する必要があるので、運用負荷は確実に上がります。私はClaude単独で運用していて、特に不便はありません。
結局どれから始めるべき?
エンジニアならClaude Code+Sonnet、非エンジニアならOpenClaw+Haikuが入口として最も摩擦が少ないです。1週間使ってから「足りない部分」を補うようにツールを足すと、無駄な学習コストを払わずに済みます。
まとめ:使い分けは「コスト×品質」のレバーである
AIエージェントは1択で選ぶものではなく、ツール×モデルの組み合わせで設計するものに変わってきました。器の役割で分けて、頭脳の重さで絞る。この2軸を意識するだけで、品質を保ったままコストは半分以下になります。
- Claude Code=コード、OpenClaw=生活、Hermes=長期記憶、と役割を切る
- 大事なタスクだけOpus、日常はSonnet、軽量処理はHaiku
- 「やり直しが効くか」「劣化のコストが高いか」でモデルを決める
- 3ツール同時導入を避け、Claude Code+Hermesから入る
「どれが正解か」を探し続けるより、自分のタスクごとにレバーを倒し分ける方が結果的に楽です。週末に1時間だけ、自分の直近のAI利用ログを眺めて、Opus行きとHaiku行きを線引きしてみてください。来月の請求書が驚くほど軽くなります。