おはようございます。
今日は「ハーネスエンジニアリング」と「ループエンジニアリング」をリサーチしました。
概要|ハーネスエンジニアリングとは?
変遷|プロンプト→コンテキスト→ハーネスの系譜
考察|用語は廃れても「検証の設計」は残る
TL;DR
ハーネスエンジニアリング: 「エージェントが走る環境」を設計する規律。2026年2月のHashimoto氏ブログ発、6日後のOpenAI公式記事で定着しました。
ループエンジニアリング: 「エージェントに指示する自分自身」を置き換える一段上の設計論。Claude Code作者Cherny氏の発言拡散を受け、Osmani氏(Google)が6月7日に命名しました。
OpenAIは人手ゼロ行で約100万行を5か月で構築したと報告。反論も根強いものの「機械的に検証する仕組みづくり」は残ります。
概要|ハーネスエンジニアリングとは?
◼️用語の定義
ハーネス(harness) はAIエージェントの「モデルそのものではないすべてのコード・設定・実行ロジック」であり、ハーネスエンジニアリングはこの環境側を設計する規律です。
ループエンジニアリングはその一段上で、「エージェントにプロンプトを打つ自分自身を置き換え、代わりにそれをやるシステムを設計すること」です。
◼️構成要素の柱
環境と権限: ツール・サンドボックス・コード構造
フィードバック機構: linter・テスト・可観測性による自己検証
知識の蓄積: 失敗をAGENTS.md等に書き戻しテストケース化
ループの自動化: 定時実行・サブエージェント等「指示する仕組み」の設計
変遷|プロンプト→コンテキスト→ハーネスの系譜
系譜はプロンプトエンジニアリング(2023年・Karpathy氏「最もホットな新しいプログラミング言語は英語だ」)→コンテキストエンジニアリング(2025年6月・Shopify CEOのLütke氏「すべてのコンテキストを与える技芸」)→ハーネスへ。
2024年12月のAnthropicはエージェントを「環境フィードバックに基づきループでツールを使うLLM」と定義済みで、Cherny氏も当時Claude Codeを「可能な限り薄いラッパー」「秘伝のタレは全部モデルの中」と評していました。
◼️「ハーネスエンジニアリング」の登場(2026年2月〜)
「agent harness」について最初に言及したのは2026年2月5日のMitchell Hashimoto氏(Ghostty作者・HashiCorp共同創業者)のブログです。
“I’ve grown to calling this ‘harness engineering.’ It is the idea that anytime you find an agent makes a mistake, you take the time to engineer a solution such that the agent never makes that mistake again.” (私はこれを「ハーネスエンジニアリング」と呼ぶようになった。エージェントのミスを見つけるたびに、二度と起きないよう時間をかけて解決策を設計する考え方だ)
ただし、同氏は考案を主張しておらず、同時多発的な言語化のようです。
2026-02-11: OpenAI「Harness engineering」公開
03-10: LangChainのTrivedy氏「モデルでないなら、あなたはハーネスだ」
04-02: Böckeler氏「コンテキストエンジニアリングの一形態」と整理
◼️「ループエンジニアリング」の誕生(2026年6月)
6月2日、WorkOSがCherny氏のインタビューまとめを公開。「Acquired Unplugged」(WorkOS主催)での発言として、次の逐語がクリップ書き起こし経由でXに急拡散しました。
“I don’t prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write loops.” (もうClaudeにプロンプトを打っていない。Claudeにプロンプトを打ち、何をすべきか考えるループたちが走っている。私の仕事はループを書くことだ)
Steinberger氏(OpenClaw作者)の「プロンプトを打つループを設計すべきだ」という投稿も拡散を加速し、Osmani氏が6月7日に「Loop Engineering」と命名。翌8日には批判記事(The Deep Feed)も登場しました。
考察|用語は廃れても「検証の設計」は残る
本質は「エージェントの仕事を、人間が張り付かなくても検証・修正できる構造を作ること」です。
◼️なぜ重要か
ボトルネックの移動: Osmani氏の「そこそこのモデル+優れたハーネスは、優れたモデル+ダメなハーネスに勝る」が端的です。
生産性の実例: 100万行実験が桁違いの生産性を示しました。
スキルの再定義: 重心は「コードを書く」から「間違えにくい構造を書く」へ。
◼️留保・リスク
「ハーネスは消える」派: Noam Brown氏(OpenAI)は「いずれ置き換えられるだけ」と述べたとされ、METRやScale AIはハーネス差を小さく評価。Manusも「より良いコンテキストの形を見つけるたびに」4回作り直したと語ります。
過剰設計と陳腐化: 過剰なハーネスはモデル更新で負債化しえます(Osmani氏の指摘)。The Deep Feedも「この言葉は秋には時代遅れになるが、検証という機能はそうならない」と評します。
◼️個人的な見解
象徴的なのはCherny氏の変化です。「秘伝のタレは全部モデルの中」と言っていた本人が、1年後に「私の仕事はループを書くことだ」と言っている。これが何よりの状況証拠です。
自分でもハーネスでの出力と普通のLLMの出力を比べてみましたが、全然違いました。当然、トークン消費量が桁違いに増えましたが、長時間をクオリティの高いアウトプットを出すためには重要な概念だと思います。
これが時代の変化で陳腐化される仕組みになる可能性もありますが、現時点でこの考え方に触れてみることは重要だと思いました。
参考リンク
免責事項:リサーチした情報を精査して書いていますが、個人運営&ソースが英語部分も多いので、意訳したり、一部誤った情報がある場合があります。ご了承ください。また、記事中に Dapps、NFT、トークン、AIサービス等を紹介することがありますが、勧誘では一切ありません。全て自己責任でご判断・ご利用ください。
About us:DEBUNK(Crypto&AI)は “For learning, not for hype.” をコンセプトに、Crypto・AI 領域の注目トレンド・プロジェクト解説・最新ニュースをまとめた Agentic Web Research を毎日配信しています。
Author:mitsui (@mitsuiio) — DEBUNK(Crypto&AI)founder。Crypto・AI 領域のリサーチャーとして活動。
Contact:法人向けのリサーチコンテンツの納品や共同制作、リサーチ力を武器にした Crypto・AI コンサルティング・勉強会なども受付中です。詳しくは以下の窓口よりお気軽にお問い合わせください。
🐦 X: @debunkrsch
🌐 HP: debunkresearch.com
「AI版」のリサーチも始動しました。「Agentic Web」時代を見据えたニュースレターとなり、CryptoとAIの2つのニュースレターが走り始めます。どちらか1つだけの購読で良い方はご自身のアカウント設定から管理できます。
クリプト版はこれまで通り続きながら、AI版も同じようなフォーマットでリサーチして更新していきますのでお楽しみに!




