Harness Engineering: Yapay Zeka Ajanları Etrafında Sistemler İnşa Etmek (2026)
Harness engineering, en iyi ekiplerin yapay zeka kodlama ajanlarını nasıl güvenilir hale getirdiğidir. Ajan = Model + Harness formülünü, temel bileşenleri ve OpenAI, Stripe ve Anthropic'ten gerçek sonuçları öğrenin.
TL;DR
| Kavram | Özet |
|---|---|
| Formül | Ajan = Model + Harness |
| Harness nedir? | Yapay zeka modelinin etrafındaki her şey: bağlam, kısıtlamalar, araçlar, doğrulama döngüleri |
| Temel içgörü | LangChain, modeli değiştirmeden sadece harness'ı değiştirerek ajan doğruluğunu %52,8'den %66,5'e çıkardı |
| Kimler kullanıyor | OpenAI (Codex), Stripe (haftalık 1.000+ PR), Anthropic, Vercel |
| Temel bileşenler | Bağlam mühendisliği, mimari kısıtlamalar, araçlar/MCP, alt ajanlar, hook'lar, öz doğrulama |
Harness Engineering Nedir?
Harness engineering; yapay zeka kodlama ajanlarını güvenilir ve üretken kılmak için onların etrafında sistemler, araçlar, kısıtlamalar ve geri bildirim döngüleri oluşturma disiplinidir.
Terim, Mitchell Hashimoto (HashiCorp kurucu ortağı) tarafından ortaya atılmış ve OpenAI'ın 2026 başlarında bu konuyla ilgili Codex makalesini yayınlamasıyla geniş kitlelerin dikkatini çekmiştir.
Ana fikir basittir:
Ajan = Model + Harness
Model zekayı sağlar. Harness ise bu zekayı faydalı kılar. İyi bir harness, genellikle daha iyi bir modelden daha fazla önem taşır.
Neden Şimdi Önemli?
2025'te her ekip yapay zeka kodlama ajanlarını benimsedi. 2026'da ise kazanan ekipler, sadece en iyi modeli seçenler değil, ajan ortamlarını mühendislik süzgecinden geçirenler oluyor.
Mitchell Hashimoto'nun temel prensibi:
"Bir ajanın hata yaptığını her fark ettiğinizde, ajanın bu hatayı bir daha asla yapmaması için bir çözüm mühendisliği yapmaya zaman ayırın."
bu prompt engineering değildir. Bu, yapay zeka için sistem mühendisliğidir.
Kanıt: Harness > Model
LangChain, Terminal Bench 2.0 üzerinde kontrollü bir deney yürüttü. Alttaki modeli değiştirmeden, sadece harness'ı geliştirerek kodlama ajanının doğruluğunu %52,8'den %66,5'e çıkardılar; bu %26'lık bir iyileşme anlamına geliyor.
Yapılan değişiklikler şunları içeriyordu:
- Daha iyi bağlam dosyaları (AGENTS.md)
- Yapılandırılmış çıktı kısıtlamaları
- Öz doğrulama (self-verification) döngüleri
- Araç optimizasyonu
Bu durum, uygulayıcıların söylediklerini doğruluyor: Tavan noktası model değil, onun etrafına ne koyduğunuzdur.
Bir Harness'ın 7 Bileşeni
1. Bağlam Mühendisliği (Context Engineering)
Bağlam mühendisliği temeldir. Burası, ajana kod tabanınızın bir haritasını, kurallarınızı ve kısıtlamalarınızı verdiğiniz yerdir.
Pratikte:- Depo (repo) kök dizinindeki
CLAUDE.md/AGENTS.mddosyaları - Dizin haritaları ve mimari genel bakışlar
- Kodlama stili kuralları ve isimlendirme standartları
# CLAUDE.md örneği
## Architecture
- src/app/ — Next.js app router sayfaları
- src/lib/ — paylaşılan yardımcı programlar ve API istemcileri
- src/components/ — React bileşenleri (aynı konumda stiller)
## Rules
- Varsayılan olarak server components kullanın
- Bileşenlerde asla doğrudan node_modules üzerinden içe aktarma yapmayın
- Tüm API çağrıları src/lib/api.ts üzerinden geçer
2. Mimari Kısıtlamalar
Ajanın doğru mimariyi seçmesini ummak yerine, bunu zorunlu kılın.
- Linter'lar tarafından doğrulanan katı katmanlı mimariler
- Desenler ihlal edildiğinde başarısız olan yapısal testler
- ESLint kuralları veya özel script'ler aracılığıyla içe aktarma kısıtlamaları
3. Araçlar ve MCP Sunucuları
Ajanların etkili olabilmesi için araçlara ihtiyacı vardır. En iyi harness'lar dahili araçları şu yollarla sunar:
- CLI sarmalayıcıları — özel araçlar yerine iyi bilinen CLI'ları (git, docker, npm) tercih edin
- MCP (Model Context Protocol) sunucuları — ajanların dahili API'lerinizi, veritabanlarınızı ve servislerinizi çağırmasına izin verin
- Dosya sistemi erişimi — kazara hasarı önlemek için belirli dizinlerle sınırlandırılmış
git'i mükemmel şekilde kullanabilir. Dökümantasyonu olmayan özel bir CLI onu şaşırtacaktır.
4. Alt-Ajanlar ve Bağlam Güvenlik Duvarları
Uzun süreli ajan oturumları, zamanla performansı düşüren bir bağlam birikimine neden olur; buna bağlam çürümesi (context rot) denir.
Çözüm: Bağlam güvenlik duvarlarına sahip alt-ajanlar.
- Karmaşık görevleri ayrı alt görevlere bölün
- Her alt görev, taze bir bağlamla kendi oturumunda çalışır
- Ajanlar arasında ham konuşmaları değil, sadece yapılandırılmış sonuçları aktarın
- Initializer Agent — işi planlar, bir özellik listesi oluşturur
- Coding Agent — her bir özelliği izole bir şekilde yürütür
5. Hook'lar ve Geri Basınç (Back-Pressure)
Hataları daha büyümeden yakalayan otomatik geri bildirim döngüleri:
- Pre-commit hook'ları — tip kontrolü, linting, formatlama
- Test çalıştırıcıları — ajanlar her değişiklikten sonra testleri çalıştırmalıdır
- Build doğrulaması — bozuk build'lerde hızlıca hata verin
6. Öz Doğrulama (Self-Verification) Döngüleri
Ajanları, görevleri tamamlandı olarak işaretlemeden önce kendi işlerini doğrulamaya zorlayın:
- Değişikliklerden sonra test paketini çalıştırın
- Build'in geçtiğini kontrol edin
- Çıktının spesifikasyonla eşleştiğini doğrulayın
- Bir ekran görüntüsü alın ve karşılaştırın (UI çalışmaları için)
7. İlerleme Dokümantasyonu
Uzun süren görevler için (30+ dakika):
- Tamamlanan adımları izleyen bir ilerleme dosyası tutun
- İşleri sık sık commit edin, böylece sonraki oturumlar devam edebilsin
- Serbest notlar yerine yapılandırılmış görev listeleri kullanın
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.
Gerçek Dünya Sonuçları
OpenAI Codex Ekibi
3 mühendis, 5 ay boyunca tek bir satır elle kod yazmadan milyon satırlık bir kod tabanı üretti. Mühendis başına günde ortalama 3,5 birleştirilmiş (merged) PR düşüyordu; bu, olgun bir harness olmadan imkansız bir verimliliktir.
Onların harness'ı şunları içeriyordu: katı commit standartları, her PR'da otomatik testler ve ajana duyarlı CI/CD boru hatları.
Stripe'ın "Minion"ları
Stripe'ın dahili sistemi, yapay zeka ajanlarını kullanarak haftalık 1.000'den fazla birleştirilmiş PR üretiyor. Onların harness'ı şunları içerir:
- Sıkıca sınırlandırılmış görev tanımları
- İnsanlar tarafından zorunlu kod incelemesi
- Otomatik regresyon testleri
- Geri alma (rollback) otomasyonu
Anthropic'in İki Ajanlı Mimarisi
Anthropic, uzun süreli ajanlar için etkili harness yaklaşımlarını yayınladı:
- Ajanlar arası devir formatı olarak yapılandırılmış özellik listeleri
- Ajanların kesintiden sonra devam edebilmesi için Git tabanlı ilerleme takibi
- Ajanların ne zaman duracağını bilmesi için açık çıkış kriterleri
Kendi Harness'ınızı Oluşturmaya Nasıl Başlarsınız?
Adım 1: Bağlam Dosyanızı Oluşturun
Projenizin kök dizinine bir CLAUDE.md (veya AGENTS.md) ekleyin:
# Project: [Projeniz]
## Stack
[Framework, dil, veritabanı, hosting]
## Architecture
[Tek satırlık açıklamalarla dizin yapısı]
## Rules
[Ajanın uyması gereken 5-10 katı kural]
## Common Tasks
[Testler nasıl çalıştırılır, build, deploy]
Adım 2: Yapısal Kısıtlamalar Ekleyin
# Örnek: Bileşenlerde doğrudan DB içe aktarmasını önleyen ESLint kuralı
# .eslintrc — no-restricted-imports kuralı
Kurallarınızı otomatik olarak uygulayan pre-commit hook'ları kurun.
Adım 3: Build Doğrulama Döngüleri Kurun
Ajanınızın şunları yapabildiğinden emin olun:
- Testleri çalıştırmak (
npm test,pytest, vb.) - Tipleri kontrol etmek (
tsc --noEmit,mypy) - Lint kontrolü yapmak (
eslint .,ruff check)
Bunları ajanınızın iş akışına bağlayın, böylece her değişiklikten sonra çalışsınlar.
Adım 4: Ajan Oturumlarını Sınırlandırın
Bir ajana tüm yapılacaklar listenizi (backlog) vermeyin. Bunun yerine:
- Her oturumda bir özellik
- Her oturumda bir hata düzeltme
- Her görev için net kabul kriterleri
Adım 5: Harness Üzerinde Yineleme Yapın
Bir ajan her hata yaptığında:
- Kök nedeni belirleyin
- Bunu önleyen bir kural, kısıtlama veya hook ekleyin
- Düzeltmeyi test edin
Harness Engineering vs. Prompt Engineering
| Prompt Engineering | Harness Engineering | |
|---|---|---|
| Odak Noktası | Modele ne söylediğiniz | Modelin etrafına ne inşa ettiğiniz |
| Dayanıklılık | Kırılgan, modele bağımlı | Sağlam, modelden bağımsız |
| Bileşik Etki | Zamanla iyileşmez | Her yinelemede daha iyiye gider |
| Kapsam | Tekil etkileşim | Tüm iş akışı |
| Yetenek Türü | Yazım | Sistem mühendisliği |
Prompt engineering hala faydalıdır, ancak resmin sadece küçük bir parçasıdır. Harness engineering ise çarpan etkisidir.
Gelişen Rol: Harness Mühendisi
Mühendislik ikiye ayrılıyor:
- Ortam Oluşturma — yapı, araçlar, kısıtlamalar ve geri bildirim döngüleri oluşturma
- İş Yönetimi — paralel ajan oturumlarını planlama, inceleme ve koordine etme
Karıştırılmaması Gereken: Harness.io
Eğer DevOps platformunu ararken "Harness Engineering" kelimesine rastladıysanız — Harness.io tamamen ayrı bir konudur. Bu, sürekli entegrasyon (CI), teslimat (CD), feature flags, bulut maliyet yönetimi ve güvenlik testi sunan, 5,5 milyar dolar değerinde (Aralık 2025 itibarıyla) yapay zeka destekli bir CI/CD platformudur.
Harness.io ve harness engineering aynı ismi paylaşsa da farklı problemleri çözüyorlar. Yine de ilginç bir kesişim noktası var: Harness.io'nun yapay zeka destekli DevOps çözümleri, tartışmasız bir şekilde harness engineering prensiplerinin dağıtım hattına (deployment pipeline) bir uygulamasıdır.
Sonuç
Model motordur. Harness ise arabadır. Kimse sadece bir motorla yarış kazanamaz.
2026'da yapay zeka kodlama ajanlarını kullanıyor ve harness'ınıza yatırım yapmıyorsanız, potansiyel değerin büyük kısmını masada bırakıyorsunuz demektir. Bir bağlam dosyasıyla başlayın, kısıtlamalar ekleyin, doğrulama döngüleri kurun ve bir şeyler her bozulduğunda sistemi güncelleyin.
En hızlı ürün çıkaran ekipler daha iyi modeller kullanmıyor. Onlar daha iyi harness'lar kullanıyor.
Be first to build with AI
Y Build is the AI-era operating system for startups. Join the waitlist and get early access.