AI PROMPT HALLUCINATION AZALTMAK
2023'te bir avukat ChatGPT'ye davası için emsal karar buldurma isteği yaptı. Model güzel bir liste verdi; avukat bunları mahkemeye sundu. Sorun şuydu: kararların yarısı uydurma. Hâkim emsalleri arayınca hiçbiri yoktu. Avukat ciddi disiplin yaptırımıyla karşı karşıya kaldı.
Bu olay yapay zeka modellerinin "hallucination" denilen davranışının somut bir örneği. Hallucination kavramı, modelin emin olmadığı konuda bile akıcı ve ikna edici şekilde uydurma cevap üretmesi. Yazım kalitesi yüksek; doğruluğu sıfır. İkna edici sunuş gerçek bilgi sanılır.
İyi haber: hallucination tamamen yok edilemese de doğru prompt teknikleriyle ciddi biçimde azaltılır — kaynak zorunluluğu, belirsizlik itirafı, kapsam daraltma ve doğrulama katmanı gibi teknikler, günlük iş akışına yerleştiğinde uydurma cevap oranını gözle görülür düşürür.
Hallucination nedir, neden olur?
Yapay zeka dil modelleri (LLM) sözleri tahmin eden istatistiksel makinalardır. "Bir sonraki en olası kelime hangisi?" sorusunu sürekli yanıtlar; sağlayıcıların resmi geliştirici dokümantasyonunda bu olasılıksal davranış ve onu sınırlamaya yarayan parametreler ayrıntılı anlatılır. Bilgi tabanı yok; öğrenme verisinden ezberlediği desenler var. Bu mantık genelde işe yarar ama bazı durumlarda yanılgıya yol açar:
- Eğitim verisinde olmayan konularda model "bilmiyorum" demek yerine "üretmeye" çalışır
- Çok spesifik isimler (kitap başlığı, kişi adı, dava numarası, URL) bağlamdan oluşturulur
- Belirsiz prompt karşısında model "olası en iyi tahminle" cevap verir; emin değildir ama emin gibi konuşur
- İstatistiksel mantık doğruluğu garanti etmez; her kelime "uyumlu" olabilir ama bütün yanlış olabilir
Yaygın hallucination tipleri
1. Uydurma referans
Kitap, makale, dava, kaynak adları üretmek. Model "Smith'in 2019 araştırmasında bildirildiği gibi..." der; Smith yok, araştırma yok.
2. Uydurma URL
Çalışmayan link verme. Model "Daha fazla bilgi için site.com/sayfa adresine bakın" der; sayfa yoktur.
3. Yanlış faktüel bilgi
"İstanbul Türkiye'nin başkenti" gibi (yanlış; başkent Ankara). Model emin değildir ama emin gibi söyler.
4. Tarih ve sayı hatası
"Bu olay 2018'de gerçekleşti" (aslında 2020'de). Modelin eğitim verisi sınırlı; spesifik tarihlerde sapma olur.
5. Kişi atıfları
"Elon Musk şu cümleyi söyledi" der; Musk böyle bir şey söylememiştir. Ünlü kişilere uydurma sözler yüklemek yaygın.
6. Mantık hatası
Matematiksel hesap yanlış yapma. "2+2=5" demek; veya kompleks akıl yürütmede yanlış adım atma.
Teknik 1: Net hedef ve bağlam
Hallucination'ın temel nedeni belirsizliktir. Belirsiz prompt karşısında model "tahmin" yapar; net prompt karşısında "bilgi" verir (varsa).
Zayıf prompt
"Türkiye'deki pazarlama trendleri nedir?"Güçlü prompt
"Sen B2B SaaS pazarlama uzmanısın. Türkiye'de orta ölçekli
yazılım şirketlerinin son 12 ayda kullandığı pazarlama kanalları
hakkında bilgi ver. Spesifik araç ve platform adı verme; sadece
genel trendleri özetle. Emin olmadığın bir konuda 'kesin bilgim
yok' diyerek belirt."Bu prompt'ta: rol, hedef kitle, zaman aralığı, format kısıtı ve "emin değilim deme yetkisi" var. Model sapma şansı azalır.
Teknik 2: Yapılandırılmış format
Model serbest metin üretirken hata yapma olasılığı yüksek; yapılandırılmış format istemek hata oranını düşürür.
"Konu: [yapay zeka tarihi]
Bana şu yapıda cevap ver:
YIL: [yıl]
OLAY: [olay açıklaması, max 50 kelime]
GÜVENILIRLIK: [yüksek / orta / düşük / emin değilim]
KAYNAK: [kaynak adı veya 'bilinen popüler bilgi']
Toplam 5 madde ver. Güvenilirliği düşük olanları işaretle."Yapı modelin "uydurmak" yerine "belirtmek" yönüne gitmesini sağlar. Güvenilirlik etiketi şart; modelden kendisinden emin olmadığını söylemesini iste.
Teknik 3: "Emin değilim" izni
Modellerin varsayılan eğilimi "kibar olmak"tır; cevabı bilmese bile uydurmaktan çekinmez. Prompt'ta açıkça "emin değilsen söyle" izni verin.
"Aşağıdaki sorulara cevap ver. EĞER bir konuda emin değilsen
'bu konuda emin bilgim yok, kullanıcının kontrol etmesini
öneririm' yaz. Tahmin etme.
Soru 1: ...
Soru 2: ...
Soru 3: ..."Bu basit ek modelin uydurma yerine "bilmiyorum" demesini sağlar. Hallucination'ı yüzde 30-50 azaltabilir.
Teknik 4: Kanıt iste
Model bilgi verirken kaynağa atıf isteyin. Eğer kaynak veremiyorsa o bilgi şüphelidir.
"Aşağıdaki iddiaları desteklemek için kaynak ver. Her iddianın
yanına:
- KAYNAK: spesifik isim (kitap, araştırma, kuruluş)
- TARİH: kaynak yayın yılı
- ALINTI: doğrudan alıntı varsa
Eğer kaynak veremiyorsan iddianı 'genel bilgi (kaynak yok)'
olarak işaretle."Bu yaklaşım modelin kaynak uydurmasını da yakalar; çünkü ünlü kaynaklar dışındaki spesifik isimler model tarafından üretilebilir. İddialardan 5 tanesinde "kaynak yok" işaretleniyorsa o konuda model güvenilir değil.
Teknik 5: Çoklu kontrol (Chain of Verification)
Modeli kendi çıktısını doğrulamaya zorlamak. İki aşamalı prompt:
Adım 1: İlk cevap
"Şu konuda 5 madde halinde özet ver: [konu]"Adım 2: Doğrulama
"Yukarıdaki listede her maddenin doğru olduğundan emin misin?
Her madde için:
- Doğru ise 'doğrulandı' yaz
- Şüpheliysen 'şüpheli, kontrol gerekli' yaz
- Yanlışsa düzelt
Sadece doğrulanmış maddeleri tut, diğerlerini çıkar."Model kendi cevabını eleştirmeye zorlandığında bazı hatalı maddeleri kendisi çıkarır. Mükemmel değil ama kalite iyileşir.
Teknik 6: Few-shot prompting
Modelden istediğiniz davranışın 2-3 örneğini önce verin; sonra asıl görevi sorun. Örnekleri görerek model nasıl davranacağını öğrenir.
"Aşağıdaki örneklerdeki gibi cevap ver:
Soru: 2026'da Türkiye'nin nüfusu ne?
Cevap: Kesin bilgim yok. Son tahmini veriler 85 milyon
civarındaydı ama güncel rakam için TÜİK kaynağına bakılmalı.
Soru: Apple'ın CEO'su kim?
Cevap: Tim Cook (eğitim verim 2023 dolaylarına dayanıyor;
güncel değişiklik varsa Apple kurumsal sitesine bakın).
Soru: [Asıl sorum]
Cevap:"Few-shot prompting modele "bu şekilde dikkatli cevap ver" demektir. Model örnekteki dil ve tutumu kopyalar.
Teknik 7: RAG (Retrieval-Augmented Generation)
Modele güvenilir kaynak metnini önce ver; sonra o metne dayanarak cevap üretmesini iste. Bu, modern enterprise AI uygulamalarının temeli.
"Aşağıdaki belgeyi oku ve sadece bu belgedeki bilgilere
dayanarak soruya cevap ver. Belgede olmayan bilgi için
'belgede bu konuda bilgi yok' yaz.
BELGE:
[Buraya 2-3 sayfa kaynak metin yapıştır]
SORU: [Asıl soru]"Model kendi eğitim verisinden değil; verdiğiniz kaynaktan cevap verir. Hallucination dramatik şekilde azalır. Bu yaklaşım hukuk, sağlık, müşteri hizmeti gibi yüksek kesinlik isteyen alanlarda standart hale geliyor.
Teknik 8: Temperature düşürme
API kullanıyorsanız "temperature" parametresi modelin yaratıcılığını ayarlar:
- Temperature 1.0: Yaratıcı, çeşitli, riskli
- Temperature 0.7: Dengeli (varsayılan)
- Temperature 0.3: Daha tutucu, daha tutarlı
- Temperature 0.0: En tutarlı; aynı prompt'a aynı cevap
Faktüel bilgi gerektiren görevler için temperature 0.2-0.3 önerilir. Yaratıcı yazı için 0.7-0.9.

Sektörel risk seviyesi
Her görevde hallucination riski aynı değildir. Risk seviyesine göre koruma katmanı eklenir.
| Risk seviyesi | Görevler | Önerilen koruma |
|---|---|---|
| Düşük | Yaratıcı yazı, beyin fırtınası, taslak | Temel prompt yeterli |
| Orta | Özetleme, çeviri, e-posta yanıtı | Yapılandırılmış format + kontrol |
| Yüksek | Faktüel makale, rapor | RAG + kanıt isteme + insan kontrolü |
| Çok yüksek | Hukuk, sağlık, finans, müşteri hizmeti | RAG + Chain of Verification + zorunlu insan onayı |
Yüksek risk alanlarında AI çıktısı asla kontrol edilmeden yayınlanmamalı.
Doğrulama rubriği
Üretilen AI içeriğini değerlendirmek için basit kontrol listesi:
- Faktüel doğruluk: Verilen bilgiler kaynak ile karşılaştırılarak doğrulandı mı?
- Referans doğruluğu: Kitap, makale, link, isim referansları gerçekten var mı?
- Tarih ve sayı: Spesifik sayısal değerler doğru mu?
- Mantık tutarlılığı: Çıktıda iç çelişki var mı?
- Bağlam uyumu: Cevap soruya gerçekten uyuyor mu?
- Tam cevap: Kısmi bilgiyle eksik bırakılmış mı?
Bu rubrik bir çıktıyı 5-10 dakikada değerlendirir; manuel ama gerekli.
Hangi konularda model güvenilmez?
Bazı alan tipleri her zaman manuel doğrulama gerektirir:
- Hukuki emsal kararlar (uydurma çok yaygın)
- Tıbbi diagnoz ve ilaç bilgisi
- Finansal rakam ve tahminler
- Bilimsel araştırma alıntıları
- Spesifik URL ve link
- Ünlü kişilere atfedilen sözler
- Spesifik tarih, yıl, sayı
- Yerel kanun ve düzenlemeler
- Akademik makale referansları
Bu alanlarda AI çıktısı sadece "başlangıç noktası" olarak kullanılır; her bilgi orijinal kaynağında doğrulanır.
Modeller arası farklar
Tüm modeller aynı oranda hallucination yapmaz:
- Claude (Anthropic): Genelde "emin değilim" demeye daha açık; daha az uydurma eğilimi
- GPT-4 (OpenAI): Akıcılığı yüksek; bazen emin olmadığını gizleyip uydurma yapabilir
- Gemini (Google): Güncel bilgi için web entegrasyonu daha iyi; eski olaylarda daha fazla hatası olabilir
- Mistral, Llama: Açık kaynak modeller; özelleşmeleri farklı, faktüel performans değişken
Yüksek risk görevlerde birden fazla modelle çapraz kontrol yapmak iyi pratiktir.
Ekip için politika
AI kullanan ekipler bir politika oluşturmalı:
- Risk sınıflandırma: Hangi görev hangi risk seviyesinde?
- Doğrulama zorunluluğu: Yüksek risk için insan kontrolü şart
- Kaynak gösterimi: AI ile üretilen içerik etiketlenir
- Faktüel kontrol: Yayın öncesi rastgele 10-20 örnek doğrulanır
- Sorumluluk: AI çıktısının sorumluluğu kullanan insan tarafında

Atılması Gereken Adım
Yapay zeka prompt mühendisliği yeni bir disiplin; iyi öğrenildiğinde verimi katlar, hatalı kullanıldığında ciddi risk yaratır. Sistemli bir başlangıç için AI prompt eğitimi programları rol tanımından hallucination yönetimine kadar uygulamalı pratik sağlar.
Önceliklendirilecek Konular
AI prompt hallucination azaltmak; net hedef belirleme, yapılandırılmış format, "emin değilim" izni, kanıt isteme, Chain of Verification, few-shot prompting, RAG ve temperature düşürme tekniklerinin birlikte kullanılmasıyla mümkün olur. Hiçbir teknik yüzde 100 koruma sağlamaz; doğru kombinasyon hallucination'ı yüzde 70-80 azaltabilir. Yüksek risk alanlarında (hukuk, sağlık, finans) AI çıktısı asla insan kontrolü olmadan yayınlanmamalı. Model güvenilmez bir asistandır; iyi yardımcı ama kontrolsüz uzman değil. Sorumluluk her zaman kullanıcı tarafında kalır.



