Yazılarımız

OfisData

DUPLICATE CONTENT TESPİT ETMEK ÇÖZÜMLEMEK

İki özdeş belge ikonu üzerinde kırmızı çapraz ve canonical etiketini gösteren yön oku tek bir hedef belgeye işaret ediyor

Google'ın en sık karşılaştığı sorunlardan biri: aynı içeriğin birden fazla URL'de bulunması. Bir e-ticaret sitesinde aynı ürün üç ayrı kategori altında listelenir; bir haber sitesinde aynı yazı PDF ve HTML olarak yayınlanır; bir kurumsal sitede www'lu ve www'suz versiyonlar paralel çalışır. Google hangisini sıralayacağına karar veremez; ikisi de zayıf görünür.

Duplicate content (yinelenen içerik) doğrudan ceza vermez ama "sıralama paylaşımı" yaratır. Aynı içeriğin URL'leri birbirinin otoritesini paylaşır; hiçbiri tam güçlü olamaz. Bu yaklaşımın resmi açıklaması ve canonical önerileri için Google'ın arama merkezi dokümantasyonu birincil kaynaktır. Bu da uzun vadede organik trafik kaybıdır.

Aşağıda duplicate content'in türlerini, tespit yöntemlerini ve canonical, 301 redirect, içerik birleştirme gibi pratik çözümleri anlatıyoruz.

Duplicate content nedir?

Aynı veya çok benzer (yüzde 80+ benzerlik) içeriğin birden fazla URL'de bulunması. Google bunu iki türde değerlendirir:

Internal duplicate

Site içinde aynı içerik birden fazla URL'de görünüyor. Çoğu site farkında olmadan bu sorunu yaşar.

External duplicate

İçeriğiniz başka sitelerde de yayınlanmış. İki tip: izinli (orijinal kaynak siz, başkaları kopyalıyor) ve izinsiz (çalıntı içerik).

Internal duplicate'in yaygın sebepleri

1. URL varyasyonları

Aynı sayfanın farklı URL'lerde çalışması:

  • http://siteniz.com
  • https://siteniz.com
  • http://www.siteniz.com
  • https://www.siteniz.com
  • https://siteniz.com/
  • https://siteniz.com/index.html

Tarayıcı için aynı sayfa; Google için 6 ayrı sayfa. Doğru çözüm: tek bir kanonik URL'e 301 redirect.

2. Parametre URL'leri

E-ticaret sitelerinde filtre ve sıralama URL'leri:

  • /kategori/giyim
  • /kategori/giyim?sort=fiyat
  • /kategori/giyim?sort=fiyat&color=mavi
  • /kategori/giyim?utm_source=facebook

Aynı listeyi gösteriyor olabilir; ama Google için ayrı URL'ler. Çözüm: canonical etiket veya parameter handling.

3. Sayfalama (pagination)

  • /blog
  • /blog?sayfa=2
  • /blog?sayfa=3

Her sayfalama listesi benzer içerik gösterir. Çözüm: rel="next" / rel="prev" veya tüm sayfaları görünür tutup canonical ile yönlendirmek.

4. Aynı ürün, birden fazla kategori

E-ticaret sitelerinde sık. Bir t-shirt hem "kadın giyim" hem "yazlık" hem "indirimde" kategorilerinde listelenir; her birinde aynı ürün sayfasının farklı URL'i.

5. www, sub-domain veya alt-domain

  • siteniz.com
  • www.siteniz.com
  • blog.siteniz.com
  • en.siteniz.com

Aynı içeriği farklı subdomain'de göstermek duplicate yaratır. Çoklu dil için hreflang kullanımı zorunlu.

6. PDF ve HTML versiyon

Bir makaleyi hem web sayfası hem indirilebilir PDF olarak sunmak. Eğer her ikisi de indekslenirse duplicate çıkar.

Tespit yöntemleri

Google Search Console

Index → Pages → "Indexed but not submitted in sitemap" veya "Duplicate, Google chose different canonical than user" raporları. Burada duplicate gruplarını görebilirsiniz.

site: operatörü

Google aramasına site:siteniz.com "spesifik cümle" yazarak aynı cümlenin birden fazla URL'de geçip geçmediğini kontrol edin. Birden fazla sonuç çıkıyorsa duplicate var.

Screaming Frog

Profesyonel SEO denetim aracı. Site taradıktan sonra "Duplicate" sekmesinde aynı title, aynı meta description, aynı içerik özetli URL'leri gruplandırır.

Copyscape veya Siteliner

Hem internal hem external duplicate'i tespit eden ücretli araçlar. Siteliner özellikle internal için pratik; bir kez tarar, duplicate yüzdesini verir.

Ahrefs ve Semrush

Site audit özellikleri duplicate content'i otomatik tarar; öncelik sırasına göre listeler.

URL karşılaştırma tablosu www HTTP HTTPS varyasyonlarının yüzde benzerlik kolonu ve canonical öneri etiketleriyle listelendiği denetim paneli

Çözüm 1: Canonical etiket

En sık kullanılan ve en esnek çözüm. Hangi URL'in "ana" olduğunu Google'a söylersiniz; diğer benzer URL'ler bu ana URL'e işaret eder.

<link rel="canonical" href="https://siteniz.com/urun/123">

Bu etiket HTML <head> içine konur. Google duplicate URL'leri görse bile sıralama için canonical URL'i kullanır.

Self-referencing canonical

Her sayfa kendisine canonical vermeli (kendi URL'ine işaret etmeli). Bu pratik Google'ın canonical kararını netleştirir; pasif duplicate önler.

Cross-domain canonical

İçerik başka bir domain'de orijinal yayınlandıysa o domain'e canonical verilebilir. RSS feed'lerde ve content syndication'da yaygın.

Çözüm 2: 301 redirect

Eski URL artık kullanılmıyorsa veya başka URL ile birleştirilmesi gerekiyorsa, 301 (kalıcı redirect) ile yönlendirme yapılır. Tüm SEO otorite eski URL'den yeniye taşınır.

# .htaccess örneği (Apache)
RewriteEngine On
RewriteCond %{HTTP_HOST} ^siteniz.com [NC]
RewriteRule ^(.*)$ https://www.siteniz.com/$1 [L,R=301]

# www'suz versiyonu www'luya yönlendir
RewriteCond %{HTTPS} off
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

Canonical bilgilendirme; 301 yönlendirme. Canonical sayfayı koruyup işaret eder; 301 sayfayı kapatır ve trafiği taşır. Hangisinin kullanılacağı duruma bağlı.

Çözüm 3: noindex etiket

Bir sayfanın arama sonuçlarında çıkmasını istemiyorsanız; ama kullanıcı için erişilebilir olsun istiyorsanız:

<meta name="robots" content="noindex, follow">

Google bu sayfayı indekslemez ama bağlantıları takip eder. Yararlı kullanım örnekleri:

  • Sepet, ödeme, hesap gibi kullanıcı-spesifik sayfalar
  • Etiket sayfaları (etiketle filtrelenmiş listeler, az içerik)
  • Arama sonuç sayfaları
  • Test ortamı kalıntıları

Çözüm 4: İçerik birleştirme

İki ayrı sayfa benzer konuyu işliyorsa; ikisini tek güçlü sayfada birleştirmek en doğru SEO kararıdır. Adımlar:

  1. İki sayfanın içeriğini analiz et; her ikisinden en iyi bölümleri seç
  2. Tek bir kapsamlı sayfa yaz (eskilerden iyi)
  3. Diğer sayfayı 301 ile bu yeni sayfaya yönlendir
  4. Search Console'da yeni URL'i indekslenmesi için tetikle
  5. İç bağlantıları yeni URL'e güncelle

İki orta kaliteli sayfa tek güçlü sayfa olur; otorite birleşir, sıralama yükselir.

Çözüm 5: Parametre handling

Search Console'da URL Parameters özelliği (artık kaldırıldı ama bazı alternatif yollar var). E-ticaret sitelerinde filtre URL'leri için iki yaklaşım:

  • Canonical ile ana kategoriye işaret: Tüm filtrelenmiş URL'ler ana kategori URL'ine canonical verir
  • noindex ile gizleme: Filtre URL'leri indekslenmez; ama crawl edilir (link otorite akışı korunur)
  • robots.txt ile engelleme: Belirli parametre desenlerini Google'ın taramasını engelleyebilirsiniz

Hreflang ile çoklu dil duplicate çözümü

Aynı içerik Türkçe ve İngilizce versiyonlarda yayınlanıyorsa hreflang etiketleriyle Google'a dilleri bildirin:

<link rel="alternate" hreflang="tr" href="https://siteniz.com/tr/sayfa">
<link rel="alternate" hreflang="en" href="https://siteniz.com/en/page">
<link rel="alternate" hreflang="x-default" href="https://siteniz.com/">

Bu sayede Google "iki ayrı sayfa ama farklı dillerde, aynı içerik değil" anlar. Türk kullanıcıya Türkçe, ABD kullanıcıya İngilizce versiyonu gösterir.

External duplicate çözümleri

İçeriğiniz çalınmış

Birisi sizinkini kopyalamış; siz orijinalisiniz. Çözüm yolları:

  • Sitede yazıyı ilk siz yayınladığınız için Google çoğunlukla orijinal olarak tanır
  • Yine de DMCA bildirimi yapabilirsiniz (Google Search Console üzerinden)
  • Çalan siteye iletişim kurup kaldırma talebi gönderin
  • Yasal yol için marka avukatı

Bilinçli content syndication

İçeriğinizi Medium, LinkedIn, başka bir blog'ta da yayınlamak istiyorsanız: o site cross-domain canonical etiketiyle orijinaline işaret eder. Sıralama orijinalde kalır.

Tipik Yanlışlar hatalar

  1. Canonical etiketin yanlış kullanılması. Her sayfayı birbirine canonical etmek; veya pasta canonical zinciri oluşturmak
  2. Birden fazla canonical etiket. Bir sayfada iki canonical Google tarafından yok sayılır
  3. www ve www'suz duplicate'i atlamak. En yaygın internal duplicate; basit 301 ile çözülür
  4. HTTP ve HTTPS paralel çalıştırmak. Tek bir versiyon olmalı; diğeri yönlendirilmeli
  5. Site tamamen Cloudflare arkasında ama https zorlanmamış. Force SSL açılmalı
  6. Pagination'da tüm sayfaları noindex yapmak. Trafik kaybı; tüm sayfaları görünür tutup canonical kullanın
  7. Filtre URL'lerini hem indexable hem canonical'sız bırakmak. Sonsuz kombinasyon Google'ın crawl bütçesini tüketir

Düzenli denetim rutini

SıklıkAksiyon
AylıkSearch Console "Indexed but not submitted" kontrolü
AylıkYeni eklenen sayfaların canonical'ı doğru mu
ÇeyreklikTam site Screaming Frog denetimi
YıllıkHreflang tutarlılığı (çoklu dilli site varsa)
Yeniden tasarım sonrasıTüm canonical etiketler taranır
Karar ağacı akış diyagramı canonical 301 redirect noindex ve içerik birleştirme dört çözüm dalı evet hayır soru düğümleriyle bağlı

Atılması Gereken Adım

Teknik SEO'nun önemli bir parçası duplicate content yönetimi. Sistemli yetkinlik için teknik SEO eğitimi programları canonical kurgusunu ve URL parametre stratejisini uygulamalı ele alır.

Çıkarımlar

Duplicate content; aynı veya çok benzer içeriğin farklı URL'lerde bulunması durumudur. Google ceza vermez ama otorite paylaşımı yaratarak sıralama gücünü zayıflatır. Çözümler: canonical etiket (en esnek), 301 redirect (kalıcı taşıma), noindex (gizleme), içerik birleştirme (en güçlü) ve hreflang (çoklu dil için). Yaygın iç duplicate sebepleri www/non-www, http/https, parametre URL'leri ve aynı ürünün birden fazla kategoride listelenmesi. Aylık Search Console kontrolü ve çeyreklik Screaming Frog denetimi sürdürülebilir tutar.

 Vimaj