
Robots.txt nedir?
Robots.txt nereye yazılır?
Robots.txt, web sitelerinin arama motorlarına (örneğin Google, Bing, Yahoo vb.) hangi bölümlerinin taranabilir olduğunu belirten bir standart dosyadır. Bu dosya, web sitesi sahiplerinin arama motorlarına hangi sayfaların taranmasına izin verildiğini, hangi sayfaların taranmaması gerektiğini belirlemelerine olanak tanır.
Robots.txt dosyası genellikle bir web sitesinin kök dizininde bulunur (örneğin, www.example.com/robots.txt). Bu dosya, web tarayıcıları ve arama motoru robotları gibi otomatik tarayıcılar için yönergeler içerir.
Örnek bir robots.txt dosyası şu şekilde görünebilir:
User-agent: *
Disallow: /gizli/
Allow: /herkesin-gorebilecegi/
Bu örnekte, User-agent
bölümü "yıldız (*)" karakteriyle (herhangi bir tarayıcı veya robot) belirtilmiş ve ardından Disallow
ve Allow
direktifleri ile taranabilirlik durumu belirtilmiştir. Disallow
kısmında belirtilen dizinler taranmamalıdır, Allow
kısmında belirtilen dizinler ise taranabilir.
Robots.txt dosyası, arama motorlarına sitenin hangi kısımlarının taranmasına izin verildiğini ve hangi kısımlarının taranmaması gerektiğini kontrol etmek için kullanılır. Ancak, bu dosyanın tamamen güvenilir bir kontrol mekanizması olmadığı unutulmamalıdır; bazı kötü niyetli web tarayıcıları ve arama motorları, bu yönergeleri ihlal edebilir. Bu nedenle, daha hassas bilgilerin korunması gerekiyorsa, ek güvenlik önlemleri alınmalıdır.
Robot.txt oluşturmak için tıkla.