Screaming Frog, yetkinlikleri anlatmakla bitmeyen ve SEO uzmanlarının sıklıkla kullandığı tarama yazılımlarından biridir. Bu yazıda Screaming Frog ile scraping (veri kazıma) işleminden bahsedeceğim.
Veri Kazıma / Scraping Nedir?
Web üzerinden veri kazıma işlemi en basit anlamıyla, bir web sitesindeki veriyi alma veya kazıma işlemidir. Veri kazıma işlemiyle iş gücünden kazanarak, kazımak istediğiniz tüm verileri toplu bir şekilde elde edebilirsiniz.
Screaming Frog ile Veri Kazıma Nasıl Yapılır?
Bir e-ticaret sitesinin kategori/vitrin içeriği mevcut olan sayfalar ile, olmayan sayfaları kolayca tespit etmek için bir örnek üzerinden (hepsiburada.com) anlatımı gerçekleştireceğim.
* Site içerisinde bulunan bütün URL’leri tarayıp boş yere kaynak ve zaman kaybı yaşamak yerine, sadece tarama yapmak istediğim URL’leri baz alacağım.
1. Veri kazıma işlemini yapmak istediğimiz sayfaların bir kaçını tarayıcımızda açarak, içerik alanının bulunduğu elementin XPath’ini almamız gerekiyor.
Görseldeki yönlendirmeyle içerik alanının XPath’ini alıyoruz(//*[@id=”categoryDescription”]). Şimdi yapmamız gereken, kopyaladığımız XPath değişkeninin karşılığı gelen alanı farklı kategorilerden de test etmek.
2. Kopyaladığımız XPath’i bir başka kategoride arıyoruz. (F12, CTRL + F)
İlgili ananın değişkenlerinin aynı olduğunu gözlemledik. Bu işlemle birlikte, Kategori / Vitrin içeriğinin bulunduğu alanın categoryDescription div ID’sine atandığını tespit ettik.
3. Şimdi yapmamız gereken ise, içerik varlığı testini gerçekleştirmek istediğimiz kategori URL’lerini Screaming Frog ile analiz etmek.
(Bu işlemi gerçekleştirmek için, Hepsiburada’daki tüm kategorilerin URL’lerinin bulunduğu site haritasından faydalandım. https://www.hepsiburada.com/sitemaps/kategoriler/sitemap.xml)
3.1. Screaming Frog’dan aşağıdaki yönlendirmeyi takip edelim,
3.2. Açılan ekranın sağ alt kısmından Add’e tıklayıp ve ekrandaki gibi ilgili alanları dolduralım,
3.3. Son adım olarak, kopyalamış olduğum kategori URL’lerinin testini gerçekleştirelim.
Bunun için yapılması gereken işlemler sırasıyla, eğer Screaming Frog Spider modundaysa, sol üstten Mode > List menüsüne tıklamak. Sonrasında ise, Upload > Enter Manually’e tıklayarak kopyaladığınız kategori URL’lerini yapıştırıp taramanın tamamlanmasını beklemek olacak.
Tarama sonucunda elde edilen verileri yukarıdaki görseldeki ok işaretlerini takip ederek bulabilirsiniz.
Sonuç olarak, testini gerçekleştirdiğimiz 80 adet kategorinin 6’sında kategori / vitrin içeriğinin bulunmadığını gözlemliyoruz.
İşinize Yarayacak Diğer XPath’ler
Heading Etiketleri
Heading etiketlerini çekmek için aşağıdaki XPath’leri kullanabilirsiniz;
//h3
//h4
Hreflang Etiketi
Multi language desteği olan web siteleri için aşağıdaki XPath’i kullanabilirsiniz;
//*[@hreflang]
Diğer örnekler için ise, buraya tıklayabilirsiniz.