
Mesela normal htlm sayfalarda parse işlemlerinde sayfanın tamamını parse etmekte sorun yok ama ajax ile yapılmış sayfalarda siz sayfayı kaydırdıkça aşağı doğru akan bilgi akışı olan sayfalarda sorun.( Siz kaydırma çubuğunu aşağı çektikçe veya daha fazlasını göster dedikçe sayfaya yeni bilgiler eklenip uzayıp gider ) Bu sayfalara örnek Nesine.com sitesindeki kupondaş kısmı benim istediğim kısım. Sayfayı ilk açtığınızda çıkan o an size görünen tüm bilgileri sayfa kaynağında görüp çekebiliyoruz fakat daha fazlasını göster dediğinizde sayfaya yeni bilgiler ekleniyor işte bunları göremiyoruz. Görmek için kaynak kodu sürekli yenilemek gerekiyor. Bu tür bir sayfadaki tüm veriyi almak için neler yapılabilir. Sizlerden bu konuda gerek kod gerek fikir olarak yardımınızı rica ediyorum.
Kendi fikrim şu şekilde
1) ilk açılan sayfadaki tüm kodu bir dosyaya kaydet ve sayfadaki daha fazla göster buttonuna tıklat. En son kaldığın noktayı bul ve bundan sonrasını al.
(Burada en son kaldığım noktayı bulduramıyorum çünkü bulmak için belli bir sabit veremiyorum. Aynı üye adı bir çok yerde geçiyor , açıklamalar aynı olabiliyor vs..)
2) Sayfa açıldığında daha fazla göster buttonunu tıklayarak bilgilerin sonuna kadar gitmek ve sona gelindiğinde tüm sayfayı alıp parse etmek.
( Bundaki sıkıntı daha fazla göster buttonu tıklandıkça , sayfanın kaynak kodunda, tıklamadan önceki bilgilerin yenileri ile değişmesi. )
Bu tür sayfalarda sizlerin çözümleriniz ne oldu ? Nasıl bir çözüme gittiniz paylaşırsanız sevinirim.
Teşekkürler