ปกติ ถ้าเชคแบบ site:a.com จะเจอทุกหน้าที่อินเด็ก รวมทั้งซับโดเมนทั้งหมดด้วย
ถ้าเชคแบบ site:www.a.com จะเจอแต่โดเมนหลัก
แล้วไหงเชคแบบ site:a.com แล้วมันมองไม่เห็น index 1หน้านั่นหว่า
+1
index ยังไม่สมบูรณ์ เว็บใหม่ๆเป็นต๊องๆแบบนี้แหละ ผมก็เคย มองข้ามๆ หาลิงค์ เพิ่ม contentไปเรื่อยๆ
google ไม่ได้บริการเราคนเดียวอะครับ
ผมเคยดาวน์โหลดลิงค์ลิสต์ทั้งหมดจากโซน thaihealth จาก google webmaster tools แค่จาก www.
ข้อมูล 30 megabyte txt file แล้วอีก 30 sub หละ อาจจะถึง 1 Gbyte นี่เฉพาะ thaihealth
แน่นอน ไม่ได้มีเว็บผมคนเดียว แสดงว่า gg อุทิศเนื้อที่ฟรีๆให้เยอะมาก ๆ
ดังนั้นเขาก็ต้องเลือกหน่อยว่าเว็บไหน เขาจะอุทิศเนื้อที่ให้เต็มที่
แน่นอน เว็บใหม่ๆอยู่ท้ายๆของ list เสมอ
ส่วนการที่ว่าจะตรวจสอบแบล็กลิสต์ด้วยวิธีนี้คงยากหน่อย