ยินดีต้อนรับคุณ, บุคคลทั่วไป กรุณา เข้าสู่ระบบ หรือ ลงทะเบียน

เข้าสู่ระบบด้วยชื่อผู้ใช้ รหัสผ่าน และระยะเวลาในเซสชั่น

หน้า: [1]   ลงล่าง
พิมพ์
ผู้เขียน หัวข้อ: Free Robots.txt Generator  (อ่าน 6034 ครั้ง)
0 สมาชิก และ 1 บุคคลทั่วไป กำลังดูหัวข้อนี้
tosakp
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 113
ออฟไลน์ ออฟไลน์

กระทู้: 1,960



ดูรายละเอียด
« เมื่อ: 14 ธันวาคม 2006, 18:32:10 »

พอดีคุย M กับฟ่าง คุยกันเรื่อง Bot MSN ไม่ยอม crawl เว็บต่อหลังจากอ่าน robots.txt โดยไม่ทราบสาเหตุว่าเป็นเพราะเหตุใด
ก็เลยลองถามอาจารย์กู แต่ก็ยังไม่ได้คำตอบที่แน่ชัด คงต้องหาต่อไป

แต่ไปสะดุด เว็บนึงเข้า
http://www.mcanerin.com/search-engine/robots-txt.htm

ก็เลยเอามาลองให้เล่นดู Cheesy
บันทึกการเข้า

EThaiZone
เจ้าพ่อโลลิค่อน
เจ้าพ่อบอร์ดเสียว
*

พลังน้ำใจ: 321
ออฟไลน์ ออฟไลน์

กระทู้: 12,518



ดูรายละเอียด เว็บไซต์
« ตอบ #1 เมื่อ: 14 ธันวาคม 2006, 18:41:54 »

ใช้ได้เลยครับ  Cheesy
บันทึกการเข้า

chonyagusa
สมุนแก๊งเสียว
*

พลังน้ำใจ: 4
ออฟไลน์ ออฟไลน์

กระทู้: 962



ดูรายละเอียด
« ตอบ #2 เมื่อ: 14 ธันวาคม 2006, 18:57:43 »

ไม่เข้าใจฟังชั่น Restricted Directories: งับ

หรือใครเจนเสร็จแบบ รับบอททุกตัว ทุกอย่าง ทุกนาๆ

ก๊อฟมาให้ทีจ้า
บันทึกการเข้า

jane
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 25
ออฟไลน์ ออฟไลน์

กระทู้: 1,265



ดูรายละเอียด
« ตอบ #3 เมื่อ: 14 ธันวาคม 2006, 19:16:24 »

เอามาฝากเหมือนกันค่ะ  Cheesy

อ้างถึง
บันทึกการเข้า

abac401
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 37
ออฟไลน์ ออฟไลน์

กระทู้: 2,693



ดูรายละเอียด
« ตอบ #4 เมื่อ: 14 ธันวาคม 2006, 19:24:09 »

อ้างอิง pawoot.com
สั่ง Search Engine ให้เชื่องด้วย robots.txt
   
               สำหรับผู้ที่มีเว็บไซต์การสร้างไฟล์ robots.txt ไว้ในเว็บของคุณจะเป็นการบอก Search engine ว่า " ไม่ต้องมาเก็บเว็บไซต์ของฉัน หรือหน้าเว็บบางหน้า หรือไฟล์บางไฟล์ ในเว็บของฉันนะ ไป index หรือเก็บไว้ในสารระบบเว็บของเธอนะจ๊ะ "
เหตุผลหลักๆที่ต้องใส่ robot.txt ก็เพราะต้องการป้องกันไม่ให้ robot ของ S/E มาเก็บข้อมูลที่เราไม่ต้องการให้แสดงใน S/E นั้น ๆอาจมีเหตุผลมาจากใน file/folder ในเว็บไซต์นั้นๆ เป็น ความลับหรือเขตห่วงห้ามพิเศษ restriction zone/Log-in required zone ที่ไม่อยากให้ Search Engine เข้าไปค้นหาเป็นต้น เช่นข้อมูลลับของบริษัท ที่ต้อง upload ไปเก็บในเว็บไซต์

             โดยวิธีการง่าย ๆ ที่คุณจะบอกกับ Search Engine ก็เพียงแค่สร้างไฟล์ "rotbot.txt" ขึ้นมา แล้วนำไฟล์ๆ นี้ไปวางไว้ในตำแหน่งที่root folder ของเว็บไซต์ของคุณ (Root Folder คือ Dir บนสุดของเว็บคุณครับ คือ http://www.ABC.com/robot.txt ครับ ไว้ตำแหน่งนี้นะครับ)

 

คำสั่งใน robots.txt เป็นดั่งนี้
-----------------------------------------------------
User-agent: * ---> ใส่ชื่อ bot ที่ต้องการ เช่น User-agent: msnbot ก็บอก msn ว่าไม่ต้องมา index เว็บของฉัน แต่ใส่ถ้า * ก็หมายถึงทุก S/E ไม่ต้องมา index
Disallow: / ---> บรรทัดนี้ ใส่ ชื่อ folder หรือ ชื่อ file หรือ File extension ที่ไม่ต้องการให่ถูกเก็บไป index
-----------------------------------------------------
:: Case Study ::

1. ถ้าไม่ต้องการให้ S/E ทุกยี่ห้อมาเก็บเว็บไซต์ทั้งเว็บไป index ใช้ข้อความข้างล่าง

User-agent: *
Disallow: /

2. ถ้าต้องการให้ S/E เฉพาะบางยี่ห้อมาเก็บเว็บไซต์ไป index ใช้ข้อความข้างล่าง เช่น msn ,google

User-agent: Googlebot
User-agent: msnbot
Disallow: [สังเกตุว่า ไม่มีเครื่องหมายใดหลัง disallow:]

User-agent: *
Disallow: /

หมายเหตุ ---> ใ นทางกลับกัน ถ้าไม่ต้องการให้ googlebot หรือ MSNbot ก็สลับบรรทัดกันระหว่างบรรทัด * กับ User-agent: Googlebot / User-agent: msnbot

3. ถ้าในกรณีของ ไม่ต้องการให้เก็บ Folder / File หรือ บาง File Extension ก็

User-agent: *
Disallow: /folder
Disallow: /file.extension อาทิ disallow:/indexhome.php ก็ไม่ต้องเก็บไฟล์ indexhome.php หรือ disallow:/indexhome.php?id ก็ไม่ต้องเก็บไฟล์ indexhome.php?[เป็น case ของ dynamic page]
Disallow:/*.file extension$ อาทิ disallow:/*.jpg$ ก็ไม่ต้องเก็บไฟล์ ที่มีนามสกุล jpg$

-----------------------------------------------------------

เพียงเท่านี้ คุณก็สามารถสั่งการ Search Engine ทุกๆ ยี่ห้อไม่ให้มายุ่ง หรือมายุ่งกับเว็บไซต์ของคุณได้อย่างไม่ยากแล้วคร้บบบบ ลองทำดูครับ ง่าย โคตรๆ

 

Pawoot P.
บันทึกการเข้า
เทมาเส็ก
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 8
ออฟไลน์ ออฟไลน์

กระทู้: 1,001



ดูรายละเอียด เว็บไซต์
« ตอบ #5 เมื่อ: 14 ธันวาคม 2006, 19:35:05 »

อ้างจาก: "abac401"
อ้างอิง pawoot.com
สั่ง Search Engine ให้เชื่องด้วย robots.txt
   
               สำหรับผู้ที่มีเว็บไซต์การสร้างไฟล์ robots.txt ไว้ในเว็บของคุณจะเป็นการบอก Search engine ว่า " ไม่ต้องมาเก็บเว็บไซต์ของฉัน หรือหน้าเว็บบางหน้า หรือไฟล์บางไฟล์ ในเว็บของฉันนะ ไป index หรือเก็บไว้ในสารระบบเว็บของเธอนะจ๊ะ "
เหตุผลหลักๆที่ต้องใส่ robot.txt ก็เพราะต้องการป้องกันไม่ให้ robot ของ S/E มาเก็บข้อมูลที่เราไม่ต้องการให้แสดงใน S/E นั้น ๆอาจมีเหตุผลมาจากใน file/folder ในเว็บไซต์นั้นๆ เป็น ความลับหรือเขตห่วงห้ามพิเศษ restriction zone/Log-in required zone ที่ไม่อยากให้ Search Engine เข้าไปค้นหาเป็นต้น เช่นข้อมูลลับของบริษัท ที่ต้อง upload ไปเก็บในเว็บไซต์

             โดยวิธีการง่าย ๆ ที่คุณจะบอกกับ Search Engine ก็เพียงแค่สร้างไฟล์ "rotbot.txt" ขึ้นมา แล้วนำไฟล์ๆ นี้ไปวางไว้ในตำแหน่งที่root folder ของเว็บไซต์ของคุณ (Root Folder คือ Dir บนสุดของเว็บคุณครับ คือ http://www.ABC.com/robot.txt ครับ ไว้ตำแหน่งนี้นะครับ)

 

คำสั่งใน robots.txt เป็นดั่งนี้
-----------------------------------------------------
User-agent: * ---> ใส่ชื่อ bot ที่ต้องการ เช่น User-agent: msnbot ก็บอก msn ว่าไม่ต้องมา index เว็บของฉัน แต่ใส่ถ้า * ก็หมายถึงทุก S/E ไม่ต้องมา index
Disallow: / ---> บรรทัดนี้ ใส่ ชื่อ folder หรือ ชื่อ file หรือ File extension ที่ไม่ต้องการให่ถูกเก็บไป index
-----------------------------------------------------
:: Case Study ::

1. ถ้าไม่ต้องการให้ S/E ทุกยี่ห้อมาเก็บเว็บไซต์ทั้งเว็บไป index ใช้ข้อความข้างล่าง

User-agent: *
Disallow: /

2. ถ้าต้องการให้ S/E เฉพาะบางยี่ห้อมาเก็บเว็บไซต์ไป index ใช้ข้อความข้างล่าง เช่น msn ,google

User-agent: Googlebot
User-agent: msnbot
Disallow: [สังเกตุว่า ไม่มีเครื่องหมายใดหลัง disallow:]

User-agent: *
Disallow: /

หมายเหตุ ---> ใ นทางกลับกัน ถ้าไม่ต้องการให้ googlebot หรือ MSNbot ก็สลับบรรทัดกันระหว่างบรรทัด * กับ User-agent: Googlebot / User-agent: msnbot

3. ถ้าในกรณีของ ไม่ต้องการให้เก็บ Folder / File หรือ บาง File Extension ก็

User-agent: *
Disallow: /folder
Disallow: /file.extension อาทิ disallow:/indexhome.php ก็ไม่ต้องเก็บไฟล์ indexhome.php หรือ disallow:/indexhome.php?id ก็ไม่ต้องเก็บไฟล์ indexhome.php?[เป็น case ของ dynamic page]
Disallow:/*.file extension$ อาทิ disallow:/*.jpg$ ก็ไม่ต้องเก็บไฟล์ ที่มีนามสกุล jpg$

-----------------------------------------------------------

เพียงเท่านี้ คุณก็สามารถสั่งการ Search Engine ทุกๆ ยี่ห้อไม่ให้มายุ่ง หรือมายุ่งกับเว็บไซต์ของคุณได้อย่างไม่ยากแล้วคร้บบบบ ลองทำดูครับ ง่าย โคตรๆ

 

Pawoot P.


robots.txt
มีอะไรมากกว่าที่คุณ pawoot เขียนครับ
ไม่งั้นผมไม่เต้นหรอก  :cry:
บันทึกการเข้า

abac401
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 37
ออฟไลน์ ออฟไลน์

กระทู้: 2,693



ดูรายละเอียด
« ตอบ #6 เมื่อ: 14 ธันวาคม 2006, 20:04:50 »

จริงๆยังไม่รู้เลยครับ  สองคนคุย Msn topic อะไรแต่เดาว่าเรื่อง bot msn ไม่ Indexมั้ง หรือมาแล้วพักนึงก็หายไป ถ้าคุยTopic นี้คงไม่ใช่เพราะ Robot txt ครับ
 เพราะ msn เพิ่ง Update ago ขนานใหญ่บอร์ดต่างประเทศเขาก็ บ่นกันอุบ จับใจความได้ว่า
 1. ago Msn เปลี่ยนเป็น Auto จะเปลี่ยน Ago สลับไปมาไม่มีใครสามารถครองอันดับได้นานเพราะมันเปลี่ยนตอลด
 2. bann เว็บ aff และเว็บMake for ad หลายเจ้าแต่ไม่แบนตลอด เดี็๋ยวสักพักก็มากลับมาแล้วหายไป
 3. ฺิิbann web too mush seo
บันทึกการเข้า
เทมาเส็ก
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 8
ออฟไลน์ ออฟไลน์

กระทู้: 1,001



ดูรายละเอียด เว็บไซต์
« ตอบ #7 เมื่อ: 14 ธันวาคม 2006, 21:33:44 »

อ้างจาก: "abac401"
จริงๆยังไม่รู้เลยครับ  สองคนคุย Msn topic อะไรแต่เดาว่าเรื่อง bot msn ไม่ Indexมั้ง หรือมาแล้วพักนึงก็หายไป ถ้าคุยTopic นี้คงไม่ใช่เพราะ Robot txt ครับ
 เพราะ msn เพิ่ง Update ago ขนานใหญ่บอร์ดต่างประเทศเขาก็ บ่นกันอุบ จับใจความได้ว่า
 1. ago Msn เปลี่ยนเป็น Auto จะเปลี่ยน Ago สลับไปมาไม่มีใครสามารถครองอันดับได้นานเพราะมันเปลี่ยนตอลด
 2. bann เว็บ aff และเว็บMake for ad หลายเจ้าแต่ไม่แบนตลอด เดี็๋ยวสักพักก็มากลับมาแล้วหายไป
 3. ฺิิbann web too mush seo


robots น่าจะช่วยได้บ้างอ่ะน่ะ
ถ้าไม่ได้ก็ปรับเรื่อย ๆ ฮ่า ๆ เรื่องอันดับสลับเป็นไปได้ยากครับ
พวกเว็บแอดเซ้นนี่บางเว็บลาขาดเลย
บันทึกการเข้า

worlddirectory
ก๊วนเสียว
*

พลังน้ำใจ: 3
ออฟไลน์ ออฟไลน์

กระทู้: 282



ดูรายละเอียด
« ตอบ #8 เมื่อ: 14 ธันวาคม 2006, 23:46:16 »

<meta name=”googlebot” content=”noodp” />
<meta name=”yahoobot” content=”noodp” />
<meta name=”msnbot” content=”noodp” />
<meta name=”alexabot” content=”noodp” />
<meta name=”askbot” content=”noodp” />
<meta name=”aolbot” content=”noodp” />
<meta name=”altavistabot” content=”noodp” />
<meta name=”excitebot” content=”noodp” />
<meta name=”lycosbot” content=”noodp” />
<meta name=”iwonbot” content=”noodp” />
<meta name=”dmozbot” content=”noodp” />
<meta name=”mifuturobusacdor” content=”noodp” />
<meta name=”eltuyobot” content=”noodp” />


ไอ้ตรงนี้เนี่ย บอกก่อนนะครับว่า มีแค่ google & yahoo ที่ออกมาประกาศว่า support tag NOODP เนี่ยครับ

โดย google ออกมาประกาศก่อนเมื่อตอนกลางปี แล้วเมื่อช่วงเดือน ตค หรือต้นพยเนี่ยล่ะมั้ง ที่ yahoo เพิ่งมาประกาศ ให้ทราบว่า สนับสนุน tag ตัวนี้


เพิ่มเติม

โดยปรกติไม่จำเป็นต้องใส่มากมายแบบนั้นหรอกครับ

แค่ใส่ว่า

<meta name=”robots” content=”xxxx” />

ก้อพอ botรู้จักหมดล่ะ ควบรวมสำหรับทุกตัว ไปเลย ในกรณีที่เค้าระบุเฉพาะตัวนั้น เนื่องมาจากสาเหตุบางประการครับ เช่น deep bot ของ google มา crawl เว็บแล้วทำให้ server แทบเดี้ยง จึงมึการจำกัดสิทธิ ของ google bot เพิ่มเติม เป็นต้น

อ่อ สำหรับผม robots.txt ไม่ได้ช่วยในการทำ seo เท่าไหร่ แต่แค่ช่วยป้องกัน server เท่านั้นครับ หลักๆ
บันทึกการเข้า

ทำตัวเองให้เป็นที่ยอมรับของสังคม

gamemaster
Newbie
*

พลังน้ำใจ: 0
ออฟไลน์ ออฟไลน์

กระทู้: 43



ดูรายละเอียด
« ตอบ #9 เมื่อ: 19 ธันวาคม 2006, 22:38:52 »

งงนะ งงจริงๆ คุยไรกัน
บันทึกการเข้า

ww.reals.com
www.realestate4.com
xex
สมุนแก๊งเสียว
*

พลังน้ำใจ: 6
ออฟไลน์ ออฟไลน์

กระทู้: 882



ดูรายละเอียด
« ตอบ #10 เมื่อ: 20 ธันวาคม 2006, 01:03:12 »

จำเป็นต้องใส่ไหม หากเรา แบบให้ index หมดเลยก็ได้
ถ้าแบบนี้ หมายความว่าอย่างไรครับ

User-agent: *
Disallow:

 Cheesy
บันทึกการเข้า
GzThai
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 72
ออฟไลน์ ออฟไลน์

กระทู้: 1,306



ดูรายละเอียด เว็บไซต์
« ตอบ #11 เมื่อ: 20 ธันวาคม 2006, 11:59:04 »

ถ้าผมสร้างไฟล์ robots.txt   แล้วข้างในว่างเปล่าไม่มีอะไรเลย bot จะเป็นอะไรมั้ยครับ
บันทึกการเข้า

หน้า: [1]   ขึ้นบน
พิมพ์