ยินดีต้อนรับคุณ, บุคคลทั่วไป กรุณา เข้าสู่ระบบ หรือ ลงทะเบียน

เข้าสู่ระบบด้วยชื่อผู้ใช้ รหัสผ่าน และระยะเวลาในเซสชั่น

ThaiSEOBoard.comพัฒนาเว็บไซต์CMS & Free Scriptว่าด้วยเรื่องของ site_map.xml ขอปรึกษาหน่อยครับ
หน้า: [1]   ลงล่าง
พิมพ์
ผู้เขียน หัวข้อ: ว่าด้วยเรื่องของ site_map.xml ขอปรึกษาหน่อยครับ  (อ่าน 577 ครั้ง)
0 สมาชิก และ 1 บุคคลทั่วไป กำลังดูหัวข้อนี้
Hotsocial
Newbie
*

พลังน้ำใจ: 0
ออฟไลน์ ออฟไลน์

กระทู้: 13



ดูรายละเอียด
« เมื่อ: 11 ตุลาคม 2017, 10:54:57 »


ขอถามเรื่องของ site_map.xml หน่อยครับพอดีว่าไม่คุ้นกับ site_map.xml  แบบนี้เลย เพราะปกติแล้วจะเจอแต่ sitemap.xml  แบบนี้ และเนื้อหาใจความของ  site_map.xml  ค่อนข้าง งง ผมเลยไม่มั่นใจว่ามันเป็นไวรัส หรือว่าคนเก่าเค้าทำอะไรกับ  site_map.xml  ตัวนี้กันแน่จึงอยากขอคำปรึกษาพี่ๆ หน่อยครับว่า  site_map.xml  มันคืออะไรกันแน่ มันเหมือน  site_map.xml ทั่วไปหรือเปล่าครับ

<?xml version="1.0" encoding="UTF-8"?>
   <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 ">
      <url>
         <loc>http://www.xxxxxx.com/2865df43...gs-4e8e5127586-descend/21-rug/ </loc>
         <lastmod>2017-08-22</lastmod>
         <changefreq>daily</changefreq>
         <priority>0.8</priority>
      </url>
      <url>
         <loc>http://www.xxxxxx.com/28b8d051...gs-89909324f28-descend/21-rug/ </loc>
         <lastmod>2017-08-22</lastmod>
         <changefreq>daily</changefreq>
         <priority>0.8</priority>
      </url>
      <url>
         <loc>http://www.bcosmo.com/285ec6f0...s-1108890fee12-descend/21-rug/ </loc>
         <lastmod>2017-08-22</lastmod>
         <changefreq>daily</changefreq>
         <priority>0.8</priority>
      </url>
      <url>
         <loc>http://www.xxxxxx.com/288c3786...s-190cd51d6416-descend/21-rug/ </loc>
         <lastmod>2017-08-22</lastmod>
         <changefreq>daily</changefreq>
         <priority>0.8</priority>
      </url> </urlset>

      และเป็นแบบนี้ยาวมาก เปิดใน Sublime  จะจบที่บรรทัด 150,915  พิมไม่ผิดครับ จบที่บรรทัด 150,915 ต้องการทราบครับว่าสรุปแล้วมันคืออะไรแน่เพราะ ลิ้งที่มันรันมา เปิดไม่ได้สักลิ้ง


ขอบคุณครับ
บันทึกการเข้า
sputtaro
สมุนแก๊งเสียว
*

พลังน้ำใจ: 139
ออฟไลน์ ออฟไลน์

กระทู้: 910



ดูรายละเอียด
« ตอบ #1 เมื่อ: 11 ตุลาคม 2017, 12:42:25 »

Sitemap ที่อ้างอิง sitemaps.org โครงสร้างแบบที่ท่านมีอยู่ ถือว่าถูกต้องแล้วครับ
sitemaps.org Sitemaps XML format

ส่วนชื่อ จะเป็นชื่ออะไรก็ได้ ไม่สำคัญ
สำคัญที่ท่านต้อง submit ไปยัง search engine แล้วตรวจสอบว่า search engine เหล่านั้น อ่านได้ครบถ้วน ถูกต้อง หรือไม่
โดยการเช็คที่ google webmaster tools หรือ bing webmaster tool ...

กรณีที่ sitemap.xml มีขนาดใหญ่เกินไป แนะนำให้แบ่งเป็นหลายๆไฟล์ หรือไม่ก็ Compress หรือ ทำทั้งสองทาง
เพราะ ถ้าไม่ compress และมีขนาดใหญ่เกินไป (แค่ 3000-4000 บันทัด ขึ้นไป ก็อาจส่งผลให้ อ่านได้ไม่ครบถ้วนได้แล้วครับ)

**************************************************************************************************

เฉพาะกรณี google ลองอ่าน Build and submit a sitemap ดูครับ

*****************************

ลืมพูดถึง ลิงค์เสีย

กรณีที่ท่านบอกว่า "ลิ้งที่มันรันมา เปิดไม่ได้สักลิ้ง" คงหมายถึง ลิ้งค์เสีย เป็น 404 NOT Found ใช่ไหม
ถ้าใช่ รีบลบลิ้งค์นั้นออกไปจนหมด
เพราะถ้าคุณปล่อยไว้ search engine จะแจ้งเตือนว่า พบ ลิ้งค์เสียจำนวนมาก พอผ่านไปนานเข้า ลิ้งค์เสียนั้นยังคงมีอยู่
อันดับเว็บคุณอาจค่อยๆลดลงไปได้

และอย่าลืมว่า การ submit ลิ้งค์ทั้งหมด ต้องเป็นลิ้งค์ภายในของเว็บที่ submit นะครับ
ถ้าเอาลิ้งค์ของเว็บอื่นมา submit เผลอๆ เว็บคุณนั่นแหละที่จะหายไปจากสารบบการค้นหา
« แก้ไขครั้งสุดท้าย: 11 ตุลาคม 2017, 12:52:36 โดย sputtaro » บันทึกการเข้า
Hotsocial
Newbie
*

พลังน้ำใจ: 0
ออฟไลน์ ออฟไลน์

กระทู้: 13



ดูรายละเอียด
« ตอบ #2 เมื่อ: 11 ตุลาคม 2017, 13:03:20 »

Sitemap ที่อ้างอิง sitemaps.org โครงสร้างแบบที่ท่านมีอยู่ ถือว่าถูกต้องแล้วครับ
sitemaps.org Sitemaps XML format

ส่วนชื่อ จะเป็นชื่ออะไรก็ได้ ไม่สำคัญ
สำคัญที่ท่านต้อง submit ไปยัง search engine แล้วตรวจสอบว่า search engine เหล่านั้น อ่านได้ครบถ้วน ถูกต้อง หรือไม่
โดยการเช็คที่ google webmaster tools หรือ bing webmaster tool ...

กรณีที่ sitemap.xml มีขนาดใหญ่เกินไป แนะนำให้แบ่งเป็นหลายๆไฟล์ หรือไม่ก็ Compress หรือ ทำทั้งสองทาง
เพราะ ถ้าไม่ compress และมีขนาดใหญ่เกินไป (แค่ 3000-4000 บันทัด ขึ้นไป ก็อาจส่งผลให้ อ่านได้ไม่ครบถ้วนได้แล้วครับ)

**************************************************************************************************

เฉพาะกรณี google ลองอ่าน Build and submit a sitemap ดูครับ

*****************************

ลืมพูดถึง ลิงค์เสีย

กรณีที่ท่านบอกว่า "ลิ้งที่มันรันมา เปิดไม่ได้สักลิ้ง" คงหมายถึง ลิ้งค์เสีย เป็น 404 NOT Found ใช่ไหม
ถ้าใช่ รีบลบลิ้งค์นั้นออกไปจนหมด
เพราะถ้าคุณปล่อยไว้ search engine จะแจ้งเตือนว่า พบ ลิ้งค์เสียจำนวนมาก พอผ่านไปนานเข้า ลิ้งค์เสียนั้นยังคงมีอยู่
อันดับเว็บคุณอาจค่อยๆลดลงไปได้

และอย่าลืมว่า การ submit ลิ้งค์ทั้งหมด ต้องเป็นลิ้งค์ภายในของเว็บที่ submit นะครับ
ถ้าเอาลิ้งค์ของเว็บอื่นมา submit เผลอๆ เว็บคุณนั่นแหละที่จะหายไปจากสารบบการค้นหา


ใช่เลยครับ 404 NOT Found

ในไฟล์ site_map.xml  ลิ้งทุกตัวเปิดไม่ได้ทุกลิ้งเลยครับ 404 NOT Found 
จึงสงสัยหนักมาก เพราะปกติแล้ว ลิ้งใน sitemap  จะสามารถเชื่อมโยงไปยังหน้าอื่นๆ ภายในเว็บไซต์ของเราได้ใช่ไหมครับ
แต่  site_map.xml ที่คนเก่าสร้าง ทุกลิ้งเป็นหน้า 404 NOT Found   และลองเช็คใน webmaster tool  เจอลิ้ง ที่คล้ายๆกับ  sitemap 288c378681d131-blessings-190cd51d6416  ที่เป็นหน้า 404 NOT Found   ประมาณ 1000 ลิ้ง ครับ ซึ่งตอนนี้ก็กำลังไล่ลบ  404 NOT Found  อยู่และไปเจอไฟล์  site_map.xml จึงเลยมาตั้งกระทู้สอบถามครับว่า สรุปแล้ว site_map.xml ตัวนี้มันมีเอาไว้ทำอะไรแน่เพราะเหมือนมันเป็น site_map.xml ที่ชี้ไปยังหน้า 404 ทั้งหมด
http://www.xxxxxx.com/288c3786...gs-190cd51d6416-descend/21-rug

ขอบคุณมากๆครับ ที่มาช่วยตอบ
บันทึกการเข้า
sputtaro
สมุนแก๊งเสียว
*

พลังน้ำใจ: 139
ออฟไลน์ ออฟไลน์

กระทู้: 910



ดูรายละเอียด
« ตอบ #3 เมื่อ: 11 ตุลาคม 2017, 13:18:59 »

ที่ผมบอกว่า "ถ้าใช่ รีบลบลิ้งค์นั้นออกไปจนหมด" นั้นหมายถึง
ให้ลบออกจากไฟล์ sitemap นะครับ
เพราะถ้ามันยังมีอยู่ในไฟล์ sitemap พวก google, bing ก็จะยังคงเจอหน้านั้น และก็จะรายงานว่า เจอลิ้งค์เสียเหมือนเดิม

**********************************************

ลองเอารายงานของ google นั่นแหละมาค้นว่า ลิ้งค์เสียที่ google เจอ
มันอยู่ในไฟล์ไหน อยู่ตรงบันทัดไหน แล้วลบที่เจอออกไปให้หมดจากไฟล์

หรือทำไฟล์ sitemap ใหม่ (ถ้ามีขนาด 1แสนกว่าบันทัดนี่ ยิ่งต้องแก้ไขวิธีการสร้างเลยครับ)
ส่วนจะเลือกแบบ compress หรือ อะไร ยังไง ก็ขึ้นอยู่กับตวามสะดวกของคุณ

จุดสำคัญตือ ให้ google bing อ่านได้ครบถ้วน ถูกต้องเท่านั้นเองครับ
บันทึกการเข้า
Hotsocial
Newbie
*

พลังน้ำใจ: 0
ออฟไลน์ ออฟไลน์

กระทู้: 13



ดูรายละเอียด
« ตอบ #4 เมื่อ: 11 ตุลาคม 2017, 13:22:18 »

ที่ผมบอกว่า "ถ้าใช่ รีบลบลิ้งค์นั้นออกไปจนหมด" นั้นหมายถึง
ให้ลบออกจากไฟล์ sitemap นะครับ
เพราะถ้ามันยังมีอยู่ในไฟล์ sitemap พวก google, bing ก็จะยังคงเจอหน้านั้น และก็จะรายงานว่า เจอลิ้งค์เสียเหมือนเดิม

**********************************************

ลองเอารายงานของ google นั่นแหละมาค้นว่า ลิ้งค์เสียที่ google เจอ
มันอยู่ในไฟล์ไหน อยู่ตรงบันทัดไหน แล้วลบที่เจอออกไปให้หมดจากไฟล์

หรือทำไฟล์ sitemap ใหม่ (ถ้ามีขนาด 1แสนกว่าบันทัดนี่ ยิ่งต้องแก้ไขวิธีการสร้างเลยครับ)
ส่วนจะเลือกแบบ compress หรือ อะไร ยังไง ก็ขึ้นอยู่กับตวามสะดวกของคุณ

จุดสำคัญตือ ให้ google bing อ่านได้ครบถ้วน ถูกต้องเท่านั้นเองครับ

ขอบคุณมากๆ เลยครับ ได้คำแนะนำจากผู้เชี่ยวชาญแล้ว มั่นใจและกล้า ลบออกทันที่เลยครับ

ขอบคุณมากๆ อีกครั้งนะครับ ^^
บันทึกการเข้า
sputtaro
สมุนแก๊งเสียว
*

พลังน้ำใจ: 139
ออฟไลน์ ออฟไลน์

กระทู้: 910



ดูรายละเอียด
« ตอบ #5 เมื่อ: 11 ตุลาคม 2017, 13:46:21 »

ขออนุญาต เพิ่มเติม กรรีที่ท่านต้องแบ่ง sitemap ออกเป็นหลายๆไฟล์นะครับ

1. เริ่มแรก ให้สร้างไฟล์ sitemap index ขึ้นมา
โดยมีโครงสร้างตามนี้

--------------------------------------------------------------------------
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 ">
  <sitemap>
    <loc>http://www.localhost.com/sitemap1.xml </loc>
    <lastmod>2017-08-10T06:20:11+00:00</lastmod>
  </sitemap>
  <sitemap>
    <loc>http://www.localhost.com/sitemap2.xml </loc>
    <lastmod>2017-04-10T06:30:11+00:00</lastmod>
   </sitemap>
  <sitemap>
    <loc>http://www.localhost.com/sitemap3.xml </loc>
    <lastmod>2017-04-10T06:40:11+00:00</lastmod>
  </sitemap>
  <sitemap>
    <loc>http://www.localhost.com/sitemap4.xml </loc>
    <lastmod>2017-07-04T06:50:11+00:00</lastmod>
  </sitemap>
    <sitemap>
    <loc>http://www.localhost.com/sitemap5.xml </loc>
    <lastmod>2017-08-10T06:50:11+00:00</lastmod>
  </sitemap>
</sitemapindex>

------------------------------------------------
ข้างบนนั้นคือ sitemapindex ซึ่งคุณสามารถใช้ submit ใน search engine tools ได้ทุกแห่ง เป็นไปตามมาตรฐานที่กำหนดไว้
โดยไม่จำเป็นต้อง submit ไฟล์ sitemap1.xml ไปจนถึง sitemap5.xml ก็ได้ (แต่ควรดูว่า ที่ webmaster tools ต่างๆ อ่านได้ครบทุกไฟล์ไหม
ถ้าไม่ครบ ก็ submit เพิ่ม เฉพาะไฟล์ที่ขาดไปก็ได้

ไฟล์ย่อย จะเพิ่มไปอีก กี่ร้อย กี่พันไฟล์ก็ได้ เช่น เพิ่มไปจนถึง sitemap1000.xml
จุดสำคัญคือ อย่าให้ใหญ่เกินไป จน search engine อ่านไม่หมด

ถ้าใหญ่เกิน 3000-4000 บันทัด ก็ compress ซะเท่านั้นเอง

*************************************************************************************************************

2. ในไฟล์ sitemap1.xml
ก็ทำตามโครงสร้างเดิมที่มีอยู่แล้ว

เวลาที่ generated ออกมา จะเรียงลำดับไฟล์ยังไงก็ได้
แต่อย่าให้มีลิ้งค์ซ้ำในไฟล์อื่นๆ

และเช่นเดิม ถ้าไฟล์เหล่านี้ใหญ่เกินไป ก็ compress
เปลี่ยนชื่อ นามสกุลของไฟล์ให้ตรงกับ sitemapindex ด้วย

*************************************************************************************************************

3. มีลืมอีกจนได้

ที่ไฟล์ robots.txt
เพิ่มข้อความไปอีก 1 บันทัด คือ

Sitemap: http://www.localhost.com/sitemap.xml


โดย sitemap.xml นั่นคือ sitemapindex นะครับ
การเพิ่มบันทัดนี้เข้าไป แม้จะไม่ใช่วิธีที่ถูกยึดถือว่า ใช่
แต่มันก็พอจะช่วยให้บาง search engine เข้าใจได้ว่า คุณมี sitemap และมันอยู่ตรงไหน

****************************************************************************************

หวังว่าจะมีประโยชน์นะครับ
« แก้ไขครั้งสุดท้าย: 11 ตุลาคม 2017, 13:53:23 โดย sputtaro » บันทึกการเข้า
Hotsocial
Newbie
*

พลังน้ำใจ: 0
ออฟไลน์ ออฟไลน์

กระทู้: 13



ดูรายละเอียด
« ตอบ #6 เมื่อ: 11 ตุลาคม 2017, 14:23:35 »

ขออนุญาต เพิ่มเติม กรรีที่ท่านต้องแบ่ง sitemap ออกเป็นหลายๆไฟล์นะครับ

1. เริ่มแรก ให้สร้างไฟล์ sitemap index ขึ้นมา
โดยมีโครงสร้างตามนี้

--------------------------------------------------------------------------
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 ">
  <sitemap>
    <loc>http://www.localhost.com/sitemap1.xml </loc>
    <lastmod>2017-08-10T06:20:11+00:00</lastmod>



  </sitemap>
  <sitemap>
    <loc>http://www.localhost.com/sitemap2.xml </loc>
    <lastmod>2017-04-10T06:30:11+00:00</lastmod>
   </sitemap>
  <sitemap>
    <loc>http://www.localhost.com/sitemap3.xml </loc>
    <lastmod>2017-04-10T06:40:11+00:00</lastmod>
  </sitemap>
  <sitemap>
    <loc>http://www.localhost.com/sitemap4.xml </loc>
    <lastmod>2017-07-04T06:50:11+00:00</lastmod>
  </sitemap>
    <sitemap>
    <loc>http://www.localhost.com/sitemap5.xml </loc>
    <lastmod>2017-08-10T06:50:11+00:00</lastmod>
  </sitemap>
</sitemapindex>

------------------------------------------------
ข้างบนนั้นคือ sitemapindex ซึ่งคุณสามารถใช้ submit ใน search engine tools ได้ทุกแห่ง เป็นไปตามมาตรฐานที่กำหนดไว้
โดยไม่จำเป็นต้อง submit ไฟล์ sitemap1.xml ไปจนถึง sitemap5.xml ก็ได้ (แต่ควรดูว่า ที่ webmaster tools ต่างๆ อ่านได้ครบทุกไฟล์ไหม
ถ้าไม่ครบ ก็ submit เพิ่ม เฉพาะไฟล์ที่ขาดไปก็ได้

ไฟล์ย่อย จะเพิ่มไปอีก กี่ร้อย กี่พันไฟล์ก็ได้ เช่น เพิ่มไปจนถึง sitemap1000.xml
จุดสำคัญคือ อย่าให้ใหญ่เกินไป จน search engine อ่านไม่หมด

ถ้าใหญ่เกิน 3000-4000 บันทัด ก็ compress ซะเท่านั้นเอง

*************************************************************************************************************

2. ในไฟล์ sitemap1.xml
ก็ทำตามโครงสร้างเดิมที่มีอยู่แล้ว

เวลาที่ generated ออกมา จะเรียงลำดับไฟล์ยังไงก็ได้
แต่อย่าให้มีลิ้งค์ซ้ำในไฟล์อื่นๆ

และเช่นเดิม ถ้าไฟล์เหล่านี้ใหญ่เกินไป ก็ compress
เปลี่ยนชื่อ นามสกุลของไฟล์ให้ตรงกับ sitemapindex ด้วย

*************************************************************************************************************

3. มีลืมอีกจนได้

ที่ไฟล์ robots.txt
เพิ่มข้อความไปอีก 1 บันทัด คือ

Sitemap: http://www.localhost.com/sitemap.xml


โดย sitemap.xml นั่นคือ sitemapindex นะครับ
การเพิ่มบันทัดนี้เข้าไป แม้จะไม่ใช่วิธีที่ถูกยึดถือว่า ใช่
แต่มันก็พอจะช่วยให้บาง search engine เข้าใจได้ว่า คุณมี sitemap และมันอยู่ตรงไหน

****************************************************************************************

หวังว่าจะมีประโยชน์นะครับ



เป็นประโยชน์อย่างมากเลยครับ ขอบคุณจริงๆ ครับผม
บันทึกการเข้า
rattanaporn
บุคคลทั่วไป
« ตอบ #7 เมื่อ: 11 ตุลาคม 2017, 18:03:28 »

ไม่ทราบค่ะ
บันทึกการเข้า
หน้า: [1]   ขึ้นบน
พิมพ์