sanook เอาบ้างไม่ยอมน้อยหน้า kapook

Kalopsky · 01 เมษายน 2008, 18:15:05

อ้างถึงจาก: gootum ใน 01 เมษายน 2008, 15:19:27
ก่อนจะโพสอะไรหาข้อมูลให้ดีๆก่อนนะครับ ข้อมูลมันเป็น 404 แต่ว่าทาง gg ยังเก็บไว้อยู่คงรออีกหลายเดือนกว่าจะเอาออก อันนี้สัญนิฐานง่ายๆ

สนุก เป็นเว็บค้นหาและดึงข้อมูลมากจาก google โดยใช้ผลการค้นหาทั่วโลก เสร็จแล้วข้อมูลที่ดึงมาได้นั้นมีทั้งเว้บเกรียนเว็บโป๊เว้บข้อมุลข่าวสารๆต่างๆซึ่ง mata data มันคละกันทาง google แยกไม่ออกหรอกครับว่าข้อมูลไหนแท้ไหนเท็จ

เสร็จแล้วทางสนุกไม่ได้ใส่ description ไว้ หรือตอนเก็บข้อมูลดันเก้บ description ของเว็บ xx ลงไปก็เป็นไปได้เช่นกัน ค่าที่ได้นั้นทาง google ดึงจากเว็บทั้งหมดมา เผอิญว่าดันไปดึงคำที่ไม่พึงประสงค์มาก็เท่านั้นเองก็เป้นไปได้อีกนั่นแหล่ะ ลองทำเว็บนึงขึ้นมาแล้วไม่ใส่ description แล้วลองหาข้อมูลมาใส่ที่หน้าเว้บ xxx ดูครับมันก็ดึงขึ้นมาเช่นกัน

ขออภัยด้วยครับ ไม่ได้มีเจตนาใดๆทั้งสิ้น เพียงแต่มีคนส่ง url มาให้ผมดูผมก็โพสตามปกติ

แต่มันเป็นอย่างนั้นผมก็เลยเอามาให้ดู ถ้าจะต้องหาข้อมูล ผมมือใหม่คงไม่เก่งขนาดนั้นครับ

ผมก็พึ่งรู้ว่าการใช้ฐานข้อมูลร่วมกัน search result มันเป็นอย่างนี้นี่เอง :

siamsix · 01 เมษายน 2008, 19:08:00

ผมเห็นด้วยกับคุณ gootum นะ

ผมลองโหลดหน้าก่อนที่มันจะ redirect เป็น 404 โดยใช้โปรแกรมช่วยโหลด แล้วเปิดด้วย text editor ดูแล้ว ก็ไม่เจอคำอย่างว่าสักคำนะ

gootum · 02 เมษายน 2008, 17:17:26

ตอบคุณก้ามปู

จากที่ผมดู เนื่องจากสนุกเป็นเว็บค้นหา ข้อมูลที่เห็นเกิดจากผลการค้นหาจากเว็บไซต์ทั่วโลก จึงไม่แปลกที่มีคำที่ไม่เหมาะสมโผล่ขึ้นมาเก็บเป็น title description และ keyword แต่มันเป็นการประมวลแบบ onpage factor ที่ไม่สามารถแก้ไขหรือบังครับได้เหมือน onpage factor ซึ่งคำที่เห็นนั้นมันเกิดจากคำที่อาจจะมีผลการค้นหาจาก user แล้วติด index มาวันนึงมันก็หายไปเนื่องจากหลายๆประการที่ไม่ทราบได้ครับ อันนี้จบเรื่องคำที่ไม่เหมาะสมติด index ของ google

ตอนที่กดลิ้งนั้นเข้าไปนี่ผมเห็นว่ามันขึ้นหน้าที่เป็นว่า นิราศภูเขาทอง มันจะขึ้นหน้าที่มี title เหมือนกับใน google ก่อนที่มันจะ redirect ไปที่หน้า 404
ตอบส่วนนี้นะครับ------ มันขึ้น title เพราะว่าโปรแกรมเค้าทำมาแบบนี้ครับคำไหนไม่มีมันก็ขึ้นคุณลองดูตัวอย่าง
http://webindex.sanook.com/search.php?stmp=684f3225a2bcb6b7c9f80589595b7a0f&qID=&wi=&hnl=&ob=s&asc=&q=gootum+%CB%C5%E8%CD%E2%A4%B5%C3%E6&it=d

มันขึ้นคำค้นหาเราครับ ผมไม่แน่ใจเหมือนกันว่ามันเก็บไปติด index ได้ไงแต่เดาๆดูถ้าจะเป้นการค้นหาตอนช่วงที่ robots มาเก้บข้อมูลมั้งครับ เลยทำให้เกิดแบบนี้ขึ้นมาได้(เดาเอาหน่ะ)

TU · 02 เมษายน 2008, 17:18:58

ขอบคุณทั่น Gootum ที่มาให้ความรู้ว่า แต่ทั่น Gootum ทั่นทำงานอยู่ใน sanook หรือทั่น

ก้ามปู · 02 เมษายน 2008, 17:28:29

อ้างถึงจาก: gootum ใน 02 เมษายน 2008, 17:17:26
ตอบคุณก้ามปู

จากที่ผมดู เนื่องจากสนุกเป็นเว็บค้นหา ข้อมูลที่เห็นเกิดจากผลการค้นหาจากเว็บไซต์ทั่วโลก จึงไม่แปลกที่มีคำที่ไม่เหมาะสมโผล่ขึ้นมาเก็บเป็น title description และ keyword แต่มันเป็นการประมวลแบบ onpage factor ที่ไม่สามารถแก้ไขหรือบังครับได้เหมือน onpage factor ซึ่งคำที่เห็นนั้นมันเกิดจากคำที่อาจจะมีผลการค้นหาจาก user แล้วติด index มาวันนึงมันก็หายไปเนื่องจากหลายๆประการที่ไม่ทราบได้ครับ อันนี้จบเรื่องคำที่ไม่เหมาะสมติด index ของ google

ตอนที่กดลิ้งนั้นเข้าไปนี่ผมเห็นว่ามันขึ้นหน้าที่เป็นว่า นิราศภูเขาทอง มันจะขึ้นหน้าที่มี title เหมือนกับใน google ก่อนที่มันจะ redirect ไปที่หน้า 404
ตอบส่วนนี้นะครับ------ มันขึ้น title เพราะว่าโปรแกรมเค้าทำมาแบบนี้ครับคำไหนไม่มีมันก็ขึ้นคุณลองดูตัวอย่าง
http://webindex.sanook.com/search.php?stmp=684f3225a2bcb6b7c9f80589595b7a0f&qID=&wi=&hnl=&ob=s&asc=&q=gootum+%CB%C5%E8%CD%E2%A4%B5%C3%E6&it=d

มันขึ้นคำค้นหาเราครับ ผมไม่แน่ใจเหมือนกันว่ามันเก็บไปติด index ได้ไงแต่เดาๆดูถ้าจะเป้นการค้นหาตอนช่วงที่ robots มาเก้บข้อมูลมั้งครับ เลยทำให้เกิดแบบนี้ขึ้นมาได้(เดาเอาหน่ะ)

ขอบคุณครับ ที่แท้ก็เหมือนเว็บปั่นนี่เอง

gootum · 02 เมษายน 2008, 17:29:59

อ้างถึงจาก: TU ใน 02 เมษายน 2008, 17:18:58
ขอบคุณทั่น Gootum ที่มาให้ความรู้ว่า แต่ทั่น Gootum ทั่นทำงานอยู่ใน sanook หรือทั่น

อยากทำเหมือนกันมารับไปทำหน่อยสิครับ ตอนนี้เข็นผักที่ตลาดไทอ่ะเหนื่อยจิงๆ

Dr.K · 02 เมษายน 2008, 19:42:08

อ้างถึงจาก: gootum ใน 02 เมษายน 2008, 17:17:26
ตอบคุณก้ามปู

จากที่ผมดู เนื่องจากสนุกเป็นเว็บค้นหา ข้อมูลที่เห็นเกิดจากผลการค้นหาจากเว็บไซต์ทั่วโลก จึงไม่แปลกที่มีคำที่ไม่เหมาะสมโผล่ขึ้นมาเก็บเป็น title description และ keyword แต่มันเป็นการประมวลแบบ onpage factor ที่ไม่สามารถแก้ไขหรือบังครับได้เหมือน onpage factor ซึ่งคำที่เห็นนั้นมันเกิดจากคำที่อาจจะมีผลการค้นหาจาก user แล้วติด index มาวันนึงมันก็หายไปเนื่องจากหลายๆประการที่ไม่ทราบได้ครับ อันนี้จบเรื่องคำที่ไม่เหมาะสมติด index ของ google

ตอนที่กดลิ้งนั้นเข้าไปนี่ผมเห็นว่ามันขึ้นหน้าที่เป็นว่า นิราศภูเขาทอง มันจะขึ้นหน้าที่มี title เหมือนกับใน google ก่อนที่มันจะ redirect ไปที่หน้า 404
ตอบส่วนนี้นะครับ------ มันขึ้น title เพราะว่าโปรแกรมเค้าทำมาแบบนี้ครับคำไหนไม่มีมันก็ขึ้นคุณลองดูตัวอย่าง
http://webindex.sanook.com/search.php?stmp=684f3225a2bcb6b7c9f80589595b7a0f&qID=&wi=&hnl=&ob=s&asc=&q=gootum+%CB%C5%E8%CD%E2%A4%B5%C3%E6&it=d

มันขึ้นคำค้นหาเราครับ ผมไม่แน่ใจเหมือนกันว่ามันเก็บไปติด index ได้ไงแต่เดาๆดูถ้าจะเป้นการค้นหาตอนช่วงที่ robots มาเก้บข้อมูลมั้งครับ เลยทำให้เกิดแบบนี้ขึ้นมาได้(เดาเอาหน่ะ)

ทำได้ไม่ยาก ไอแบบจะให้ค้นหาแล้วเก็บในดาต้าเบสน่ะ
ผมทำจนเบื่อเลย เพราะ80% ของคำที่เก็บได้คือเรื่องเซกซ์
กับคำที่ไม่มีความหมาย
ทำไปทำมา ก็คือให้ user ปั่นเว็บให้แหละครับ
ทางที่ดีคือไม่เก็บ query เข้า database เพราะถ้าเก็บเข้า google ก็ index ให้
แต่ถ้าจะเอาแบบดัก ก็อีกเรื่อง เก็บไปเยอะ ๆ tag ไปเยอะๆ
ดังนั้น ผมถือว่า case นี้ ใกล้เคียงกับ กป. และ ตูฮิด
ฟันธง ขยะอีกแล้วครับ

gootum · 02 เมษายน 2008, 23:15:58

ก่อนจะสรุปก่อนจะฟันธงอะไรหาข้อมูลมาให้ดีๆก่อนดีกว่ามั้งครับ ว่าเค้าเก็บข้อมูลผลค้นหาของ user รึเปล่า ผมว่าไม่น่าจะช่ายการเก็บข้อมูลของการค้นหาของ user หลอกครับ ถ้าอยากรู้ก็หามา 1 คำ แล้วลองค้นหาให้มันเก็บ cache google หากติดแล้วให้มันวิ่งไปที่หน้า 404 ให้ดูหน่อยครับ

ถ้ามีหลักฐาน 1 keyword ที่ได้ลองกันแล้วจะได้สรุปว่ามันเกิดจากอะไร ผมก็อยากรู้เหมือนกันที่พูดๆกันมานี้ครับ จะได้สรุปได้ว่ามันคืออะไรกันแน่

คำพูดทุกคนมีสิดแต่พูดแล้วต้องหาหลักฐานมาประกอบอะครับ ทุกคนจะได้กระจ่าง

ฉันไม่มีตัวตน · 02 เมษายน 2008, 23:24:02

งงวุ๊ย

satansatan · 02 เมษายน 2008, 23:30:02

งงตามอีกคน ตกลงมันเป็นไงแน่ หรือว่าแค่ เมษาหน้าโง่

Sylar · 02 เมษายน 2008, 23:48:51

มาโพสไว้หน่อยเฝื่อมันร้อน

Dr.K · 03 เมษายน 2008, 00:51:12

อ้างถึงจาก: gootum ใน 02 เมษายน 2008, 23:15:58
ก่อนจะสรุปก่อนจะฟันธงอะไรหาข้อมูลมาให้ดีๆก่อนดีกว่ามั้งครับ ว่าเค้าเก็บข้อมูลผลค้นหาของ user รึเปล่า ผมว่าไม่น่าจะช่ายการเก็บข้อมูลของการค้นหาของ user หลอกครับ ถ้าอยากรู้ก็หามา 1 คำ แล้วลองค้นหาให้มันเก็บ cache google หากติดแล้วให้มันวิ่งไปที่หน้า 404 ให้ดูหน่อยครับ

ถ้ามีหลักฐาน 1 keyword ที่ได้ลองกันแล้วจะได้สรุปว่ามันเกิดจากอะไร ผมก็อยากรู้เหมือนกันที่พูดๆกันมานี้ครับ จะได้สรุปได้ว่ามันคืออะไรกันแน่

คำพูดทุกคนมีสิดแต่พูดแล้วต้องหาหลักฐานมาประกอบอะครับ ทุกคนจะได้กระจ่าง

จริงๆไม่ใช่คนชอบแฉ
แต่เคยคุยกับหลายๆคนว่า ที่เว็บต่างๆมันทำมาเนี่ย
เราน่าจะลองมาหมดแล้วหละ

http://search.sanook.com ทำไมโดน de-index จาก google
ทังที่เขาเป็น partner กันนะ
ไปก่อนวันที่ 25 พย. ก่อนเว็บอื่นๆเสียอีก
และตอนนี้
webindex.sanook.com
ก็ตามมาแบบเดียวกัน
index 5 แสนกว่าหน้า
หน้าเว็บส่วนมาก ส่วนท้ายของ url ก็คือ rewrite เนียนๆ แบบเก็บจากคำค้น $q หาจากดาต้าเบสก่อน ถ้าไม่มีก็หน่วงเวลาส่งค่า $q ไปค้น GG ใช้ header redirect ธรรมดา ๆ
(บังเอิญ API ของเขาคงเป็น partner คือ unlimited)
ส่วน $q นี่ ก็แล้วแต่จะคิดว่ามันเก็บไปสร้างเป็นหน้าเว็บหรือเปล่า แต่ถ้าไม่เก็บแล้วมีกว่า 5 แสนหน้า index นี่ก็น่าคิด
ลองดูสิ ของ webindex
http://www.google.com/search?q=site:webindex.sanook.com&hl=en&rlz=1T4ADBS_enTH239TH242&start=300&sa=N
(เหมือนกำลังค้นคำในห้องสมุด )

แสดงว่า
1. ต้องมีการสร้างหน้าจาก $q ไม่งั้น gg และ yahoo จะเก็บไปได้ไงเป็นแสนๆหน้า
2. ต้องไปวางแขวนลิงค์ให้ robot มาเก็บ ซึ่งสถานที่ที่แขวนได้มีเยอะแยะ ที่สะดวกที่สุดคือ ระบบ tag ต่างๆไง ดูหน้าเว็บ กป. หรือส่วนท้ายๆของเว็บที่ กป.ทำให้ เช่น ปลาวาฬ ไทยคลีน ฯลฯ
3. จะตามร่องรอย ก็ต้องใช้ siteexplorer.search.yahoo.com แน่นอนกว่า

นี่ของ search (ที่โดน gg deindex ไปแล้ว)
http://siteexplorer.search.yahoo.com/advsearch?ei=UTF-8&p=http%3A%2F%2Fsearch.sanook.com&bwm=p&bwms=p&searchbwm=Explore+URL
ดูแพทเทอร์นนี่ เกิดจากคนค้นครับ มีคำพิมพ์ผิด พิมพ์ค้างไม่ครบ ไม่เปลี่ยนแป้น เก็บเป็นค่า q แล้ว เจนเป็นเว็บ ฯลฯ
เกือบเหมือนกับ webindex ข้างบน แต่ข้างบนดีกว่าตรงตัดคำมั่วๆออกไปดีกว่า และส่วนใหญ่คือคำที่มีใน index ของ s! เอง
(ก็แค่กำหนด condition ว่าไม่มีใน database ไม่ต้องเก็บคำนั้น เป็นการแก้ไขข้อผิดพลาดจากเว็บ search ที่โดนไปแล้ว)

ขนาดผม api limited ยังได้เดือนละหลายหมื่น q แต่ผม ดู analyse แล้วก็โยนทิ้ง ไม่เอามา generate เป็นหน้าค้นหา
ถ้าไม่มีระบบกรองคำ ก็ขยะครับ และก็โดนดีจาก gg ตามระเบียบ
(เท่าที่ถามมา มีคนโดนแบนด้วยกรณีนี้หลายคนอยู่ เนื่องจากเปิดช่องให้มีการค้นที่เก็บค่า q เอาไว้ เลยมีคนทำ tag เอาไปแขวนลิงค์จากเว็บลึกลับ ทำให้ ติด index บางคนมี เป็นล้านๆหน้า)
ถ้ามีระบบกรองได้ดี ก็จะดีครับตามสโลแกน "หาอะไรก็เจอ ของเขาไงครับ" ก็อนุโมทนา

ส่วนการเรียงลำดับตามที่บล๊อกแอนตี้ข้างต้นกล่าวหา อันนี้คงยาก เพราะการให้อันดับของ search engine ย่อมมี algo ที่ไม่เหมือนกัน จะไปห้ามไม่ให้SERPs เว็บเรื่อง sex มาติดกับเรื่องศาสนา หรือบรรพบุรุษก็ยากอยู่ แต่ผมดูจากพืนฐาน การให้คะแนนคงเน้นจาก keyword บน title และ บนหน้าเว็บ

ลองพิจารณาดูก็แล้วกัน จะได้ไม่ต้องมาเถียงกัน หลักฐานมันมีครับ อยู่ใน gg กับ y! น่ะแหละ

TU · 03 เมษายน 2008, 05:59:04

คุณหมอ Dochost ครับ ฝากพิจารณา อีกอันนึงครับ

guru.sanook.com อันนี้ เข้าข่ายด้วยป่าวครับ ถ้าไม่เข้า ผมจะทำมั่ง เห็นแล้วน่าสนมั๊กๆ ได้หน้าเว็บตั้ง 5 แสน หน้าแหนะ มันจะส่งผลกับ อันดับ และหน้าอื่นๆ เรารวมทั้ง traffic ด้วยป่าวครับ

แบบประมาณว่า long tail ( คำหางๆ )

ถ้า search คำ ประมาณ ว่า ไทยแท้ ของอวัยวะเพศ ตามด้วย คำแปล ละ อันดับต้นๆ เลย

แต่รอคุณหมอมาฟันธง เสียหน่อยดีกว่า ว่า คำหางๆ มัน เป็น อันดับต้นๆ จิงไหม และ ด้วยส่วนนี้ ทำให้ sanook ได้ traffic ( ส้มหล่น ) จาก google เหมือนเก็บเม็ดน้ำตาล คงได้เป็นกระบุงเช่นกัน บวก เข้ากับ webindex ( ก็อีก 5 แสนหน้า ) ละ จ๊าบๆๆ ผลการค้นหาถึงล่อไป 6 ล้าน แต่ก็เว็บใหญ่ คนเข้าเยอะ เป็นธรรมดา ทำอะไรคงเป็นเรื่องปกติ

ในด้าน seo ถ้าไม่นับรวม คำเทพ ที่สนุกได้จาก seo อีก มองๆ ดู คำรองๆ สุดยอดดีแท้ ปั่นเนียนๆ

คนทำ seo ของ สนุก idea กาฉูดจัง ( ผมเพิ่งมา getๆ จาก idea พี่หมอ เลื่อมใสๆ ที่ให้ความกระจ่าง ) อยากสมัครเป็นลูกสมุน

tinnoi · 03 เมษายน 2008, 09:26:54

สนุกนี่ทีมเขาน่าจะเยอะมากนะครับ content เว็บมีตั้งไม่รู้กี่หมวด กี่ section

อยากรู้จักเลยว่าเขามีพนักงานกี่คน

Dr.K · 03 เมษายน 2008, 09:45:21

อืม ไม่อยาก discuss อีกแล้วครับ
ไม่ฟันธง ให้ไปคิด
http://www.google.com/search?q=site:guru.sanook.com&hl=en&rlz=1T4ADBS_enTH239TH242&start=100&sa=N

สมัยเรียน เนื่องจากขลุกอยู่กับคณะวิศวะวิทยา
เลยโชกโชนมากกับพวกเหล่านี้
เลยแอบลักลอบเข้าใช้คอม อ.
ลักลอบ tab สายโทรของหอต่อ net
tab โทรทางไกลจากบึงสีถาน
แฮกเข้าศูนย์คอม
โทรทางไกลโดยใช้เหรียญเดียว
ฯลฯ

รู้ พิจารณา เรารู้ว่าทำได้ ทำแล้วไม่มีคนจับได้ แต่ทำแล้วดีหรือเปล่า :

ถ้าทำแล้วดี มีประโยชน์ ผมว่า ก็ไม่มีปัญหาอะไรครับ

zubzip · 03 เมษายน 2008, 12:08:39

งง จัง

Sylar · 03 เมษายน 2008, 14:08:10

เท่าที่รู้จักคนทำ seo ให้สนุก เขาไม่ได้เจตนาจะทำให้มันออกมาไม่ดี แต่บางทีมันอาจมีส่วนที่มันเกี่ยวข้องกับโปรแกรมเดิมอาจทำให้มันต้องแสดงผลออกมาอย่างนั้นเอง

gootum · 03 เมษายน 2008, 16:54:02

อ้างถึงจาก: dochost ใน 03 เมษายน 2008, 00:51:12
อ้างถึงจาก: gootum ใน 02 เมษายน 2008, 23:15:58
ก่อนจะสรุปก่อนจะฟันธงอะไรหาข้อมูลมาให้ดีๆก่อนดีกว่ามั้งครับ ว่าเค้าเก็บข้อมูลผลค้นหาของ user รึเปล่า ผมว่าไม่น่าจะช่ายการเก็บข้อมูลของการค้นหาของ user หลอกครับ ถ้าอยากรู้ก็หามา 1 คำ แล้วลองค้นหาให้มันเก็บ cache google หากติดแล้วให้มันวิ่งไปที่หน้า 404 ให้ดูหน่อยครับ

ถ้ามีหลักฐาน 1 keyword ที่ได้ลองกันแล้วจะได้สรุปว่ามันเกิดจากอะไร ผมก็อยากรู้เหมือนกันที่พูดๆกันมานี้ครับ จะได้สรุปได้ว่ามันคืออะไรกันแน่

คำพูดทุกคนมีสิดแต่พูดแล้วต้องหาหลักฐานมาประกอบอะครับ ทุกคนจะได้กระจ่าง
จริงๆไม่ใช่คนชอบแฉ
แต่เคยคุยกับหลายๆคนว่า ที่เว็บต่างๆมันทำมาเนี่ย
เราน่าจะลองมาหมดแล้วหละ

http://search.sanook.com ทำไมโดน de-index จาก google
ทังที่เขาเป็น partner กันนะ
ไปก่อนวันที่ 25 พย. ก่อนเว็บอื่นๆเสียอีก
และตอนนี้
webindex.sanook.com
ก็ตามมาแบบเดียวกัน
index 5 แสนกว่าหน้า
หน้าเว็บส่วนมาก ส่วนท้ายของ url ก็คือ rewrite เนียนๆ แบบเก็บจากคำค้น $q หาจากดาต้าเบสก่อน ถ้าไม่มีก็หน่วงเวลาส่งค่า $q ไปค้น GG ใช้ header redirect ธรรมดา ๆ
(บังเอิญ API ของเขาคงเป็น partner คือ unlimited)
ส่วน $q นี่ ก็แล้วแต่จะคิดว่ามันเก็บไปสร้างเป็นหน้าเว็บหรือเปล่า แต่ถ้าไม่เก็บแล้วมีกว่า 5 แสนหน้า index นี่ก็น่าคิด
ลองดูสิ ของ webindex
http://www.google.com/search?q=site:webindex.sanook.com&hl=en&rlz=1T4ADBS_enTH239TH242&start=300&sa=N
(เหมือนกำลังค้นคำในห้องสมุด )

แสดงว่า
1. ต้องมีการสร้างหน้าจาก $q ไม่งั้น gg และ yahoo จะเก็บไปได้ไงเป็นแสนๆหน้า
2. ต้องไปวางแขวนลิงค์ให้ robot มาเก็บ ซึ่งสถานที่ที่แขวนได้มีเยอะแยะ ที่สะดวกที่สุดคือ ระบบ tag ต่างๆไง ดูหน้าเว็บ กป. หรือส่วนท้ายๆของเว็บที่ กป.ทำให้ เช่น ปลาวาฬ ไทยคลีน ฯลฯ
3. จะตามร่องรอย ก็ต้องใช้ siteexplorer.search.yahoo.com แน่นอนกว่า

นี่ของ search (ที่โดน gg deindex ไปแล้ว)
http://siteexplorer.search.yahoo.com/advsearch?ei=UTF-8&p=http%3A%2F%2Fsearch.sanook.com&bwm=p&bwms=p&searchbwm=Explore+URL
ดูแพทเทอร์นนี่ เกิดจากคนค้นครับ มีคำพิมพ์ผิด พิมพ์ค้างไม่ครบ ไม่เปลี่ยนแป้น เก็บเป็นค่า q แล้ว เจนเป็นเว็บ ฯลฯ
เกือบเหมือนกับ webindex ข้างบน แต่ข้างบนดีกว่าตรงตัดคำมั่วๆออกไปดีกว่า และส่วนใหญ่คือคำที่มีใน index ของ s! เอง
(ก็แค่กำหนด condition ว่าไม่มีใน database ไม่ต้องเก็บคำนั้น เป็นการแก้ไขข้อผิดพลาดจากเว็บ search ที่โดนไปแล้ว)

ขนาดผม api limited ยังได้เดือนละหลายหมื่น q แต่ผม ดู analyse แล้วก็โยนทิ้ง ไม่เอามา generate เป็นหน้าค้นหา
ถ้าไม่มีระบบกรองคำ ก็ขยะครับ และก็โดนดีจาก gg ตามระเบียบ
(เท่าที่ถามมา มีคนโดนแบนด้วยกรณีนี้หลายคนอยู่ เนื่องจากเปิดช่องให้มีการค้นที่เก็บค่า q เอาไว้ เลยมีคนทำ tag เอาไปแขวนลิงค์จากเว็บลึกลับ ทำให้ ติด index บางคนมี เป็นล้านๆหน้า)
ถ้ามีระบบกรองได้ดี ก็จะดีครับตามสโลแกน "หาอะไรก็เจอ ของเขาไงครับ" ก็อนุโมทนา

ส่วนการเรียงลำดับตามที่บล๊อกแอนตี้ข้างต้นกล่าวหา อันนี้คงยาก เพราะการให้อันดับของ search engine ย่อมมี algo ที่ไม่เหมือนกัน จะไปห้ามไม่ให้SERPs เว็บเรื่อง sex มาติดกับเรื่องศาสนา หรือบรรพบุรุษก็ยากอยู่ แต่ผมดูจากพืนฐาน การให้คะแนนคงเน้นจาก keyword บน title และ บนหน้าเว็บ

ลองพิจารณาดูก็แล้วกัน จะได้ไม่ต้องมาเถียงกัน หลักฐานมันมีครับ อยู่ใน gg กับ y! น่ะแหละ

มั่วได้ใจมากน้าหมอ ไม่รู้จริงพูดไปเรื่อย ดูหัวข้อกระทู้หน่อยครับว่าเค้าพูดเรื่องอะไรกัน หลงทางเข้าป่าไป Search.sanook.com ได้ไงหว่า Search.sanook.com ก็ส่วน Search จะโดน de-index มันก็อีกเรื่องไม่ได้คุยกันเรื่องนั้นครับ

ประเด็นที่คุยกันคุยเรื่องค้นหา เย็ด คำแปล แล้วมีสนุกติดคำที่ไม่สุภาพ ผมก็เลยอยากรู้ว่ามันเกิดอะไรขึ้นด้วยการขอความรู้จากเพื่อนๆว่ามันเป็นเพราะอะไร แต่ยังไงหน้านั้นมันก็เป็น 404 ไปแล้วประเด็นเค้าก็ไม่มีเจตนาจะให้มันมี ไม่งั้นจะทำ 404 ทำไว้หาอะไรรึ

ส่วนอันนี้ผมว่าน้าหมอมั่วรึว่าคิดไปเองนะครับ
หน้าเว็บส่วนมาก ส่วนท้ายของ url ก็คือ rewrite เนียนๆ แบบเก็บจากคำค้น $q หาจากดาต้าเบสก่อน ถ้าไม่มีก็หน่วงเวลาส่งค่า $q ไปค้น GG ใช้ header redirect ธรรมดา ๆ
(บังเอิญ API ของเขาคงเป็น partner คือ unlimited)
ขอเดา 1 - api เป็น partner กันรู้หรือครับว่าได้ unlimited ผมว่าน่าจะได้ไม่กี่ % มั้งครับเท่าที่รู้มา แล้ว เก็บจากคำค้น $q หาจากดาต้าเบสก่อน ถ้าไม่มีก็หน่วงเวลาส่งค่า $q ไปค้น GG ใช้ header redirect ธรรมดา ๆ
อันนี้พูดเหมือนเขียนโปรแกรมเองเลยนะครับรึว่าน้าหมอทำแบบนี้..

ส่วน $q นี่ ก็แล้วแต่จะคิดว่ามันเก็บไปสร้างเป็นหน้าเว็บหรือเปล่า แต่ถ้าไม่เก็บแล้วมีกว่า 5 แสนหน้า index นี่ก็น่าคิด
ลองดูสิ ของ webindex
ขอเดา 2 - $q ทำไมเหรอครับ q มันเป็น parameter จะใช้อะไรก็ได้ไม่เห็นเกี่ยวเลย ก็ผมบอกแล้วไงถ้าคิดว่ามันสร้างหน้าใหม่ก็หามาสิครับ 1 keyword ไปค้นหาที่ webindex ให้มันเก็บ index แล้วมาโชว์ให้ผมดูหน่อย ผมลองแล้ว ไม่ใช่ว่าค้นหา 1 คำแล้วเอาไปสร้างหน้าเพิ่ม ก็บอกตั้งแต่แรกแล้วถ้าคิดว่าใช่ก็ไปลองค้นดู ส่วนที่มันเป็นข้อมูลเยอะนั้นไม่เห็นจะแปลกเลยเว้บอันดับ 1 เมืองไทยคนเข้าก็เยอะที่สุดแล้วทำไมจะมี index 5 แสนหน้าไม่ได้ รึว่าไม่จริงครับ (ค้นจน keyboard พังมันก็ไม่เก็บ index หรอกครับ)

แสดงว่า
1. ต้องมีการสร้างหน้าจาก $q ไม่งั้น gg และ yahoo จะเก็บไปได้ไงเป็นแสนๆหน้า
ขอเดา 3 - ก่อนหน้านี้สนุกเค้าทำอะไรรู้เหรอครับ โปรแกรมรึว่าการอัพเดดผมเห็นเค้ามีตลอดเวลามันจะเก็บเจอบ้างไม่เจอบ้าง 404 บ้างมันก็ไม่เห็นแปลก

3. จะตามร่องรอย ก็ต้องใช้ siteexplorer.search.yahoo.com แน่นอนกว่า
นี่ของ search (ที่โดน gg deindex ไปแล้ว)
http://siteexplorer.search.yahoo.com/advsearch?ei=UTF-8&p=http%3A%2F%2Fsearch.sanook.com&bwm=p&bwms=p&searchbwm=Explore+URL
ดูแพทเทอร์นนี่ เกิดจากคนค้นครับ มีคำพิมพ์ผิด พิมพ์ค้างไม่ครบ ไม่เปลี่ยนแป้น เก็บเป็นค่า q แล้ว เจนเป็นเว็บ ฯลฯ
ขอเดา 4 - ยิ่งผมอ่านก็ยิ่งงง น้าคงเข้าใจอะไรผิดๆหลายๆอย่าง รึคิดว่าคนอื่นจะทำเหมือนไทยเอล เหรอคับ หากคิดว่า เก็บเป็นค่า q แล้ว เจนเป็นเว็บ ก็ หา คำมาครับ จะได้สรุปได้ว่ามันเป็นแบบนั้นจริงๆ ผมจะได้ไม่เข้าใจผิดว่ามันไม่ใช่แบบที่ผมคิด เพราะว่านี่นั่งค้นหาคำว่า gootum หล่อ มา 1 อาทิตแล้วทำไมไม่เห็นเก็บไป index เลยอ่ะครับ ??

ผมสงสัยแค่นั้นแหล่ะครับ เพราะจากที่ผมได้ทดลองมันไม่จริงตรงก่ะน้าหมอ เลยต้องมาถามเพราะมันสงสัย แต่อย่าลืมนะครับหากคิดว่ามันเก็บ index ด้วยค่า q รึว่าสร้างหน้าใหม่ก็ลองหาหลักฐานมาให้ผมดูหน่อยครับ จะขอบคุณที่ทำให้ผมเข้าใจ

ด้วยจิตเคารพ
Gootum.com

StarDust · 03 เมษายน 2008, 17:49:42

อ้างถึงจาก: dochost ใน 03 เมษายน 2008, 09:45:21
อืม ไม่อยาก discuss อีกแล้วครับ
ไม่ฟันธง ให้ไปคิด
http://www.google.com/search?q=site:guru.sanook.com&hl=en&rlz=1T4ADBS_enTH239TH242&start=100&sa=N

สมัยเรียน เนื่องจากขลุกอยู่กับคณะวิศวะวิทยา
เลยโชกโชนมากกับพวกเหล่านี้
เลยแอบลักลอบเข้าใช้คอม อ.
ลักลอบ tab สายโทรของหอต่อ net
tab โทรทางไกลจากบึงสีถาน
แฮกเข้าศูนย์คอม
โทรทางไกลโดยใช้เหรียญเดียว
ฯลฯ

รู้ พิจารณา เรารู้ว่าทำได้ ทำแล้วไม่มีคนจับได้ แต่ทำแล้วดีหรือเปล่า :
ถ้าทำแล้วดี มีประโยชน์ ผมว่า ก็ไม่มีปัญหาอะไรครับ

แก้ไขคำผิด (เสียสถาบันหมด)

สมัยเรียน เนื่องจากขลุกอยู่กับคณะวิศวกรรมศาสตร์ (ไม่ใช่วิศวะวิทยา คณะนี้ไม่มีใน ม.ดินแดง)
เลยโชกโชนและเก่งกาจเรื่องคอมพิวเตอร์ (เรื่องพวกนี้ มันกำกวมไป คิคิ)
เลยแอบลักลอบใช้คอมพิวเตอร์เพื่อนบ่อย ๆ (ตอนคอมพิวเตอร์ตัวเองเสีย)
ลักลอบหนีออกจากหอ ไปเล่นเน็ต (ในหอไม่มีสายตรงให้ลักลอบ)
แอบโดดเรียนไปนั่งกินส้มตำแถวบึงสีฐาน (แถวนั้นโทรศัพท์เสียบ่อย tab ลำบากน่ะ)
นอนเฝ้าศูนย์คอมพิวเตอร์ จนเหมือนบ้านหลังที่สอง (ไม่ได้แฮก แต่หน้าด้านนอนในนั้นเลย)
โทรทางไกลโดยใช้เหรียญบาท
ฮ่าๆๆๆๆๆๆๆๆๆๆๆๆ

ฉันไม่มีตัวตน · 03 เมษายน 2008, 18:01:48

ต่อๆ ผมยังงงอยู่เลยคุยเรื่องไรกัน