ศึกษาเรื่อง web scraping นั่นแหละ
ถ้า php ต้องไปศึกษาพวก fsockopen หรือ curl แนะนำ curl นะ แต่ถ้าเอาไวจิงๆ fsock จะเร็วกว่า แต่ก็ยุ่งยากในการเขียนโค้ดมากกว่า
ต้องทำความเข้าใจกับ HTTP ให้มากๆ โดยเฉพาะ POST METHOD ต้องใช้เยอะ (เพราะต้องจำลองการซับมิทของ form) ต้องอ่าน HTTP REQUEST และ HTTP RESPONSE ออก
- เรื่อง COOKIE เพราะถ้าใช้ Cookie ไม่เป็นก็เข้า member area ไม่ได้
- เรื่อง useragent ก็ต้องหามาปลอมๆกันไปเพราะคงไม่มีใครอยากให้รู้วาาตั้งใจมา spam อย่าง curl ถ้าไม่กำหนด useragent ไปด้วยมันจะใส่ default ไปเป็นของ curl เองซึ่งถ้าผมตรวจขึ้นมาผมจะรู้ทันทีว่าโดนแระ
- regular expression อันนี้เลี่ยงไม่ได้ เกือบทุกเว็บเราต้องทำการหาข้อมูลบางอย่างเพื่อส่งไปพร้อมฟอร์ม ไม่งั้นซับมิทไม่ผ่าน
- เครื่องมือสำหรับเช็ค HTTP Header ใครไม่ใช้ถือว่ามือใหม่ เพาะเราต้องจำลองสถานะกาาณ์ให้ธรรมชาติที่สุด โปรแกรมฟรีๆที่เช็ค HTTP Header ได้ที่ผมใช้อยู่คือ HTTPFox เป็น addon ของ firefox นะ อีกโปรแกรมไม่ฟรีแต่สามารถดัก Header ของ process อื่นได้นอกเหนือจาก Firefox คือ HTTP Analyzer
โปรแกรมพวกนี้ยังมีประโยชฃน์ในการช่วย debug ajax response ด้วยนะ
- ส่วนเรื่อง captcha อันนี้เป็นเรื่องที่ผมยังมิอาจเอื้อม เพราะผมไม่ถนัดเรื่องรูปภาพ เพราะงั้นเว็บไหนมี captcha ผมบายก่อนเลย
อีกหนึ่งเรื่องที่ควรศึกษาคือหากเว็บไหนมี API เราควรใช้ API ของเค้า เพราะมันง่ายกว่าการมางมที่หน้าเว็บ
อ้อ โปรแกรมพวกนี้ไม่จำเป็นต้องใช้ Database ครับ
สคิรปท์ที่แนะนำให้ศึกษาคือ Auto Social Poster อันนี้จะชัดเจนที่สุด ส่วนพวก desktop application ผมไม่ทราบเหมือนกันเพราะหาโค้ดมาอ่านยาก ที่สำคัญคือผมไม่เป็นด้วยแหละ
ที่สำคัญทำแล้วอย่าเอามาแจก ถ้าอยากใช้ได้ไปนานๆ
ปล. ผมเริ่มหัดเขียน PHP เพราะอยากเขียนโปรแกรมพวกนี้แหละ พวกเว็บปั่นสมัยพระเจ้าเหาพวก rssgm yacg ผมแกะมาเกือบหมดแล้ว หรือแม้แต่เว็บปั่นสัญชาติไทย
เลยชอบมากพวกดูดๆด๊วบๆ แต่พักหลังมาไม่มีเน็ตดีดีใช้เลยทำงานยาก T T~
อ่านแล้ว อึ่งไปเลย คำศัพท์ ทางโปรแกรม ผมไม่รู้จักเลย ว่ารูปแบบมันเป็นอย่างไร
เดี่ยวลองหาดูว่า แปลว่าอะไร มือใหม่กิ๊ก
ขอบคุณครับ ได้ความรู้เพิ่มอีก