วันนี้ผมจะมาสอนวิธีแก้ ทำไม import เว็บไม่เข้า
เว็บที่ว่านี่คือ blogger หรือ wordpress นะครับ หลายต่อหลายคนอาจจะมีการซื้อสคริปต์มาใช้
ผมก็คนนึงที่ซื้อมา แต่ปัญหาหนึ่งที่พบคือ import ออกมาเป็น file xml แล้วก็ import เข้าบ้างไม่เข้าบ้าง
บางที generate มา 300 บาทความ import เข้าไปแค่ 10 ผมก็งงว่าทำไม blogger มันไม่ตอบสนอง
บางทีก็ตอบบางทีก็ไม่ตอบ มันยังไงกันแน่
หลังจากการทดสอบหลายต่อหลายครั้ง พบว่า ใน file xml มันจะมี บทความอยู่หลายบทความ
blogger มันจะอ่านบทความแรกตามลำดับ ถ้าใช้งานได้มันจะนำเข้า แล้วก็อ่านบทความสองใน xml ถ้าได้ก็นำเข้า
อย่างนี้ไปเรื่อยๆ แต่ถ้าบังเอิญไปเจอบทความที่มี html เสียรูปแบบ เช่นมีเปิด <strong> blah blah blah ... แต่ลืมปิด </strong>
อย่างนี้ผมเรียกว่า html เสียรูปแบบ มันจะทำให้ import ไม่เข้า แล้วระบบของ blogger จะหยุดทำงาน
แล้วอะไรที่ทำให้เกิดปัญหาเช่นนี้เช่นสคริปต์ import blogger ที่ดึงสินค้าจาก amazon มา เป็นการดึงสินค้าโดยอัตโนมัติจากโปรแกรม อาจจะได้รับบทความที่มี
รูปแบบของ html ที่ไม่ถูกต้องเกิดขึ้นได้
ดังนั้นวิธีการแก้ไขคือใช้ html purify
ชื่อก็บอกแล้วว่าไว้ชำระล้าง html ให้สะอาด
ก่อนอื่นเข้าไปที่เว็บhttp://htmlpurifier.org 
ไปดาวน์โหลดสคริปต์มาก่อน
แล้วก็วิธีการใช้งานแบบนี้ครับ
ให้เอาสคริปต์ที่โหลดมาไปแตกไว้ใน root path ของสคริปต์ของเรา
เพิ่มโค้ดส่วนนี้ลงไปใน php สคริปต์ของเรา require_once '/path/to/HTMLPurifier.auto.php'; //ไปเปิดหาไฟล์ นี้นะครับว่ามันอยู่ตรงไหนแล้วกำหนด path ให้ถูกต้อง
$config = HTMLPurifier_Config::createDefault();
$purifier = new HTMLPurifier($config);
$clean_html = $purifier->purify($dirty_html); //ทีนี้เอาโค้ดที่สกปรกมาทำความสะอาดซะ ผ่านตัวแปร $dirty_html
แล้วเราจะได้โค้ดที่สะอาดสุดๆพร้อมใช้งานผ่านตัวแปร $clean_html
