ความจริงทำเลขเบี้ยวๆ ธรรมดาก็กันอยู่นี้นา
ถ้าท่านทำแบบว่า พื้นขาว อักษรดำ ไร้ลวดลาย

อันนั้นแกะได้มาหลายปีแล้วครับ (หัวใจคือลวดลายครับ)
และควรจะทำให้ฮีสโตแกรมของสีออกมาใกล้เคียงกัน ทุกสี บอทตอบไม่ได้แน่นอนครับ
ส่วนการทำ OCR มีโมดูลสำเร็จเรียบร้อย มีไปถึงภาษา C# คิดดูละกัน (ผมว่า C# เป็นภาษาระดับสูงๆ นะครับแล้วก็ยังใหม่สำหรับคนไทยด้วย)
ยังไงถ้าท่านทำแคปช่าแบบเดิมถึงเปลี่ยนภาษาไทยก็ช่วยซื้อเวลา ให้ได้ไม่นานหรอกครับ (ยกเว้นว่าเขาจะขี้เกียจเพราะว่ามีไม่กี่เว็บที่ทำแคปช่าไทย)
ประเทศเขาก็มี Google เหมือนกัน ถ้าเขาจะเอาจริงๆ เขาหาได้ครับ ลิสตัวอักษรไทย