หลังจากที่ Google ประกาศเปิดตัว Gemini 2.0 ให้เข้าไปทดลองใช้ ผมก็ไม่รอช้ารีบเข้าไปทดลองใช้งานในเบื้องต้นมาในทันที
หลังจากที่ได้ลองใช้งานแล้ว ต้องบอกว่ามีจุดเด่นที่น่าสนใจหลายอย่างอยู่เหมือนกัน เลยอยากจะมารีวิวจุดที่น่าสนใจจากเจ้า Gemini 2.0 ให้เพื่อน ๆ ฟังกันครับ
1️⃣ ความเร็วในการใช้งาน
ไม่ว่าจะเป็นงานวิเคราะห์ข้อมูล การสร้างเนื้อหา หรือการตอบสนองต่อคำถามแบบเรียลไทม์ Gemini 2.0 ถือว่าโดดเด่นเรื่องความเร็วในการตอบคำถามมาก ๆ
แต่ถ้าให้พูดกันตามตรงบางคำตอบที่ได้ก็อาจจะยังไม่ตรงใจมากเท่าไหร่นักเหมือนกัน
2️⃣สร้างภาพคุณภาพสูงได้
Gemini 2.0 มี Imagen Image Generator ซึ่งสามารถสร้างภาพคุณภาพสูงได้ในไม่กี่วินาที จากที่ได้ลองใช้ ถือว่าทำออกมาได้ดีและค่อนข้างเร็วเลยนะ โดยผมได้ทดลองให้ Imagen Image Generator ทำงานเกี่ยวกับรูปภาพให้เล็ก ๆ น้อย ๆ คือ
- ลองให้ Imagen ออกแบบโลโก้ในสไตล์ Google สำหรับเว็บไซต์ส่วนตัวของผมเว็บไซต์หนึ่ง ผลลัพธ์ออกมาตรงกับที่ผมบรีฟไปเลย อันนี้ให้ผ่าน
- Imagen ทำในสิ่งที่ Image Generator อื่นยังทำได้ไม่ดีมากนัก อย่างการใส่ข้อความในภาพที่อ่านได้ชัดเจนและสวยงามได้ เหมาะสำหรับคนที่ต้องการออกแบบโฆษณา สื่อออนไลน์ หรือกราฟิกต่าง ๆ
3️⃣ การปรับแต่งหลายรอบ (Conversational Multi-turn Editing)
Imagen ยังมีฟีเจอร์ที่ช่วยให้คุณปรับแต่งภาพหรือข้อความในลักษณะ สนทนาแบบหลายรอบ เช่น เราสามารถสร้างภาพครั้งแรก แล้วปรับเปลี่ยนรายละเอียด เช่น สี ตัวอักษร หรือองค์ประกอบอื่น ๆ ได้เรื่อย ๆ จนกว่าจะพอใจ
4️⃣ การวิเคราะห์ภาพขั้นสูง
Gemini 2.0 ไม่ได้แค่สร้างภาพ แต่ยังสามารถ วิเคราะห์ภาพที่เราอัปโหลด ได้อย่างละเอียด เช่น การอ่านข้อความในภาพ หรือการสร้างเวอร์ชันใหม่ที่ดียิ่งขึ้น นี่ถือเป็นการเปิดมิติใหม่สำหรับงานกราฟิกและการออกแบบเลย
5️⃣ การใช้งานผ่าน API ที่เรียบง่าย
การเชื่อมต่อ Gemini 2.0 กับระบบต่าง ๆ ทำได้ง่ายมาก ด้วย Google API ที่ออกแบบมาให้ใช้งานได้สะดวกและรวดเร็ว
6️⃣ การเขียน Code น่าจะพัฒนาได้อีก
ในส่วนของ Code Generation เจ้า Gemini 2.0 แม้ว่าจะสามารถสร้างโค้ดได้ดีในระดับพื้นฐาน แต่เมื่อเปรียบเทียบกับ AI อื่น ๆ ผมยังคิดว่าน่าจะพัฒนาต่อได้ดีกว่านี้อีก
7️⃣ รองรับการป้อนข้อมูลเสียง
Gemini 2.0 ยังรองรับ การสั่งงานด้วยเสียง ผ่านไมโครโฟน แม้จะยังไม่มีอะไรโดดเด่นมาก แต่ก็เป็นฟีเจอร์ที่เสริมความครบเครื่องให้กับการใช้งานในรูปแบบ Multimodal
8️⃣ ข้อมูลที่อัปเดตได้ตลอดเวลา
ข้อนี้ชอบมาก เพราะเจ้า Gemini 2.0 สามารถเข้าถึงข้อมูลปัจจุบันจาก Google Search ได้ในทันที เพราะผมลองถามว่า "ข้อมูลล่าสุดของโมเดลคืออะไร" คำตอบคือ "I don't have a fixed knowledge cut-off date. I have access to up-to-date information: I can access and process information from the real world through Google Search." ซึ่งหมายความว่า เราสามารถใช้งาน Gemini 2.0 เพื่อรับข้อมูลล่าสุดแบบเรียลไทม์ได้เลยนั่นเองครับ
สรุปจุดเด่นที่ชอบ
- ความเร็ว
- การสร้างและปรับแต่งภาพระดับมืออาชีพ
- การเข้าถึงข้อมูลได้แบบเรียลไทม์
- รองรับการสั่งงานแบบ Multimodal
ถามว่า Gemini 2.0 เหมาะกับใคร?
Gemini 2.0 ออกแบบมาเพื่อตอบโจทย์ทั้ง นักพัฒนา ที่ต้องการ API สำหรับการพัฒนาแอปพลิเคชัน, นักออกแบบ ที่ต้องการสร้างภาพที่น่าทึ่ง และ นักการตลาด ที่ต้องการเนื้อหาแบบ Multimodal ที่ครบจบในตัวเดียวครับ
