Gemini 1.5 pro แซงหน้า ChatGPT-4o ?

Gemini 1.5 Pro ใหม่ได้รับการทดสอบใน Chatbot Arena เมื่อสัปดาห์ที่ผ่านมา โดยได้รับคะแนนโหวตจาก community กว่า 12,000 คะแนน เป็นครั้งแรกที่ Google Gemini ขึ้นเป็นอันดับ 1 โดยแซงหน้า GPT-4o/Claude-3.5 ด้วยคะแนนที่น่าประทับใจที่ 1,300 และยังขึ้นเป็นอันดับ 1 บน Vision Leaderboard ของเราอีกด้วย Gemini 1.5 Pro

Read More

OpenAI เผยงานวิจัยพัฒนา AI

ช่วยเพิ่มความชัดเจนของเอาต์พุตโมเดลภาษาโดยการฝึกโมเดลที่แข็งแกร่งเพื่อสร้างข้อความที่ง่ายสำหรับโมเดลที่ไม่แข็งแรงในการตรวจสอบ และง่ายกว่าสำหรับมนุษย์ในการประเมิน ความสามารถของโมเดลภาษาในการสร้างข้อความที่เข้าใจได้เป็นสิ่งสำคัญสำหรับผู้คน โดยเฉพาะอย่างยิ่งเมื่อต้องแก้ไขปัญหาที่ซับซ้อน เช่น ปัญหาทางคณิตศาสตร์ การเพิ่มประสิทธิภาพกระบวนการแก้ไขปัญหาเพื่อความถูกต้องสามารถทำให้วิธีแก้ไขปัญหาเข้าใจได้ยากขึ้น ซึ่งนำไปสู่ข้อผิดพลาด เพื่อปรับปรุงความชัดเจน โมเดลภาษาขั้นสูงควรได้รับการฝึกอบรมเพื่อสร้างข้อความที่โมเดลที่ไม่มีประสิทธิภาพสามารถตรวจสอบได้อย่างง่ายดาย สิ่งนี้สามารถทำได้ผ่านเกมผู้พิสูจน์ความจริง โดยที่ “ผู้พิสูจน์ความจริง” สร้างวิธีแก้ปัญหา และ “ผู้พิสูจน์ยืนยัน” จะตรวจสอบความถูกต้อง ความสมดุลนี้สามารถนำไปสู่แอปพลิเคชัน AI ที่มีประสิทธิภาพและเชื่อถือได้มากขึ้น การศึกษานี้มีจุดมุ่งหมายเพื่อปรับปรุงความชัดเจนของปัญหาคณิตศาสตร์ในโรงเรียนประถมโดยการปรับห่วงโซ่ความคิดให้สามารถตรวจสอบได้ด้วยแบบจำลองที่อ่อนแอกว่า ซึ่งได้รับแรงบันดาลใจจากเกม Prover-Verifier วิธีการนี้เพิ่มประสิทธิภาพได้ครึ่งหนึ่งในการปรับคำตอบให้ถูกต้อง ขณะที่ยังคงความแม่นยำของผู้ประเมินโดยมนุษย์ โมเดลภาษาขนาดใหญ่ (LLM) ถูกนำมาใช้มากขึ้นในแอปพลิเคชันที่ซับซ้อน ทำให้จำเป็นอย่างยิ่งที่จะต้องแน่ใจว่าผลลัพธ์ของโมเดลนั้นน่าเชื่อถือ วิธีการที่ต้องการเหตุผลที่ชัดเจนและสามารถตรวจสอบได้จะช่วยเพิ่มความไว้วางใจในแบบจำลองเหล่านี้ได้

Read More

GPT-4o mini

OpenAI ได้ประกาศเปิดตัว GPT-4o mini ซึ่งเป็นรุ่นขนาดเล็กที่คุ้มค่าที่สุด โดยมีจุดมุ่งหมายเพื่อให้ AI เข้าถึงได้และราคาไม่แพงมากขึ้น โมเดลนี้มีราคาอยู่ที่ 15 เซนต์ต่อล้านโทเค็นอินพุต และ 60 เซนต์ต่อล้านโทเค็นเอาท์พุต ทำให้มีราคาไม่แพงกว่ารุ่นก่อนๆ และถูกกว่า GPT-3.5 Turbo มากกว่า 60% GPT-4o mini รองรับข้อความและการมองเห็นใน API พร้อมรองรับอินพุตและเอาต์พุตข้อความ รูปภาพ วิดีโอ และเสียงในอนาคต เหนือกว่า GPT-3.5

Read More