OpenAI เปิดตัวการอัปเดตสำหรับการอนุมานแบบเรียลไทม์ในด้านเสียง ภาพ และข้อความ

ดูต้นฉบับ

Bitget2024/10/02 14:17

ตามรายงานของ Cointelegraph, OpenAI ได้ทำการอัปเดตโมเดลของตนสี่ครั้งในเดือนตุลาคมเพื่อช่วยให้โมเดล AI ของตนสามารถสนทนาได้ดีขึ้นและปรับปรุงการจดจำภาพ การอัปเดตหลักครั้งแรกคือ API แบบเรียลไทม์ที่ช่วยให้นักพัฒนาสามารถสร้างแอปพลิเคชันเสียงที่สร้างโดย AI โดยใช้คำสั่งเดียว ทำให้เกิดการสนทนาที่เป็นธรรมชาติเหมือนกับรูปแบบการพูดขั้นสูงของ ChatGPT ก่อนหน้านี้นักพัฒนาต้อง "รวม" โมเดลหลายตัวเข้าด้วยกันเพื่อสร้างประสบการณ์เหล่านี้ การป้อนข้อมูลเสียงมักจะต้องอัปโหลดและประมวลผลให้เสร็จสิ้นก่อนที่จะได้รับการตอบกลับ ซึ่งหมายความว่าแอปพลิเคชันแบบเรียลไทม์เช่นการสนทนาเสียงมีความหน่วงสูง ด้วยความสามารถในการสตรีมของ Realtime API นักพัฒนาสามารถสร้างการโต้ตอบที่เป็นธรรมชาติและทันทีได้เหมือนกับผู้ช่วยเสียง โดยทำงานบน GPT-4 ซึ่งจะเปิดตัวในเดือนพฤษภาคม 2024 API ช่วยให้สามารถอนุมานแบบเรียลไทม์ในด้านเสียง ภาพ และข้อความ การอัปเดตอื่น ๆ รวมถึงเครื่องมือปรับแต่งสำหรับนักพัฒนาที่ช่วยให้พวกเขาปรับปรุงการตอบสนองของ AI ที่สร้างจากข้อมูลภาพและข้อความ ตัวปรับแต่งตามภาพช่วยให้ AI เข้าใจภาพได้ดีขึ้น นำไปสู่การค้นหาภาพและการตรวจจับวัตถุที่ดีขึ้น กระบวนการนี้รวมถึงข้อเสนอแนะจากมนุษย์ที่ให้ตัวอย่างของการตอบสนองที่ดีและไม่ดีสำหรับการฝึกอบรม นอกเหนือจากการอัปเดตด้านเสียงและภาพแล้ว OpenAI ยังได้แนะนำ "การกลั่นโมเดล" และ "การแคชคำใบ้" ซึ่งช่วยให้โมเดลขนาดเล็กเรียนรู้จากโมเดลขนาดใหญ่และลดต้นทุนและเวลาการพัฒนาโดยการใช้ข้อความที่ประมวลผลแล้วซ้ำ OpenAI คาดว่ารายได้จะเพิ่มขึ้นเป็น 11.6 พันล้านดอลลาร์ในปีหน้า เพิ่มขึ้นจากที่คาดการณ์ไว้ 3.7 พันล้านดอลลาร์ในปี 2024 ตามรายงานของ Reuters

ข้อสงวนสิทธิ์: เนื้อหาทั้งหมดในบทความนี้เป็นเพียงความคิดเห็นของผู้เขียนเท่านั้น ไม่ได้มีส่วนเกี่ยวข้องกับแพลตฟอร์มแต่อย่างใด บทความนี้ไม่มีจุดประสงค์เพื่อใช้เป็นข้อมูลอ้างอิงประกอบการตัดสินใจลงทุน

PoolX: ล็อกเพื่อรับโทเค็นใหม่

APR สูงสุดถึง 12% เปิดตลอด ได้ Airdrop ตลอด

ล็อกเลย!