OpenAI เปิดตัวการอัปเดตสำหรับการอนุมานแบบเรียลไทม์ในด้านเสียง ภาพ และข้อความ
ตามรายงานของ Cointelegraph, OpenAI ได้ทำการอัปเดตโมเดลของตนสี่ครั้งในเดือนตุลาคมเพื่อช่วยให้โมเดล AI ของตนสามารถสนทนาได้ดีขึ้นและปรับปรุงการจดจำภาพ การอัปเดตหลักครั้งแรกคือ API แบบเรียลไทม์ที่ช่วยให้นักพัฒนาสามารถสร้างแอปพลิเคชันเสียงที่สร้างโดย AI โดยใช้คำสั่งเดียว ทำให้เกิดการสนทนาที่เป็นธรรมชาติเหมือนกับรูปแบบการพูดขั้นสูงของ ChatGPT ก่อนหน้านี้นักพัฒนาต้อง "รวม" โมเดลหลายตัวเข้าด้วยกันเพื่อสร้างประสบการณ์เหล่านี้ การป้อนข้อมูลเสียงมักจะต้องอัปโหลดและประมวลผลให้เสร็จสิ้นก่อนที่จะได้รับการตอบกลับ ซึ่งหมายความว่าแอปพลิเคชันแบบเรียลไทม์เช่นการสนทนาเสียงมีความหน่วงสูง ด้วยความสามารถในการสตรีมของ Realtime API นักพัฒนาสามารถสร้างการโต้ตอบที่เป็นธรรมชาติและทันทีได้เหมือนกับผู้ช่วยเสียง โดยทำงานบน GPT-4 ซึ่งจะเปิดตัวในเดือนพฤษภาคม 2024 API ช่วยให้สามารถอนุมานแบบเรียลไทม์ในด้านเสียง ภาพ และข้อความ การอัปเดตอื่น ๆ รวมถึงเครื่องมือปรับแต่งสำหรับนักพัฒนาที่ช่วยให้พวกเขาปรับปรุงการตอบสนองของ AI ที่สร้างจากข้อมูลภาพและข้อความ ตัวปรับแต่งตามภาพช่วยให้ AI เข้าใจภาพได้ดีขึ้น นำไปสู่การค้นหาภาพและการตรวจจับวัตถุที่ดีขึ้น กระบวนการนี้รวมถึงข้อเสนอแนะจากมนุษย์ที่ให้ตัวอย่างของการตอบสนองที่ดีและไม่ดีสำหรับการฝึกอบรม นอกเหนือจากการอัปเดตด้านเสียงและภาพแล้ว OpenAI ยังได้แนะนำ "การกลั่นโมเดล" และ "การแคชคำใบ้" ซึ่งช่วยให้โมเดลขนาดเล็กเรียนรู้จากโมเดลขนาดใหญ่และลดต้นทุนและเวลาการพัฒนาโดยการใช้ข้อความที่ประมวลผลแล้วซ้ำ OpenAI คาดว่ารายได้จะเพิ่มขึ้นเป็น 11.6 พันล้านดอลลาร์ในปีหน้า เพิ่มขึ้นจากที่คาดการณ์ไว้ 3.7 พันล้านดอลลาร์ในปี 2024 ตามรายงานของ Reuters
ข้อสงวนสิทธิ์: เนื้อหาทั้งหมดในบทความนี้เป็นเพียงความคิดเห็นของผู้เขียนเท่านั้น ไม่ได้มีส่วนเกี่ยวข้องกับแพลตฟอร์มแต่อย่างใด บทความนี้ไม่มีจุดประสงค์เพื่อใช้เป็นข้อมูลอ้างอิงประกอบการตัดสินใจลงทุน
เผื่อคุณอาจชื่นชอบ
Three Arrows Capital ต้องการเพิ่มจำนวนการเรียกร้องต่อ FTX เป็น 1.53 พันล้านดอลลาร์
มีการโอน 50 ล้าน DOGE จากกระเป๋าเงินที่ไม่รู้จักไปยัง CEX มูลค่า 19.71 ล้านดอลลาร์สหรัฐ