أوبن إيه آي تصدر تحديثات للاستدلال في الوقت الحقيقي عبر الصوت والرؤية والنص
وفقًا لـ Cointelegraph، قامت OpenAI بإجراء أربعة تحديثات على نماذجها في أكتوبر لمساعدة نماذج الذكاء الاصطناعي الخاصة بها على إجراء المحادثات بشكل أفضل وتحسين التعرف على الصور. التحديث الرئيسي الأول هو واجهة برمجة تطبيقات في الوقت الفعلي تتيح للمطورين إنشاء تطبيقات كلام مولدة بواسطة الذكاء الاصطناعي باستخدام موجه واحد، مما يمكن من إجراء محادثات طبيعية مشابهة لأنماط الكلام المتقدمة لـ ChatGPT. في السابق، كان على المطورين "تجميع" نماذج متعددة لإنشاء هذه التجارب. عادةً ما يحتاج إدخال الصوت إلى أن يتم تحميله ومعالجته بالكامل قبل تلقي استجابة، مما يعني أن التطبيقات في الوقت الفعلي مثل محادثات الصوت إلى الكلام تعاني من تأخير عالٍ. مع قدرات البث لواجهة برمجة التطبيقات في الوقت الفعلي، يمكن للمطورين الآن تحقيق تفاعلات فورية وطبيعية، تمامًا مثل مساعد الصوت. تعمل على GPT-4، الذي سيتم إصداره في مايو 2024، تتيح واجهة برمجة التطبيقات الاستدلال في الوقت الفعلي عبر الصوت والرؤية والنص. يتضمن تحديث آخر أدوات ضبط دقيقة للمطورين تمكنهم من تحسين استجابات الذكاء الاصطناعي المولدة من مدخلات الصور والنصوص. يمكن للضابط الدقيق القائم على الصور تمكين الذكاء الاصطناعي من فهم الصور بشكل أفضل، مما يؤدي إلى تحسين البحث البصري واكتشاف الأجسام. تتضمن العملية ملاحظات من البشر الذين يقدمون أمثلة على الاستجابات الجيدة والسيئة للتدريب. بالإضافة إلى تحديثات الكلام والرؤية، قدمت OpenAI "تقطير النموذج" و"تخزين المؤشرات"، مما يسمح للنماذج الأصغر بالتعلم من النماذج الأكبر وتقليل تكاليف ووقت التطوير عن طريق إعادة استخدام النص المعالج. تتوقع OpenAI أن ترتفع الإيرادات إلى 11.6 مليار دولار العام المقبل، ارتفاعًا من 3.7 مليار دولار متوقعة في 2024، وفقًا لرويترز.
إخلاء المسؤولية: يعكس محتوى هذه المقالة رأي المؤلف فقط ولا يمثل المنصة بأي صفة. لا يُقصد من هذه المقالة أن تكون بمثابة مرجع لاتخاذ قرارات الاستثمار.
You may also like
البيانات: SOL يتجاوز 220 دولارًا
انخفاض الذهب الفوري بنسبة 0.34% خلال اليوم
ماسك: معدل التضخم السلس لدوجكوين ليس خطأ