كتبت/مريم مصطفى
أعلنت شركة “ميتا” اليوم عن إطلاق نموذجها الجديد للذكاء الاصطناعي مفتوح المصدر “Spirit LM”، والذي تم تصميمه خصيصًا لمعالجة التحديات المرتبطة بالنماذج متعددة الوسائط في الذكاء الاصطناعي،ويهدف هذا النموذج إلى تقديم تجربة صوتية أكثر طبيعية وواقعية، وهو ما يعتبر تقدمًا كبيرًا في تطوير الروبوتات الذكية القادرة على التواصل الصوتي بشكل معقد وشبيه بالبشر.
نموذج “Spirit LM” يعتمد على بنية لغوية مدرّبة مسبقًا تحتوي على 7 مليارات مُعلمة، ما يميزه عن النماذج التقليدية التي تعتمد على تقنيات التعرف التلقائي على الكلام (ASR)، ويعمل هذا النموذج باستخدام الفونيمات والنغمات ودرجات الصوت، مما يتيح إنتاج أصوات قريبة من التجربة البشرية، مع القدرة على تنفيذ مهام متعددة مثل تحويل النص إلى صوت، تصنيف الكلام، والتعرف عليه.
وأشارت ميتا إلى أن هذا التطوير يهدف إلى تحسين جودة التفاعلات الصوتية بين المستخدمين والذكاء الاصطناعي في تطبيقاتها مثل واتساب وإنستاجرام وفيسبوك، حيث سيتمكن المستخدمون من الاستفادة من تقنيات المحادثة الصوتية الطبيعية قريبًا.
نموذج “Spirit LM” متاح الآن للمطورين والباحثين على منصات مفتوحة المصدر، مما يفتح الباب لتطوير المزيد من التطبيقات المستقبلية التي تعتمد على الذكاء الاصطناعي في التواصل الصوتي.
من اخبار وفن ورياضة واقتصاد واحداث جارية ويهتم بالصحة والتعليم والتنمية المحلية
https://www.youtube.com/@esharekhabar