Alibab تطلق نموذج كوين الجديد لتعزيز أدوات تفريغ الكلام الذكية
أعلن فريق Qwen في Alibaba عن إطلاق طراز Qwen3-ASR-Flash الجديد، والذي يعتمد على الذكاء الصناعي Qwen3-Omni القوي، وتم تدريبه باستخدام مجموعة بيانات ضخمة تضم عشرات الملايين من ساعات بيانات الكلام. يتميز الطراز الجديد بالدقة العالية حتى في البيئات الصوتية الصعبة أو الأنماط اللغوية المعقدة.
النقاط الرئيسية:
– حقق الطراز نسبة خطأ قدرها 3.97% فقط في اختبار عام للغة الصينية القياسية، متفوقًا على منافسيه Gemini-2.5-Pro (8.98%) و GPT4o-Transcribe (15.72%).
– أظهر الطراز مهارة في التعامل مع اللهجات الصينية، حيث حقق نسبة خطأ قدرها 3.48%. في اللغة الإنجليزية، حقق نسبة خطأ قدرها 3.81%.
– تمكن الطراز من التعرف على كلمات الأغاني بنسبة خطأ قدرها 4.51% فقط، متفوقًا على منافسيه بشكل كبير.
– يوفر الطراز ميزات مبتكرة لأدوات التفريغ الصوتي للجيل القادم من الذكاء الصناعي، مثل التحيز السياقي المرن.
– يهدف Alibaba من خلال هذا الطراز إلى أن يصبح أداة عالمية للتفريغ الصوتي، حيث يوفر التفريغ الدقيق لـ11 لغة، بما في ذلك العديد من اللهجات والألسنة. وتشمل اللغات المدعومة الإنجليزية والفرنسية والألمانية والإسبانية والإيطالية والبرتغالية والروسية واليابانية والكورية والعربية.
التأثيرات المحتملة على الأعمال في المنطقة العربية: يمكن أن يكون لهذا الطراز تأثير كبير على الأعمال في المنطقة العربية، حيث يدعم اللغة العربية ويمكن أن يسهل الاتصال والتعاون بين الشركات المحلية والدولية. ومن الممكن أيضًا استخدامه في تطبيقات متعددة مثل خدمات العملاء والتسويق والأبحاث.