علي بابا تطلق نموذجين جديدين من Qwen3 لتوليد واستنساخ الأصوات بالذكاء الاصطناعي

Mohamed Elsharef ديسمبر 24, 2025

0 4 دقيقة واحدة

كتبت بوسي عبدالقادر

أعلنت شركة علي بابا كلاود عن إطلاق نموذجين جديدين من سلسلة Qwen3 للذكاء الاصطناعي، مخصصين لتقنيات توليد الأصوات واستنساخها عبر الأوامر النصية، في خطوة تستهدف دعم تطبيقات الصوت الاحترافية وصناعة المحتوى الرقمية.

ويحمل النموذج الأول اسم Qwen3-TTS-VD-Flash، ويتيح للمستخدمين إنشاء أصوات اصطناعية اعتمادًا على أوصاف تفصيلية تشمل المشاعر، ونبرة الصوت، وسرعة الإلقاء، إلى جانب خصائص إضافية مثل العمر ونوع الصوت والأسلوب، ما يوفر درجة عالية من التحكم في المخرجات الصوتية.

وأكدت الشركة أن هذا النموذج يقدم أداءً متفوقًا مقارنةً بواجهة OpenAI الخاصة بنموذج GPT-4o mini-tts، وفقًا لتقرير نشره موقع SCMP واطلعت عليه العربية Business.

أما النموذج الثاني، Qwen3-TTS-VC-Flash، فيركز على استنساخ الأصوات، حيث يستطيع نسخ صوت شخص اعتمادًا على مقطع صوتي لا يتجاوز ثلاث ثوانٍ فقط، مع إعادة إنتاجه بما يصل إلى 10 لغات مختلفة. وتوضح علي بابا أن النموذج يحقق معدل أخطاء أقل مقارنةً بحلول منافسة بارزة مثل ElevenLabs وMiniMax.

وتتميز نماذج Qwen3 الجديدة بقدرتها على التعامل مع النصوص المعقدة، وتقليد أصوات الحيوانات، واستخراج الأصوات من التسجيلات، ما يوسع نطاق استخدامها في سيناريوهات متعددة.

وتتوفر هذه الأدوات عبر واجهة برمجة التطبيقات (API) الخاصة بـ علي بابا كلاود، مع إتاحة نسخ تجريبية على منصة Hugging Face للمطورين والباحثين.

ويأتي هذا الإطلاق في وقت تشهد فيه سوق تقنيات الصوت بالذكاء الاصطناعي منافسة متزايدة، مدفوعة بالطلب المتنامي من قطاعات مثل الإعلانات، والألعاب، وصناعة الفيديو، والتعليم الإلكتروني، وخدمات مراكز الاتصال. ومن المتوقع أن تسهم هذه النماذج في خفض التكاليف وتسريع الإنتاج مقارنة بالأساليب التقليدية، مع فتح آفاق جديدة للدبلجة متعددة اللغات وصناعة الشخصيات الصوتية الرقمية.

الوسوم