xAI تطلق أصواتًا مخصصة لاستنساخ الصوت الفوري في تحويل النص إلى

Cybersecurity Arab

يتم إنشاء الصوت المخصص في أقل من دقيقتين، ويشمل العملية مراحل التحقق والمعالجة وتسليم نموذج جاهز للاستخدام. بعد ذلك، يمكن استخدام هذه الأصوات في أي مكان تدعم فيه xAI الأصوات المدمجة.

xAI launches Custom Voices for instant voice cloning in TTS and agents

آلية التحقق الأمني

للتعامل مع مخاوف أمن الصوت، تعتمد xAI عملية تحقق من مرحلتين.首先، يقرأ المستخدم جملة مرور محددة، التي تُنسخ في الوقت الفعلي لتأكيد الموافقة والحضور. ثم يقارن النظام بيانات المتحدث من جملة المرور والتسجيل الكامل للتأكد من أن كليهما ينتمي إلى نفس الشخص، مما يمنع استنساخ الصوت من تسجيلات موجودة مسبقًا أو عينات غير مصرح بها.

مميزات الأصوات المخصصة

تدعم الأصوات المخصصة عدة ميزات، منها:

صورة توضيحية من المقال
صورة توضيحية من المقال
  • علامات الكلام (Speech Tags)
  • إخراج متعدد اللغات
  • وصول عبر REST API
  • تدفق عبر WebSocket

كما تشمل حالات استخدام متنوعة مثل سرد المحتوى للمبدعين، وروبوتات الصوت الخاصة بالعلامات التجارية، وسهولة الوصول، والألعاب، وإنتاج الكتب الصوتية.

مكتبة الأصوات (Voice Library)

أطلقت xAI أيضًا مكتبة الأصوات (Voice Library)، وهي قسم في وحدة التحكم لإدارة واستعراض الأصوات المدمجة والمخصصة. تحتوي المكتبة على أكثر من 80 صوتًا مدمجًا عبر 28 لغة، ولا تترتب أي تكلفة إضافية لاستخدام الأصوات المخصصة مع واجهاتها البرمجية.

نبذة عن غراك (Grok)

غراك هو مساعد ذكاء اصطناعي طورته xAI، مصمم لتقديم رؤى مفيدة وصادقة. يسمح للمستخدمين بطرح الأسئلة، وإنشاء صور، وتحليل الصور المرفوعة. يعمل غراك بدون إعلانات ولا يتطلب مهارات برمجية. على الرغم من ميزاته، حصل غراك على تقييم 2.4.

إرسال تعليق