بينما كانت الأسواق الأمريكية تركز على تأثير أدوات Anthropic و أدوات Altruist على البرمجيات والخدمات المالية، أصدرت عمالقة التكنولوجيا في الصين نماذج ذكاء اصطناعي هذا الأسبوع أظهرت تقدمًا في الروبوتات وتوليد الفيديو.
Alibaba ، ومنشئ TikTok ByteDance ومنصة الفيديو القصير Kuaishou ، جميعها أصدرت نماذج ذكاء اصطناعي جديدة تؤكد كيف أن الشركات الصينية تواكب تلك الموجودة في الولايات المتحدة.
يأتي ذلك بعد أن أخبر رئيس Google DeepMind ديميس حاسابيس CNBC أن نماذج الذكاء الاصطناعي الصينية متأخرة “بضعة أشهر” عن نظرائها الغربيين.
تتنافس هذه النماذج من الصين مباشرة مع نماذج توليد الفيديو مثل Sora من OpenAI، بالإضافة إلى نماذج الروبوتات من Nvidia و Google.
إليك ملخص عن النماذج.
RynnBrain من Alibaba
أكاديمية DAMO التابعة لـ Alibaba كشفت النقاب عن RynnBrain هذا الأسبوع، وهو نموذج ذكاء اصطناعي مصمم لمساعدة الروبوتات على فهم العالم الفيزيائي من حولها والتعرف على الأشياء.
في عرض فيديو، أظهرت Alibaba روبوتًا بذراعين على شكل ملقط يبدو قادراً على عد البرتقال، التقاطه ووضعه في سلة. كما تم عرضه وهو يأخذ الحليب من الثلاجة.
تتطلب النماذج تدريبًا مكثفًا لتمكينها من التعرف على الأشياء اليومية للتفاعل معها، مما يعني أن المهام البسيطة مثل التقاط الفواكه يمكن أن تكون تحديًا في مجال الروبوتات.
تضع RynnBrain الآن Alibaba في منافسة مع أمثال Nvidia و Google التي تطور نماذج ذكاء اصطناعي خاصة بها للروبوتات.
“واحدة من ابتكاراته الرئيسية هي الوعي الزمني والمكاني المدمج” قالت أدينا يكيفو، باحثة في Hugging Face، لـ CNBC.
“بدلاً من مجرد التفاعل مع المخرجات الفورية، يمكن للروبوت أن يتذكر متى وأين حدثت الأحداث، ويدرج تقدم المهام، ويواصل عبر خطوات متعددة. وهذا يجعله أكثر موثوقية وتماسكاً في البيئات المعقدة من العالم الحقيقي.”
وأضافت يكيفو أن “طموح Alibaba الأوسع” هو “إنشاء طبقة ذكاء أساسية لأنظمة التجسيد.”
Seedance 2.0 من ByteDance
Seedance 2.0 هو نموذج ذكاء اصطناعي لتوليد الفيديو قادر على إنشاء فيديو واقعي من مجرد موجه نصي من المستخدم. ولكن يمكن أن تحتوي الموجهات أيضًا على فيديوهات وصور أخرى.
يبدو أن الفيديوهات التي تم إنشاؤها باستخدام Seedance 2.0 والتي تمت مراجعتها من قبل CNBC تُظهر صورًا وفيديوهات واقعية تمامًا تم إنشاؤها بالكامل بواسطة الذكاء الاصطناعي.
بيلي بومان، الذي يقيم في ستوكهولم، السويد، ويعمل في وكالة إعلانات إبداعية تقوم بإنتاج محتوى مولد بواسطة الذكاء الاصطناعي، قد استخدم Seedance 2.0.
قال إن توليد الفيديو بواسطة الذكاء الاصطناعي حقق تقدمًا كبيرًا على مدى العامين الماضيين، مع تحسينات سريعة عبر الصناعة.
“في عام 2023 … كان من الصعب الحصول على شخص يجري أو يمشي. وكان أي نوع من الواقعية [مقتصرًا على] مقاطع قصيرة جدًا، كل شيء كان بطيئًا جدًا، وبتفاصيل رديئة، ولا توجد قTextures للجلد، تفتقر إلى التفاصيل. الآن تغيرت الأمور. الآن يمكنني فعل أي شيء. لقد كانت التقدمات التكنولوجية استثنائية” قال بومان لـ CNBC في مقابلة.
أضافت يكيفو من Hugging Face أن نموذج Seedance 2.0 أظهر تقدمًا من الأجيال السابقة في “التحكم، السرعة وكفاءة الإنتاج.”
“Seedance 2.0 هو واحد من أكثر نماذج توليد الفيديو شمولًا التي اختبرتها حتى الآن. لقد فاجأني حقًا بتقديم نتائج مرضية في التجربة الأولى، حتى مع موجه بسيط. ال visuais، والموسيقى، والتصوير السينمائي تتجمع بشكل يجعلها تبدو حسنة التصنيع بدلاً من التجريبية” قالت يكيفو.
ومع ذلك، بينما أشاد المستخدمون بالتكنولوجيا، واجهت Seedance بعض المشاكل. أفادت وسائل الإعلام المحلية الصينية بتعليق ميزة كانت تتيح للذكاء الاصطناعي توليد صوت شخص بناءً على صورة قام برفعها. جاء ذلك بعد أن أعرب مدون في الصين عن مخاوفه بشأن توليد الصوت الذي يحدث بدون موافقة.
لم يكن لدى ByteDance رد فوري عندما تم الاتصال بها من قبل CNBC.
Kuaishou’s Kling 3.0
تم إصدار Kling 3.0 من Kuaishou الأسبوع الماضي، وهو نموذج توليد فيديو آخر ينافس ByteDance.
Kling 3.0 “يتميز بترقيات كبيرة في الاتساق، والإنتاج الفوتوغرافي الواقعي، ومدة الفيديو الممتدة حتى 15 ثانية، وتوليد الصوت الأصلي عبر عدة لغات ولهجات ونبرات.
النموذج متاح فقط للمشتركين المدفوعين ولكنه سيكون متاحًا للجمهور قريبًا، حسب قول Kuaishou.
كان نجاح Kuaishou مع نماذج Kling هو العامل الأساسي وراء زيادة سعر سهمه بأكثر من 50% على مدى العام الماضي.
إطلاقات نماذج الذكاء الاصطناعي الأخرى الرئيسية
شهدت Zhipu AI – التي تُتداول كـ تقنية أطلس المعرفة في هونغ كونغ – ارتفاع أسهمها يوم الخميس بعد أن أصدرت GLM-5، نموذج لغة مفتوح المصدر مع قدرات ترميز محسنة ومهام وكيل طويلة المدى.
قالت الشركة إن النموذج يقترب من Claude Opus 4.5 الخاص بـ Anthropic في معايير الترميز بينما يتفوق على Google’s Gemini 3 Pro في بعض الاختبارات. لم تتمكن CNBC من التحقق من تلك الادعاءات.
ارتفعت أسهم MiniMax أيضًا يوم الخميس بعد أن أطلقت نموذج M2.5 المحسن الخاص بها مع أدوات وكيل ذكاء اصطناعي محسنة. تشير “الوكيلين” أو “الذكاء الاصطناعي الوكلي” إلى أدوات الذكاء الاصطناعي المصممة لأتمتة المهام.
— ساهمت آنك باو وديلان بتس من CNBC في هذا التقرير.
