جوجل I/O ٢٠٢٦: جيميني ٣.٥ فلاش، جيميني أومني، وعصر الوكلاء الذاتي
فريق Gate of AI
خبير أنظمة الذكاء الاصطناعي
٢٠٢٦-٠٥-١٩
© بوابة الذكاء الاصطناعي
تعلن الكلمة الرئيسية لجوجل في I/O ٢٠٢٦ عن الانتقال الرسمي إلى عصر الوكلاء الذاتي، بقيادة الإطلاق الفوري لجيميني ٣.٥ فلاش والهندسة الثورية لجيميني أومني.
·
٢٠٢٦-٠٥-١٩
·
١٠ دقائق قراءة
النقاط الرئيسية
- تم إطلاق جيميني ٣.٥ فلاش فورًا كنموذج افتراضي جديد، متفوقًا على جيميني ٣.١ برو في البرمجة وسير العمل الذاتي.
- كشفت جوجل عن جيميني أومني فلاش، وهو نموذج “محاكاة العالم” الجديد القادر على إنتاج فيديو وصوت سينمائي عالي الدقة من أي مدخلات متعددة الوسائط.
- ظهر جيميني سبارك كوكيل ذاتي شخصي مستضاف على السحابة يعمل على مدار الساعة في الخلفية عبر إطار عمل جوجل أنتيجرافيتي.
- توسعت بنية جوجل التحتية مع وحدات معالجة التنسور من الجيل الثامن (TPU 8t و8i) مما يتيح تدريب النماذج الموزعة عالميًا عبر المواقع باستخدام JAX.
ما حدث
في مؤتمر المطورين السنوي I/O ٢٠٢٦، قدمت جوجل تحولًا كبيرًا في استراتيجيتها للذكاء الاصطناعي، منتقلة من المساعدين الحواريين التقليديين إلى وكلاء الذكاء الاصطناعي الذاتي طويل الأمد. أعلن الرئيس التنفيذي لجوجل وألفابت سوندار بيتشاي عن التوفر الفوري لجيميني ٣.٥ فلاش، معلنًا بداية الجيل التالي من عائلة النماذج الرئيسية لجوجل. تم تصميم النموذج من الألف إلى الياء للسرعة الفائقة، وتوليد الأكواد، والاستدلال المعقد، وقد أصبح رسميًا الطبقة الذكية الأساسية وراء تطبيق جيميني العالمي ووضع الذكاء الاصطناعي في البحث.
بالتزامن مع القفزة المعمارية ٣.٥، قدم الرئيس التنفيذي لجوجل ديب مايند ديميس هاسابيس جيميني أومني فلاش. يمثل هذا النظام المنتظر بشدة قفزة هيكلية إلى الأمام في نماذج العالم وتوليد الفيديو، متجاوزًا مجرد التنبؤ بالنص لمحاكاة الواقع. يتيح جيميني أومني التحرير الحواري الأصلي، مما يمكن المستخدمين من إعادة تشكيل الزوايا البصرية، والخلفيات، واتساق الشخصيات في ملفات الفيديو المعقدة من خلال أوامر صوتية بسيطة.
لتنسيق هذه القدرات في سير العمل اليومي، عرضت جوجل جيميني سبارك، وهو وكيل خلفي ذاتي مخصص يعمل على مدار الساعة. يعمل على الآلات الافتراضية عبر جوجل كلاود، يستفيد سبارك من إطار العمل أنتيجرافيتي ٢.٠ المطور حديثًا للتنقل بشكل مستقل عبر سير العمل عبر التطبيقات، والتعامل مع حجوزات المواعيد، وتنظيم دورات حياة المستندات، وتنسيق بيانات نظام التطبيقات الخارجية عبر دعم بروتوكول سياق النموذج (MCP).
الأرقام
لماذا يهم هذا الآن
يغير النشر الفوري لجيميني ٣.٥ فلاش اقتصاديات تشغيل الذكاء الاصطناعي على نطاق الإنتاج. تقليديًا، كان تنفيذ الحلقات الذاتية متعددة الخطوات يتطلب ميزانيات حسابية كبيرة وقدم تأخيرات زمنية شديدة. من خلال تحسين الهندسة ٣.٥ لمعالجة الرموز بسرعة أربع مرات أسرع من النماذج الرائدة السابقة، كسرت جوجل فعليًا عنق الزجاجة “السرعة مقابل القدرة” لخطوط الأنابيب البرمجية الذاتية والتنفيذ الذاتي للمهام.
علاوة على ذلك، يقدم عرض جيميني أومني منافسة هيكلية لمشهد الوسائط التوليدية. من خلال ربط التعددية الأصلية بالفيزياء الموحدة، والتاريخ، ومنطق العلوم، لم تعد جوجل تنتج إطارات معزولة فحسب، بل تبني محاكاة فيديو مدركة للسياق. دمج العلامة المائية الرقمية غير المرئية SynthID مباشرة في خط إنتاج أومني يعالج مخاوف الشفافية الضخمة، مما يضع جوجل كملاذ آمن على مستوى المؤسسات خلال توسع الوسائط التوليدية التنافسي للغاية.
التحليل الفني
يعتمد الاختراق المعماري لجوجل على تصميم مشترك شامل للأجهزة والبرمجيات. لأول مرة، قامت جوجل بدمج بنية معالجة ثنائية الشريحة مدعومة بوحدات معالجة التنسور من الجيل الثامن: TPU 8t (محسنة للتدريب المسبق على نطاق واسع) وTPU 8i (مصممة خصيصًا للاستدلال الفوري السريع). باستخدام JAX وPathways، قامت جوجل بفصل مجموعات التدريب عن حدود مراكز البيانات الفردية، موزعة سير العمل المعالجة بسلاسة عبر أكثر من مليون وحدة معالجة تنسور عالميًا.
على طبقة تنظيم البرمجيات، يحصل المطورون على وصول إلى Antigravity 2.0 وAntigravity CLI الجديد. يوفر هذا البيئة صندوق رمل طرفي عبر المنصات، وإخفاء تلقائي للاعتمادات، وسياسات تحقق Git محصنة. يتيح ذلك للمطورين استدعاء ميزة “الوكلاء المدارة” في Gemini API بأمان، مما يتيح إنشاء حاويات تشغيل معزولة قادرة على كتابة وتحليل وتحسين Kotlin أو سكريبتات الويب الحديثة بشكل ذاتي دون المخاطرة بالبنية التحتية للآلة الأساسية.
ما الذي سيأتي بعد ذلك
يضع التوفر الفوري لجيميني ٣.٥ فلاش الأساس لجدول تحديث سريع طوال صيف ٢٠٢٦. يمكن للمطورين توقع انتقال نشر المعاينة الداخلية لنموذج جيميني ٣.٥ برو القوي للغاية إلى الوصول العام الشهر المقبل، مما يجلب حدود استدلال أعلى إلى أنظمة الوكلاء الذاتي أنتيجرافيتي.
بالتزامن مع ذلك، ستسمح تجربة WebMCP الأصلية التجريبية التي تبدأ في كروم ١٤٩ قريبًا للوكلاء الخلفيين بالعمل مباشرة داخل حاويات المتصفح المحلية تحت سيطرة المستخدم الصريحة. يجب على المؤسسات الآن التركيز على تحويل خطوط الأنابيب الهندسية بعيدًا عن وظائف الإكمال التلقائي الأساسية نحو أطر تنسيق الوكلاء المتعددين لتجنب التفوق من قبل فرق التطوير الآلية.
رأينا
تظهر إعلانات جوجل في I/O ٢٠٢٦ مخططًا محسوبًا وعدوانيًا يستهدف عنق الزجاجة الأساسية للبنية التحتية للذكاء الاصطناعي الحديث. جيميني ٣.٥ فلاش ليس مجرد تكرار تدريجي؛ إنه تحقيق هيكلي بأن الوكلاء يحتاجون إلى كفاءة التكلفة وسرعات الرموز العالية ليكونوا ذوي فائدة عملية في بيئات الإنتاج. من خلال إعطاء الأولوية بشكل كبير لأمان الطرفية المحصنة عبر أنتيجرافيتي والفيزياء العالمية الأصلية عبر جيميني أومني، قامت جوجل ديب مايند ببناء خندق قوي حول الأتمتة المؤسسية المسؤولة والقابلة للتوسع.
سيعتمد المعيار الحقيقي للنجاح الآن على تنفيذ المجتمع. تشير الأدوات المقدمة على المسرح — مثل أدوات تطوير كروم للوكلاء ووحدات الترجمة المباشرة لـ Kotlin — إلى أن جوجل قد نجحت في بناء إطار عمل المطور اللازم لتحويل نظرية الوكلاء إلى سرعة تطبيق كاملة الفورية.