يفتح Google Gemini 2.0 ، أقوى طراز الذكاء الاصطناعي ، للجميع

جاك سيلفا | صور SOPA | lightrocket | غيتي الصور
جوجل في يوم الأربعاء ، أصدرت Gemini 2.0 – “جناحها” الأكثر قدرة على الذكاء الاصطناعي “بعد”.
في ديسمبر / كانون الأول ، منحت الشركة إمكانية الوصول إلى المطورين والمختبرين الموثوق بهم ، بالإضافة إلى لف بعض الميزات في منتجات Google ، ولكن هذا “إصدار عام” ، وفقًا لـ Google.
تتضمن مجموعة النماذج 2.0 فلاش ، والتي يتم وصفها بأنها “نموذج العمود الفقري ، الأمثل للمهام ذات الحجم العالي ، وعالي التردد على نطاق واسع” ؛ 2.0 Pro التجريبية ، والتي تركز إلى حد كبير على أداء الترميز ؛ و 2.0 Flash-Lite ، والتي تتصاعد Google بصفتها “النموذج الأكثر كفاءة من حيث التكلفة حتى الآن.”
يكلف Gemini Flash المطورين 10 سنتات لكل مليون رمز للمدخلات النصية والصور والفيديو ، على الرغم من أن فلاش-لايت ، نسخته أكثر فعالية من حيث التكلفة ، يتكلف 0.75 من المائة لنفسه.
تعد الإصدارات المستمرة جزءًا من استراتيجية أوسع لـ Google من الاستثمار بشكل كبير في “وكلاء الذكاء الاصطناعي” – حيث يرتفع سباق AI Arms بين عمالقة التكنولوجيا والشركات الناشئة على حد سواء.
ميتا، الأمازون ، Microsoftيتحرك Openai و Anthropic أيضًا نحو AICENT AI ، أو النماذج التي يمكنها إكمال المهام المتعددة الخطوات المعقدة نيابة عن المستخدم ، بدلاً من أن يضطر المستخدم إلى السير في كل خطوة فردية.
“على مدار العام الماضي ، كنا نستثمر في تطوير المزيد من النماذج الوكلاء ، مما يعني أنه يمكنهم فهم المزيد عن العالم من حولك ، والتفكير في خطوات متعددة إلى الأمام ، واتخاذ الإجراءات نيابة عنك ، مع إشرافك” ، كتبت Google في مدونة ديسمبر Post ، مضيفًا أن Gemini 2.0 له “تطورات جديدة في الوسائط المتعددة – مثل الصورة الأصلية والمخرجات الصوتية – واستخدام الأدوات الأصلية” ، وأن عائلة النماذج “ستمكننا من بناء وكلاء منظمة العفو الدولية الجديدة التي تقربنا أكثر من ذلك رؤيتنا لمساعد عالمي “.
تعد الأنثروبور ، بدء تشغيل AIM Amazon المدعوم من الذكاء الاصطناعي التي أسسها المديرون التنفيذيون للبحوث السابقين ، منافسًا رئيسيًا في السباق لتطوير وكلاء الذكاء الاصطناعي. في شهر أكتوبر ، قال ناشئة إن عملاء الذكاء الاصطناعي تمكنوا من استخدام أجهزة الكمبيوتر مثل البشر لإكمال المهام المعقدة. وقالت الشركة الناشئة إن إمكانية استخدام الكمبيوتر الخاصة بالجهاز ، تتيح قدرتها على تفسير ما هو موجود على شاشة الكمبيوتر ، واختيار الأزرار ، وإدخال النص ، والتنقل في مواقع الويب ، وتنفيذ المهام من خلال أي برنامج وتصفح الإنترنت في الوقت الفعلي.
وقال جاريد كابلان ، كبير مسؤولي العلوم في الإنسان ، لـ CNBC في مقابلة في ذلك الوقت ، يمكن أن “يمكن أن” استخدام أجهزة الكمبيوتر بنفس الطريقة التي نفعل بها “. وقال إنه يمكن أن يفعل المهام مع “عشرات أو حتى مئات الخطوات”.
أصدرت Openai أداة مماثلة مؤخرًا ، حيث قدمت ميزة تسمى المشغل والتي ستقوم بأتمتة المهام مثل التخطيط للإجازات ، وملء النماذج ، وإجراء حجوزات المطعم وترتيب البقالة. وصفت شركة Microsoft المدعومة من Microsoft المشغل بأنه “وكيل يمكنه الذهاب إلى الويب لأداء المهام لك.”
في وقت سابق من هذا الأسبوع ، أعلنت Openai عن أداة أخرى تسمى Deep Research تتيح لوكيل الذكاء الاصطناعى تجميع تقارير البحث المعقدة وتحليل الأسئلة ومواضيع اختيار المستخدم. أطلقت Google في ديسمبر أداة مماثلة تحمل نفس الاسم – “البحث العميق” – الذي يعمل كمساعد باحث ، واستكشاف موضوعات معقدة وتجميع التقارير نيابة عنك “.
ذكرت CNBC لأول مرة في ديسمبر أن Google ستقدم العديد من ميزات الذكاء الاصطناعي في أوائل عام 2025.
وقال الرئيس التنفيذي سوندار بيشاي في اجتماع إستراتيجي في ذلك الوقت “في التاريخ ، لا تحتاج دائمًا إلى أن تكون أولاً ولكن عليك أن تنفذ بشكل جيد وأن تكون الأفضل في الفصل كمنتج”. “أعتقد أن هذا ما يدور حوله 2025.”
اكتشاف المزيد من نهج
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.