- يُطلق Gemini 3 واجهات توليدية ويُحسّن التفكير على مستوى الخبراء.
- تم تحسين تعدد الوسائط باستخدام 1 مليون رمز وتحسين نتائج الصور والفيديو.
- وكلاء أكثر كفاءة: مكافحة الجاذبية، وتكامل مساحة العمل، واستخدام الأدوات.
- نشر واسع النطاق وأمان معزز، مع إمكانية الوصول إلى التطبيق والبحث وAI Studio وVertex AI.
يأتي الجيل الجديد من الذكاء الاصطناعي من جوجل بطموح واضح: الانتقال من المحادثة إلى التنفيذ. مع جيميني 3، تُحرز الشركة قفزة نوعية في الاستدلال، والتعددية الوسائطية، والقدرة الفاعليةوهو يقدم أيضًا طريقة مختلفة للتفاعل: واجهات ينشئها النموذج نفسه أثناء التنقل لمساعدتك على تحقيق هدفك دون إضاعة الوقت في الخطوات الوسيطة.
كل هذا يأتي مع إعادة تصميم التطبيق والتحسينات في بحث Google ومساحة العمل وأدوات المطورينوتركيز قوي على الأمن. هناك تحسينات ملحوظة للجميع، لكن العديد من التغييرات ستكون أكثر وضوحًا في الاستخدامات المتقدمة: البرمجة، وتحليل البيانات، والعمل مع مقاطع الفيديو والصور، و الأتمتة مع الوكلاء التي تخطط وتتصرف بإشراف بشري.
ما هو الجوزاء 3 ولماذا يشكل نقطة تحول؟
في الممارسة العملية، يترجم هذا إلى استجابات أكثر مباشرة ومفيدة، وتقليل "الإطراء" النموذجي لبعض برامج الدردشة الآلية، و تفسير أفضل للسياقحتى عند العمل مع مدخلات طويلة أو غير متجانسة (نصوص وصور وفيديو وصوت ورموز).
بالإضافة إلى ذلك، قامت Google بنشر Gemini 3 عبر أسطح متعددة منذ اليوم الأول: تطبيق Gemini، ووضع AI لمحرك البحث، وAI Studio، وVertex AI، وCLI الخاص بالنموذج، ومنصة جديدة للوكلاء تسمى جوجل مضاد الجاذبيةتم تصميمه لتخطيط وتنفيذ مهام برمجية معقدة مع إمكانية الوصول إلى المحرر والمحطة والمتصفح.
ولتأكيد نطاق الإطلاق، تستذكر الشركة التأثير التراكمي لعصر جيميني: تجربة عرض مدعوم بالذكاء الاصطناعي يصل التطبيق إلى مليارات الأشخاص شهريًا، ويتجاوز عدد مستخدميه مئات الملايين من المستخدمين، ويستخدم معظم عملاء Google Cloud بالفعل قدرات الذكاء الاصطناعي، وقد بنى ملايين المطورين حلولاً باستخدام نماذجه التوليدية.
واجهات توليدية وتجربة مستخدم جديدة
يُطلق Gemini 3 تطبيقًا جديدًا بمظهر جمالي أكثر نظافة وحداثة، مما يجعل من السهل بدء المحادثات وتحديد موقع ما أنتجته في المجلد "أشيائي"التجديد ليس تجميليا: القفزة الكبيرة تكمن في واجهات توليدية، وهو نوع من الاستجابة حيث يقرر النموذج التنسيق الأمثل ويولد وجهات نظر بصرية ديناميكية بدلاً من كتلة من النص العادي.
ومن بين التجارب الأولى "التصميم المرئي" (أ عرض على غرار المجلة مع صور ووحدات تفاعلية) و"العرض الديناميكي" المصمم لاستكشاف النتائج وتخصيصها. إذا طلبت منه "التخطيط لرحلة لمدة ثلاثة أيام إلى روما في الصيف"، فستحصل على مسار مرئي قابلة للتنقل، مع أسئلة المتابعة والعناصر التفاعلية.
الفكرة مرتبطة بما يسمى ترميز الاهتزازتصف الهدف باللغة الطبيعية ويقوم النظام بإنشاء الواجهة أو الرمز المطلوب لتحقيق ذلك، إذا كان الرسم التخطيطي أو الرسوم المتحركة أو التطبيق المصغر التفاعلي أفضل من الفقرة، يقوم Gemini 3 بإنشائه داخل التجربة، دون إجبارك على تبديل الأدوات.
كما تتقدم تجربة التسوق خطوة للأمام: حيث يتم دمج القوائم وجداول المقارنة والأسعار مباشرةً من رسم بياني للتسوق من Google (مع عشرات المليارات من المراجع) للبناء أدلة تفاعلية دون مغادرة التدفق، على غرار صفحة التوصيات المتخصصة، ولكن يتم إنشاؤها أثناء التنقل بواسطة النموذج.
هناك تحسين عملي آخر وهو أنه في محرك البحث، يمكن لمجموعة محدودة من المشتركين اختيار البديل الجوزاء 3 برو موجه نحو التفكير للحصول على ملخصات أكثر اكتمالاً وإثباتًا، وليس فقط الاستجابة التركيبية للوضع الحالي.

وضع التفكير المتقدم والتفكير العميق
تسلط جوجل الضوء على تقدم كبير في الاختبارات عالية الصعوبة: فهي تتحدث عن التفكير على مستوى الدكتوراهبنتائج تنافسية للغاية في معايير مثل Humanity's Last Exam وGPQA Diamond. من حيث الأرقام، حقق Gemini 3 Pro درجات مثل 37,5% في HLE (بدون أدوات) و91,9% في GPQA Diamond، وأثبت أداءً متطورًا في الرياضيات مع 23,4% على MathArena Apex.
طريقة الجوزاء 3 التفكير العميق يتقدم خطوةً أخرى في التحديات المعقدة والجديدة بشكل خاص. في التقييمات الداخلية، يتفوق على Pro في عدة جوانب: 41,0% في اختبار Humanity's Last Exam (بدون أدوات)، و93,8% في GPQA Diamond، و45,1% في ARC-AGI عند السماح بتنفيذ التعليمات البرمجية - وهو مزيج من التفكير الرمزي واستخدام الأدوات والبرمجة مُصممة للمشاكل الصعبة.
في المجالات الوكيلة، يظهر النموذج شكلًا جيدًا في محطة العمل الطرفية 2.0 (54,2%)، والذي يقيس قدرتهم على تشغيل الكمبيوتر عبر المحطة الطرفية، ويحافظ على اتخاذ القرارات بشكل مستقر في بيئات طويلة الأمد مثل طاولة البيع 2حيث حقق عائدًا صافيًا يزيد عن خمسة آلاف دولار في محاكاة الأعمال خلال عام افتراضي.
وبعيدًا عن المقاييس، فإن ما يهم حقًا هو التغيير في الدور: من مساعد يستجيب الوكيل الذي يتصرفيخطط جيميني 3 المهام، ويُقسّمها إلى خطوات، ويطلب الموافقة عند الحاجة، وينفذها بإشراف بشري. يمكنه فرز رسائل البريد الوارد في Gmail، وتنظيم الجداول الزمنية من خلال مقارنة التوافر، أو إعداد... سير العمل مجمع يجمع بين التفكير، واستدعاء الأدوات، والتنقل.
لقد لاحظ مجتمع المطورين والأعمال بالفعل تحسينات ملموسة: فهم بصري أفضل، إنشاء أكواد أكثر موثوقية وتحسين الأداء في المهام طويلة الأمد. كل هذا يُترجم إلى وكلاء أكثر فعالية، قادرين على استدامة المشاريع باستمرار ودون انحراف عن الهدف بمرور الوقت.

التعددية الوسائطية والسياق واسع النطاق
يعزز جهاز Gemini 3 Pro من فهم متعدد الوسائط ويرفع هذا النظام معايير الصور والفيديو: فهو يتفوق في MMMU-Pro (81%) وVideo-MMMU (87,2%)، ويُظهر تقدمًا في دقة البيانات الفعلية مع SimpleQA Verified (72,1%). يكمن السر في قدرته على دمج النصوص والأكواد والصور والصوت ومقاطع الفيديو في السياق نفسه، وتفسيرها. العلاقات والفروق الدقيقة.
يعمل النموذج مع كميات كبيرة من المعلومات بفضل نافذة سياقية تحتوي على مليون رمز مميزهذا يكفي للمقالات المطولة، والصفوف الدراسية الكاملة، ومستودعات الأكواد، أو مستندات متعددة تعمل بالتوازي. يتيح استخدامات عملية للغاية: من توحيد وصفات العائلة المكتوبة بخط اليد (حتى بلغات متعددة) وتحويلها إلى كتاب طبخ، إلى تحويل المقالات العلمية ومقاطع الفيديو الطويلة إلى... البطاقات التفاعلية والتصورات.
بالنسبة للمبرمجين، تتحدث جوجل عن قفزة نوعية في تحليل الكود، والتفكير المجرد، والتنفيذ المتحكم. في سيناريوهات دعم التطوير مثل كود أسيست 3.0إنه يصف فهمًا للهندسة المعمارية الكاملة للمستودع ونافذة سياق موسعة لما يصل إلى 10 ملايين رمز، وهو أمر مفيد لاكتشاف التبعيات التي يمكن كسرها بواسطة تغيير محلي.
كما يعمل النموذج على تحسين التفكير المتوازي استخدام البيانات المرئية والنصية، وتحسين تفسير الجداول والرسوم البيانية والواجهات. يُعد هذا التطور بالغ الأهمية عندما لا يقتصر الأمر على مجرد "رؤية" الصورة، بل يشمل أيضًا ربطها بالنص والأرقام لاستخلاص النتائج واتخاذ الإجراءات اللازمة.
ونتيجة لذلك، فإن الإجابات ليست دائما حرفية: في بعض الأحيان تكون الاستجابة المثالية هي تطبيق ويب تفاعلي (آلة حاسبة أو جهاز محاكاة أو أداة في الوقت الفعلي) تسمح لك باستكشاف الحل بشكل أكثر حدسيًا داخل تدفق Gemini نفسه.
الوكلاء والتطوير ومنصة Google Antigravity
أصبح Gemini 3 متاحًا الآن للمطورين في استوديو جوجل للذكاء الاصطناعيVertex AI وCLI، والعرض الأول جوجل مضاد الجاذبيةإنها منصة تطوير تعتمد على الوكيل مع إمكانية الوصول المباشر إلى المحرر والطرفية والمتصفح. يمكن للنظام تخطيط وتنفيذ مهام البرامج الشاملة، التحقق من صحة الكود الخاص به والتنسيق مع الأسطح الأخرى في عائلة Gemini (مثل التحكم في الكمبيوتر وتحرير الصور).
يؤدي النموذج إلى اختبارات مثل ساحة تطوير الويب (1.487 ELO)، يحصل على 54,2% في Terminal-Bench 2.0 و76,2% في SWE-bench Verified، ويتفوق في توليد التعليمات البرمجية بدون أمثلة وفي إنشاء واجهات ويب غنية بناءً على تعليمات معقدة. بالنسبة للشركات، يُسرّع هذا تطوير حلول مُخصصة قائمة على الوكلاء.
تستفيد أمثلة واقعية من هذا بالفعل: فالشركات المتخصصة في العروض التقديمية الآلية تُغذي النموذج بوثائق فنية لإنتاج مواد كانت تستغرق ساعات طويلة من العمل على المحلل. مع جيميني 3، تم اختصار هذا العمل إلى... في غضون دقائق، بفضل التفكير المتعدد الوسائط والسياق الموسع.
التكامل مع Google Workspace ومحرك البحث
سيكون التأثير الأكثر وضوحًا على الفرق مساحة عمل Googleلم يعد جيميني مجرد شريط جانبي؛ بل أصبح الآن مُدمجًا كمحرك ضمن Gmail، ومستندات Google، وجداول بيانات Google، والتقويم، ويوتيوب، والخرائط. في Gmail، على سبيل المثال، لا يقتصر دوره على التلخيص فحسب: صياغة وتحديد الأولويات والإجابة عليها جدول الاجتماعات مع توفرك الفعلي؛ في جداول البيانات، يتصرف مثل محلل البيانات الذي ينشئ المخططات البيانية وجداول المحور من أسئلتك.
كما أنها تعمل على تعزيز كروم الجوزاءإنه قادر على إنشاء عروض فيديو كاملة من وثائق Drive، ويتم تعزيز التعاون باستخدام محتوى متعدد الوسائط: يفهم النموذج ويجمع النصوص والصور والمقاطع لإنتاج أصول مفيدة في وقت أقل.
En البحثبالإضافة إلى الملخصات المدعومة بالذكاء الاصطناعي، يمكن لبعض المشتركين الترقية إلى Gemini 3 Pro للحصول على إجابات أغنى بناءً على قدراتهم التحليلية. وللتسوق، يستخدم Gemini الرسم البياني للتسوق طريقة جوجل لإنشاء أدلة التوصية باستخدام الأسعار والتفاصيل تم التحديث دون إعادة توجيهك خارج التجربة.
من التحسينات الملحوظة الأخرى أن محرك البحث يمكنه تقسيم أسئلتك بشكل أفضل إلى استعلامات فرعية يبحث عنها نيابة عنك، مما يؤدي إلى فهم أكثر دقة نية وتجنب الإغفالات التي لم نلاحظها من قبل.
بشكل عام، هذا التكامل يعد بـ احتكاك أقلاطلب ما تحتاجه، وإذا كان ذلك مناسبًا، يقوم النموذج بإنشاء العرض أو الجدول أو التقويم أو التطبيق الصغير ضمن نفس التدفق، دون إجبارك على التنقل بين علامات التبويب.
التوفر والنشر والأمان
تدعي جوجل أن جيميني 3 هو النموذج الأكثر أمانًا حتى الآنبفضل مجموعة التقييمات الأكثر شمولاً التي طبقوها. من بين التحسينات: تقليل الإطراء، وزيادة المرونة الحقن الفوري وتحسين الدفاعات ضد سوء الاستخدام المتعلق بالهجمات الإلكترونية، مع التحقق من صحة هذه الدفاعات من قبل خبراء مستقلين وهيئات خارجية (مثل AISI في المملكة المتحدة) والشركات المتخصصة.
إن عملية الطرح هائلة: حيث يجدها المستخدمون النهائيون في تطبيق Gemini وفي وضع الذكاء الاصطناعي لمحرك البحث، والمطورون في Gemini API وAI Studio وAntigravity وCLIوالمنظمات من خلال Vertex AI وGemini Enterprise. تُعرض بعض الميزات المتقدمة، مثل Deep Think أو بعض قدرات الوكلاء، مبدئيًا لمشتركي جوجل AI Ultra وسوف يستمرون في التوسع.
ملاحظة عملية: الجوزاء 3 برو يُقدّم مجانًا منذ اليوم الأول على التطبيق والويب، وهو أمر غير مسبوق حتى الآن، مع أن ترقية البحث إلى الإصدار الاحترافي محجوزة حاليًا للخطط المدفوعة. علاوة على ذلك، يُمكن اختباره بالفعل من خلال Google AI Studio، وسيتم تفعيل طرحه العام في الأيام القادمة حسب المنطقة والمنتج.
وتدعم Google عملية الطرح ببيانات التبني: حيث تصل تجربة الذكاء الاصطناعي في البحث إلى مليارات المستخدمين شهريًا، ويتجاوز عدد مستخدمي التطبيق نصف مليار مستخدم، ويستخدم أكثر من 70% من عملاء Google Cloud قدرات الذكاء الاصطناعي. 13 مليون مطور لقد ابتكروا حلولاً بنماذجهم.
التطبيقات في الشركات وحالات الاستخدام
في البيئات المؤسسية، يسمح Gemini 3 بتصميم حلول مخصصة تتكامل الوكلاء والأتمتة والذكاء الاصطناعي المتعدد الوسائط في العمليات الرئيسية. من المساعدة في تطوير وتحسين قنوات البيانات، إلى ابتكار تجارب تفاعلية تتناول المستندات والصور ومقاطع الفيديو بموضوع مشترك.
تجمع العديد من الشركات هذه القدرات مع أفضل الممارسات الأمن السيبراني واختبار الاختراق لحماية النماذج والبيانات، يستخدمون بنى تحتية سحابية (AWS وAzure) تضمن قابلية التوسع والتوافر والامتثال. في مجال التحليلات، يدمجون لوحات المعلومات وخدمات ذكاء الأعمال (مثل Power BI) لتحويل البيانات إلى قرارات عملية، بالاعتماد على التفكير المنطقي وتوليد الرؤى. تصورات من جانب النموذج.
ويستفيد الجناح أيضًا من التأريض باستخدام بحث جوجليُرسّخ جيميني 3 الاستجابات بناءً على معلومات دقيقة حول الأحداث الجارية، مما يُقلّل من المعلومات المضللة. في البرمجة، يفهم جيميني 3 بنية المستودع، ويقترح التغييرات، ويُنبّه إلى التبعيات المُحتملة التعطل، مما يُوفّر وقت الفرق الفنية.
بالنظر إلى المستقبل، تتوقع جوجل التخصيص الجذري: نماذج تتكيف بشكل خاص وآمن مع أسلوب ونبرة ومعرفة مؤسستك دون الحاجة إلى عمليات الكون المثالى معقدة. وملاحظة: على الرغم من أن المستخدم العادي قد لا يلاحظ جميع التغييرات، إلا أن المجالات التقنية والبيانات تلاحظ تحسينات واضحة في الدقة والسرعة والقدرة.
يعمل Gemini 3 على إعادة تعريف كيفية عملنا مع الذكاء الاصطناعي من خلال الجمع بين التفكير المتقدم والوكلاء العمليين والواجهات التوليدية: احتكاك أقل وسياق أكبر وإمكانية استجابة في العالم الحقيقي. تجربة تفاعلية الذي يأخذك من الهدف إلى التنفيذ من خلال مجموعة من التعليمات المعطاة بشكل جيد.


