Gemini 3.1 Flash Live و Search Live: هكذا يصل البحث التفاعلي الجديد إلى إسبانيا

  • يوفر Gemini 3.1 Flash Live ميزة الصوت في الوقت الفعلي وزمن استجابة أقل لـ Search Live و Gemini Live.
  • تصل ميزة البحث الحواري الجديدة إلى إسبانيا وهي متاحة بالفعل في أكثر من 200 دولة مع دعم في العديد من اللغات الأوروبية.
  • يُحسّن هذا النموذج فهم النغمات، ويُصفّي الضوضاء، ويتبع التعليمات المعقدة للاستخدام من قِبل المستهلكين والشركات.
  • تستخدم جوجل تقنية SynthID لوضع علامات على الصوت المُنشأ بواسطة الذكاء الاصطناعي وتحسين إمكانية التتبع.

جيميني 3.1 فلاش لايف والبحث التفاعلي

وصول Gemini 3.1 Flash Live to Search Live and Gemini Live يمثل هذا خطوة جديدة لشركة جوجل في سباقها نحو واجهات الصوت الفورية. بدأت الشركة في طرح... تجربة البحث الحواري والذي يجمع بين الصوت والفيديو ومحرك بحث جوجل، والذي يتم تفعيله بالفعل في إسبانيا وجزء كبير من أوروبا.

وراء هذه الاستراتيجية يكمن نموذج صوتي من الجيل التالي, مصمم للاستجابة بسرعة تقارب سرعة المحادثة البشريةيُمكّن هذا النظام المستخدمين من فهم دلالات الكلام والتنقل في بيئاتهم اليومية بكفاءة أكبر، حتى مع وجود ضوضاء في الخلفية، ومقاطعات، وسلسلة من الأسئلة. تُقدّمه جوجل باعتباره نظامها الصوتي الأكثر تطورًا حتى الآن، وهو مُصمّم خصيصًا للمستخدمين العاديين والمطورين والشركات على حدٍ سواء.

ما هي خاصية البحث المباشر وكيف تعمل مع برنامج Gemini 3.1 Flash Live

خدمة البحث المباشر، والتي أصبحت تُعرف باللغة الإسبانية باسم البحث المباشرإنها ميزة تدمج بحث جوجل في "وضع الذكاء الاصطناعي" مع تجربة Gemini Live.عملياً، يتيح لك ذلك إجراء محادثة في الوقت الفعلي مع محرك البحث، باستخدام صوتك، وإذا رغبت في ذلك، كاميرا هاتفك المحمول لتوفير سياق مرئي.

في إسبانيا، يتم تفعيل هذه الميزة ضمن تطبيق Google لنظامي Android وiOSبفتح التطبيق والنقر على أيقونة "البث المباشر"، يستطيع المستخدم طرح سؤاله بالتحدث بصوت عالٍ. وفي حال تفعيل الكاميرا، يُمكن عرض أشياء أو أماكن أو مواقف محددة، على غرار عدسة جوجل، ولكن بتفاعل أكثر سلاسة وطبيعية.

يعتمد تنسيق البحث الجديد هذا بالكامل على Gemini 3.1 Flash Live، وهو نموذج من تقنية الصوت والصورة في الوقت الفعلي تعالج ما يحدث حول المستخدم وتستجيب بسرعة المحادثةالفكرة هي أن يكون التفاعل أشبه بالتحدث إلى شخص حقيقي بدلاً من ربط عمليات البحث النصية التقليدية معًا.

تُؤطّر جوجل هذه الخطوة ضمن تحوّلها نحو محرك بحث أكثر تفاعلية، حيث يُعد "وضع الذكاء الاصطناعي" في محرك البحث بمثابة بوابة للإجابات التي تولدها النماذج المتقدمةفي هذا السياق، تُعدّ خدمة Search Live طبقة إضافية تضيف الصوت والكاميرا والحوار المستمر فوق محرك البحث نفسه.

انتشار عالمي: أكثر من 200 دولة مع التركيز على أوروبا

بعد الإعلان الأولي في مؤتمر جوجل I/O العام الماضي ومرحلة اختبار أولية في مختبرات AI Mode، ظهرت خدمة Search Live لأول مرة في الولايات المتحدة في سبتمبرأكدت جوجل الآن أن هذه التجربة يتم طرحها في أكثر من 200 دولة ومنطقة حيث تم بالفعل تفعيل وضع الذكاء الاصطناعي في البحث.

يشمل هذا النشر إسبانيا والأسواق الأوروبية الأخرىأكدت الشركة دعمها للعديد من اللغات الشائعة الاستخدام في البلاد. فبالإضافة إلى الإسبانية، تم تأكيد التوافق مع الكاتالونية والجاليكية والباسكية، مما يتيح إمكانية التفاعل الصوتي الفوري بهذه اللغات ضمن تجربة البحث نفسها.

يعتمد التوسع الدولي على الشخصية Gemini 3.1 Flash Live متعدد اللغات بطبيعتهوفقًا لشركة جوجل، يدعم النموذج أكثر من 90 لغة لإجراء محادثات متعددة الوسائط في الوقت الفعلي، مما يسهل تقديم نفس تجربة الصوت والكاميرا في المناطق ذات التنوع اللغوي العالي دون الحاجة إلى تطوير نماذج منفصلة لكل لغة.

من منظور السوق، تُؤدي هذه الخطوة إلى تكثيف المنافسة للسيطرة على واجهات الذكاء الاصطناعي اليومية في أوروبا. فبدلاً من حصر التطورات في الدول الناطقة بالإنجليزية أو عدد قليل من الدول الأخرى، اختارت جوجل نشر هذه التقنية على نطاق واسع حيثما تتمتع بحصة سوقية قوية. أصبح وضع الذكاء الاصطناعي متاحًا الآن في Finderمع إيلاء اهتمام خاص لجودة التعرف والاستجابة في كل لغة.

بالنسبة للمستخدم الأوروبي العادي، يتمثل الفرق العملي في أن لم يعد البحث يقتصر على الكتابة في مربع نص وهي تتحول بشكل متزايد إلى محادثة يمكنك فيها التحدث وعرض الصور وتلقي ردود مولدة بواسطة الذكاء الاصطناعي في الوقت الفعلي.

Gemini 3.1 Flash Live: زمن استجابة أقل وصوت أكثر طبيعية

يكمن جوهر هذا التغيير من الناحية التقنية في Gemini 3.1 Flash Live، وهو نموذج الصوت والصوت الذي تصفه جوجل بأنه الأكثر تقدماً في كتالوجها للتفاعلات في الوقت الفعلي. هدفها هو تقليل زمن الاستجابة وجعل الردود تبدو أكثر طبيعية، مع إيقاع ونبرة أقرب إلى الكلام البشري.

في التفاعلات الآنية، كل جزء من الثانية مهم. وتجادل جوجل بأن هذا النموذج يعني قفزة نوعية في سرعة وموثوقية وجودة الحواربالمقارنة مع الإصدارات السابقة مثل 2.5 Flash Native Audio، فإن Gemini 3.1 Flash Live يقلل من التأخير الملحوظ بين سؤال المستخدم واستجابة النظام، مما يقلل من فترات التوقف المحرجة التي تقطع تدفق المحادثة.

بالإضافة إلى سرعة الاستجابة، فإن النموذج أكثر دقة في التعرف على الفروق الصوتية الدقيقة مثل نبرة الصوت، والتشديد، وإيقاع الصوتوهذا يسمح له بالتمييز بشكل أفضل بين أجزاء الصوت ذات الصلة (تعليمات المستخدم) وتلك التي تنتمي إلى ضوضاء الخلفية (حركة المرور، التلفزيون، المحادثات القريبة)، وتصفية الأخيرة للحفاظ على تماسك التفاعل.

وفقًا للبيانات التي شاركتها الشركة، يتصدر برنامج Gemini 3.1 Flash Live نتائج الاختبارات مثل ComplexFuncBench Audio، حيث يتم تقييمه. استدعاءات الدوال متعددة الخطوات ذات القيود المختلفةيحقق نتائج تقارب 90% في سيناريوهات الصوت المعقدة. كما يتفوق على معايير الأداء مثل تحدي الصوت المتعدد من Scale AI عند تفعيل وظيفة "التفكير"، مما يشير إلى تحسن في اتباع التعليمات الطويلة والاستدلال في المحادثات التي تشهد مقاطعات وترددات.

باختصار من الناحية الفنية، هو نموذج مصمم لدعم محادثات أطول وأكثر سلاسة وأكثر قوةحتى عندما يغير الشخص الموضوع، أو يتردد، أو يعيد صياغة السؤال، أو يقدم طلبات متسلسلة تتطلب عدة خطوات لإكمالها.

وكلاء صوتيون أكثر كفاءة للشركات والمطورين

بالإضافة إلى بُعدها الاستهلاكي، تُقدم Gemini 3.1 Flash Live كـ عنصر أساسي للشركات والمطورين لبناء وكلاء صوتيين معقدينالنموذج متاح للمعاينة عبر واجهة برمجة تطبيقات Gemini Live داخل Google AI Studio، مما يسمح لك بالبدء في تجربة تطبيقات الصوت والرؤية في الوقت الفعلي.

بالنسبة لبيئة الشركات، تدمج جوجل هذا النموذج في جيميني إنتربرايز لتجربة العملاءيقترحون حلاً لخدمة العملاء وأتمتة التفاعلات واسعة النطاق. وتتلخص الفكرة في أن الشركات تستطيع تصميم مساعدين قادرين على إنجاز مهام كاملة - وليس مجرد الإجابة على أسئلة بسيطة - مع الحفاظ على سياق المحادثة بأكملها.

ومن بين التحسينات التي تسلط الشركة الضوء عليها لهؤلاء الوكلاء ما يلي: ارتفاع معدلات إنجاز المهام في البيئات الصاخبةيعود الفضل في ذلك إلى تحسين القدرة على تفعيل الأدوات الخارجية وتوفير المعلومات مع الحفاظ على استمرارية المحادثة مع المستخدم. عمليًا، يعني هذا وجود مساعدين قادرين على الاستعلام عن قواعد البيانات، وتنفيذ الإجراءات، أو دمج خدمات أخرى دون مقاطعة المحادثة.

نقطة رئيسية أخرى هي "اتباع التعليمات بشكل أفضل" أو تحسين تتبع التعليمات المعقدةلقد عزز النموذج قدرته على احترام القواعد والحدود الموضوعة له، بحيث يبقى الوكيل ضمن "ضوابطه" حتى عندما تأخذ المحادثة منعطفات غير متوقعة أو يحاول المستخدم إخراجها من سياقها.

أشارت جوجل أيضاً إلى أمثلة على الاستخدام الموجه نحو البرمجة الصوتية، والدعم الفني التفاعلي، أو المساعدين الداخليين للموظفين، بهدف أن يصبح الصوت واجهة فعالة للمهام التي يتم إنجازها حاليًا عن طريق النصوص أو اللوحات التقليديةعلى الرغم من أن الشركة تستشهد بآراء إيجابية من شركاء الأعمال الذين قاموا بالفعل باختبار النموذج، إلا أنها لم تنشر مقاييس مستقلة حول التأثير الاقتصادي أو خفض التكاليف.

تجربة استخدام Gemini Live: استجابات أسرع وسياق أوسع

من وجهة نظر المستخدم النهائي، يتكامل برنامج Gemini 3.1 Flash Live مباشرةً مع جيميني لايف، تجربة المحادثة من جوجل المتوفرة على الأجهزة المحمولةوتزعم الشركة أن النموذج الجديد يوفر استجابات أسرع وبفترات توقف أقل إحراجاً تعيق سير العمل.

ومن التغييرات المهمة الأخرى القدرة على تابع مسار المحادثة لمدة ضعف المدة بالمقارنة مع النموذج السابق. وهذا مفيد بشكل خاص في جلسات العصف الذهني، وشرح المفاهيم المعقدة، أو تخطيط المهام، حيث تميل الاستفسارات إلى أن تصبح متسلسلة، وفقدان السياق يقلل بشكل كبير من فائدة المساعد.

يمكن لـ Gemini Live، المدعوم بتقنية Flash Live 3.1، أن يقوم أيضاً اضبط طول ودرجة صوت استجاباتك بشكل ديناميكي بحسب الموقف: إجابات أقصر للأسئلة السريعة، وشروحات أكثر تفصيلاً عندما يتعمق المستخدم أكثر أو يحتاج إلى دليل خطوة بخطوة.

يتم تسهيل هذا التكيف مع النغمة من خلال فهم النموذج الأكبر للنغمات، والذي أصبح الآن يتعرف عليه بدقة أكبر. المشاعر والفروق الدقيقة مثل الإحباط أو الشك أو الارتباكفي سياقات خدمة العملاء، يمكن أن تترجم هذه الحساسية إلى استجابات أكثر تعاطفاً أو توضيحات إضافية دون أن يضطر المستخدم إلى تحديد أنه لم يفهم شيئاً بشكل صريح.

بشكل عام، تشير التجربة إلى أن إن التحدث إلى النظام لا يتعلق بإملاء الأوامر بقدر ما يتعلق بالدردشة مع محاور يفهم السياق ويتكيف مع الموقف.، على الرغم من أنها دائماً ضمن حدود وقدرات نموذج الذكاء الاصطناعي التفاعلي.

التعدد اللغوي وأهميته بالنسبة لإسبانيا وأوروبا

إحدى ركائز برنامج Gemini 3.1 Flash Live هي شخصيته يدعم البرنامج لغات متعددة بشكل افتراضي، مع دعم لأكثر من 90 لغة في المحادثات الصوتية والمرئية. وهذا لا يسمح لشركة جوجل فقط بتوفير خدمة البحث المباشر وخدمة جيميني المباشر في المزيد من البلدان، بل يسمح أيضاً بتقديم تجربة أكثر اتساقاً في المناطق التي تضم لغات رسمية متعددة.

وفي حالة إسبانيا، أكدت الشركة دعمها لـ الإسبانية والكتالونية والجاليكية والباسكية ضمن إطلاق خدمة البحث المباشر. بالنسبة للمستخدم، هذا يعني القدرة على التفاعل مع محرك البحث باستخدام لغته اليومية، دون الحاجة إلى التبديل إلى الإنجليزية أو الإسبانية إذا كان يفضل خيارًا آخر.

في أوروبا، يمكن أن تصبح هذه القدرة على تعدد اللغات عامل تمييز مقارنة بحلول الذكاء الاصطناعي الصوتي الأخرى التي تعطي الأولوية لعدد قليل من اللغات. إن القدرة على إجراء محادثات طويلة وسياقية بلغات مختلفة تسهل اعتمادها من قبل كل من المستهلكين والشركات العاملة في أسواق متعددة.

علاوة على ذلك، وبما أنه نموذج يجمع بين الصوت والصورة، فإن التجربة لا تقتصر على فهم ما يقوله المستخدم فحسب، بل تشمل أيضاً ما تُظهره الكاميراوهذا يفتح المجال أمام سيناريوهات مثل الدعم الفني عبر الفيديو، والاستفسارات حول المنتجات المادية، والمساعدة في الوقت الفعلي أثناء الرحلة، أو شرح المستندات المطبوعة الموضوعة أمام الهاتف المحمول.

يكمن المفتاح في كيفية تكيف النظام مع خصائص كل لغة ومنطقة أوروبيةتُعدّ اللهجات والتعبيرات العامية ومجموعة متنوعة من الأساليب الرسمية وغير الرسمية عوامل يجب مراعاتها. وتؤكد جوجل أن تقنية فلاش لايف في جيميني 3.1 مصممة للتعامل مع هذه الاختلافات، على الرغم من أن أداءها الفعلي سيخضع للاختبار مع وصول الميزة إلى عدد أكبر من المستخدمين.

الأمن، والعلامات المائية، ومكافحة التضليل الإعلامي

كما أن التقدم في طبيعية الصوت المُولّد بالذكاء الاصطناعي يثير أسئلة حول الأمن والمصداقية وسوء الاستخدام المحتملسعت جوجل إلى معالجة هذه المشكلة من خلال دمج SynthID، وهو نظام وضع العلامات المائية الذي يتم تطبيقه على الصوت الذي ينتجه برنامج Gemini 3.1 Flash Live.

هذه العلامات المائية هي غير مسموعة للأذن البشرية ولكن يمكن اكتشافها باستخدام أدوات محددةيُتيح ذلك تحديد متى تم توليد مقطع صوتي بواسطة الذكاء الاصطناعي. والهدف هو تعزيز إمكانية تتبع المحتوى وتسهيل عمل وسائل الإعلام والمنصات والمنظمات التي تحتاج إلى التحقق من مصدر التسجيلات.

يأتي هذا القرار وسط تزايد المخاوف بشأن التزييف الصوتي وسرقة الهويةينطبق هذا على السياقات السياسية، والقطاع المالي، وحتى عمليات الاحتيال عبر الهاتف. ورغم أن العلامة المائية وحدها لا تقضي على هذه المخاطر - على سبيل المثال، قد لا تستخدم جهات خارجية نماذج مزودة بتقنية SynthID أو قد تتلاعب بالصوت لاحقًا - إلا أنها تُضيف طبقة إضافية من المسؤولية إلى تصميم النظام.

تشير جوجل إلى بطاقة طراز Gemini 3.1 Flash Live للحصول على التفاصيل. التركيز على السلامة، وتخفيف المخاطر، والاستخدام المسؤولومن بين العناصر المذكورة الحاجة إلى الحفاظ على آليات التدقيق، وضوابط الاستخدام، والحدود الواضحة على السياقات التي يمكن فيها استخدام النموذج.

تدرك الشركة أنه مع تلاشي الحدود بين الصوت البشري والصوت الاصطناعي، لن تعتمد الثقة على جودة الصوت فحسب، بل ستعتمد أيضاً على القدرة على إثبات متى تم إنشاؤه بواسطة آلة.يُعد SynthID أحد الحلول المقترحة في هذا الاتجاه، على الرغم من أن النقاش حول التنظيم والمعايير المشتركة لا يزال مفتوحًا في أوروبا وبقية العالم.

مع إطلاق Gemini 3.1 Flash Live وتوسيع نطاق Search Live ليشمل إسبانيا وأوروبا وأكثر من 200 منطقة أخرى، تحاول جوجل ترسيخ نظام بيئي يكون فيه أصبح الصوت والكاميرا من الوسائل الشائعة للوصول إلى الذكاء الاصطناعيسيعتمد نجاح هذا المشروع على ما إذا كانت التجربة الموعودة - الأسرع والأكثر طبيعية والأكثر أمانًا والأكثر فائدة - ستتأكد في الاستخدام اليومي للمستخدمين والشركات والمطورين الذين بدأوا الآن في اختبار هذه القدرات الجديدة.

تلميحات برج الجوزاء
المادة ذات الصلة:
نصائح لمواليد برج الجوزاء: دليل شامل، أمثلة وحيل