Gemini من Google قد يقوم بمهامك قريباً

تفيد التقارير بأن شركة Google تعمل على تطوير كبير لمساعدها التوليدي للذكاء الاصطناعي Gemini، والذي قد يحوله من مجرد مساعد للمحادثة إلى شيء أقرب إلى وكيل عمل حقيقي. في تحليل تجريبي حديث لرمز تطبيق Google بواسطة 9to5Google، كشف المطورون عن سلاسل برمجية تشير إلى ميزة تُعرف داخليًا باسم “أتمتة الشاشة”. يشير هذا إلى أن Gemini قد يتمكن قريبًا من اتخاذ إجراءات مباشرة نيابة عنك داخل تطبيقات Android معينة، مثل تقديم الطلبات أو حجز الرحلات، دون الحاجة إلى أن ينقر المستخدم يدويًا عبر الشاشات.

جيميني Gemini من Google قد يقوم بمهامك قريباً

في حين أن Gemini يقوم بالفعل بتشغيل مهام المحادثة مثل صياغة رسائل البريد الإلكتروني أو إنشاء خطط بحث، يبدو أن هذا التحديث يهدف إلى السماح له بالتفاعل حرفيًا مع واجهات التطبيقات، والنقر فوق الأزرار والتنقل بين الشاشات لإنهاء المهام التي تقوم بها عادةً بنفسك. تشير الأدلة المبكرة من النسخة التجريبية إلى أن هذه الإمكانات ستقتصر في البداية على عدد قليل من التطبيقات المدعومة وستؤكد على إشراف المستخدم، مع تحذير Google من أن “Gemini يمكن أن يرتكب أخطاء” وأن المستخدمين يظلون مسؤولين عن الإجراءات المتخذة نيابة عنهم.

كيف تنقل هذه الترقية الذكاء الاصطناعي من مساعد إلى وكيل

يمثل المفهوم الكامن وراء أتمتة الشاشة خطوة كبيرة نحو منح الذكاء الاصطناعي مزيدًا من الاستقلالية في مهام سير العمل الرقمية اليومية. بدلاً من مجرد اقتراح ما يمكنك القيام به، قد يقوم Gemini قريبًا بتنفيذ هذه الخيارات مباشرة داخل التطبيقات نيابة عنك. تشير سلاسل التعليمات البرمجية المبكرة من نسخة Google التجريبية أيضًا إلى احتياطات الخصوصية، مثل نصح المستخدمين بعدم إدخال معلومات تسجيل الدخول أو الدفع في محادثات الذكاء الاصطناعي والتحذير من أن لقطات الشاشة قد تتم مراجعتها لتحسين الميزة. تقدم Google بالفعل بعض إمكانات الوكيل من خلال نظام Gemini Agent الأساسي في Workspace والويب، حيث يمكن للذكاء الاصطناعي التعامل مع مهام سير العمل المعقدة والتنسيق بين الخدمات، ولكن أتمتة الشاشة يمكن أن تجلب هذه القدرات مباشرة إلى الهواتف الذكية والاستخدام اليومي للتطبيقات.

إذا تم طرح هذه الميزات على نطاق واسع، فقد يمثل ذلك تحولًا في كيفية تفاعل الأشخاص مع الأجهزة المحمولة، من النقر والتمرير بأنفسهم إلى منح أدوات الذكاء الاصطناعي إذنًا بالتصرف نيابة عنهم. قد يؤدي ذلك إلى تسهيل الإجراءات الروتينية اليومية، ولكنه يثير أيضًا تساؤلات حول التحكم والأمان والرقابة، خاصةً عندما تمس الأتمتة المهام الحساسة مثل الحجوزات أو الطلبات المالية.

وبحسب التقارير، فإن Google تضع هذه الترقيات على أنها اختيارية وخاضعة للإشراف، مما يتيح للمستخدمين إيقاف Gemini أو تجاوزه في أي وقت. ولكن في الوقت الحالي، لا تزال ميزة أتمتة الشاشة قيد التطوير ولم تصل بعد إلى الإصدارات المستقرة.

Gemini