
قدمت شركة مايكروسوفت للأبحاث نموذجًا جديدًا للذكاء الاصطناعي يسمى Magma، والذي قد يمثل تقدمًا كبيرًا في الذكاء الاصطناعي للتحكم في كل من واجهات البرامج والأنظمة الروبوتية، حيث يجمع Magma بين المعالجة البصرية واللغوية، مما يسمح له بالعمل في كل من العالم الرقمي والمادي، مما يجعله نموذجًا متعدد الاستخدامات للذكاء الاصطناعي.
وعلى عكس العديد من أنظمة الذكاء الاصطناعي المتعددة الوسائط الحالية التي تعتمد على نماذج منفصلة لتفسير البيانات وأداء الإجراءات، يدمج Magma هذه القدرات في نظام واحد، وتزعم Microsoft أن هذا يجعل Magma فريدًا من نوعه، حيث يمكنه معالجة البيانات مثل النصوص والصور والفيديو والتصرف بناءً عليها بشكل أصلي، سواء كان ذلك من خلال التنقل في البرامج أو التحكم في الروبوتات.
ويمكن أن يؤدي هذا التقدم إلى أنظمة ذكاء اصطناعي أكثر استقلالية وذكاءً وقادرة على العمل عبر سيناريوهات مختلفة، وكان تطوير Magma جهدًا تعاونيًا بين Microsoft والمؤسسات الأكاديمية البارزة، بما في ذلك KAIST وجامعة ماريلاند وجامعة ويسكونسن ماديسون وجامعة واشنطن.
ويهدف الذكاء الاصطناعي إلى تجاوز مجرد الإجابة على الأسئلة أو تنفيذ أوامر فردية، حيث تتخيله Microsoft كخطوة نحو إنشاء نظام ذكاء اصطناعي وكيل، وهذا يعني أن الذكاء الاصطناعي يمكنه التخطيط بشكل مستقل وتنفيذ مهام متعددة الخطوات لتحقيق أهداف معقدة دون تدخل بشري.
وفي بحثها، تسلط مايكروسوفت الضوء على كيفية قدرة Magma على صياغة الخطط بناءً على هدف محدد واتخاذ الإجراءات اللازمة لتحقيق هذا الهدف، ومن خلال الاستفادة من البيانات المرئية واللغوية المتاحة، يمكن لـ Magma التعامل مع المهام المعقدة في كل من الإعدادات الافتراضية والمادية، والتي يمكن أن يكون لها مجموعة واسعة من التطبيقات في الصناعات مثل التصنيع والرعاية الصحية والأتمتة الرقمية.
وتستكشف شركات التكنولوجيا الأخرى مثل OpenAI وGoogle أيضًا إمكانات الذكاء الاصطناعي الوكيل. تركز تجارب OpenAI مع مشاريع مثل Operator على أداء المهام في متصفحات الويب، بينما تعمل Google على تطوير الذكاء الاصطناعي الوكيل من خلال مبادرة Gemini 2.0، ومع ذلك، فإن ما يجعل Magma مختلفة هو نهجها المتكامل للإدراك والعمل، مما يمنحها ميزة محتملة في التطبيقات في العالم الحقيقي.