يستطيع الكلب الآلي Spot التابع لشركة Boston Dynamics الآن “لعب الجلب” – وذلك بفضل اختراق معهد ماساتشوستس للتكنولوجيا
يمكن للروبوتات الشبيهة بالكلاب أن تتعلم يومًا ما لعبة الجلب، وذلك بفضل مزيج من الذكاء الاصطناعي (الذكاء الاصطناعي) ورؤية الكمبيوتر تساعدهم على التركيز على الأشياء.
في دراسة جديدة نشرت في 10 أكتوبر في المجلة IEEE الروبوتات ورسائل الأتمتةطور الباحثون طريقة تسمى “Clio” تتيح للروبوتات رسم خريطة للمشهد بسرعة باستخدام الكاميرات المثبتة على الجسم وتحديد الأجزاء الأكثر صلة بالمهمة التي تم تكليفها بها عبر التعليمات الصوتية.
يستخدم كليو نظرية “عنق الزجاجة المعلوماتي”، حيث يتم ضغط المعلومات بطريقة بحيث تقوم الشبكة العصبية – وهي مجموعة من خوارزميات التعلم الآلي التي تم وضعها في طبقات لتقليد الطريقة التي يعالج بها الدماغ البشري المعلومات – باختيار الأجزاء ذات الصلة وتخزينها فقط. سيقوم أي روبوت مزود بالنظام بمعالجة تعليمات مثل “الحصول على مجموعة الإسعافات الأولية” ثم يفسر فقط أجزاء بيئته المباشرة ذات الصلة بمهامه – متجاهلاً كل شيء آخر.
“على سبيل المثال، لنفترض أن هناك كومة من الكتب في المشهد ومهمتي هي فقط الحصول على الكتاب الأخضر. في هذه الحالة، ندفع كل هذه المعلومات حول المشهد عبر عنق الزجاجة وينتهي الأمر بمجموعة من الأجزاء التي تمثل الكتاب الأخضر”، مؤلف مشارك في الدراسة دومينيك ماجيو، قال طالب دراسات عليا في معهد ماساتشوستس للتكنولوجيا في أ إفادة. “جميع الأجزاء الأخرى غير ذات الصلة يتم تجميعها في مجموعة يمكننا إزالتها ببساطة. ويتبقى لدينا كائن بالدقة الصحيحة اللازمة لدعم مهمتي.”
ولإظهار Clio أثناء العمل، استخدم الباحثون روبوتًا رباعي الأرجل من Boston Dynamics Spot يشغل Clio لاستكشاف مبنى المكاتب وتنفيذ مجموعة من المهام. من خلال العمل في الوقت الفعلي، أنشأ Clio خريطة افتراضية تظهر فقط الأشياء ذات الصلة بمهامه، مما مكّن روبوت Spot من إكمال أهدافه.
الرؤية والفهم والفعل
حقق الباحثون هذا المستوى من التفصيل مع Clio من خلال الجمع بين نماذج اللغة الكبيرة (LLMs) – الشبكات العصبية الافتراضية المتعددة التي تدعم الذكاء الاصطناعي الأدوات والأنظمة والخدمات – التي تم تدريبها على التعرف على جميع أنواع الأشياء من خلال رؤية الكمبيوتر.
حققت الشبكات العصبية تقدمًا كبيرًا في تحديد الكائنات بدقة داخل البيئات المحلية أو الافتراضية، ولكن غالبًا ما تكون هذه سيناريوهات منسقة بعناية مع عدد محدود من الكائنات التي تم تدريب الروبوت أو نظام الذكاء الاصطناعي مسبقًا على التعرف عليها. إن التقدم الذي تقدمه Clio هو القدرة على أن تكون دقيقة مع ما تراه في الوقت الفعلي، وذو صلة بالمهام المحددة التي تم تعيينها لها.
كان الجزء الأساسي من ذلك هو دمج أداة رسم الخرائط في Clio والتي تمكنها من تقسيم المشهد إلى العديد من الأجزاء الصغيرة. تقوم الشبكة العصبية بعد ذلك باختيار الأجزاء المتشابهة من الناحية الدلالية، مما يعني أنها تخدم نفس الهدف أو تشكل كائنات مماثلة.
على نحو فعال، تتمثل الفكرة في امتلاك روبوتات تعمل بالذكاء الاصطناعي يمكنها اتخاذ قرارات بديهية وتمييزية تتمحور حول المهام في الوقت الفعلي، بدلاً من محاولة معالجة مشهد أو بيئة بأكملها أولاً.
وفي المستقبل، يخطط الباحثون لتكييف كليو للتعامل مع المهام ذات المستوى الأعلى.
وقال ماجيو: “ما زلنا نعطي Clio مهامًا محددة إلى حد ما، مثل العثور على مجموعة أوراق اللعب”. “بالنسبة للبحث والإنقاذ، تحتاج إلى تكليفه بمزيد من المهام عالية المستوى، مثل العثور على ناجين، أو إعادة الطاقة”. لذا، نريد الوصول إلى فهم أكثر إنسانية لكيفية إنجاز المزيد المهام المعقدة.”
إذا لم يكن هناك شيء آخر، يمكن أن يكون كليو هو المفتاح لوجود كلاب روبوتية يمكنها بالفعل لعب لعبة الجلب، بغض النظر عن الحديقة التي يركضون فيها.