سیستم ادراکی روباتیک دانشگاه برکلی اجسام را با لمس آنها شناسایی میکند
دانشمندان دانشگاه برکلی موفق شدهاند نوعی سیستم ادراکی هوش مصنوعی برای رباتها بسازند که میتواند اشیاء را با لمسکردن آنها شناسایی کنند.
این واقعیتی ثابت شده است که انسانها خیلی از دانستههای خود دربارهی جهان پیرامون را ازطریق لمسکردن میآموزند. پژوهشها نشان میدهند یادگیری حرکتیلمسی باعث تقویت نتایج یادگیری، حتی در کسانی میشود که آموزش به سایر سبکهای دیداری یا شنیداری یا خواندنونوشتن را ترجیح میدهند. یادگیری حرکتیلمسی نوعی سبک یادگیری است که دانشآموزان در آن بهجای گوشدادن به معلم یا نگاهکردن به کارهایی که وی انجام میدهد، درگیر انجام فعالیتهای فیزیکی میشوند.
دانشمندان دانشگاه کالیفرنیا در برکلی با الهامگرفتن از حس لامسهی انسانها، نوعی سیستم ادراکی برای رباتها طراحی کردند که نتیجهی آن بیشتر متکی به قابلیت لمسکردن اشیاء است، نه توانایی مشاهدهکردن آنها. آنها با مبنا قراردادن کار پژوهشگران دانشگاه کارنگی ملون، نوعی سیستم هوش مصنوعی (AI) طراحی کردند که بتواند رابطهی بین مشاهدههای فیزیکی و شیئی خاص را تشخیص دهد.
مقالهی آنان با عنوان «یادگیری برای شناسایی اشیاء با لمس آنها: تشخیص لمسی ازطریق تطبیق چندحالتی» در Arxiv.org منتشر شده است. در این مقاله، این دانشمندان توضیح میدهند:
انسانها بهطور طبیعی میتوانند رابطهی بین ظاهر و ویژگیهای مادی اشیاء را در حالتهای مختلف تشخیص بدهند. ادراک ما ماهیتی چندحالتی دارد. وقتی اسباببازی نرمی میبینیم، آنچه انگشتانمان در زمان لمس سطح نرم حس خواهد کرد، در ذهن تصور میکنیم یا وقتی لبههای قیچی را حس میکنیم، میتوانیم آنها را در ذهنمان تجسم کنیم. آنچه در ذهن ما نقش میبندد، فقط هویت آنها نیست؛ بلکه شکل و اندازهی حدسی و نسبتهای آنها را هم میبینیم. در این پروژه، میزان دقت در فراگیری روابط چندحالتی حاصل از لمس روباتیک را بررسی میکنیم.
حرفزدن دربارهی این کار خیلی آسانتر از انجامدادنش بود. بهگفتهی پژوهشگران، حسگرهای لمسی از قدرت دید همهجانبهی حسگرهای تصویری برخوردار نیستند و فقط باتوجهبه ویژگیهای سطحی محلی عمل میکنند. همچنین، تفسیر یافتههای آنها کار سختتری است. آنها برای برطرفکردن این محدودیت و مواردی مشابه آن، حسگر لمسی GelSight با رزولوشن بالا را با شبکهی عصبی پیچشی (Convolutional Neural Network) ترکیب کردند که نوعی هوش مصنوعی برای تحلیل تصاویر بصری است. حسگر لمسی GelSight با استفاده از دوربینی که تغییرشکلهای ناشی از لمس شیء را مشاهده میکند، تولید اطلاعات را شروع میکند. دانشمندان دو حسگر GelSight را روی انگشتان گریپر (Gripper) نصب کردند تا علاوهبر دادههای بهدستآمده از مشاهدههای دوربین، درصورتیکه گریپر موفق شد انگشتان خود را دور شیء هدف حلقه کند، یافتههای حاصل از تماسهای حسگر لمسی را نیز جمعآوری کنند.
رویهمرفته، پژوهشگران موفق شدند نمونههایی از ۹۸ شیء مختلف بهدست بیاورند که از ۸۰ شیء آن (شامل ۲۷,۳۸۶ مثال) برای آموزش شبکهی عصبی استفاده کردند. ۱۸ نمونه و ۶,۸۴۴ مثال دیگر هم برای آزمایشها نگه داشته شدند. در آزمایشها، سیستمهای هوش مصنوعی توانستند در ۶۴.۳ درصد از موارد بهدرستی هویت اشیای مختلف را با لمس آنها تشخیص بدهند. این آمار حتی مواردی را هم شامل میشود که در زمان آموزش، خود با آنها روبهرو نشده بودند. افزونبراین، پژوهشگران ادعا میکنند سیستم مذکور عملکرد خیلی بهتری درمقایسهبا روشهای مشابه داشته است؛ ازجمله روشی که دانشجویان کارشناسی دانشگاه برکلی بهکار گرفتند و از ۱۱ انسان داوطلب در ۴۲۰ آزمایش خواستند تا اشیاء را با نگاهکردن به حالت انگشتانشان، با این فرض حدس بزنند که اشیاء در دستان آنها است.
پژوهشگران معتقدند میتوان این پروژه را بهبود بخشید. همهی تصاویری که آنها در آزمایششان استفاده کردند به یک محیط متعلق بودند. آنان به این نکته اشاره میکنند که کارشان فقط باتوجهبه یافتههای فردی انجام شد و به تعاملات حسی چندگانه توجهی نکردند؛ اما بازهم مدعی هستند که این پژوهش نخستین گام امیدوارکننده در مسیر ساختن سیستمهای ادراکی هوش مصنوعی است که میتوانند مانند انسانها، اشیاء را فقط با لمسکردن شناسایی کنند.
در مقالهی آنها آمده است:
تکمیل رویکرد پیشنهادی ما دربارهی لمس روباتیک، مسیری پرهیجان را برای پژوهشهای آتی خواهد گشود. اگر رباتها این توانایی را داشته باشند که اجسام را فقط با لمس آنها شناسایی کنند، میتوانیم رباتهای کارگری را تجسم کنیم که کالاها را فقط از روی تصاویر حاصل از لمس آنها روی قفسههای انبار شناسایی میکنند یا رباتهای خدمتکاری که وسایل خانه را از محلهای دورازدسترس بهدست میآورند و شاید با استفاده از آموزشهای چندحالتی، درکی عمیقتر از ویژگیهای اشیاء داشته باشند.