به گزارش سرویس ترجمه ایمنا، انسانها برای تشخیص اشیا به روابط پیکربندیشده میان ویژگیهای مکانی شکل یک شیء متکی هستند. در اصل یکی از مشخصههای ادراک جسم توسط انسان، حساسیت به پیکربندی کلنگر ویژگیهای مکانی شکل اشیا بهشمار میرود.
شبکههای عصبی کانولوشن عمیق
شبکههای عصبی کانولوشن یا پیچشی عمیق (DCNN) یک الگوریتم یادگیری عمیق برای دریافت تصاویر و تمیز دادن آنها از یکدیگر همچنین نشاندهنده وضعیت هنر در سیستمهای هوش مصنوعی بینایی کامپیوتری برای تشخیص تصویر هستند. این شبکهها درحالحاضر مدلهای غالب برای پردازش تشخیص اشیا در قشر بینایی هوش مصنوعی محسوب میشوند و رایجترین نوع برای شناسایی الگوها در تصاویر و ویدئوها، تکاملیافته شبکههای عصبی مصنوعی سنتی هستند؛ همچنین مقلد یک الگوی عصبی سهبعدی الهام گرفته از قشر بینایی حیوانات هستند.
شبکههای عصبی کانولوشن عمیق، توانایی پیشبینی نسبی پاسخهای عصبی در نواحی بصری انتخابی شیء در قشر انسانی و غیرانسانی را دارد که البته انحرافهایی میان این مدلها و پاسخهای مغز انسان مشاهده شده است. درک بهتر پتانسیلDCNN ها بهعنوان مدلهایی از ادراک اشیا انسانی نیازمند تجزیهوتحلیل ویژگیهای بصری زیربنایی تشخیص شیء است که میتواند شامل رنگ، بافت و شکل باشد.
نشانههای شکل که بهعنوان پایهای برای تشخیص اشیا در ادراک انسان شناخته میشوند، نشان میدهد که در مقایسه با انسانها، DCNNها ممکن است کمتر به شکل و بیشتر به رنگ و بافت متکی باشند.
شبکههای عصبی کانولوشن عمیق بهطورمداوم در وظایف مختلف تجزیهوتحلیل بصری چالشبرانگیز برتری داشتهاند و مدلهای عمیق برنامهنویسیشده آنها با معماریهای سیستمی سنگین پارامتری در بسیاری از برنامهها بهکار گرفته شده و موفقیت خود را تا حد زیادی مدیون توسعه مداوم واحدهای پردازش گرافیکی قدرتمندتر هستند.
با این حال مصرف انرژی و اندازه خالص چنین مدلهایی مانع از کاربرد آنها در رباتیک میشود. بنابراین تحقیقات اخیر به سمت بهینهسازی معماریهای یادگیری عمیق برای استقرار در دستگاههایی با منابع محدود هدایت شده است.
ضعف هوش مصنوعی در تشخیص پیکربندی اشکال
بنابه گفته محققان دانشگاه یورک، شبکههای عصبی کانولوشن عمیق، اشیا را به همان شکلی که انسان توانایی دیدن آن را دارد (یعنی از طریق ادراک شکل پیکربندیشده آنها) نمیبیند که این امر ممکن است در برنامههای کاربردی هوش مصنوعی در دنیای واقعی خطرناک باشد.
محققان دانشگاه یورک طی مطالعهای دریافتند که مدلهای یادگیری عمیق نمیتواند ماهیت پیکربندی ادراک شکل انسان را بهتصویر بکشد. این محققان بهمنظور بررسی چگونگی پردازش مغز انسان وDCNN ها از ویژگیهای پیکربندیشده جسم کلنگر، در مطالعه خود از محرکهای بصری جدیدی به نام «فرانکشتاین» استفاده و نتایج بهدستآمده خود را در مجله iScience منتشر کردند.
طبق توضیحات آنها، فرانکشتاینها اشیایی هستند که بهسادگی از هم جدا شده و به روشی اشتباه کنار هم قرار گرفتهاند، در نتیجه همه آنها دارای ویژگیهای شکلی درست اما در مکانهای اشتباه هستند.
محققان دانشگاه یورک از مجموعه دادهای از شبحهای حیوانات استفاده و گونهای از آن را ایجاد کردند که پیکربندی هر شیء را با حفظ ویژگیهای مکانی آن مختل میکند. برای مثال تصویری از یک حیوان را بهصورتی قرار میدهد که قسمت بالایی و پایینی بدن آن در دو جهت مخالف روی هم سوار شده است.
محققان دریافتند درحالیکه عملکرد مغز انسان تحتتأثیر این دستکاری قرار گرفت، DCNNها آن را تشخیص نداد که این امر به معنای فقدان حساسیت آنها به ویژگیهای پیکربندیشده جسم است. علاوه بر این اصلاحات در برنامهنویسی و معماری این شبکهها برای شبیهتر کردن آنها به مغز انسان همچنان تأثیری در بهبود توانایی آنها برای پردازش پیکربندی جسم نشد و هیچیک از این شبکهها توانایی پیشبینی دقیق قضاوتهای آزمایشی انسانی درمورد اشیا را بهدست نیاورد.
این نتایج توضیح میدهد که چرا مدلهای هوش مصنوعی عمیق تحت شرایطی خاص شکست میخورد و نیاز به درنظرگرفتن وظایفی فراتر از تشخیص اشیا بهمنظور درک پردازش بصری در مغز را نشان میدهد، لذا برای مطابقت با حساسیت قابلتنظیم انسان، شبکههای عصبی کانولوشن عمیق بهکار رفته در هوش مصنوعی باید فراتر از توانایی تشخیص دسته، برای تشخیص طیف وسیعتری از وظایف اشیا مناسبسازی و بازنویسی شوند.
مدلهای عمیق معمولاً هنگام حل وظایف تشخیص پیچیده از میانبر استفاده میکنند. این میانبرها ممکن است در بسیاری از موارد کار کند اما در بعضی از برنامههای کاربردی هوش مصنوعی دنیای واقعی میتواند خطرناک باشد. یکی از این کاربردها، سیستمهای ایمنی ویدئویی ترافیکی است. وسایلنقلیه موتوری، دوچرخهها و عابرانپیاده اشیای موجود در صحنههای ترافیکی شلوغ هستند که بهعنوان مجموعهای از قطعات جدا شده به چشم راننده میرسند.
مغز برای دستهبندی صحیح و شناسایی مناسب مکان هر یک از این مجموعهها باید آنها را به درستی گروهبندی کند. حالآنکه یک سیستم هوش مصنوعی مختص نظارت بر ایمنی ترافیک که تنها توانایی پردازش جداگانه این قطعات را دارد، در این امر شکست خواهد خورد و امکان پردازش از خطرات موجود برای کاربران آسیبپذیر جاده نخواهد داشت.
نظر شما