هوش مصنوعی و بهره‌گیری از میان‌برهای بالقوه خطرناک

تحقیقات دانشگاه یورک نشان می‌دهد که حتی پیشرفته‌ترین هوش مصنوعی نیز نمی‌تواند با پردازش بصری انسان مطابقت داشته باشد.

به گزارش سرویس ترجمه ایمنا، انسان‌ها برای تشخیص اشیا به روابط پیکربندی‌شده میان ویژگی‌های مکانی شکل یک شیء متکی هستند. در اصل یکی از مشخصه‌های ادراک جسم توسط انسان، حساسیت به پیکربندی کل‌نگر ویژگی‌های مکانی شکل اشیا به‌شمار می‌رود.

شبکه‌های عصبی کانولوشن عمیق

شبکه‌های عصبی کانولوشن یا پیچشی عمیق (DCNN) یک الگوریتم یادگیری عمیق برای دریافت تصاویر و تمیز دادن آن‌ها از یکدیگر همچنین نشان‌دهنده وضعیت هنر در سیستم‌های هوش مصنوعی بینایی کامپیوتری برای تشخیص تصویر هستند. این شبکه‌ها درحال‌حاضر مدل‌های غالب برای پردازش تشخیص اشیا در قشر بینایی هوش مصنوعی محسوب می‌شوند و رایج‌ترین نوع برای شناسایی الگوها در تصاویر و ویدئوها، تکامل‌یافته شبکه‌های عصبی مصنوعی سنتی هستند؛ همچنین مقلد یک الگوی عصبی سه‌بعدی الهام گرفته از قشر بینایی حیوانات هستند.

شبکه‌های عصبی کانولوشن عمیق، توانایی پیش‌بینی نسبی پاسخ‌های عصبی در نواحی بصری انتخابی شیء در قشر انسانی و غیرانسانی را دارد که البته انحراف‌هایی میان این مدل‌ها و پاسخ‌های مغز انسان مشاهده شده است. درک بهتر پتانسیلDCNN ها به‌عنوان مدل‌هایی از ادراک اشیا انسانی نیازمند تجزیه‌وتحلیل ویژگی‌های بصری زیربنایی تشخیص شیء است که می‌تواند شامل رنگ، بافت و شکل باشد.

نشانه‌های شکل که به‌عنوان پایه‌ای برای تشخیص اشیا در ادراک انسان شناخته می‌شوند، نشان می‌دهد که در مقایسه با انسان‌ها، DCNN‌ها ممکن است کمتر به شکل و بیشتر به رنگ و بافت متکی باشند.

شبکه‌های عصبی کانولوشن عمیق به‌طورمداوم در وظایف مختلف تجزیه‌وتحلیل بصری چالش‌برانگیز برتری داشته‌اند و مدل‌های عمیق برنامه‌نویسی‌شده آن‌ها با معماری‌های سیستمی سنگین پارامتری در بسیاری از برنامه‌ها به‌کار گرفته شده و موفقیت خود را تا حد زیادی مدیون توسعه مداوم واحدهای پردازش گرافیکی قدرتمندتر هستند.

با این حال مصرف انرژی و اندازه خالص چنین مدل‌هایی مانع از کاربرد آن‌ها در رباتیک می‌شود. بنابراین تحقیقات اخیر به سمت بهینه‌سازی معماری‌های یادگیری عمیق برای استقرار در دستگاه‌هایی با منابع محدود هدایت شده است.

ضعف هوش مصنوعی در تشخیص پیکربندی اشکال

بنابه گفته محققان دانشگاه یورک، شبکه‌های عصبی کانولوشن عمیق، اشیا را به همان شکلی که انسان توانایی دیدن آن را دارد (یعنی از طریق ادراک شکل پیکربندی‌شده آن‌ها) نمی‌بیند که این امر ممکن است در برنامه‌های کاربردی هوش مصنوعی در دنیای واقعی خطرناک باشد.

محققان دانشگاه یورک طی مطالعه‌ای دریافتند که مدل‌های یادگیری عمیق نمی‌تواند ماهیت پیکربندی ادراک شکل انسان را به‌تصویر بکشد. این محققان به‌منظور بررسی چگونگی پردازش مغز انسان وDCNN ها از ویژگی‌های پیکربندی‌شده جسم کل‌نگر، در مطالعه خود از محرک‌های بصری جدیدی به نام «فرانکشتاین» استفاده و نتایج به‌دست‌آمده خود را در مجله iScience منتشر کردند.

طبق توضیحات آن‌ها، فرانکشتاین‌ها اشیایی هستند که به‌سادگی از هم جدا شده و به روشی اشتباه کنار هم قرار گرفته‌اند، در نتیجه همه آن‌ها دارای ویژگی‌های شکلی درست اما در مکان‌های اشتباه هستند.

محققان دانشگاه یورک از مجموعه داده‌ای از شبح‌های حیوانات استفاده و گونه‌ای از آن را ایجاد کردند که پیکربندی هر شیء را با حفظ ویژگی‌های مکانی آن مختل می‌کند. برای مثال تصویری از یک حیوان را به‌صورتی قرار می‌دهد که قسمت بالایی و پایینی بدن آن در دو جهت مخالف روی هم سوار شده است.

محققان دریافتند درحالی‌که عملکرد مغز انسان تحت‌تأثیر این دستکاری قرار گرفت، DCNNها آن را تشخیص نداد که این امر به معنای فقدان حساسیت آن‌ها به ویژگی‌های پیکربندی‌شده جسم است. علاوه بر این اصلاحات در برنامه‌نویسی و معماری این شبکه‌ها برای شبیه‌تر کردن آن‌ها به مغز انسان همچنان تأثیری در بهبود توانایی آن‌ها برای پردازش پیکربندی جسم نشد و هیچ‌یک از این شبکه‌ها توانایی پیش‌بینی دقیق قضاوت‌های آزمایشی انسانی درمورد اشیا را به‌دست نیاورد.

این نتایج توضیح می‌دهد که چرا مدل‌های هوش مصنوعی عمیق تحت شرایطی خاص شکست می‌خورد و نیاز به درنظرگرفتن وظایفی فراتر از تشخیص اشیا به‌منظور درک پردازش بصری در مغز را نشان می‌دهد، لذا برای مطابقت با حساسیت قابل‌تنظیم انسان، شبکه‌های عصبی کانولوشن عمیق به‌کار رفته در هوش مصنوعی باید فراتر از توانایی تشخیص دسته، برای تشخیص طیف وسیع‌تری از وظایف اشیا مناسب‌سازی و بازنویسی شوند.

مدل‌های عمیق معمولاً هنگام حل وظایف تشخیص پیچیده از میان‌بر استفاده می‌کنند. این میان‌برها ممکن است در بسیاری از موارد کار کند اما در بعضی از برنامه‌های کاربردی هوش مصنوعی دنیای واقعی می‌تواند خطرناک باشد. یکی از این کاربردها، سیستم‌های ایمنی ویدئویی ترافیکی است. وسایل‌نقلیه موتوری، دوچرخه‌ها و عابران‌پیاده اشیای موجود در صحنه‌های ترافیکی شلوغ هستند که به‌عنوان مجموعه‌ای از قطعات جدا شده به چشم راننده می‌رسند.

مغز برای دسته‌بندی صحیح و شناسایی مناسب مکان هر یک از این مجموعه‌ها باید آن‌ها را به درستی گروه‌بندی کند. حال‌آن‌که یک سیستم هوش مصنوعی مختص نظارت بر ایمنی ترافیک که تنها توانایی پردازش جداگانه این قطعات را دارد، در این امر شکست خواهد خورد و امکان پردازش از خطرات موجود برای کاربران آسیب‌پذیر جاده نخواهد داشت.

کد خبر 618277

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.