متا زبان‌های در معرض انقراض را احیا می‌کند

متا سعی دارد با بهره‌گیری از هوش مصنوعی، ضمن ایجاد امکان ترجمه متون پلت‌فرم‌های زیرمجموعه خود به ۲۰۰ زبان زنده دنیا، به احیای زبان‌های در معرض انقراض نیز بپردازد.

به گزارش سرویس ترجمه خبرگزاری ایمنا، متا، شرکت مادر فیس‌بوک و اینستاگرام، اعلام کرد که فناوری اصلی خود را بهبود بخشیده است و به‌زودی مشاهده پست‌های این پلت‌فرم‌ها به زبان‌های جهانی ساده‌تر خواهد شد؛ در اصل این پست‌ها به ۲۰۰ زبان کمتر صحبت شده در سراسر جهان قابل ترجمه خواهد بود.

در این میان متا از زبان‌های بومی از جمله زبان‌های اروپایی با منابع کم (گاهی کمتر از یک میلیون جمله داده که می‌توان از آن استفاده کرد) هم‌چون گالیک اسکاتلندی، گالیسی، ایرلندی، لینگوری، بوسنیایی، ایسلندی و ولزی نیز غافل نمانده است.

۲۰۰ زبان زنده دنیا در متا

متا هوش مصنوعی (AI) خود را با داده‌های مخزن Opus (یک پلت‌فرم منبع باز با مجموعه‌ای از متون گفتاری یا نوشتاری معتبر برای زبان‌های مختلف که می‌تواند یادگیری ماشینی را برنامه‌ریزی کند)، ارتقا داده است و زیرمجموعه‌ای از تحقیقات هوش مصنوعی را راه‌اندازی کرده است که به رایانه‌ها توانایی ترجمه و درک زبان انسان را می‌دهد. آن‌ها همچنین از ترکیب داده‌های استخراج‌شده از منابعی هم‌چون ویکی‌پدیا در پایگاه داده خود استفاده می‌کنند.

هوش مصنوعی، ناجی زبان‌های کمیاب و در معرض انقراض

این داده‌ها برای ایجاد آنچه استفاده می‌شود که متا آن را مدل زبان چندزبانه (MLM) می‌نامد و در آن هوش مصنوعی می‌تواند هر زبانی را بدون تکیه بر داده‌های انگلیسی ترجمه کند. کیفیت ترجمه‌های این مدل با معیاری از جملات ترجمه‌شده توسط انسان، همچنین آموزش نرم‌افزار برای فیلتر لیستی از کلمات یا عبارات ناشایست تضمین شده است. دقت ترجمه‌ها نیز تا ۴۴ درصد نسبت به اولین مدل ارائه‌شده در ۲۰۲۰ بهبود پیدا کرده است.

تخمین زده می‌شود با پیاده‌سازی کامل این فناوری، روزانه بیش از ۲۵ میلیارد ترجمه در فید خبری فیس‌بوک، اینستاگرام و سایر پلت‌فرم‌های اجتماعی وجود خواهد داشت.

چالش‌های احیای زبان‌های در حال انقراض

حدود ۲.۵ درصد از جمعیت اسکاتلند (۱۳۰ هزار نفر)، در سرشماری ۲۰۲۲ اظهار کردند که مهارت‌هایی در زبان سلتیک قرن سیزدهم دارند. نزدیک به دو هزار نفر سخنور به زبان گالیک نیز در شرق کانادا وجود دارد که زبان اقلیت است. یونسکو این زبان را به دلیل تعداد کمی از مردم که به‌طور منظم به آن صحبت می‌کنند، به‌عنوان در معرض خطر انقراض طبقه‌بندی کرده است.

هوش مصنوعی، ناجی زبان‌های کمیاب و در معرض انقراض

به این ترتیب ترجمه‌های متا به زبان گالیکی اسکاتلندی به دلیل داده‌های جمع‌سپاری شده‌ای که از آن‌ها استفاده می‌کنند، «هنوز خیلی خوب» نیستند و بهبود آن‌ها نیازمند مشارکت مردم گالیک‌زبان است. این امر دشوار است، زیرا بیشتر این گویش‌وران در دهه ۷۰ زندگی خود به سر می‌برند و از رایانه استفاده نمی‌کنند. از سوی دیگر گویش نسل جوان این زبان با اجداد بزرگسال خود متفاوت است.

متا سعی دارد برای حفظ زبان از ایجاد محتوای آنلاین باکیفیت بالا بهره بگیرد تا مجموعه داده‌های موجود را اصلاح کنند. این امر نیازمند تلاش متخصصان زبان است که می‌توانند متون را اصلاح، تصحیح و با ابرداده‌های در دسترس، به‌روز کنند.

این داده‌ها که به کمک گویش‌وران بومی و تصحیح متخصصان زبان به‌دست می‌آید، به‌طور تقریبی همه جنبه‌های زندگی انسان را منعکس می‌کنند، بنابراین کیفیت زبان می‌تواند بسیار بهتر از استفاده از متون رسمی‌تر باشد.

با این حال استفاده از ترجمه‌های پلت‌فرم‌ها به دلیل خطا در داده‌ها توصیه نمی‌شود مگر این‌که متا تغییراتی در مجموعه داده‌های خود ایجاد کند. به این ترتیب هم‌چون سایر ابزارهای هوش مصنوعی، قبل از استفاده از این ابزار باید نقاط ضعف این فناوری شناسایی شود.

کد خبر 768014

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.