به گزارش سرویس ترجمه خبرگزاری ایمنا، متا، شرکت مادر فیسبوک و اینستاگرام، اعلام کرد که فناوری اصلی خود را بهبود بخشیده است و بهزودی مشاهده پستهای این پلتفرمها به زبانهای جهانی سادهتر خواهد شد؛ در اصل این پستها به ۲۰۰ زبان کمتر صحبت شده در سراسر جهان قابل ترجمه خواهد بود.
در این میان متا از زبانهای بومی از جمله زبانهای اروپایی با منابع کم (گاهی کمتر از یک میلیون جمله داده که میتوان از آن استفاده کرد) همچون گالیک اسکاتلندی، گالیسی، ایرلندی، لینگوری، بوسنیایی، ایسلندی و ولزی نیز غافل نمانده است.
۲۰۰ زبان زنده دنیا در متا
متا هوش مصنوعی (AI) خود را با دادههای مخزن Opus (یک پلتفرم منبع باز با مجموعهای از متون گفتاری یا نوشتاری معتبر برای زبانهای مختلف که میتواند یادگیری ماشینی را برنامهریزی کند)، ارتقا داده است و زیرمجموعهای از تحقیقات هوش مصنوعی را راهاندازی کرده است که به رایانهها توانایی ترجمه و درک زبان انسان را میدهد. آنها همچنین از ترکیب دادههای استخراجشده از منابعی همچون ویکیپدیا در پایگاه داده خود استفاده میکنند.
این دادهها برای ایجاد آنچه استفاده میشود که متا آن را مدل زبان چندزبانه (MLM) مینامد و در آن هوش مصنوعی میتواند هر زبانی را بدون تکیه بر دادههای انگلیسی ترجمه کند. کیفیت ترجمههای این مدل با معیاری از جملات ترجمهشده توسط انسان، همچنین آموزش نرمافزار برای فیلتر لیستی از کلمات یا عبارات ناشایست تضمین شده است. دقت ترجمهها نیز تا ۴۴ درصد نسبت به اولین مدل ارائهشده در ۲۰۲۰ بهبود پیدا کرده است.
تخمین زده میشود با پیادهسازی کامل این فناوری، روزانه بیش از ۲۵ میلیارد ترجمه در فید خبری فیسبوک، اینستاگرام و سایر پلتفرمهای اجتماعی وجود خواهد داشت.
چالشهای احیای زبانهای در حال انقراض
حدود ۲.۵ درصد از جمعیت اسکاتلند (۱۳۰ هزار نفر)، در سرشماری ۲۰۲۲ اظهار کردند که مهارتهایی در زبان سلتیک قرن سیزدهم دارند. نزدیک به دو هزار نفر سخنور به زبان گالیک نیز در شرق کانادا وجود دارد که زبان اقلیت است. یونسکو این زبان را به دلیل تعداد کمی از مردم که بهطور منظم به آن صحبت میکنند، بهعنوان در معرض خطر انقراض طبقهبندی کرده است.
به این ترتیب ترجمههای متا به زبان گالیکی اسکاتلندی به دلیل دادههای جمعسپاری شدهای که از آنها استفاده میکنند، «هنوز خیلی خوب» نیستند و بهبود آنها نیازمند مشارکت مردم گالیکزبان است. این امر دشوار است، زیرا بیشتر این گویشوران در دهه ۷۰ زندگی خود به سر میبرند و از رایانه استفاده نمیکنند. از سوی دیگر گویش نسل جوان این زبان با اجداد بزرگسال خود متفاوت است.
متا سعی دارد برای حفظ زبان از ایجاد محتوای آنلاین باکیفیت بالا بهره بگیرد تا مجموعه دادههای موجود را اصلاح کنند. این امر نیازمند تلاش متخصصان زبان است که میتوانند متون را اصلاح، تصحیح و با ابردادههای در دسترس، بهروز کنند.
این دادهها که به کمک گویشوران بومی و تصحیح متخصصان زبان بهدست میآید، بهطور تقریبی همه جنبههای زندگی انسان را منعکس میکنند، بنابراین کیفیت زبان میتواند بسیار بهتر از استفاده از متون رسمیتر باشد.
با این حال استفاده از ترجمههای پلتفرمها به دلیل خطا در دادهها توصیه نمیشود مگر اینکه متا تغییراتی در مجموعه دادههای خود ایجاد کند. به این ترتیب همچون سایر ابزارهای هوش مصنوعی، قبل از استفاده از این ابزار باید نقاط ضعف این فناوری شناسایی شود.
نظر شما