به گزارش کسب و کار نیوز و به نقل از ام. آی. تی نیوز، پژوهشگران سعی دارند سیستمهای یادگیری ماشینی موسوم به “شبکههای عصبی” را در مقیاس بسیار کوچک و میکروسکوپی بررسی کنند.
این پژوهش که یک همکاری مشترک میان پژوهشگران دانشگاه “ام. آی. تی” (MIT) و “مؤسسه پژوهش محاسباتی قطر” (QCRI) است، نحوه مدیریت این سیستمها را در ترجمه متن از یک زبان به زبان دیگر مشخص میکند. پژوهشگران، روشی ابداع کردهاند که نورونهای موجود در شبکههایی که خصوصیات زبانی خاص را جذب میکنند، نشان میدهد.
شبکههای عصبی یاد میگیرند کارهای محاسباتی را با پردازش مجموعههای بزرگی از دادههای آموزشی اجرا کنند. این شبکهها در کاری مانند ترجمه ماشینی، دادههای زبانی تفسیر شده توسط انسان را به کار میبرند و ویژگیهای زبانی مانند واژهشناسی، ساختار جمله و معنی واژه را یاد میگیرند. هنگامی که متن جدیدی به این شبکهها ارائه میشود، آنها ویژگیهای یک زبان را با ویژگیهای زبان دیگر تطبیق میدهند و ترجمه را ارائه میکنند.
در هر حال، این شبکهها تنظیمات داخلی را طوری انجام میدهند که ابداعکنندگان از عهده تفسیر آنها برنمیآیند. این موضوع نشان میدهد که ابداع کنندگان نمیدانند که شبکه، کدام ویژگی زبانی را جذب میکند.
پژوهشگران در این بررسی جدید، روشی را توضیح دادند که فعالترین نورونها را در طبقهبندی ویژگیهای خاص زبانی نشان میدهد. آنها، ابزاری هم برای کاربران طراحی کردهاند که نحوه ترجمه متن را تحلیل میکند.
پژوهشگران در این بررسی، نورونهایی را مشخص کردند که برای طبقهبندی اطلاعاتی مانند واژههای مربوط به جنسیت، زمانهای گذشته و حال، اعداد ذکر شده در آغاز یا میان جملات و واژههای جمع و مفرد به کار میروند. آنها همچنین نشان دادند که انجام دادن برخی از کارها به نورونهای بسیاری نیاز دارد در حالی که برای برخی کارها، تنها یک یا دو نورون کافیست.
“یوناتان بلینکوف” (Yonatan Belinkov)، از نویسندگان این پژوهش گفت: هدف از انجام این پژوهش، بررسی شبکههای عصبی و اطلاعاتی است که این شبکهها یاد میگیرند. نتایج این پژوهش میتوانند به ما کمک کنند درک درستی از شبکههای عصبی داشته باشیم و آنها را بهتر کنترل کنیم.
این پژوهش، در نشست “انجمن پیشبرد هوش مصنوعی” (AAAI) ارائه شد.
انتهای پیام