Google AI مجموعه ای از داده ها را برای بررسی سوگیری جنسیتی در ترجمه ماشینی معرفی می کند

[ad_1] از پیسانا فراری - سفیر کاپاستا در دهکده جهانی یک پست اخیر در وبلا

توسط HONARENEWS در 11 مرداد 1400
[ad_1]

از پیسانا فراری - سفیر کاپاستا در دهکده جهانی

یک پست اخیر در وبلاگ هوش مصنوعی Google در مورد سوگیری جنسیتی در ترجمه ماشینی یک تلاش بلند پروازانه اما معقول را اعلام می کند: ایجاد مجموعه داده بر اساس شرح حالات ترجمه شده ویکی پدیا. هدف از این مجموعه داده ها تجزیه و تحلیل خطاهای جنسیتی رایج در ترجمه ماشینی است. چرا ویکی پدیا؟ گوگل توضیح می دهد که چون آنها به خوبی نوشته شده اند ، از نظر جغرافیایی متنوع هستند ، شامل جملات زیادی هستند و به موضوعات شخص ثالث مربوط می شوند (و بنابراین شامل ضمایر زیادی هستند). زندگینامه های ویکی پدیا پتانسیل بالایی برای اشتباهات ترجمه متداول مربوط به جنسیت ارائه می دهد. آنها اغلب زمانی رخ می دهند که مقالات در جملات اولیه یک پاراگراف به صراحت به شخصی اشاره می کنند ، اما در جملات بعدی هیچ اشاره صریحی از شخص وجود ندارد. مثالهای ارائه شده در نشریه روشن است ، دامنه کار مشخص است ، ادعاها و اهداف غیر واقعی نیستند. گوگل تصریح می کند که این مجموعه بر روی موضوعی خاص در رابطه با سوگیری جنسیتی تمرکز دارد و قصد ندارد کل مسئله را پوشش دهد و قصد تعیین رویکرد بهینه برای مقابله با سوگیری جنسیتی را ندارد. هدف این مشارکت ، پیشرفت در این چالش در جامعه تحقیقاتی جهانی است.

تلاش های قبلی گوگل برای ترویج انصاف و کاهش سوگیری یادگیری ماشینی شامل ارائه ترجمه های زنانه و مردانه برای برخی از کلمات بی جنسیت در وب سایت Google Translate است. از نظر تاریخی ، او تنها یک ترجمه را در صورت درخواست ارائه کرده است ، حتی اگر ترجمه می تواند زن یا مرد باشد. بنابراین هنگامی که مدل ترجمه ای ارائه می دهد ، ناخواسته ترجیحات جنسیتی موجود را بازتولید می کند. به عنوان مثال: او مردان را برای کلماتی مانند "قوی" یا "دکتر" و زنان را برای کلمات دیگر مانند "پرستار" یا "زیبا" تحریف می کند. در مقاله ای برای وبلاگ ما با عنوان "آیا ما در مسیرهای کلیشه ای و ترجیح جنسیتی در محیط های آنلاین دنبال می کنیم؟" ، رهبر پروژه CApStAn ، امل اینس ، ترک ، نمونه های گویایی از زبان خود ارائه کرد. در زبان ترکی ، هیچ تفاوتی بین مردان یا زنان در ضمیر "o" از شخص سوم وجود ندارد ، که می تواند برای زنان و مردان استفاده شود. ترجمه محتوای ترکی منجر به: O ilginc، جالب است؛ ای مهندس آبجو ، او یک مهندس است. O bir ahci ، او آشپز است. ای دکتر ، او پزشک است. امل در مقاله خود توضیح می دهد که چگونه تعصب در برخی از زبانها بیشتر از سایر زبانها قابل توجه است و چگونه این لزوما بازتاب نگرشهای جنسیتی در فرهنگ بومی زبان مبدا نیست ، بلکه ممکن است صرفاً نتیجه گرامرهای مختلف باشد. سیستم ها به زبان های مختلف ادامه مطلب را در این لینک بخوانید

اعتبار عکس Shutterstock


[ad_2]
منبع
آخرین مطالب