محققان فیس بوک برای ترجمه بهتر از ریاضیات استفاده می کنند
طراحان ابزار ترجمه ماشینی هنوز بیشتر به فرهنگ لغت متکی هستند تا زبان خارجی را قابل فهم کنند. اما اکنون یک روش جدید وجود دارد: اعداد.
محققان فیس بوک می گویند: واژگان به صورت چهره ها و سوء استفاده از شباهت های ریاضی بین زبان ها یک راه امیدوار کننده است - حتی اگر یک ارتباط دهنده جهانی a La Star Trek یک رویای دور باشد.
ترجمه اتوماتیک قدرتمند برای غول های اینترنتی یک اولویت بزرگ است. اجازه دادن به هرچه بیشتر مردم در سراسر جهان برای برقراری ارتباط فقط یک هدف نوع دوستانه نیست ، بلکه تجارت خوبی نیز خواهد بود.
فیس بوک ، گوگل و مایکروسافت و همچنین Yandex روسیه ، Baidu چین و دیگران به طور مداوم به دنبال بهبود ابزار ترجمه خود هستند.
فیسبوک در یکی از آزمایشگاههای تحقیقاتی خود در پاریس ، از کارشناسان هوش مصنوعی مشغول کار است.
آنتوان بوردز ، مدیر اروپایی تحقیقات بنیادی هوش مصنوعی برای شبکه های اجتماعی گفت: در حال حاضر حداکثر 200 زبان در فیس بوک استفاده می شوند.
ترجمه خودکار در حال حاضر مبتنی بر داشتن پایگاه داده های بزرگ متون یکسان در هر دو زبان برای کار از آن است. اما برای بسیاری از زوج های زبانی فقط چنین متون موازی کافی نیست.
به همین دلیل محققان به دنبال روش دیگری مانند سیستم توسعه یافته توسط فیس بوک هستند که نمایشی ریاضی برای کلمات ایجاد می کند.
هر کلمه در فضایی چند صد بعدی به "وکتور" تبدیل می شود. کلماتی که ارتباط تنگاتنگی با زبان گفتاری دارند نیز در این فضای برداری خود را نزدیک به یکدیگر می دانند.
از باسک گرفته تا آمازونی؟
Guillaume Lample یکی از سیستم ها گفت: "برای مثال ، اگر از کلمات" گربه "و" سگ "استفاده کنید ، آنها کلماتی هستند که یک چیز مشابه را توصیف می کنند ، بنابراین از نظر جسمی بسیار نزدیک به هم خواهند بود." طراحان
"اگر شما کلماتی مانند مادرید ، لندن ، پاریس را که پایتخت اروپا هستند ، بنویسید ، همان ایده است."
این نقشه های زبانی سپس با استفاده از الگوریتم ها می توانند به یکدیگر پیوند داده شوند - ابتدا تقریباً اصلاح می شوند ، اما در نهایت بیشتر تر می شوند ، تا اینکه کل عبارات بدون خطاهای خیلی زیاد همسان شوند.
نمونه گفت نتایج قبلاً امیدوار کننده است.
لمپ گفت: برای زوج زبانی انگلیسی-رومانیایی ، سیستم ترجمه فعلی ماشین فیس بوک "برابر یا شاید کمی بدتر" از سیستم وکتور کلمه است.
وی گفت ، اما برای زوج های نادر انگلیسی و اردو که سیستم سنتی فیس بوک متون دو زبانه زیادی را برای مراجعه به آنها ندارد ، سیستم بردار کلمه از قبل برتر است.
اما آیا روش می تواند اجازه ترجمه مثلاً از باسک به زبان یک قبیله آمازونی را بدهد؟
در تئوری ، بله ، گفت ، لامپ ، اما در عمل به تعداد زیادی از متون نوشتاری برای نقشه برداری زبان نیاز است ، چیزی که در زبان قبایل آمازونیایی فاقد آن است.
وی گفت: "اگر شما فقط ده ها هزار عبارت دارید ، این کار نمی کند. شما به صدها هزار نفر نیاز دارید."
'جام مقدس'
کارشناسان مرکز ملی علمی CNRS فرانسه گفتند که رویکردی که Lample برای فیس بوک در نظر گرفته است می تواند نتایج مفیدی را به بار آورد ، حتی اگر به ترجمه های کامل منجر نشود.
تیری Poibeau از آزمایشگاه شبکه CNRS ، همچنین تحقیقات مربوط به ترجمه ماشین را انجام می دهد ، واژه رویکرد بردار را "یک انقلاب مفهومی" نامید.
وی گفت: "ترجمه بدون داده موازی" - لغت نامه ها یا نسخه های اسناد مشابه در هر دو زبان - "چیزی از کتاب مقدس" ترجمه دستگاه است.
Poibeau گفت: "اما سوال اینجاست که از چه سطح عملکردی می توان انتظار داشت" از روش وکتور کلمه.
روش "می تواند ایده ای را از متن اصلی ارائه دهد" اما توانایی ترجمه خوب هر بار اثبات نشده است.
فرانسوا ایوون ، محقق آزمایشگاه علوم رایانه و مهندسی CNRS در مکانیک و علوم مهندسی ، گفت: "هنگامی که آنها از یکدیگر دور شوند" پیوند زبانها بسیار دشوارتر است ".
وی افزود: "نحوه بیان مفاهیم به زبان چینی کاملاً متفاوت با فرانسوی است."
با این وجود حتی ترجمه های ناقص می تواند مفید باشد ، و می تواند برای ردیابی سخن از نفرت ، که یک اولویت اصلی برای فیس بوک است ، اثبات شود.