تبلیغات
زبان شناسی همگانی - از آسمان سگ و گربه می بارد: گوگل و امپریالیسم زبان (لوموند دیپلماتیک: ژانویه 2015)
 
زبان شناسی همگانی
درباره وبلاگ


سایت زبان شناسی همگانی در جهت گسترش و معرفی رشته زبان شناسی همگانی آغاز به کار کرد
rezasalimi18@yahoo.com

مدیر وبلاگ : رضا سلیمی
مطالب اخیر
نویسندگان
فردریک کاپلان و دانا کیانفر برگردان شیرین روشار

در آغاز ماه دسامبر گذشته، هر کس که از گوگل ترانسلیشن معادل ایتالیائی اصطلاح «این دختر زیباست» را می خواست، ترجمه عجیبی دریافت می کرد : «Questa ragazza è abbastanza»، یعنی «این دختر نسبتاً است». زیبائی «was lost in translation» - در طول ترجمه گم شده بود. چگونه امکان دارد که یکی از کارآمدترین مترجمین اتوماتیک دنیا، که دارای مخزن زبانی منحصر به فرد شامل میلیاردها جمله است، بتواند مرتکب چنین اشتباه ناشیانه ای بشود؟ پاسخ ساده است : از زبان انگلیسی می گذرد. «زیبا» را می توان «pretty» ترجمه کرد، که هم به معنای «زیبا» است و هم «نسبتاً». معنای دوم معادل واژه ایتالیائی «abbastanza» است.

یک بار که با این اصل آشنائی پیدا کردیم، به راحتی می توانیم جمله های عجیب و غریب و اغلب بامزه بسازیم. جمله «به نظر من شما یک رئیس جمهور فوق العاده دارید» می شود «Penso che tu abbia una bella sedia» یعنی : «به نظر من تو یک صندلی زیبا داری»، چون «رئیس جمهور» را به انگلیسی می توان «chair» نیز ترجمه کرد. استفاده از زبان انگلیسی به عنوان زبان محور گاه موجب تعبیرات نادرست می شود. ترجمه جمله ایتالیائی«Hai fatto un compito terrificante»، یعنی «تو مشق ات را افتضاح انجام داده ای»، با گوگل و با مداخله واژه انگلیسی «terrific» چنین می شود : «شما یک کار محشر انجام داده اید»؛ اصطلاح گویشی «مثل دم اسب باران می بارد» تبدیل می شود به یک جمله بسیار شاعرانه «Piove gatti e cani» - از آسمان سگ و گربه می بارد. این جمله که ترجمه ای  است از «It’s raining cats and dogs»، برای یک ایتالیائی کاملاً نامفهموم به نظر می آید.

برای تدوین یک مترجم اتوماتیک، می بایست مجموعه های بزرگ از متون همانند ترجمه شده از یک زبان به زبانی دیگر در اختیار داشت. گوگل، به عنوان یک مؤسسه آمریکائی، به طور منطقی ابزار خود را بر پایه متون جفت  که تقریباً همیشه از انگلیسی به عنوان زبان محور استفاده می کنند بنا کرده است. با این وصف، برای برگردان از زبان فرانسوی به ایتالیائی، می بایست «با معادل آن»، از یک ترجمه انگلیسی واسطه رد شد. این طرز عمل دخالت های زبانی قابل ملاحظه ای را موجب می شود. زبان فرانسوی و ایتالیائی نسبتاً به هم نزدیک هستند. در مقایسه، انگلیسی یک زبان مختص است، فشرده و پر از فرمولهای گویشی. درک نادرست متن راه را بر اشتباهات بیشمار می گشاید.  فرستادن یک اصطلاح به سوی فضای انگلیسی و سپس بازفرستادن آن به سوی زبان مقصد، موجب نوآوری های زبانی غیرارادی می گردد.

این  ترکیبات عجیب و غریبی که برنامه های ترجمه اتوماتیک تولید می کنند می توانند فکاهی به نظر بیایند. اصولاً ترجمه به طور کلی و ترجمه اتوماتیک به ویژه، مشکلات آشکاری را پیش رو قرار می دهند. با این وصف، چگونه می توان از اینکه ماشین اشتباه بکند تعجب کرد؟ وانگهی، این اشتباهات یک مزیت هم دارند؛ ما را وامی دارند تا درباره ویژگی هر زبان بیشتر بیاندیشیم. و در نهایت، رشد و تحول مجموعه متون دوزبانه ای که بتواند ما را از میانجیگری زبان انگلیسی برحذر کند، ونیز تصحیحاتی که خود کاربران انجام می دهند، باعث بهبود ترجمه ها خواهد شد. شاید غلط های عنوان شده در این مقاله، تاکنون تصحیح شده باشند، یعنی در لحظه ای که مقاله به زیر چاپ می رود – اصطلاحی که گوگل به زبان اسپانیائی چنین ترجمه می کند : «vamos a presionar»، یعنی «ما فشار خواهیم داد». آیا بایست واقعاً نگران این پدیده بود؟

برای دریافتن تأثیرات واقعی زبان انگلیسی به عنوان زبان محور، می بایست ترجمه اتوماتیک را در زمینه ای گسترده تر قرار داد یعنی در زمینه متونی که از آلگوریتم های  موجود برروی اینترنت استفاده می کنند. این برنامه های انفورماتیک نه تنها موجب ابداعات زبانی در زمینه ترجمه های اتوماتیک می شوند، بلکه برای تدوین اتوماتیک مقاله های مطبوعاتی، تصحیح محتوای صفحات ویکی پدیا از لحاظ نحوی و معنائی، تولید پیام های بازرگانی هدفدار یا بهبود محتوای یک صفحه وب برای سهولت بخشیدن به  اندکس کردن آن از سوی موتورهای جستجو  نیز از آنها استفاده می شود.

در نتیجه، چگونه می توانیم منابع زبانی دست اول که به دست انسان بدون میانجیگری آلگوریتم (مکالمات کتبی، محتوای کتابهای الکترونیک و غیره) تهیه شده اند را از منابع دست دوم ، که از دگرگونی های آلگوریتمی منابع دست اول به دست آمده اند، تشخیص دهیم ؟

با فراگیرشدن عمل تکمیل خودکار در بسیاری از رابط های کاربری (ایتنرفیس) – کاربر شروع یک اصطلاح را تایپ می کند، و برنامه ای به طور خودکار جمله را تکمیل می کند -، زمانی که متنی را آنلاین می نویسیم، آلگوریتم ها به واسطه هائی تقریباً سیستماتیک تبدیل شده اند. در بسیاری موارد، دیگر متون خود را حرف به حرف یا کلمه به کلمه تایپ نمی کنیم : بلکه به انتخاب از میان چندین پیشنهاد ممکن آلگوریتم اکتفا می کنیم. این طرز نگارش سرعت و کارآئی را یک جا جمع می کند مخصوصاً در مواردی که از صفحه کلید کوچک تلفن همراه استفاده می کنیم. در این چهارچوب جدید، نوشتن فقط در انتخاب سریع مسیری در نمودار اصطلاحات پیش بینی شده خلاصه می شود. تا چند سال دیگر، بدون شک یافتن رابط کاربری (اینترفیسی) که این تکنولوژی را به کار نگیرد دشوار خواهد بود.

مانند دیگر منابع دست دوم، متونی که به وسیله آلگوریتم ها توسط مترجمین اتوماتیک تهیه می شوند الزاماً به عنوان دست دوم شناسائی و برچسب نخواهند خورد. برعکس، اغلب خود را به عنوان منابع طبیعی دست اول معرفی خواهند کرد که خوانندگان می توانند احتمالاً به صورت نمونه از آن استفاده کنند. هیچ دلیلی ندارد کاربری که ایتالیائی زبان مادری اش نیست، اصطلاح «Piove gatti e cani» را غلط به حساب آورد. این نکته خیلی بیشتر در مورد آلگوریتم هائی که ساختار یک زبان را از غربال رد می کنند تا به شکل مصنوعی متونی جدید تولید کنند صادق است. آلگوریتمی که برای بهبود ظرفیت ترجمه اش در جستجوی یک منبع دست اول است، می تواند اشتباهاً از متنی که توسط آلگوریتم دیگری تهیه شده و حاوی معانی غلط و دوستان دروغین است، استفاده کند.

فراگیر شدن منابع «آلوده» توسط اتومات ها بر روی اینترنت، مجموع یک بنای تکنولوژیک را تهدید می کند که برای مقدار انبوه داده ها مزیت بیشتری قائل است تا کنترل سیستماتیک کیفیت آنها. از هم اکنون، نمونه های بیشماری از اصطلاحات عجیب و غریب روی وب می بینیم. روی سایت مغازه آنلاینی که آپل نرم افزارهای خود را می فروشد (Apple Store)، به طور مثال این کامنت ها را در مورد نرم افزار کاربردی (اپلیکیشن)  که با آن می توان در حین راه رفتن پیام تایپ کرد می خوانیم ...«استفاده غریزی، نتایج زیبا و از نو سر حال. مرسی از کسی که درست کرده آن را! واقعاً با حال است و توصیه می کند». کمی دورتر، کامنت دیگری از قرار معلوم با برخی از عجایب زبانی اولی همصدا شده : «به من کمک می کند وارد کنم متن را افقی و عمودی، بفرستم پیام های اس ام اس، بفرستم ایمیل، بفرستم پیام روی توئیتر و فیس بوک... بامزه است، مرسی از شما!»

این جمله هائی که ترکیبات عجیب آلگوریتم ها در بر دارند می توانند  در مرحله دوم به عنوان نمونه  برای خدمات متون واسطه ای به کار آیند که مثلاً پیشنهاد می کنند اصطلاحی که در حال تایپ آن هستید را به طور اتوماتیک تکمیل کنند. هیچ بعید نیست که در چند سال دیگر، یک ایتالیائی که جمله ای را با واژه «Piove …» شروع بکند، دستگاه به او ادامه اش را «Piove gatti e cani» پیشنهاد کند، اصطلاحی که احتمالاً در کل تاریخ زبان ایتالیائی هرگز نه نوشته شده و نه به زبان آمده است.

به این ترتیب، زبان انگلیسی محور، بالقوه سهمی در نوعی پدیده اختلاط زبانی دارد : شکل گیری یک زبان جدید بر پایه تغییر شکل دیگر زبان های قدیمی تر در اثر استفاده، پدیده ای بسیار شناخته شده نزد زبان شناسان. در حال حاضر، تغییرات وارده از طریق میانجیگری آلگوریتمی، بین دو سیستم زبان شناسی نوعی زبان یدکی را تشکیل می دهد، نوعی زبان تماس، بالقوه ناپایدار. اما، در حالی که نسلی جدید در معرض این اصطلاحات دگرگون شده قرار می گیرد، این خطر وجود دارد که ابداعات در قالب زبانی منسجم و مستقل، یک زبان مختلط، شکل قانونی پیدا کنند. تحولی که میانجیگری  رابط های کاربری (اینترفیس) جدید می تواند به آن سرعت بخشد، همان زبان های مصنوعی نزدیک به اصل که دارای قابلیت تأثیرگذاری شدید بر گونه های بیانی آینده هستند.

بدین سان، امپریالیسم زبانی انگلیسی تأثیراتی بسیار حساس تر از آنچه که  رویکردهای متمرکز بر «جنگ زبان ها» القا می کنند، به وجود می آورد. در واقع، چرخیدن به دور محور تنها یک زبان، موجب می شود که در تمامی زبان های دیگر منطق های زبانی مختص آن زبان و سپس، به تدریج، روش های اندیشه بخصوص آن را وارد کنیم. این پدیده همچنین می تواند سبب یک دگرگونی زبانی کلی شود که در آن آلگوریتم ها نقش کلیدی را به عهده دارند. اگر زبان انگلیسی به عنوان واسطه در میان زبان های اروپائی عمل می کند، بدون شک زبان هائی دیگر هستند که همین موقعیت را در حوزه های زبانی دیگر اشغال می کنند (مانند زبان هندی). به این ترتیب، شبکه ای از ترجمه زنجیره ای که با ارجاع به زبان های واسطه ای متعدد عمل می کند در سطح جهانی به وجود می آید.

چه کسی در پنج سال آینده هنوز منابع دست اول خالص تولید خواهد کرد؟ تا کی صبر خواهیم کرد پیش از آنکه اولین ابداعات آلگوریتمی به عنوان گونه های طبیعی تلقی شوند؟ این طرز نگارش های دورگه مطالعه ای دقیق می طلبند. و شاید به وجود آمدن یک علم زبان شناسی نوین که بطور انبوه از آلگوریتم ها استفاده کند، برای بهتر فهمیدن و زیر نظر داشتن تأثیرات آلگوریتم ها...

نوشته : فردریک کاپلان و دانا کیانفر

(به نوبت مسئول و دانشجوی دکترای آزمایشگاه دیجیتال هومانیتیز مدرسه پلی تکنیک فدرال لوزان سوئیس)

 





نوع مطلب :
برچسب ها :
لینک های مرتبط :
 
لبخندناراحتچشمک
نیشخندبغلسوال
قلبخجالتزبان
ماچتعجبعصبانی
عینکشیطانگریه
خندهقهقههخداحافظ
سبزقهرهورا
دستگلتفکر


آمار وبلاگ
  • کل بازدید :
  • بازدید امروز :
  • بازدید دیروز :
  • بازدید این ماه :
  • بازدید ماه قبل :
  • تعداد نویسندگان :
  • تعداد کل پست ها :
  • آخرین بازدید :
  • آخرین بروز رسانی :