|
Скачати 1.15 Mb.
|
ВИСНОВКИ У період глобалізації суспільства в iнформацiйнiй практиці сформувалася очевидна проблема збільшення попиту на переклад науково-технічної, комерційної, ділової iнформацiї. Вiдповiддю на соціальний запит подолання мовного бар’єру було утворення в промислово розвинених країнах iндустрiї машинного перекладу. В основі підходу до вирішення проблематики машинного перекладу має лежати певна класифiкацiя систем МП. Щодо участі у процесі перекладу та обсягу роботи системи МП поділяються на автоматизовані та автоматичні. В автоматизованих системах МП людина є обов’язковим учасником процесу перекладу, в той час як в автоматичних системах машина здійснює аналіз тексту оригіналу та синтез тексту перекладу, і сама робить переклад, який може бути використаний у вигляді iнформацiйного документу, котрий в деякій мiрi може замінити оригінал. Вiдповiдно до кiлькості мов, що їх “розуміє” система, розрізняють двомовні та багатомовні системи. У залежності від підходу, на основі якого виконується машинний переклад, СМП поділяються на статистичні (statistic) та традиційні системи, які ґрунтуються на використанні лінгвістичних правил (rule-based). У відповідності до лінгвістичного критерію СМП поділяються на системи, що реалiзують прямий переклад (direct translation); системи, якi базуються на трансферi (transfer approach); системи з мовою-посередником (interlingua approach). Системи прямого перекладу будуються на використанні великих словників i порівняно простих алгоритмів морфологiчно-синтаксичного аналізу тексту-оригіналу i синтезу текста-перекладу. Ідея трансферу - впровадження в систему блока перетворення структури вхідного тексту у вiдповiдностi з правилами і нормами мови перекладу. Головна ідея систем з мовою-посередником - аналіз змісту тексту та його подання на спецiальнiй мовi, яка не залежить від будь-якої природної мови. На сьогоднішній день найбільш відомими системами, які здатні перекладати тексти з англійської на українську мову є Google Translate Beta компанії Google і СМП Pragma 5.x компанії Trident Software. Ядро перекладу Pragma базується на СМП SYSTRAN 5, яка збудована на принципі трансфер-підходу. Головна проблема перекладу - багатозначність слів - вирішена двома способами. Перш за все - спеціальне маркування слів по тематичній спрямованості (близько сотні тематик). По-друге - об'єднання слів у фрази, які мають вищий пріоритет під час перекладу. Google Translate — це сервіс компанії Google, що дозволяє автоматично перекладати слова, фрази та web-сторінки з однієї мови на іншу. Використовується підхід статистичного машинного перекладу, у якому максимальна довжина контексту є 5 слів, а фрази - 6. Вона аналізує великі обсяги тексту (мільярди слів) на різних мовах, а також оригінали та переклади, зроблені професійними лінгвістами. Потім за допомогою спеціальних методик формується модель для перекладу тексту з однієї мови на іншу. Комунікативний підхід до аналізу адекватності машинного перекладу дозволив дійти наступних висновків. Функціонально-прагматична адекватність машинного перекладу є змінною категорією і може бути представлена трьома типами:
Якість перекладу Google Translate і Pragma 5 приблизно однакова і обидві СМП можуть виконувати переклади із стовідсотковим рівнем жанрово-тематичної адекватності. Щодо адекватності інформативності, наш аналіз помилок показав, що при перекладі програми-перекладачі спотворюють зміст оригіналу на 50 відсотків і отриманий переклад не задовольняє у повній мірі вимоги реципієнта в отриманні релевантної інформації. Проведений аналіз помилок на рівнях мови із залученням кількісних підрахунків дає змогу зробити висновок, що СМП не в змозі досягти семантико-синтаксичної адекватності і перекладачу для редагування перекладу в обов’язковому порядку треба звертатися до оригінального тексту. Google Translate частіше підбирає правильні словесні і фразеологічні еквіваленти, хоча в той же час гірше справляється з побудовою граматично правильних речень. Це можна пояснити тим, що в базі даних цієї системи більше відповідностей, але контекст статистичної системи Google Translate становить лише 5 слів, пояснює складність побудови системою граматично правильних речень. При перекладі довгих речень, якщо Google Translate допустив помилку на початку, він може не допустити помилку в кінці, причому з більшою ймовірністю, ніж Pragma 5, яка в таких випадках спотворює все речення, намагаючись узгодити першу частину з помилкою з другою частиною. При цьому частіше всього помилка переноситься також і на другу частину. Причиною більшості помилок в машинному перекладі є нерозуміння тексту системою МП, так як розуміння вихідного тексту є первинним етапом у процесі перекладу, а, відповідно, й основою правильного викладу його на іншій мові. Головною причиною “вiдторження” мови машиною є антропоморфізм мови, її повна зорiєнтованiсть на людину i, як наслідок, нерозуміння інформації автоматом, позбавленого “людського чинника”. Так, ми бачили, що Google Translate має засоби розуміння, що дозволяють в деякій мірі розуміти фразовий рівень мови, тоді як Pragma 5 - синтаксичний. У той же час, виходячи з результатів аналізу, обидві СМП достатньо добре здатні розуміти тільки морфологічний рівень. Таким чином, можна зробити висновок про те, що РР даних СМП дорівнює одиниці. Якість перекладу поліпшувалася останні 30-40 років в основному за рахунок збільшення швидкості обробки інформації та збільшення обсягів пам'яті, як оперативної, так і для зберігання даних, що дало можливість створювати об'ємні словники і швидше виконувати розроблені алгоритми. Тоді як багато хто з лінгвістів взагалі сумнівається в можливості створення ідеальної СМП, математики, які не стикаються з усією складністю процесу перекладу, сповнені оптимізму, і продовжують намагатися створювати все більш складні моделі або покращити існуючі СМП. СМП задовольняють якусь частину потреби користувачів в перекладі іноземних текстів, що створює потребу в них. В даний час адекватність перекладу СМП - це те, чого хотілося б досягти, але також і те, що не є обов'язковим для того, щоб СМП представляла дійсну матеріальну цінність для суспільства. Адекватність перекладу сучасними СМП - це скоріше випадковість, ніж показник здатності СМП адекватно перекладати. Первісна проблема досягнення адекватності машинного перекладу полягає в нездатності людства на даному етапі розвитку створити ІС з вищим рівнем розуміння. В першу чергу це обумовлено тим, що ще ніхто не зміг пояснити механізмів обробки і структуру зберігання інформації в людському мозку. Summary Luk’yanov Ivan Adequate machine translation problems. The thesis of 5th year student of the Department of Linguistics (speciality 7.030507) for Specialist’s Degree. – Translation Studies. – Kremenchuk Mykhaylo Ostrogradskiy State Polytechnic University, Kremenchuk, 2009. The thesis focuses on adequate machine translation problems taking into consideration different levels of adequacy and sets out the approaches to machine translation systems. It consists of an introduction, two chapters, conclusions, a list of references and 4 appendixes. The object of the research are the translations made by the “Pragma 5” and “Google Translate” machine translation systems, which are evaluated and researched taking into account the information about the algorithms of translation systems, their grammar structure and vocabulary. Actuality of this investigation is determined by the recent increase of the availability of translation systems to public, and therefore as more people use them, the problem of quality of the translations made by translation systems is faced more often now. The purpose of this research – to study the quality of the translations made by translation systems and to show the main ways the translation systems do the translation, the problems related to those as well as possible ways of solving these issues. The tasks of this research are as follows:
The scientific novelty of this research is determined by its purpose and targets, and is based on complex research and description of translating engines, in particular through researching the level of “understanding” of the text by the translating engines. Also, this is first time, when translation systems are classified by the level of their “understanding” of the translating text. This is first time, when the reasons of problems of translation from Ukrainian into English and contra versa are studied as well. Factually of this thesis is based on the text of 17087 characters in English, and its translations into Ukrainian made by “Pragma 5”, “Google Translate” and professional translator. This research uses several methods, which are as follows: - Analytic-descriptive, that made possible to investigate the object of the research and to expose its structural-semantic features. - Calculative, when the proportion of the number of mistakes in different translations of texts of varied difficulty was calculated; - Induction, that makes possible to conclude about machine translation problems. Communicative approach to the analysis of machine translation adequacy made possible to conclude, that functional-pragmatic adequacy of machine translation is a fluctuating category and can be represented by three types:
The results of this research are as follows: - The translated texts were analyzed; - The levels of the adequacy of the translations were identified; - The basic principles of the translation process of “Google Translate” and “Pragma 5” were identified; - The possible reasons for low quality of the translated texts were identified; - The attempt to classify the translation systems by the level of their “understanding” of the text was made; - The possible ways to improve the quality of the translations made by translation systems were suggested. Theoretical significance of this research is based on its input into the development and improvement of the translation engines. The idea of the levels of the “text understanding” was introduced and also the classification based on those has been proposed. The correlation of the quality of the translation and the “level of text understanding” was identified as well. Practical significance of this research is based on the possibility of using this research for improving the translating engines; its help to find week places of the translation systems and eventually solve those. The results of the present research can be used as an additional study source for several courses, such as introduction to the linguistics, theoretical and practical translation, special courses on translating engines, and also it might be used by the users of the translation systems or people who are planning to purchase one, so they will know what to expect from it. СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ
|
ДИПЛОМНА РОБОТА ТЕМА: ХУЛІГАНСТВО Вступ |
ДИПЛОМНА РОБОТА На тему: «День вчителя,вечеря на 40 осіб» Характеристика бенкету |
ДИПЛОМНА РОБОТА СПЕЦІАЛІСТА на тему: СПЕЦИФІКА МІЖНАРОДНОГО МАРКЕТИНГУ... |
Дипломна робота РОЗДІЛ ЗАРОДЖЕННЯ І СТАНОВЛЕННЯ СОЦІАЛЬНОГО СЛУЖІННЯ ЯК ОСОБЛИВОЇ ФОРМИ СУСПІЛЬНОЇ ДІЯЛЬНОСТІ |
ДО ЗАХИСТУ Дипломна робота містить сторінки, 27 таблиць, 18 рисунків, список використаних джерел із найменувань, додатків |
ДИПЛОМНА РОБОТА Професійна підготовка учнів старших класів засобами інноваційних технологій на уроках трудового навчання 1 |
ДИПЛОМНА РОБОТА Органи прокуратури їх значення і роль у здійсненні контрольно-наглядових функцій державних органів влади в Україні |
Дипломна робота з психології Поняття адаптації, дезадаптації. Проблема соціальної адаптації молодших школярів |
Дипломна робота на здобуття освітньо-кваліфікаційного рівня “спеціаліст” Техніко – криміналістичне дослідження підроблених документів на право водіння, володіння і користування автотранспортом” |
ДИПЛОМНА РОБОТА НА ТЕМУ: “ АНАЛІЗ КРИМІНОГЕННОЇ СИТУАЦІЇ В УКРАЇНІ Фактори, що визначали стан, структуру та динаміку злочинності в 2001 р виглядають наступним чином |