ДИПЛОМНА РОБОТА


Скачати 1.15 Mb.
Назва ДИПЛОМНА РОБОТА
Сторінка 7/12
Дата 14.03.2013
Розмір 1.15 Mb.
Тип Диплом
bibl.com.ua > Література > Диплом
1   2   3   4   5   6   7   8   9   ...   12

ВИСНОВКИ
У період глобалізації суспільства в iнформацiйнiй практиці сформувалася очевидна проблема збільшення попиту на переклад науково-технічної, комерційної, ділової iнформацiї. Вiдповiддю на соціальний запит подолання мовного бар’єру було утворення в промислово розвинених країнах iндустрiї машинного перекладу.

В основі підходу до вирішення проблематики машинного перекладу має лежати певна класифiкацiя систем МП. Щодо участі у процесі перекладу та обсягу роботи системи МП поділяються на автоматизовані та автоматичні. В автоматизованих системах МП людина є обов’язковим учасником процесу перекладу, в той час як в автоматичних системах машина здійснює аналіз тексту оригіналу та синтез тексту перекладу, і сама робить переклад, який може бути використаний у вигляді iнформацiйного документу, котрий в деякій мiрi може замінити оригінал. Вiдповiдно до кiлькості мов, що їх “розуміє” система, розрізняють двомовні та багатомовні системи. У залежності від підходу, на основі якого виконується машинний переклад, СМП поділяються на статистичні (statistic) та традиційні системи, які ґрунтуються на використанні лінгвістичних правил (rule-based). У відповідності до лінгвістичного критерію СМП поділяються на системи, що реалiзують прямий переклад (direct translation); системи, якi базуються на трансферi (transfer approach); системи з мовою-посередником (interlingua approach).

Системи прямого перекладу будуються на використанні великих словників i порівняно простих алгоритмів морфологiчно-синтаксичного аналізу тексту-оригіналу i синтезу текста-перекладу. Ідея трансферу - впровадження в систему блока перетворення структури вхідного тексту у вiдповiдностi з правилами і нормами мови перекладу. Головна ідея систем з мовою-посередником - аналіз змісту тексту та його подання на спецiальнiй мовi, яка не залежить від будь-якої природної мови.

На сьогоднішній день найбільш відомими системами, які здатні перекладати тексти з англійської на українську мову є Google Translate Beta компанії Google і СМП Pragma 5.x компанії Trident Software. Ядро перекладу Pragma базується на СМП SYSTRAN 5, яка збудована на принципі трансфер-підходу. Головна проблема перекладу - багатозначність слів - вирішена двома способами. Перш за все - спеціальне маркування слів по тематичній спрямованості (близько сотні тематик). По-друге - об'єднання слів у фрази, які мають вищий пріоритет під час перекладу. Google Translate — це сервіс компанії Google, що дозволяє автоматично перекладати слова, фрази та web-сторінки з однієї мови на іншу. Використовується підхід статистичного машинного перекладу, у якому максимальна довжина контексту є 5 слів, а фрази - 6. Вона аналізує великі обсяги тексту (мільярди слів) на різних мовах, а також оригінали та переклади, зроблені професійними лінгвістами. Потім за допомогою спеціальних методик формується модель для перекладу тексту з однієї мови на іншу.

Комунікативний підхід до аналізу адекватності машинного перекладу дозволив дійти наступних висновків.

Функціонально-прагматична адекватність машинного перекладу є змінною категорією і може бути представлена трьома типами:

  • жанрово-тематична адекватність, коли від перекладу вимагається просто отримання знань про жанр тексту-оригіналу та його тематику;

  • адекватність інформативності, де домінантою перекладу є загальний зміст повідомлення, поданого у тексті-оригіналі;

  • семантико-синтаксична адекватність, коли від перекладу потрібна повна і точна передача смислового змісту.

Якість перекладу Google Translate і Pragma 5 приблизно однакова і обидві СМП можуть виконувати переклади із стовідсотковим рівнем жанрово-тематичної адекватності. Щодо адекватності інформативності, наш аналіз помилок показав, що при перекладі програми-перекладачі спотворюють зміст оригіналу на 50 відсотків і отриманий переклад не задовольняє у повній мірі вимоги реципієнта в отриманні релевантної інформації.

Проведений аналіз помилок на рівнях мови із залученням кількісних підрахунків дає змогу зробити висновок, що СМП не в змозі досягти семантико-синтаксичної адекватності і перекладачу для редагування перекладу в обов’язковому порядку треба звертатися до оригінального тексту.

Google Translate частіше підбирає правильні словесні і фразеологічні еквіваленти, хоча в той же час гірше справляється з побудовою граматично правильних речень. Це можна пояснити тим, що в базі даних цієї системи більше відповідностей, але контекст статистичної системи Google Translate становить лише 5 слів, пояснює складність побудови системою граматично правильних речень.

При перекладі довгих речень, якщо Google Translate допустив помилку на початку, він може не допустити помилку в кінці, причому з більшою ймовірністю, ніж Pragma 5, яка в таких випадках спотворює все речення, намагаючись узгодити першу частину з помилкою з другою частиною. При цьому частіше всього помилка переноситься також і на другу частину. Причиною більшості помилок в машинному перекладі є нерозуміння тексту системою МП, так як розуміння вихідного тексту є первинним етапом у процесі перекладу, а, відповідно, й основою правильного викладу його на іншій мові.

Головною причиною “вiдторження” мови машиною є антропоморфізм мови, її повна зорiєнтованiсть на людину i, як наслідок, нерозуміння інформації автоматом, позбавленого “людського чинника”.

Так, ми бачили, що Google Translate має засоби розуміння, що дозволяють в деякій мірі розуміти фразовий рівень мови, тоді як Pragma 5 - синтаксичний. У той же час, виходячи з результатів аналізу, обидві СМП достатньо добре здатні розуміти тільки морфологічний рівень. Таким чином, можна зробити висновок про те, що РР даних СМП дорівнює одиниці.

Якість перекладу поліпшувалася останні 30-40 років в основному за рахунок збільшення швидкості обробки інформації та збільшення обсягів пам'яті, як оперативної, так і для зберігання даних, що дало можливість створювати об'ємні словники і швидше виконувати розроблені алгоритми.

Тоді як багато хто з лінгвістів взагалі сумнівається в можливості створення ідеальної СМП, математики, які не стикаються з усією складністю процесу перекладу, сповнені оптимізму, і продовжують намагатися створювати все більш складні моделі або покращити існуючі СМП.

СМП задовольняють якусь частину потреби користувачів в перекладі іноземних текстів, що створює потребу в них. В даний час адекватність перекладу СМП - це те, чого хотілося б досягти, але також і те, що не є обов'язковим для того, щоб СМП представляла дійсну матеріальну цінність для суспільства.

Адекватність перекладу сучасними СМП - це скоріше випадковість, ніж показник здатності СМП адекватно перекладати. Первісна проблема досягнення адекватності машинного перекладу полягає в нездатності людства на даному етапі розвитку створити ІС з вищим рівнем розуміння. В першу чергу це обумовлено тим, що ще ніхто не зміг пояснити механізмів обробки і структуру зберігання інформації в людському мозку.

Summary
Luk’yanov Ivan

Adequate machine translation problems.
The thesis of 5th year student of the Department of Linguistics (speciality 7.030507) for Specialist’s Degree. – Translation Studies. – Kremenchuk Mykhaylo Ostrogradskiy State Polytechnic University, Kremenchuk, 2009.

                                     

The thesis focuses on adequate machine translation problems taking into consideration different levels of adequacy and sets out the approaches to machine translation systems. It consists of an introduction, two chapters, conclusions, a list of references and 4 appendixes.

The object of the research are the translations made by the “Pragma 5” and “Google Translate” machine translation systems, which are evaluated and researched taking into account the information about the algorithms of translation systems, their grammar structure and vocabulary.

Actuality of this investigation is determined by the recent increase of the availability of translation systems to public, and therefore as more people use them, the problem of quality of the translations made by translation systems is faced more often now.

The purpose of this research – to study the quality of the translations made by translation systems and to show the main ways the translation systems do the translation, the problems related to those as well as possible ways of solving these issues.

The tasks of this research are as follows:

  • to observe the causes of machine translation appearing, modern development of machine translation systems and to generalize their typology in accordance with certain criteria;

  • to reveal the approaches to machine translation;

  • to find the adequate machine translation problems;

  • to discover and describe the main principles of the translation systems translating process on the basis of made by these systems translations analysis;

The scientific novelty of this research is determined by its purpose and targets, and is based on complex research and description of translating engines, in particular through researching the level of “understanding” of the text by the translating engines. Also, this is first time, when translation systems are classified by the level of their “understanding” of the translating text. This is first time, when the reasons of problems of translation from Ukrainian into English and contra versa are studied as well.

Factually of this thesis is based on the text of 17087 characters in English, and its translations into Ukrainian made by “Pragma 5”, “Google Translate” and professional translator.

This research uses several methods, which are as follows:

- Analytic-descriptive, that made possible to investigate the object of the research and to expose its structural-semantic features.

- Calculative, when the proportion of the number of mistakes in different translations of texts of varied difficulty was calculated;

- Induction, that makes possible to conclude about machine translation problems.

Communicative approach to the analysis of machine translation adequacy made possible to conclude, that functional-pragmatic adequacy of machine translation is a fluctuating category and can be represented by three types:

  • Genre-thematic adequacy, when translation is for getting information about the genre or/and the thematics of the source text.

  • Informative adequacy, when the dominating idea of translation is understanding of general contents of the message, presented in source text.

  • Semantic-syntactical adequacy, when translation is needed for exact transferring of original text sense contents.

The results of this research are as follows:

- The translated texts were analyzed;

- The levels of the adequacy of the translations were identified;

- The basic principles of the translation process of “Google Translate” and “Pragma 5” were identified;

- The possible reasons for low quality of the translated texts were identified;

- The attempt to classify the translation systems by the level of their “understanding” of the text was made;

- The possible ways to improve the quality of the translations made by translation systems were suggested.

Theoretical significance of this research is based on its input into the development and improvement of the translation engines. The idea of the levels of the “text understanding” was introduced and also the classification based on those has been proposed. The correlation of the quality of the translation and the “level of text understanding” was identified as well.

Practical significance of this research is based on the possibility of using this research for improving the translating engines; its help to find week places of the translation systems and eventually solve those. The results of the present research can be used as an additional study source for several courses, such as introduction to the linguistics, theoretical and practical translation, special courses on translating engines, and also it might be used by the users of the translation systems or people who are planning to purchase one, so they will know what to expect from it.

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ


  1. Анисимов В. Компьютерная лингвистика для всех: Мифы. Алгоритмы. Язык. К.: Наукова думка, 1991. – 208 с.

  2. Апресян Ю. Д., Жолковский А. К., Мельчук И. А. О системе семантического синтеза. III. Образцы словарных статей // НТИ. – сер. 2. – 1968. – №11 – С. 8 - 21.

  3. Апресян Ю.Д., Богуславский И.М., Иомдин Л.Л., Лазурский А.В., Перцов Н.В., Санников В.З., Цинман Л.Л. Лингвистическое обеспечение системы ЭТАП-2. М., Наука, 1989. - 295 с.

  4. Бархударов Л.С. Язык и перевод. М.: Междунар. отн-я, 1975. - 240 с.

  5. Бархударов Л.С. Тетради переводчика. Вып. 15. – М.: Международные отношения, 1978. – 112с.

  6. Бектаев К. Б, Пиотровский Р. Г. Математические методы в языкознании. // Ч. 1. - Алма-Ата: КазГУ, 1973. - 281 с.

  7. Березин Ф. М., Головин Б. Н. Общее языкознание. - М. : Просвещение, 1979. - 416 c.

  8. Блехман М.С. “Комп’ютерна лiнгвiстика”, монографія. – Харкiв:ХГУ. - 1997. – 153 с.

  9. Блехман М.С., Войнов В. К. Методы построения локальных АСНТИ. – Харьков: ХГУ. – 1989. – 106 с.

  10. Блехман М. С. Машинный перевод: история и реалии // Компьютерное обозрение. – 1996. – №5(29). – С. 22-23.

  11. Ванников Ю.В. Проблемы адекватности перевода. Типы адекватности, виды перевода и переводческой деятельности // Текст и перевод / Отв. ред. А.Д.Швейцер. – М.:Наука,1988. – С. 34-39.

  12. Вейценбаум Дж. "Понимание связного текста вычислительной машиной" гл. VII "Понимание связного текста вычислительной машиной", М., 1970. – 228 с.

  13. Виноградов В. А. Всегда ли система системна? // Система и уровни языка. — М., 1969. – С. 92-96.

  14. Войнов В. К., Блехман М.С. Состав, методики разработки и эффективность действующих систем машинного перевода.– Харьков: ХГУ. – 1989. – 245 c.

  15. Жолковский А. К., Мельчук И. А. О семантическом синтезе //Проблемы кибернетики. – Вып. 19. – 1967. – С. 177–238.

  16. Ивин А.А. Логика. Учебное пособие. Издание 2-е. - М.: Знание, 1998. – 240 с.

  17. Каде О. Проблемы перевода в свете теории коммуникации // Проблемы теории перевода в зарубежной лингвистике. - М., 1978. – С. 54-73.

  18. Кодухов В. И. Общее языкознание. — М., 1974. – 152 с.

  19. Колтун А.Я., Пшеничная Л.Э. Использование терминов заглавия для автоматического реферирования текста научного документа// Автоматическая обработка текста. Препринт 80-24 АН УССР, 1980. – N 24. – 29 с.

  20. Комиссаров В. Н. Слово о переводе. - М.: Международные отношения, 1973. – 215 с.

  21. Комиссаров В. Н. Смысловая стратификация текста как переводческая проблема // Текст и перевод. - М.: Наука, 1988. – С. 32-56.

  22. Комиссаров В.Н. Теория перевода (лингвистические аспекты). - М.: Высш. шк., 1990. – 253 с.

  23. Корунец И.В. Теорія і практика перекладу (аспектний переклад): Підручник. – Вінниця. «Нова книга», 2001 – 448 с.

  24. Кулагина О. С. Исследования по машинному переводу. - М.: Наука, 1979. – 320 с.

  25. Кулагина О.С. О современном состоянии машинного перевода // Математические вопросы кибернетики, вып. 3, М.: Наука, 1991. – С. 15-20.

  26. Латышев, Л.К. Технология перевода: учеб. пособие / Л.К. Латышев. - М.: Академия, 2005. – 317 с.

  27. Марчук Ю. Н. Проблемы машинного перевода. – М.: Наука, 1983. – 232 с.

  28. Марчук Ю.Н. Методы моделирования перевода/ Отв. ред. Р.Г. Пиотровский. - М.: Наука,1985. – 199 с.

  29. Марчук Ю.Н., Эволюция семантики экономической терминологии русского языка в XX веке. – М.: Московский государственный лингвистический университет. – 1989. – 175 c.

  30. Мороховський О. М. Про співвідношення понять мовлення — норма — система // Мовознавство. – М. — 1973. — № 1. – С. 32-49.

  31. Пинягин Ю. Н. Проблемы перевода // Тетради переводчика. Вып. 18. - М.: Международные отношения, 1981. – С. 35-43.

  32. Проблемы глубинной семантики (материалы к библиографическому справочнику). Части 1, 2. ИРЯ АН СССР. Проблемная группа по экспериментальной и прикладной лингвистике. Предварительные публикации. Вып. 67. М., 1975. – 54 с.

  33. Проблемы глубинной семантики (материалы к библиографическому справочнику). Части 1, 2. ИРЯ АН СССР. Проблемная группа по экспериментальной и прикладной лингвистике. Предварительные публикации. Вып. 32. М., 1972. – 45 с.

  34. Рецкер Я. И. Теория перевода и переводческая практика. - М.: Международные отношения, - 1974. – 216с.

  35. Семчинський С. Л. Загальне мовознавство. - К.: АТ „ОКО”, 1996. – 416 с.

  36. Сидоров Е. В. Системная модель коммуникации и параметры текста в переводе // Лингвистические проблемы перевода (Сб. статей). - М.: Изд-во Московского ун-та, 1981. – С. 57-88.

  37. Сыроваткин С.Н. Теория перевода в аспекте функциональной лингвистики. Калинин: Изд-во Калининского ун-та, 1978. – 374 c.

  38. Успенский Б. А. Отношение подсистем в языке и связанные с ними универсалии // Вопр. языкознания. — 1968. — № 6. – С. 148-167.

  39. Федоров А. В. Введение в теорию перевода. - М., 1953; 2-е изд., перераб. - М., 1958. – 376 с.

  40. Шаляпина З.М. Автоматический перевод: эволюция и современные тенденции // Вопросы языкознания, 1996. – No.2. – С. 105-117.

  41. Швейцер А.Д. Перевод и лингвистика. М.: Воениздат, 1973. – 185 с.

  42. Швейцер А.Д. Теория перевода: статус, проблемы, аспекты. - М.: Наука,1988. – 214 с.

  43. Юрченко О.В. и Блехман. М.С. Автоматизированное рабочее место переводчика-япониста. НТИ, сер.2, 1991. – № 1. – С. 18-21.

  44. Ahmad K. and Kugler. M., The Translator's Workbench: Tools & Terminology for Translation & Text Preprocessing in Europe. 04/1996 Springer-Verlag New York, Vol. 1. – 185p.

  45. Bennett, W.S. and Slocum J., "The LRC Machine Translation System," Computational Linguistics 11 (2-3), 1985. – pp. 111-121.

  46. Farwell D. and Wilks. Y. ULTRA: A Multilingual Machine Translator. Proceedings of the Machine Translation Summit III, 1991. – pp. 19-24.

  47. Hutchins J., The origins of the translator’s workstation. // Machine Translation, 13, 1998. – С. 287-307

  48. Jakobson R. On Linguistic Aspects of Translation // On translation. - Cambridge, MA: Harvard University Press, 1959. – pp. 232-239.

  49. Kushima H., Uchida H. Fujitsu's Machine Translation Systems. – Japan Computer Quarterly, 1986. – No. 64. – pp. 19-23.

  50. Lawson V. Aslib Proceedings 46(3), Aslib, March 1994 – No. 92. – pp. 83-87.

  51. Nirenburg S., Raskin V., and Tucker A. "The Structure of Interlingua in TRANSLATOR" in Machine Translation: Theoretical and Methodological Issues, Sergei Nirenburg, ed. NY: Cambridge University Press. 1987. – pp. 42-58.

  52. Slocum J. Machine Translation Systems: Survey and Selected Papers, ed. Jonathan Slocum. London: Cambridge University Press, 1987. – pp. 187-235.

  53. Status of Machine Translation (MT) Technology. Hearing before the Subcommittee on Science, Research and Technology of the Committee on Science, Space, and Technology, U.S. House of Representatives 101st Congress, Second Session, No. 153 (11 September 1990). Washington: U.S. Government Printing Office, 1990. – pp. 27-48.

1   2   3   4   5   6   7   8   9   ...   12

Схожі:

ДИПЛОМНА РОБОТА ТЕМА: ХУЛІГАНСТВО
Вступ
ДИПЛОМНА РОБОТА На тему: «День вчителя,вечеря на 40 осіб»
Характеристика бенкету
ДИПЛОМНА РОБОТА СПЕЦІАЛІСТА на тему: СПЕЦИФІКА МІЖНАРОДНОГО МАРКЕТИНГУ...

Дипломна робота
РОЗДІЛ ЗАРОДЖЕННЯ І СТАНОВЛЕННЯ СОЦІАЛЬНОГО СЛУЖІННЯ ЯК ОСОБЛИВОЇ ФОРМИ СУСПІЛЬНОЇ ДІЯЛЬНОСТІ
ДО ЗАХИСТУ
Дипломна робота містить сторінки, 27 таблиць, 18 рисунків, список використаних джерел із найменувань, додатків
ДИПЛОМНА РОБОТА
Професійна підготовка учнів старших класів засобами інноваційних технологій на уроках трудового навчання 1
ДИПЛОМНА РОБОТА
Органи прокуратури їх значення і роль у здійсненні контрольно-наглядових функцій державних органів влади в Україні
Дипломна робота з психології
Поняття адаптації, дезадаптації. Проблема соціальної адаптації молодших школярів
Дипломна робота на здобуття освітньо-кваліфікаційного рівня “спеціаліст”
Техніко – криміналістичне дослідження підроблених документів на право водіння, володіння і користування автотранспортом”
ДИПЛОМНА РОБОТА НА ТЕМУ: “ АНАЛІЗ КРИМІНОГЕННОЇ СИТУАЦІЇ В УКРАЇНІ
Фактори, що визначали стан, структуру та динаміку злочинності в 2001 р виглядають наступним чином
Додайте кнопку на своєму сайті:
Портал навчання


При копіюванні матеріалу обов'язкове зазначення активного посилання © 2013
звернутися до адміністрації
bibl.com.ua
Головна сторінка