Дарчук Н. П. Комп’ютерна лінгвістика (автоматичне опрацювання тексту) : підручник / Н. П. Дарчук


Скачати 31.95 Kb.
Назва Дарчук Н. П. Комп’ютерна лінгвістика (автоматичне опрацювання тексту) : підручник / Н. П. Дарчук
Дата 19.05.2013
Розмір 31.95 Kb.
Тип Документи
bibl.com.ua > Література > Документи
РОЗМЕЖУВАННЯ І ПЕРЕКЛАД ДІЄСЛІВ ПАСИВНОГО СТАНУ В КОРПУСІ АНГЛІЙСЬКИХ ТЕКСТІВ

Смирнова Єлизавета Олегівна

Київський Національний Лінгвістичний Університет, Кафедра теоретичної і прикладної лінгвістики та української філології
Київ, Україна

[email protected]

В роботі реалізується процес розробки програми розмежування значень дієслів пасивного стану в англійському тексті і перекладу.

Розвиток новітніх технологій зробив можливим машинний переклад, тобто переклад, який побудовано на використанні машиною визначених та постійних для даного виду матеріалу відповідностей між словами та граматичними явищами різних мов.

Існують різні види машинного перекладу, а саме машинний переклад на базі паралельних корпусів, моделей перекладних відповідників і на основі диференційних ознак. Встановлено, що системи машинного перекладу на основі паралельних корпусів досягають найбільшої точності, отже було вирішено зупинитися саме на цьому виді.

Актуальність даної роботи полягає в тому, що вона здійснена на базі формальних диференційних ознак, які охоплюють всі форми англійського дієслова, і за допомогою створеної програми можна розробити модуль системи автоматичного морфологічного аналізу, автоматичного семантичного аналізу і машинного перекладу на підставі розмежування значення окремих дієслів пасивного стану.

За статистичними показниками було обрано дієслова англійської мови (surprise, call, dress, wash, know, remember, base, expect), які характеризуються найбільшою частотою вживання у пасивному стані, досліджено їх перекладні еквіваленти, розмежовано їхні значення, в результаті чого було вирішено зупинитися на перекладі 4 дієслів з найбільшою кількістю значень (call, dress, wash, base) і розроблено правила, за якими вони перекладаються. Також був розроблений алгоритм, за яким програма має розпізнавати форми дієслів пасивного стану, розмежовувати їхні значення і автоматично перекладати.

Встановленні диференційні ознаки дієслів пасивного стану можуть бути використані в системах аналізу тексту, а також для систем автоматичного морфологічного аналізу, розмітки корпусу текстів англійською мовою, кодування дієслівних форм пасивного стану та семантичного аналізу, що є важливим етапом у створенні систем машинного перекладу.

Література

  1. Дарчук Н.П. Комп’ютерна лінгвістика (автоматичне опрацювання тексту) : підручник / Н.П. Дарчук. – К.: Видавничо-поліграфічний центр «Київський університет», 2008. – С. 351.

  2. Марчук Ю.Н. Проблемы машинного перевода. – М. – 1983. – С. 233.

  3. Морфология английского глагола: система и функционирование: Справочник – Morphology of the English Verb: System and Functioning: Reference-book / Ред. В.И. Перебейнос. М.: РГГУ, 2008. – С. 545. +CD

  4. Никитина С.Е.. Формальный анализ страдательных конструкций в русском языке // Машинный перевод и прикладная лингвистика. – М. – 1961. – Вып. 6. – С. 100.

  5. Перебейнос В. И. Широкомасштабные лингвостатистические исследования в Украине / Проблеми квантитативної лінгвістики: збірник наукових праць. – Чернівці: Рута, 2005. – 352 с.

  6. Jurafsky D., Martin J. H. Speech and Language Processing / D. Jurafsky, J. H. Martin. – New Jersey: Prentice Hall, 2000. – P. 933.

  7. Lebedev K. Parallel Multi-Lingual Corpus of Spoken Language // Book of Abstracts. The six International Conference “Cultural research: Challenges for the 3rd Millennium”. Kyiv National Linguistic University. April 12-15 2010. – P. 12-13.

Схожі:

20. Методика навчання технології опрацювання графічних даних. Комп'ютерна...
Комп'ютерна графіка — це створення і обробка зображень (малюнків, креслень і т д.) за допомогою комп'ютера. Розрізняють два способи...
Технологія опрацювання графічних даних
Комп'ютерна графіка — це створення і обробка зображень (малюнків, креслень і т д.) за допомогою комп'ютера
УРОК ВСЕСВІТНЬОЇ ІСТОРІЇ В 6 КЛАСІ. Тема уроку
Обладнання: підручник, атласи, картки із завданнями, роздатковий матеріал, таблиці,ілюстрації до теми, комп’ютерна презентація
Технологія опрацювання текстових даних
Технологія опрацювання текстових даних. Системи опрацювання текстів. Засоби редагування та форматування текстів. Підготовка тексту...
Тема: «Сканери. Типи сканерів» Мета
Розповісти студентам, як здійснюється автоматичне введення документів в ПК. Дати класифікацію пристроїв введення сканерів, підкреслити...
Тема. Контрольна робота з теми Основи роботи з текстовою інформацією та комп’ютерна графіка Мета
Мета: перевірка знань, умінь та навичок учнів з теми. Розвивати вміння застосовувати практичні навички опрацювання графічної інформації...
Дисципліна "Комп'ютерна схемотехніка" є однією з найважливіших дисциплін...
Тому "Комп'ютерна схемотехніка" є саме тою дисципліною, матеріал якої має підготувати студентів не тільки до розробки складних цифрових...
Основи комп’ютерної грамотності комп’ютерна графіка
Звертатись: вул. Набережна Леніна, 18 Центр консалтингу Дніпропетровського університету ім. А. Нобеля
Урок 1 Тема уроку. Продукти харчування, їх склад
...
КАЛЕНДАРНО-ТЕМАТИЧНИЙ ПЛАН з предмета «Інформатика і комп’ютерна...
Засоби створення електронного документа. Автоматизація введення інформації в комп'ютер
Додайте кнопку на своєму сайті:
Портал навчання


При копіюванні матеріалу обов'язкове зазначення активного посилання © 2013
звернутися до адміністрації
bibl.com.ua
Головна сторінка