BigEdu.ru
» » » Семантико-синтаксична модель автоматичного перекладу
Вернуться назад

Семантико-синтаксична модель автоматичного перекладу

Національний університет "Києво-Могилянська Академія"

Департамент Коп‘ютерних Технологій

Кафедра інформатики

Семантико-синтаксична модель автоматичного перекладу

Контрольна робота з курсу
"Лінгвістичне забезпечення інтелектуальних систем"
за осінній триместр 1999/2000 н. р.р.
студентів ДКТ-5

Підгорного Свєтослава,
Сігаєвої Марини

Викладач:
доц. Штерн Ірен Борисівна

Київ
1999

План

1. Система французько-російського автоматичного перекладу

2. Етапи роботи системи:

a) підготовка тексту та графематичний аналіз;

b) морфологічний аналіз;

c) попередній синтаксичний аналіз;

d) синтаксичний аналіз;

e) семантичний аналіз;

3. Підготовка до синтезу й синтез;

4. Висновки

5. Література

Система французько-
російського
автоматичного
перекладу

Розглянемо автоматичний переклад на прикладі системи ФРАП (французько-російського автоматичного перекладу). Розробка цієї системи стала значним кроком вперед у розвитку систем автоматичного перекладу.
Система ФРАП складається з чотирьох компонентів – графематичного, морфологічного, синтаксичного та семантичного. Повний аналіз має проходити через усі чотири компонента, синтез – через три (без графематичного).
Головний компонент у системі – семантичний, він визначає структуру та межі всіх інших компонентів. Основою семантичного компоненту є спеціально розроблена семантична мова. Але система ФРАП не досягає повного розуміння тексту. Реально досяжні границі розуміння обмежено в рамках одного окремого речення. Тобто відсутнє звертання до змісту інших речень чи до енциклопедій відповідної галузі знань.

Етапи роботи
системи

При роботі система ФРАП проходить етапи графематичного, морфологічного, попереднього синтаксичного, синтаксичного та семантичного аналізу. Розглянемо детальніше роботу на кожному з етапів.

Підготовка тексту та
графематичний аналіз

Деякі особливості реального тексту можуть створювати значні проблеми при автоматичному перекладі. Як-то: наявність різного роду формул, схем, креслень, діаграм тощо. Найкраще рішення – опустити їх при подальшому аналізі, залишивши в тексті спеціальну позначку, а потім вставити у відповідні місця при синтезі вихідного тексту.
Крім того, слід виділити різного роду посилання (на інші сторінки, приклади, малюнки тощо). Вони не входять в структуру речення, а їх значення можливо доведеться змінити у вихідному тексті перекладу.
Може виявитися, що реальний текст є складно-організованою структурою, тобто в нього можуть бути вставлені інші тексти (анотація, зміст, виноски, підписи до малюнків, цитати, бібліографія). Деякі з таких текстів доведеться прив‘язати до певних елементів (наприклад, підписи до малюнків), деякі передрукувати у вихідному тексті без перекладу (бібліографія).

Отже, для того, щоб врахувати властивості реального тексту потрібно ввести етап графематичного аналізу. Крім вже зазначених дій графематичний аналіз визначає та перевизначає границі слів. Так від слів відділяються розподільники, що стояли поруч: лапки, дужки, крапки, коми. Проводиться обробка слів, що пишуться через дефіс або апостроф. Формується гіпотетична морфолого-синтаксична та семантична інформація для слів-формул: наприклад, 25-ий буде представлено як слово 25 з підкласом "порядковий числівник" і семантичною характеристикою "квантор (25, х)", що дозволить йому далі брати участь у синтаксичному та семантичному аналізі.

Морфологічний аналіз

Морфологічний аналіз проводиться двічі: для слів, основи яких знайдено у словнику, та для слів, основи яких не знайдено. Морфологічний аналіз полягає у виявленні інформації про форму даного слова за його закінченням, яке залишилося після відсікання основи. Якщо ж слово непізнане, то на основі аналізу його кінцевих літер формується гіпотетична інформація щодо класу, до якого воно може належати. Також проводиться попереднє зняття морфологічної омонімії на основі розгляду лінійного контексту.

Попередній синтаксичний
аналіз

Оскільки головним завданням семантичного компоненту є інтерпретація вузлів та зв'язків синтаксичної структури, вузли синтаксичної структури повинні максимально наближатися до одиниць семантичної структури. Це означає, що вузлами синтаксичної структури повинні бути лише повнозначні слова, а не допоміжні слова чи службові частини мови. Завдання попереднього синтаксичного аналізу й полягає в тому, щоб утворити вузли майбутньої синтаксичної структури. Для цього використовують техніку локального аналізу. В один вузол збираються звороти на основі спеціального словника зворотів. В один вузол збираються також аналітичні граматичні дієслівні комплекси. При цьому вузол представлено повнозначним словом комплексу, а вся інформація щодо часу, числа, особи, наявності заперечення тощо переходить в інформацію до вузла. Також утворюються іменні вузли, де інформація про прийменник, артикль, детермінатив стає частиною інформації про вузол.

Синтаксичний аналіз

Теоретичною основою синтаксичного аналізу є граматика членів речення. Крім граматики до засобів аналізу також належа

Внимание, отключите Adblock

Вы посетили наш сайт со включенным блокировщиком рекламы!
Ссылка для скачивания станет доступной сразу после отключения Adblock!

Скачать
Рефераты по английскому языку Національний університет "Києво-Могилянська Академія" Департамент Коп‘ютерних Технологій Кафедра інформатики Семантико-синтаксична
Оценок: 1012 (Средняя 5 из 5)

Наверняка у вас есть товары или услуги, продажа которых приносит вам максимальную прибыль. Для быстрого старта в сети вам необходимо создание посадочной страницы (одностраничного сайта), на которой будет размещена информация о маржинальных товарах/услугах интернет магазина. За 8 лет опыта разработки конверсионных страниц мы выработали оптимальную структуру, которая позволит привлекать через landing page больше продаж. На такую структуру «одевается» ваш контент — фирменный стиль, тексты, фотографии, уникальные торговые предложения, после чего страница выходит в свет. Разработка лендинга и запуск в сети — до 7 рабочих дней. Стоит отметить, что в разработку самой посадочной страницы входит и написание копирайтером продающих текстов для вашего бизнеса, чтобы каждый посетитель страницы захотел совершить покупку именно у вас. Результат: качественно разработаная продающая посадочная страница, которая готова приносить вам новых клиентов.

© 2016 - 2022 BigEdu.ru