8(8412)74-58-38
(с 10-00 до 20-00 МСК)
Зачётик.Ру - помогаем студентам в учёбе

У нас можно недорого заказать курсовую, контрольную, реферат или диплом

Главная / готовые работы / Дипломные работы / Литература и лингвистика

Особенности работы лингвиста-переводчика под влиянием машинного перевода - Дипломная работа

Содержание


Введение 3

ГЛАВА 1. Теоретические основы машинного перевода 6

1.1. Понятие машинного перевода 6

1.2. Потенциал применения машинного перевода 7

1.3. Системы машинного перевода: виды и особенности применения 9

1.3.1. Системы на основе лингвистических правил (RBMT) 9

1.3.2. Статистические системы (SMT) 10

1.3.3. Нейронные системы (NMT) 12

1.3.4. Гибридные системы (HMT) 13

1.4. Проблема качества машинного перевода 14

1.5. Проблема постредактирования машинного перевода 20

1.5.1. Виды постредактирования машинного перевода 21

1.5.2. Взаимосвязь пред- и постредактирования МП 24

1.5.3. Стратегии постредактирования МП 26

Выводы по главе 1 29

ГЛАВА 2. Сопоставительный анализ машинных и ручных переводов специальных текстов 32

2.1. Сравнительный анализ машинных и ручных переводов 32

2.2. Анализ полученных результатов исследования 55

Выводы по главе 2 61

Заключение 63

Список источников примеров 65

Список литературы 69

Введение (выдержка)

Машинный перевод (МП) стал новой реальностью в переводческой отрасли по всему миру. Спрос на услуги машинного перевода стремительно растёт благодаря нарастанию темпов глобализации и усилению международного сотрудничества. Несмотря на то, что многие игроки на рынке переводческих услуг активно внедряют машинный перевод в свою деятельность, возможности по предоставлению услуг по качественному машинному переводу даже у лидеров данной отрасли, тем не менее, все еще серьезно ограничены.

Актуальность темы ВКР заключается в том, благодаря растущей потребности в автоматизации переводческих процессов и востребованности высококвалифицированных услуг по машинному переводу, возникает закономерная необходимость в повышении качества машинного перевода. Несмотря на достигнутый за последние 30 лет значительный прогресс в сфере разработки и совершенствования систем машинного перевода, на данном этапе переводческий процесс не может быть полностью автоматизирован ввиду возможности получения перевода неудовлетворительного качества. Машинные переводы нуждаются в обязательной проверке и редактуре, т. е. постредактировании.

Одна из ключевых проблем, связанных с постредактированием МП, заключается в том, что данный процесс зачастую требует значительных временных и трудовых ресурсов переводчика. Выбор подходящих типов текста, грамотная настройка системы МП, знание о наиболее частотных ошибках машинного перевода и верная стратегия постредактирования могли бы существенно оптимизировать процесс постредактирования МП: сделать работу пост редактора эффективней и повысить качество выходного материла, чтобы оно могло бы быть сопоставимо с качеством профессионального перевода «с нуля».

Объект исследования – фрагменты машинных переводов специальных текстов экономической, политической и социокультурной направленности.

Предмет исследования – частотные ошибки МП.

Цель исследования – анализ современных проблем постредактирова-ния машинного перевода и сопоставительный анализ машинных и ручных переводов специальных текстов с целью выявления частотных ошибок МП.

Поставленная цель обуславливает решение следующих задач:

• раскрыть сущность таких понятий, как «машинный перевод» и «постредактирование машинного перевода»;

• проанализировать потенциал и ограничения применения МП в пере-водческой деятельности;

• проанализировать современные проблемы машинного перевода и постредактирования МП;

• провести сопоставительный анализ фрагментов машинных и ручных переводов специальных текстов;

• выявить наиболее частотные ошибки машинного перевода.

Гипотеза исследования: в машинных переводах специальных текстов экономической, политической и социокультурной направленности наиболее частотными являются лексико-семантические ошибки.

Теоретическая база исследования: научные работы и исследования А.Д. Андреевой, И.А. Борисовой, Е.Н. Барашко, А.А. Арестовой, А.А. Прохоровой, Н.А. Худякова, А.А. Гончарова, Ф.Б. Ситдиковой, Н.А. Крашенинниковой, Н.А. Панасенкова, А.Р. Жаворонковой, И.В. Переходько, С.В. Бездорожева и др.

В ВКР использовались следующие методы исследования: поисковый метод, методы анализа и синтеза, сравнительный метод, сопоставительный метод, метод классификации, описательный метод, конструктивный метод, количественный метод.

Материалы исследования – статьи англоязычных изданий The Economist, The New York Times, Bloomberg, UN News, Forbes, The Washington Post, The BBC и The Economic Times; материалы ECB и IMF.

Теоретическая значимость исследования состоит в освещении проблемы качества МП, анализе современных проблем постредактирования МП и разработке классификации частотных ошибок МП.

Практическая значимость исследования заключается в возможности использования результатов исследования для дальнейшей разработки алгоритмов систем МП и совершенствования стратегий по постредактированию МП.

Структура работы: работа состоит из введения, двух глав, заключения, списка источников примеров и списка литературы.

Основная часть (выдержка)

ГЛАВА 1. Теоретические основы машинного перевода

1.1. Понятие машинного перевода

Термин «машинный перевод» (МП) употребляется как в широком, так и узком смысле. В узком смысле машинный перевод – это процесс связанного перевода текстов компьютерной программой с одного естественного языка на другой [Андреева, 2013: 64].

Некоторые исследователи в своих дефинициях МП делают акцент на эквивалентности подобного перевода исходному тексту. Таким образом, машинный перевод – «это выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия» [Фролов, 2008: 127].

Европейская ассоциация машинного перевода (EAMT) дает следующее определение МП: «использование компьютера для перевода текста с одного естественного языка на другой язык» [Европейская ассоциация машинного перевода (EAMT)].

В толковом переводческом словаре Л.Л. Нелюбина дана следующая дефиниция машинного перевода – «процесс перевода текста с одного языка (естественного или искусственного) на другой (естественный или искусственный), осуществляемый на ЭВМ» [Нелюбин, 2009:10].

В некоторых исследовательских работах по МП можно также встретить термин «автоматический перевод». Оба термина – «машинный перевод» и «автоматический перевод» (но не «автоматизированный перевод») – являются равнозначными [Богуславский, 2005: 156]

В данном исследовании под машинным переводом понимают процесс связанного перевода текстов с одного естественного языка на другой с помощью системы машинного перевода (СМП).


1.2. Потенциал применения машинного перевода

Использование современных систем машинного перевода (СМП) значительно оптимизирует переводческий процесс и существенно повышает эффективность работы переводчика.

Применение МП предоставляет возможности для:

• общего ознакомления или ознакомления с интересующей информацией.

Перевод, сделанный в СМП, позволяет реципиенту сформировать общее представление о содержании и смысле текста любой направленности [Андреева, 2013: 64]. Если цель перевода – ознакомление с текстом в общих чертах или конкретной интересующей информацией, то с помощью СМП можно мгновенно получить черновой вариант перевода, который позволит решить эту задачу [Машинный перевод: исторический обзор и преимущества, PROMT].

• автоматической локализации.

Применение МП позволяет быстрорастущим компаниям выходить на международный рынок сбыта. С помощью современных СМП осуществляется перевод описаний товаров и услуг, интерфейсов и контента интернет-магазинов и торговых площадок, различного ПО, пользовательской и технической документации, интернет-форумов, компьютерных игр, мобильных приложений и сайтов международных компаний на родной язык потребителей [Андреева, 2013: 64]. Применение систем МП дает возможность быстро перевести большой объем информации, при этом сохранив единство стиля и терминологии при переводе повторяющихся документов [Машинный перевод: исторический обзор и преимущества, PROMT].

• оптимизации работы над переводом.

Перевод средствами современных СМП позволяет оптимизировать временные и трудовые ресурсы переводчика. Повышение эффективности переводческой деятельности достигается за счет использования специальных инструментов для работы с терминологией и большим набором настроек, которые позволяют задать необходимые параметры для перевода текстов разной тематики [Машинный перевод: исторический обзор и преимущества, PROMT].

Усиленная интеграция систем МП в профессиональную деятельность переводчиков обусловлена тем, что машинный перевод обладает целым рядом преимуществ:

• Высокая скорость и сокращенные сроки выполнения перевода.

Использование систем МП позволяет значительно сократить время выполнения перевода. Особенно это актуально для больших переводческих проектов [Борисова, 2014: 54].

• Низкая стоимость перевода.

Если цель перевода – ознакомление с общим содержанием текста, то использование услуг переводческого бюро может быть экономически нецелесообразным. В данном случае системы МП помогут справиться с этой задачей не хуже, чем профессиональные переводчики [Машинный перевод: исторический обзор и преимущества, PROMT].

• Конфиденциальность.

Машинный перевод является оптимальным решением для перевода внутренней документации компании (в т. ч. документов, содержащих коммерческую тайну и секреты производства) или документов, содержащих персональную информацию (например, личная переписка или финансовые документы). Таким образом, выбор в пользу систем МП поможет сохранить конфиденциальность данных [Машинный перевод: исторический обзор и преимущества, PROMT].

• Универсальность.

В отличие от профессионального переводчика, который специализируются, как правило, на определенной тематике, машинный переводчик справляется со специализированными текстами разных направлений, а для правильного перевода терминологии достаточно подключить необходимые настройки [Машинный перевод: исторический обзор и преимущества, PROMT].



ГЛАВА 2. Сопоставительный анализ машинных и ручных переводов специальных текстов

2.1. Сравнительный анализ машинных и ручных переводов

В рамках настоящего исследования был проведен сравнительный анализ машинных переводов таких СМП как Яндекс.Переводчик, PROMT Expert NMT и DeepL Pro. Выбор конкретных переводчиков обусловлен лежащими в их основе алгоритмами высокого уровня. Переводчики PROMT Expert NMT и DeepL Pro – это одни из самых современных NMT систем, функционирующих на основе самообучаемых нейронных сетей, а Яндекс.Переводчик – отечественная СМП гибридного типа с уникальной технологией CatBoost, анализирующей переводы RBMT и SMT систем и отбирающей наиболее оптимальный вариант перевода.

Также был проведен сопоставительный анализ машинных и ручных переводов отдельных фрагментов политических, экономических и социокультурных текстов – новостных материалов, статей и пресс-релизов. За единицу анализа приняты исходное предложение на языке оригинала, три варианта его машинного перевода и его ручной перевод. Для каждой рассматриваемой единицы анализа дано описание выявленных ошибок МП и обоснование необходимого постредактирования результатов МП. В рамках данного анализа рассматриваются только те фрагменты МП, в которых были выявлены ошибки и которые, соответственно, нуждаются в постредактировании.

В ходе данного исследования были выявлены следующие ошибки машинного перевода:

1. “Now that the clay feet of the economic system have been exposed, the gap between a global system for economics and the global political system based on the state must be addressed as a dominant task in 2009”. (An End of Hubris, The Economist, 2008).


В процессе пост редактирования МП необходимо исправить следующие ошибки:

1) буквальный и не эквивалентный перевод идиомы “the clay feet of the economic system” (видоизмененной библейской метафоры “feet of clay”) - «глиняные основы» (DeepL), «глиняные ступни» (PROMT) и «глиняные ноги» (Яндекс.Переводчик) вместо «нестабильность» или «ненадежность» экономической системы и вытекающий из этого также дословный перевод пассивной конструкции “have been exposed” («были разоблачены» (Яндекс.Переводчик), «обнажены» (PROMT) и «обнажались» (DeepL) вместо «нестабильность стала очевидна» или «нестабильность стала явной»);

2) не контекстуальный перевод слова “the gap” как «разрыв» вместо «несогласованности» или «дезорганизации» экономических и политических систем;

3) семантическая ошибка в переводе словосочетания “dominant task” как «доминирующая задача» вместо «основная задача», «главная задача» или «ключевая задача».

2. “In the Bible, seven years of feast were followed by seven years of famine. For banks there have been ten lean years.” (The three Rs behind global banks’ recovery, The Economist, 2017).


Заключение (выдержка)

Машинный перевод стал одной из главных тенденций в переводческой отрасли благодаря своему богатому потенциалу в оптимизации переводческого процесса: сокращении трудовых и временных затраты переводчика и получение высококачественного перевода для определённых типов текста.

Растущий спрос на высококвалифицированные услуги машинного перевода делают вопрос о повышении качества результатов МП актуальным как никогда раньше. Проблема качества МП заключается в наличии в текстах МП языковых и смысловых ошибок, а само качество машинного перевода во многом обусловлено такими факторами, как тип переводимого текста и его языковые особенности.

Постредактирование МП – это, прежде всего, работа над повышением качества перевода за счет исправления выявленных языковых и смысловых ошибок и внесение изменений согласно требованиям заказчика перевода. С учетом назначения перевода и качества полученных результатов, постредактор осуществляет легкое или полное постредактирование МП.

На текущем этапе развития технологий машинного перевода обозначались следующие проблемы постредактирования МП:

• Зависимость качества перевода от качества исходного текста.

• Значительное влияние качества перевода на длительность, трудоемкость и результаты постредактирования МП.

• Невозможность гарантии повышения качества МП до требуемого уровня при неудовлетворительном качестве «сырого» перевода».

• Ограниченное использование различных типов текста для МП.

• Нецелесообразность применения МП и постредактирования МП при больших, по сравнению с ручным переводом «с нуля», трудовых и временных затратах переводчика.

• Трудоемкость процесса полного постредактирования МП (особенно для больших переводческих проектов).

Помимо выбора подходящих типов текста и применения верной стратегии постредактирования, осведомленность о наиболее частотных ошибках МП может существенно оптимизировать постредактирование перевода – спрогнозировать возможное появление конкретных видов ошибок в тексте перевода и оперативно сделать необходимые исправления.

В результате проведения сопоставительного исследования фрагментов машинных и ручных переводов специальных текстов политической, экономической и социокультурной направленности были выявлены следующие частотные ошибки машинного перевода:

• Смысловые ошибки (т.е. искажение смысла - замена идеи на противоположную или ее подмена совершенно другой идеей).

• Семантические ошибки (т.е. ошибки неверного выбора значения лексических единиц).

• Ошибки в переводе устойчивых словосочетаний (метафор, идиом, сравнений, фразовых глаголов и других устойчивых выражений).

• Дословный перевод (т.е. буквальная, пословная передача единиц).

• Не контекстуальный перевод (т.е. перевод без учета смыслового контекста).

В качестве не частотных ошибок МП можно выделить такие лексические ошибки, как дублирование и опущение лексических единиц, а также ошибки в передаче имен собственных.

Как показало настоящее исследование, проблема качества МП все еще нуждается в решении, т.к. в переводах даже самых современных машинных переводчиков постредактору все еще приходится исправлять смысловые и языковые (преимущественно лексико-семантические) ошибки. Несмотря на выбор подходящих типов текстов для МП, все рассмотренные фрагменты нуждались в разной степени постредактирования. Таким образом, наличие ошибок в анализируемых фрагментах на практике подтвердило идею о необходимости постредактировании результатов МП.

Литература

Список источников примеров

1. An End of Hubris. The Economist, London, Nov. 19th 2008 edition. [Электронный ресурс] Режим доступа: https://www.economist.com/news/2008/11/19/an-end-of-hubris (дата обращения 12.02.2022).

2. Boucinha, Miguel. Negative rates and the transmission of monetary policy / M. Boucinha, L. Burlon // Update on economic and monetary developments: ECB Economic Bulletin – 2020. – Issue 3. [Электронный ресурс] Режим доступа: https://www.ecb.europa.eu/pub/economic-bulletin/html/eb202003.en.html (дата обращения 12.02.2022).

3. Brody, Jane E.Brody. Scientists Tame Wild Rice, The 'Caviar Of Grains'. The New York Times, 1986. – Nov. 25th 1986 edition – Section C – p. 3. [Электронный ресурс] Режим доступа: https://www.nytimes.com/1986/11/25/science/scientists-tame-wild-rice-the-caviar-of-grains.html (дата обращения: 12.02.2022).

4. Collins, Mike. The Pros And Cons Of Globalization. Forbes, May 6, 2015. [Электронный ресурс] Режим доступа: https://www.forbes.com/sites/mikecollins/2015/05/06/the-pros-and-cons-of-globalization/?sh=6260e29bccce (дата обращения: 12.02.2022).

5. Crossed lines in the Caribbean. The Economist, London, Oct. 24th 2009 edition. [Электронный ресурс] Режим доступа: https://www.economist.com/the-americas/2009/10/22/crossed-lines-in-the-caribbean (дата обращения 12.02.2022).

+ еще 55 источников

Информация о работе

Тип: Дипломная работа
Страниц: 77
Год: 2024
3200 p.
Не подошла эта работа?
Узнайте стоимость написания
работы по Вашему заданию.

Закажите авторскую работу по Вашему заданию!
Контрольная работа
от 100 p.
cрок: от 1 дня
Реферат
от 600 p.
cрок: от 1 дня
Курсовая работа
от 1000 p.
cрок: от 3 дней
Дипломная работа
от 6000 p.
cрок: от 6 дней
Отчет по практике
от 1000 p.
cрок: от 3 дней
Решение задач
от 150 p.
cрок: от 1 дня
Лабораторная работа
от 200 p.
cрок: от 1 дня
Доклад
от 300 p.
cрок: от 2 дней
Заказать работу очень просто!
Вы оформляете заявку
Получаете доступ в лк
Вносите предоплату
Автор пишет работу
Получаете уведомление
о готовности
Вносите доплату
Скачиваете готовую
работу из лк
X
X