СТАТЬИ И ПУБЛИКАЦИИ

Вход или Регистрация

ПОМОЩЬ В ПАТЕНТОВАНИИ НАУЧНО-ТЕХНИЧЕСКИЙ ФОРУМ Научно-техническая библиотекаНаучно-техническая библиотека SciTecLibrary
 
Cтатьи и Публикации ПРЕДВАРИТЕЛЬНАЯ ИДЕНТИФИКАЦИЯ НЕОДНОЗНАЧНОГО ИСХОДНОГО ТЕКСТА И ЕГО ПЕРЕВОД НА ДРУГИЕ ЯЗЫКИ С ИСПОЛЬЗОВАНИЕМ СИСТЕМЫ СОГЛАСОВАННЫХ СЛОВАРЕЙ

 

ПРЕДВАРИТЕЛЬНАЯ ИДЕНТИФИКАЦИЯ НЕОДНОЗНАЧНОГО ИСХОДНОГО ТЕКСТА И ЕГО ПЕРЕВОД НА ДРУГИЕ ЯЗЫКИ С ИСПОЛЬЗОВАНИЕМ СИСТЕМЫ СОГЛАСОВАННЫХ СЛОВАРЕЙ.

 

© Панич Ю. В. 

Контакт с автором: iuli-panich@yandex.ru

 

Аннотация.

Предварительная идентификация основана на дополнении многозначных слов и словосочетаний элементами словарных статей, заимствуемых автором в опорном толковом словаре исходного (родного) языка. Универсальность состоит в том, что машинные переводы на другие языки осуществляют с использованием словарей, согласованных с опорным толковым словарем. В процессе предварительной идентификации учитывают не только широкий спектр значений, но также неоднозначность в выражении действий и состояний, рода и числа и т.п., когда в одном языке эти признаки определяются контекстом, а в другом могут отражаться в конкретных грамматических формах.

Можно также прочитать английскую версию : http://sciteclibrary.ru/eng/catalog/pages/9403.html

_______________________________________________________________

 

Предпосылки. Некоторые принципы универсального смыслового кодирования и построения системы согласованных словарей ранее опубликованы в работах автора [17,18]. В данной статье расширяется подход к идентификации неоднозначностей морфологического и синтаксического характера. Также уточняются некоторые положения, касающиеся компактного представления смысловых дополнений к многозначным словам и словосочетаниям.

Как правило, в  исходных текстах неизбежно присутствуют многозначные слова и словосочетания. Перевод таких слов и словосочетаний зависит от контекста. Анализ смысла и формы широкого контекста практически невыполним с помощью традиционных программ машинного перевода.
В мире публикуется множество исходных текстов, которые необходимо переводить на многие целевые языки. К ним относятся   научные статьи, описания изобретений и т.п., которые публикуются в региональных патентных фондах и в национальных научных журналах, но представляют также интерес для иноязычных пользователей.

Отсюда следует, что текст на родном языке, который потенциально может быть переведен на многие целевые языки, должен содержать некоторые дополнения к многозначным словам и словосочетаниям, которые указывают универсальным образом на их фактические смысловые значения. Указанные дополнения  должны также отражать  грамматические (морфологические и синтаксические) особенности более широкого контекста, что при переводе на целевые языки позволит выбрать соответствующие грамматические формы слов или групп слов и синтаксические связи между словами. В целом, подобные смысловые дополнения устраняют как неоднозначность исходного языка, так и взаимные, переводные неоднозначности, что позволит получать корректные по смыслу и по форме машинные переводы на любой из целевых языков.

Известны достаточно абстрактные методы смыслового кодирования исходного текста  [1–3, 3*].

Один из ранних методов, основанный на семантическом анализе многозначных слов и их смысловом кодировании, описан в US Patent 5,285,386 “Machine translation apparatus having means for translating polysemous words using dominated codes” – “Устройство машинного перевода, содержащее средства для перевода многозначных слов, основанные на доминантных кодах”. Данный метод семантического анализа имеет универсальный характер, т.е. не зависит от того, на какой язык будет осуществляться перевод; в связи с этим предлагаются некоторые коды, имеющие “философский” характер, например:

S0 принадлежит "характеру/природе"

S02 принадлежит "погоде" в "природе"

S028 принадлежит "ветру" в "погоде"

S028a принадлежит "давлению" в "ветре"….

Иерархическая система кодов, характеризующих смысловые значения слов и зависимости между словами, имеет слишком абстрактный характер, т.е. далека от реальных проблем перевода выражений и словосочетаний, отражающих разнообразные способы употребления слов, сложные синтаксические конструкции и т.п.

Элементы смыслового кодирования такого же абстрактного характера предлагаются в US Patent 5,523,946 “Compact encoding of multi-lingual translation dictionaries”. Каждое слово это файл, в котором содержится информация, общая для некоторого абстрактного базового языка; эта информация базируется на концепциях типа – часть речи, род, число, знак пунктуации (запятая, круглые скобки,…), область значений, к которым принадлежит данное слово (например, область знаний, действий,…).

Таким образом, предлагаемый метод содержит элементы смыслового кодирования в виде концепций абстрактного базового языка; однако это кодирование также является очень поверхностным, т.к. не касается конкретных смысловых значений слов, а связано с общими признаками.

Наконец, уже длительное время разрабатывается проект Universal Networking Language (UNL) [3,3*], нацеленный на создание универсального искусственного языка с помощью кодов, которые в некоторой отвлеченной форме учитывали бы множество смысловых и грамматических особенностей исходного языка и, кроме того, отражали бы особенности переводов на множество целевых языков.

Текст на UNL - это универсальные слова с дополнительными символами типа:

icl (inclusion), означает “вкл., содержит, определяет”,

aoj - определяет, что объект находится в каком-то состоянии или имеет определенные атрибуты и многие другие.

Каждое значение может иметь также множество частных значений, например:

seq (occur, occur) / seq (occur, do) / seq (do, occur) / seq (do, do) / seq (occur, (aoj>thing)) ...

Коды атрибутов добавляются к универсальному слову и указывают на варианты употребления:

категория времени @future, @present, … / модальность @obligation, @possibility … /

характер выражения @emphasis, @focus … и многие другие.

Предложение “The dog caught a wild cat” будет иметь следующее UNL-представление:

[S] agt(catch(icl>#event).@past.@pred.@entry, dog(icl>animal).@def)
obj(catch(icl>#event).@past.@pred.@entry, cat(icl>animal).@indef)
mod(cat(icl>animal).@indef,wild(icl>#state, ant>domestic)) [/S]

Из примеров следует, что искусственный язык имеет особый словарный состав, особые формы представления смысловых значений, а также собственную морфологию и синтаксис; все эти особенности выражаются в виде сложных цепочек ограничений и атрибутов.

Как было отмечено вначале, анализ смысла и формы широкого контекста практически невыполним с помощью программ автоматического машинного перевода. В системе UNL эта проблема, как минимум, удваивается, а именно: система UNL основана на двукратном машинном переводе: с исходного на промежуточный язык (I) и с промежуточного языка на целевой язык (II). Такой подход приведет к неизбежному суммированию ошибок в передаче смысла текста и к взаимному влиянию неоднозначностей, возникающих на каждом из этапов; иными словами, ошибки, возникающие на первом этапе, могут порождать цепь ошибок на втором этапе.

Автор имеет возможность вносить некоторые изменения в текст на промежуточном искусственном языке на этапе его обратного перевода на исходный язык; но для этого автор должен профессионально владеть этим языком, т.е. должен уметь индицировать с помощью комбинаций символов реальные отклонения, возникшие между исходным текстом и его обратным переводом.

Возможно, система UNL м.б. использована для передачи достаточно коротких и “однозначных” текстов.

В целом, можно предположить, что упомянутые выше методы, основанные на искусственных кодах, позволяют решить проблему универсальности, но не содержат элементов, позволяющих повысить точность машинного перевода.

Предварительная идентификация исходного текста. Исходя из общих соображений, многозначность (или неоднозначность) исходного текста, приводящая к неправильным интерпретациям слов и словосочетаний, должна быть устранена до начала автоматического машинного перевода.

Информация, необходимая для предельно точного смыслового кодирования исходных текстов, уже присутствует в том или ином виде в толковых и двуязычных словарях. Детальное представление смысловых значений в толковом словаре характеризует внутреннюю многозначность исходного языка. Сюда следует отнести и иллюстративные примеры, отражающие различные формы употребления слова и словосочетаний при конкретных значениях; при этом переводы указанных примеров, содержащиеся в двуязычных словарях, отражают взаимные неоднозначности исходного и целевых языков [16, 16*].
Идея состоит в использовании для подготовки исходного текста к последующему переводу тех или иных элементов толкового словаря исходного языка (взамен искусственных кодов); эти элементы могут естественным образом отражать смысл широкого контекста. Автору достаточно лишь внимательно всмотреться в свой контекст, сравнить его с той или иной словарной статьёй и затем внести в дополнение к слову его фактическое значение или соответствующий иллюстративный пример и т.д. – это обеспечит верный перевод на целевые языки. Иными словами, речь идёт о предварительной идентификации смысловых значений, форм употребления и т.д. и т.п. с помощью толкового словаря исходного языка общего или тематического характера.

Проблема состоит в том, как превратить элементы словарных статей, включая и упомянутые иллюстративные примеры, в универсальные смысловые коды; иными словами, как согласовать эти элементы с переводами, содержащимися в  двуязычных словарях.

Расширенная система согласованных словарей.

Указанную проблему предлагается решать с помощью системы согласованных словарей, содержащей опорный толковый словарь родного языка, который мы будем называть далее согласованным толковым словарем (с.т.с.), и специальные словари исходного языка - выходных языков, которые мы будем называть далее согласованными двуязычными словарями (с.д.с.) [17, 18].

В каждом из согласованных словарей в точности совпадает словарный состав исходного языка и совпадают все элементы словарных статей, включая:
- смысловые значения заглавного (производного, составного и т.п.) слова (это касается также и частных значений, на которые разделяются смысловые значения),

- все иллюстративные примеры (ил.п.), отражающие использование слова при конкретном смысловом значении,

- все словосочетания, их смысловые значения и их собственные ил.п.,
- грамматические комментарии.

Также совпадают последовательности расположения всех упомянутых элементов и их цифровые, алфавитные, символические обозначения.
Это также относится к специализированным и тематическим разделам (LingvoUniversal, LingvoEconomy, LingvoScience, LingvoPolytechnical…).

Для пояснения ниже представлены фрагменты, характеризующие согласованность словарных статей.  

 В с.т.с. исходного языка должны быть объединены функции толкового словаря и словаря перевода. Другими словами, с.т.с. должен отражать также и те элементы исходного языка, которые имеют специальное значение хотя бы в одном из целевых языков, входящих в систему согласованных словарей данного исходного языка. Действительно, если одни случаи неоднозначности не зависят от того, на какой язык переводится текст, то неоднозначности другого типа возникают только при переводе на определенный язык.

Таким образом, наряду с множеством смысловых и грамматических особенностей исходного языка, в с.т.с. должны также отражаться особенности переводов на множество целевых языков. Следовательно, словарные статьи должны быть максимально дифференцированными, т.е. должны одновременно отражать не только внутриязыковую многозначность, но и взаимные неоднозначности, а именно:

- словарные статьи должны содержать словосочетания нефразеологического характера, имеющие особый (не пословный) перевод хотя бы на один из целевых языков;

- словарные статьи должны отражать значения, имеющие морфологическую природу и обусловленные наличием в целевых языках тех или иных отдельных грамматических форм, отсутствующих в исходном языке; с этой целью в словарные статьи вводятся специальные (дополнительные) секции дифференцированных (морфологических) значений; эти секции имеют символическое обозначение (morphm) (аббревиатура от слов morphological meanings);

- также словарные статьи должны отражать значения, имеющие синтаксическую природу, т.е. значения, уточняющие возможные синтаксические связи и позволяющие устранить возможную синтаксическую неполноту / неоднозначность от устраняющих связи акже должны отражать оттенки смысловых значений, уточняющих синтаксическую неполноту исходного текстатвующи в исходном языке; с этой целью в словарные статьи вводятся специальные (дополнительные) секции дифференцированных (синтаксических) значений; эти секции имеют символическое обозначение (syntaxm).

Следующий пример отражает многозначность местоимения you и характеризует согласованность словарных статей в тех случаях, когда в одних языках смысловые значения слова определяются контекстом, а в других языках этим значениям соответствуют отдельные формы:

 

с.т.с. англ. языка

you person or people being addressed [6]

(a) person m

(b) person f

(c) people

(d) people f

англо–русск. с.д.с.

you ты, вы

(a,b)ты

(c,d)вы

англ.–иврит с.д.с.

you אתֶן/ אַתֶם/ אַת/ אַתָה

(a)… אַתָה

(b)אַת

(c) … אַתֶם

(d)אַתֶן


 

 

 

 

 

 

В данном случае в английском языке местоимение you заменяет лицо или группу лиц м. рода или ж. рода (что зависит от смысла текста). В переводе на русский язык местоимению you соответствуют две формы – ты, вы, но в переводе на иврит местоимению you соответствуют четыре формы, выражающие м. и ж. род как в ед., так и во мн. числе:

אַתֶן/ אַתֶם/ אַת/ אַתָה

Как видим, в с.т.с. английского языка местоимение you имеет четыре частных значения - это учитывает указанные особенности двух целевых языков - русского и иврита.

В качестве примера, имеющего более общий характер, ниже представлен расширенный фрагмент согласованных словарных статей глагола to take:

 Приведем первые примеры предварительной идентификации в исходном тексте многозначного слова. Положим, что автор анализирует исходную фразу, содержащую глагол took:

- в одном случае автор приходит к выводу, что в контексте речь идет о перемещении кого-то в некоторое место. Автор анализирует словарную статью, значение take 1 carry sb/sth … и илл. пример, наиболее близкий по смыслу и по форме употребления к исх. тексту: She takes her…, и отмечает этот пример. Кроме того, автор учитывает, что в контексте говорится о действии несоверш. вида или соверш. вида; в связи с этим автор отмечает в словарной статье значение (morphm)… (a) или (b).

Служебная программа автоматически переносит отмеченные значения в текст в виде следующего смыслового дополнения к глаголу (справа: перевод глагола на русский, учитывая перевод илл. примера):

took{take v 1 carry sb/sth or accompany sb from one place to another: She takes her children to school by car (morphm) Inf., Indef. T. (a) (imper-ve) или (b) (per-ve) } отвозил,-а,-и или от|вёз,-везла,-везли

- в другом случае автор приходит к выводу, что в контексте речь идет о том, что характер одного из действующих лиц позволяет нести на себе тяжесть, поддерживает его, подкрепляет. Автор отмечает наиболее близкий илл. пример: Her energy and talent took … и получает следующее смысловое дополнение к глаголу:

took{take v 1 carry sb/sth or accompany sb from one place to another: Her energy and talent took her to the top of her profession} сопровождал,-а,-и

- наконец, в третьем случае автор приходит к выводу, что в контексте речь идет о том, что одно из действующих лиц должно держать кого-то. Автор анализирует словарную статью, значение take 2 get or lay hold of и илл. пример: Would you mind taking …, наиболее близкий по смыслу и по форме употребления к исх. тексту. Автор отмечает этот илл. пример:

took{take v 2 get or lay hold of with the hands, arms, etc: Would you mind taking the baby for a moment} подержал,-а,-и

В согласованных словарях каждый из элементов имеет определенный порядковый номер в той или иной секции словарной статьи. Поэтому все смысловые дополнения к словам можно представить в компактной форме, где в начале указывается заглавное слово и относящиеся к заглавному слову грамматические характеристики, затем раздел словаря (LU – LingvoUniversal, LE – LimgvoEconomy, LS - LingvoScience, LPT - LingvoPolytechnical…), а затем порядковые номера элементов, отмеченных автором в словарной статье (порядковые номера автоматически подсчитывает служебная программа), например:

xxx{headword v /LU/01/04/ / / / / /1(a)/}, xxx{headword n /LS /07/ /08/}, xxx{headword /LE/ / / /03/ /04/ /1(b)/}

Компактная форма смысловых дополнений к словам представлена на следующей схеме:

 

На Фиг.1 представлена структура систем согласованных словарей.

 

Учет всех типов неоднозначностей расширяет объем словарных статей. В связи с этим конкретный исходный язык может иметь несколько подсистем согласованных словарей - для родственных групп целевых языков (Фиг. 2).

В некоторых случаях, подсистема может касаться только двух языков – исходного и целевого; это означает, что единственный в этой подсистеме двуязычный словарь согласован с толковым словарем. Поясним более подробно смысл упомянутых специальных (дополнительных) секций.

1. Дифференцированные (морфологические) значения.

Речь идет о словах, которые в сочетании с контекстом выражают различные грамматические признаки, но не имеют в исходном языке соответствующих грамматических форм. В переводе на тот или иной целевой язык этим значениям соответствуют конкретные грамматические формы слова и / или слов, связанных с ним. К таким группах слов могут относиться:

1) личные и возвратные местоимения, которые не имеют в исходном языке некоторых отдельных форм, обозначающих лицо мужского  или женского пола / лицо или группу лиц / группу лиц мужского или женского пола / лицо или неодушевлённый предмет,  а также притяжательные местоимения, которые не имеют в исходном языке отдельных форм, указывающих на род и / или число принадлежащего объекта, или на род лица, которому это принадлежит (т.е. смысл зависит от того о ком или о чём идёт речь в контексте); в то же время в тех или иных целевых языках для выражения указанных признаков используются местоимения и/или связанные с ними слова, имеющие конкретные грамматические формы

Следующий пример касается притяжательного местоимения-существительного yours, которое не имеет каких-л. других грамматических форм, но при этом  в сочетании с контекстом может выражать:

- принадлежность объекта мужского или женского или среднего рода или нескольких объектов к лицу или к группе лиц (тво|й, -я, -ё, -и; ваш, -а, -е, -и);

- род лица (группы лиц), к которому (к которым) выражается принадлежность; это необходимо учитывать при переводе на иврит, в котором местоимению yours может соответствовать одно из следующих местоимений:

שֶלךָ / שֶלָך/שֶלָכֶם /שֶלָכֶן

Многозначность местоимения отражена в согласованной словарной статье:

 

2) глаголы, причастия, деепричастия, которые не имеют в исходном языке некоторых отдельных форм, выражающих однозначно характер действия и/или состояния, достигнутого в результате действия (т.е. о характере действия и/или состояния можно судить лишь в зависимости от контекста); в то же время в тех или иных целевых языках для выражения указанных оттенков действий и / или состояний используются глаголы, причастия, деепричастия, имеющие конкретные грамматические формы. Например:  

а) в русском языке глагол (в сочетании с контекстом) может выражать множество действий и состояний, которым в английском языке соответствуют отдельные грамматические формы ([12], стр.113-162):

В следующей таблице представлены дифференцированные (морфологические) значения глагола заканчивать:

с.т.с. русск. языка

зак|анчивать,-ончить …до к.

(morphm) 1. (a) (неопред.): Я закончил р. и ушел домой.

(b) (длит.): Я заканчивал р., когда вы зашли ко мне.

(c) (к опред. м-ту): Я закончил р. и сейчас иду домой.

(d) (изв. дл-ти): Я закончил два факульт. за последние 5 лет и сейчас нашел р.

2. страдат. (a) (состояние): Р. закончены. Техники могут отдохнуть. (b) (действие, неопред.): Р. обычно заканчиваются в полночь.

(c) (действие, длит.): Р. сейчас заканчивается. Инспектору придется подождать. (d) (действие, к опред. м-ту): Р. только что закончены техниками.

3. действ. (маловероятное) в условном предлож. в сослагат. наклонении с частицей бы; время выполн. условия зависит от контекста

(a) (в наст.-будущ.): Если бы вы закончили исследования, мы начали бы ... Но вы не закончите их скоро.

(b) (в прошл.): Если бы вы закончили исследования, мы начали бы ... Но вы их до сих пор не закончили.

4. действит. причастн. оборот; действ. одноврем. или предшеств. действию сказуемого (a) (одновр.), (b) (ранее)

5. страдат. причастн. оборот несоверш. вида (a) реальное действие (реальн.) (b) действие, происходящее безотносит. ко времени (вообще)

Русско - англ. с.д.с.

зак|анч…to finish, to end (morphm) 1. (a) Indef. T.: I finished a w. and went home.

(b) Contin. T.: I was finishing a w. when you called on me.

(c) Perf. T.: I have finished a w. and am going home now.

(d) Perf. Contin. T.: I had been finishing two faculties for last 5 years and I have now found w.

2. passive form (a) (state) Compound Predicate: The works are ended. The technicians can have a rest. (b) (action): Indef. Passive T.: The works are usually ended at midnight. (c) (action) Contin. Passive T.: The w. is being ended. The inspector will have to wait. (d) (action) Perf. Passive T.: The works have just been ended by the technicians.

3. Conditional Sentence

(a) If you ended (should end, were to end) investigations, we should start the project. But we shall not end them soon.

(b) If we have ended investigations, we should have started the ... But we have not ended them till now.

4. participle in verb phrase, active v. (a) (simult.) (b) (preced.)

5. participle in verb phrase, passive v., imperf-ve (a) (real) (b) (irrelative)

 

б) также в английском языке глагол (в сочетании с контекстом) может выражать различные действия и состояния, которым в русском языке соответствуют отдельные грамматические формы ([12]).

В следующей таблице представлены дифференцированные (морфологические) значения глагола to ask:

с.т.с. англ. языка

ask v.i 1 make enquiries 4 ~ sb (to sth) invite sb

(morphm) 1. Inf., Indef. T. (a) (imperf-ve): I don’t know him well enough to ask him forhelp (b) (perf-ve): … to ask to speak at a seminar

2. passive form (a) (state): Guests are asked to a meeting.

(b) (action): Guests are asked to a meeting by collaborators. (c) (imperf-ve) (d) (perf-ve)

3. should+Indef. Inf., Perf. Inf. (a) (indica-ve): You should have asked her. (b) (subjunc-ve): You should have at first asked her.

4. participle in verb phrase (a) (simult.)

(b) (preced.) (c) (imperf-ve) (d) (perf-ve)

англо–русск. с.д.с.

ask v.i. 1 спр|ашивать, -осить 4 пригла|шать,-сить

(morphm) 1. (a) (несоверш): Я знаю его недостат. хорошо, чтобы просить его о помощи (b) (соверш): …чтобы попросить выступить на семинаре

2. страдат. (a) (состояние): Гости приглашены на встр. (b) (действ.): Гостей приглашают на встр. сотр.

(-ся…) (c) (несоверш.) (d) (соверш.)

3. (a) (изъявит): Вам следовало спросить её. (b) (сослагат): Вам следовало бы снач. спросить её.

4. при|частный, дее- оборот

(a) (одноврем. с действ. сказ.)

(b) (предшеств. действ. сказ.)

(c) (несоверш.) (d) (соверш.)

 

3) существительные, которые не имеют в исходном языке форм ед. и мн. числа, в то время как в переводе на те или иные целевые языки они приобретают, в зависимости от контекста, отдельные формы ед. и мн. числа и т.д.

Во всех приведенных выше случаях автору достаточно лишь внимательно всмотреться в свой контекст, чтобы внести в дополнение к слову фактическое дифференцированное (морфологическое) значение – это обеспечит верный перевод.

2. Дифференцированные (синтаксические) значения.

Также в словарных статьях представлены значения, которые выражают возможные синтаксические связи данного слова с другими словами в предложении; указанные синтаксические связи характеризуют некоторые предикативные (в части сказуемого) и непредикативные (атрибутивные, объектные, обстоятельственные) синтаксические отношения (syntactical relations).

Использование дифференцированных (синтаксических) значений при смысловом кодировании позволяет исключить погрешности машинного перевода (syntactical errors) в трактовке таких исходных предложений, которые обладают синтаксической двусмысленностью или синтаксической неполнотой (syntactical ambiguity/ incompleteness), в частности:

- предложений, в которых сказуемое выражает действие или состояние относительно удаленного дополнения, отделенного от сказуемого другими обстоятельствами и/или определениями, внутри которых присутствуют собственные существительные;

- предложений, которые содержат удаленные или обособленные или удаленно-обособленные пояснительные приложения (атрибутивные, обстоятельственные), внутри которых присутствуют собственные дополнения. Примерами таких приложений могут быть обособленные определения, удаленные от определяемого объекта (существительного, местоимения), обособленные  обстоятельства, удаленные от сказуемого (в противоположность однородным членам предложений, которые находятся в одинаковых синтаксических отношениях с одним членом предложения, выполняют одну синтаксическую функцию и объединяются друг с другом путём перечисления или с помощью сочинительных союзов [12*]).

Например, в русском языке синтаксические отношения во многих случаях базируются на том, что слова – определения (прилагательные, причастия), обособленные определения, придаточные определительные предложения, именные части составных сказуемых и т.д. имеют грамматические признаки, отражающие род и/или число определяемого слова; в то время как переводы этих слов на те или иные целевые языки могут не иметь указанных признаков, вследствие чего синтаксические отношения целиком зависят от порядка слов. Такие различия в языках могут приводить к синтаксической неопределенности переведенных фраз. Известные программы машинного перевода во многих случаях допускают смысловые неточности при переводе фраз, содержащих синтаксически сложные формы.

Дифференцированные (синтаксические) значения представлены в словарных статьях в виде отдельных секций, следующих вслед за теми смысловыми значениями слова, для которых они являются общими. Эти секции, имеющие в словарных статьях условное обозначение (syntaxm) (от слов syntax, meanings), могут касаться синтаксических связей следующих слов:

- глагол, выражающий действие или состояние относительно удаленного дополнения - некоторого контекстного слова (к.с.);

- прилагательное, которое может являться частью обособленного определения/ приложения к некоторому к.с.;
- причастие, которое может являться частью причастного оборота, играющего роль обособленного определения/ приложения к некоторому к.с.;
- деепричастие, которое может являться частью деепричастного оборота, играющего роль обособленного обстоятельства к к.с., выражающему действие.

В секциях дифференцированных (синтаксических) значений далее приняты следующие обозначения: к.с.* / c.w.* контекстное слово, которое автор должен отметить в исх. тексте (во всех случаях, касающихся идентификации синтаксических связей слов).

Для пояснения приведем характерные примеры словарных статей, содержащих секции (syntaxm):

с.т.с. англ. языка (с исп. [6])
refer v.t. pass on, direct  v.i. 1 have recourse  2 allude; cite
(morphm) …

(syntaxm) (a) a predicate (its part) expressing an action or a state relative to remote c.w.* (b) referr|ing, -ed a separated attribute/ apposition (its part) to c.w.* (c) referr|ing, having been -ed a separated adverbial modifier (its part) to c.w.* expressing action

англо–русск. с.д.с.

refer v.t. от|сылать, -ослать v.i.

1 справ|ляться,-иться  2 упом|инать,-януть; ссылаться, сослаться на
(morphm) …

(syntaxm) (a) сказуемое, выражающее действие или состояние относительно к.с.*

(b) часть обособл. определ./ приложения к к.с.* (c) часть обособл. обстоятельства к к.с.*, выражающему действие

rough adj. 1 opp. smooth… 2 opp. calm… 4 of sounds 5 crude … 7 inexact, approximate
(syntaxm) ~ a separated attribute/ apposition (its part) to c.w.*
rough adj. 1 opp. шероховатый   2 opp. бурный… 4 резкий  5 грубый…7 приблиз.
(syntaxm) ~ часть обособл. определ./ приложения к к.с.*

 

 

 

 

 

 

 

 

 


 

с.т.с. русск. языка

реш|ать, -ить 1 прийти к выводу … 2 найти ответ
(morphm) …

(syntaxm) (a) сказуемое, выражающее действие или состояние относит. к.с.*

(b) реша|ющий,-емый,-вший, реш|ённый,-ивший часть обособл. определ./ приложения к к.с.* (c) реш|ая, -ив часть обособл. обстоят. к к.с.*, выражающему действие

Русско – англ. с.д.с.

реш... 1 to decide 2 to solve, to settle
(morphm) …

(syntaxm) (a) a predicate (its part) expressing an action or a state relative to remote c.w.* (b) a separated attribute/ apposition (its part) to c.w.* (c) a separated adverbial modifier (its part) to c.w.*

Т.о., автору также достаточно лишь внимательно всмотреться в свой контекст, чтобы внести в дополнение фактическое дифференцированное (синтаксическое) значение данного слова и отметить соответствующее к.с.*  – это обеспечит при переводе верную синтаксическую связь между словами в пределах данного предложения (в случае местоимения - отмеченное к.с.*  может находиться и в одном из предшествующих предложений). 

Далее описываются последовательности операций смыслового кодирования и перевода.

Предварительная идентификация исходного текста.  Данный процесс выполняется в компьютере автора исходного текста с помощью служебной программы, содержащей упомянутый с.т.с. исходного языка.  Автор анализирует исходный текст и выделяет очередное слово особым шрифтом в случае, если, по мнению автора (в некоторых случаях – по инициативе служебной программы), данное слово обладает хотя бы одним из следующих признаков:
а) данное слово является многозначным словом, причём его сочетание с соседними словами  не содержит информации, достаточной для выбора смыслового значения, наиболее близкого к исходному тексту;
б) грамматическая форма данного слова и связанных с ним слов не отражает тот или иной оттенок фактического смысла текста, хотя в переводе на те или иные целевые языки данное слово и/или связанные с ним слова могут иметь конкретные грамматические формы, выбор которых строго зависит от контекста (как это следует из приведенных выше примеров дифференцированных (морфологических) значений);
в) данное слово вместе с некоторыми соседними словами, возможно, представляет собой словосочетание; для перевода этого словосочетания необходимо осуществить поиск среди известных словосочетаний, относящихся к данному слову, причём, возможно, есть  лексические или структурные различия, которые не влияют на иносказательное значение словосочетания, например:
- вклинились определения или обстоятельства к тем или иным словам, уточняющие значение словосочетания в целом,
- или вклинились вводные слова,
- добавились  переменные компоненты к началу или концу словосочетания,
- изменились те или иные собственные слова или их последовательность, и т.п. [4];
в связи с этим возникает проблема определить, что некоторые слова принадлежат к сочетанию, найти границы внутри фразы, определить ключевое слово и, наконец, выбрать значение, соответствующее контексту;
г) данное слово вместе с некоторыми соседними словами, возможно, представляет собой многозначное словосочетание;
д) данное слово имеет несколько родственных семантических значений, которым соответствуют неравнозначные переводы или переводы с неравнозначными формами употребления (по отношению к общей направленности исходного текста или по отношению к характеру действий и обстоятельств). Во многих случаях корректный перевод части фразы или всей фразы может быть получен лишь путём выбора наиболее подходящего ил.п. Использование этого ил.п. при последующем переводе исходной фразы на целевые языки позволяет выбрать верный вариант перевода данного слова, а также  отразить особенности использования слова, например, особенности синтаксической структуры, специфической для фраз подобного типа в этом целевом языке, или особенности глагольных форм и т.д.

е) данное слово вместе с некоторыми соседними словами, возможно, представляет собой удаленное или обособленное или удаленно-обособленное пояснительное приложение (атрибутивное, обстоятельственное), внутри которого, возможно, присутствуют собственные дополнения. 

Далее служебная программа выполняет поиск в с.т.с. словарной статьи, соответствующей отмеченному автором слову; затем автор фиксирует смысл этого слова, сопоставляя исходный текст с теми или иными элементами статьи; при этом он выполняет следующие операции:

а) в случае, если данное слово вместе с соседними словами совпадает с одним из словосочетаний фразеологического характера (в английском языке это может быть также и фразовый глагол) или соответствует структурной формуле, характеризующей лексическую изменчивость, то автор отмечает конкретное словосочетание или структурную формулу или конкретное смысловое значение, наиболее близкое исходному тексту, или ил.п., в котором употребление сочетания совпадает с исходным текстом, а область употребления соответствует общей направленности текста, характеру описываемых в нём действий и обстоятельств.

Указанные элементы автор отмечает и в том случае, когда  между сочетанием в исходном тексте и в словаре имеются лексические или структурные различия.

Затем автор с помощью служебной программы помещает в виде дополнения к данному слову заглавное слово и само словосочетание, текст смыслового значения или текст иллюстративного примера.

При этом автор выделяет в исходном тексте жирным шрифтом данное слово и другие слова, входящие в состав сочетания (за исключением вклинившихся слов), и, кроме того, с помощью специальных граничных символов обозначает левую и правую границы сочетания в предложении (например, угловыми скобками).

б) но в случае, если данное слово не принадлежит ни одному из словосочетаний фразеологического характера, то автор отмечает  в словарной статье конкретное смысловое значение слова, наиболее близкое исходному тексту, при условии, что грамматические признаки при этом значении, характеризующие изменяемые формы и формы управления другими словами, не противоречат исходному тексту (речь идет о следующих признаках: форма употребления глагола - в соверш./несоверш. виде; управление глагола, в т.ч. предлоги, падежные окончания; форма прямого дополнения и т.п.; форма атрибутивного, предикативного употребления ...);
в) если данное слово вместе с соседними словами совпадает с одним из словосочетаний нефразеологического характера, приведенных в словарной статье при этом значении, то автор отмечает это словосочетание; затем автор выделяет слова в исходном тексте особым шрифтом и граничными символами, как это описано выше; в случае, если данное слово и несколько соседних слов могут иметь характер словосочетания нефразеологического характера, но автор не находит в словарной статье данного слова это словосочетание или иллюстративный пример, в котором оно фигурирует, то автор выделяет особым шрифтом данное слово и соседние слова и затем вводит в действие команду, по которой служебная программа осуществляет поиск данного словосочетания во всех словарных статьях согласованного толкового словаря (включая и иллюстративные примеры, в которых оно фигурирует); служебная программа выводит на экран обнаруженные элементы словарных статей, один из которых автор может использовать как смысловое дополнение к данному словосочетанию;

г) если же данное слово не фигурирует ни в одном из словосочетаний, но в группе иллюстративных примеров при этом значении содержится конкретный пример с аналогичным употреблением слова, а область применения соответствует общей направленности текста, характеру описываемых в нём действий и обстоятельств, то автор отмечает этот пример;

д) если в словарной статье имеется упомянутая выше секция дифференцированных (морфологических) значений (morphm), то автор отмечает конкретное значение слова, касающееся рода и/или числа, лица или неодушевлённого предмета, характера действия или состояния, и т.д. и т.п.; в случае, если для идентификации местоимения необходимо знать к.с., которое заменяет это местоимение, то автор отмечает это к.с.;

е) наконец, если в словарной статье имеется упомянутая выше секция дифференцированных (синтаксических) значений (syntaxm), то автор отмечает конкретное значение слова, указывающее на то, что оно входит в состав члена предложения, обособленного/ удалённого от того к.с., с которым оно синтаксически связано, и отмечает это к.с.;

ж) в некоторых случаях автор отмечает конкретный ил.п. в словарной статье, касающейся одного из соседних слов, связанных с данным словом, при условии, что указанный ил.п. соответствует  смысловому значению и другим признакам, упомянутым выше;
з) также в некоторых случаях конкретное значение данного слова или конкретный ил.п.  или собственный ил.п. словосочетания автор отмечает в словарной статье, извлечённой из специализированного тематического раздела с.т.с.

Затем служебная программа переносит из словарной статьи в исходный текст заглавное слово и те элементы, которые отмечены, помещая  всё в виде смыслового дополнения к данному слову; в тех случаях, когда отмечено к.с., то служебная программа автоматически вносит это к.с. в смысловое дополнение (или служебная программа автоматически подсчитывает порядковый номер N отмеченного контекстного слова и вносит этот номер в смысловое дополнение).

Затем автор отмечает в исходном тексте следующее слово, обладающее одним из описанных выше признаков, и т.д. – до конца текста. 

В завершение выполняют запись полученного текста, готового к переводу на другие языки.

Схема процесса предварительной идентификации представлена на Фиг.3.

Повышение точности идентификации исходного текста.

На Фиг.3 представлен также дополнительный блок, выделенный более тёмным цветом, с помощью которого выполняют следующие операции:

- после завершения кодирования, служебная программа автоматически анализирует текст и дополняет некоторые слова символами, содержащими знак вопроса, а именно, символом (morth?), означающим, что данное слово, возможно, имеет неоднозначную грамматическую (морфологическую) форму, и символом (syntax?), означающим, что данное слово, словосочетание, возможно, имеет неоднозначную грамматическую форму, допускающую синтаксическую связь с разными членами предложения;

- обнаружив символ (morth?), автор анализирует в словарной статье секцию дифференцированных (грамматических) значений и отмечает значение, соответствующее смыслу контекста, например:

в случае местоимений – отмечает значение, в котором говорится о роде и/ или числе того/ тех, к кому обращаются, или того/ тех, о ком идёт речь, или того, что принадлежит или того/ тех, к кому выражается принадлежность и т.д.;

в случае глагола - отмечает значение, в котором говорится о том или ином характере действия или состояния и т.д. и т.п.; служебная программа автоматически вносит в смысловое дополнение отмеченное грамматическое значение;

- обнаружив символ (syntax?), автор анализирует данное предложение и отмечает то к.с., с которым синтаксически связано данное слово; кроме того, автор анализирует в словарной статье секцию дифференцированных (синтаксических) значений и отмечает значение, соответствующее смыслу контекста, например: обособленное/ удалённое определение (обстоятельство, дополнение); служебная программа автоматически вносит в смысловое дополнение отмеченное синтаксическое значение и отмеченное к.с. (или порядковый номер к.с.).

Служебная программа смыслового кодирования обладает некоторыми другими инициативными функциями, например, указывает автору на несовпадение употребления слова или словосочетания в исходном тексте и в отмеченном элементе словарной статьи, а также указывает автору на слова, пропущенные в процессе анализа исходного текста, но, возможно, обладающие той или иной неоднозначностью.

Перевод кодированного исходного текста на целевые языки. Процесс перевода выполняется в компьютере читателя с помощью программы машинного перевода, в состав которой входит основная программа перевода, содержащая собственный традиционный двуязычный словарь, и специальная подпрограмма, содержащая описанный выше с.д.с.
Основная программа перевода анализирует текст слово за словом и в случае, если очередное слово не содержит смысловое дополнение, то выполняет его перевод с использованием собственного традиционного двуязычного словаря; но в случае, если очередное слово содержит смысловое дополнение, то вступает в действие упомянутая специальная подпрограмма, которая находит в с.д.с. перевод этого слова или связанного с ним словосочетания, учитывая смысловое дополнение, а именно:
- если в смысловом дополнении к данному слову содержится ил.п., то подпрограмма отыскивает его перевод, выполняет сравнительный анализ исходного текста  и текста перевода ил.п., выделяет на основании анализа перевод слова в тексте ил.п.;
- если в смысловом дополнении к данному слову содержится словосочетание, то подпрограмма переводит всю группу слов, выделенных в исходной фразе упомянутыми  граничными символами и особым шрифтом, как одно целое; невыделенные в этой группе вклинившиеся слова переводит как определения, обстоятельства, вводные слова, но только по отношению к всему словосочетанию в целом; подпрограмма учитывает также и структурную формулу, характеризующую переменный состав словосочетания в исходном языке;
- если в смысловом дополнении к данному слову содержится ил.п., характеризующий употребление словосочетания, то подпрограмма отыскивает его перевод, выполняет сравнительный анализ исходного текста  и текста перевода ил.п., выделяет на основании анализа перевод словосочетания в тексте ил.п.;

- если в смысловом дополнении указано дифференцированное (морфологическое) значение, то подпрограмма выполняет перевод этого слова и других слов, связанных с ним, с учётом этого значения, а именно:
- если данное слово представляет собой личное, притяжательное, возвратное местоимение, то в этом случае перевод  части фразы, т.е. местоимения вместе со связанными с ним членами предложения, выполняет с учётом  того, что указано значение, касающееся рода и/или числа, лица или неодушевлённого предмета, или указано контекстное слово, которое заменяет данное личное или возвратное местоимение или вместо которого употреблено данное притяжательное местоимение - существительное;
- если данное слово представляет собой глагол, то перевод части фразы, связанной с этим глаголом, выполняет с учётом  того, что указано значение, касающееся характера действия или состояния, достигнутого в результате действия, и т.д. и т.п.;

- если в смысловом дополнении к данному слову содержится дифференцированное (синтаксическое) значение, указывающее на то, что слово является обособленным определением к к.с. или обособленным обстоятельством к к.с., выражающему действие, то подпрограмма отыскивает это к.с. и затем выполняет перевод данного слова и других слов, связанных с ним в предложении, в синтаксической связи с к.с. ; в общем случае, подпрограмма трансформирует характер составных частей предложения таким образом, чтобы обеспечить в переведенном тексте прямую синтаксическую связь между данным словом и к.с.

Полученный перевод специальная подпрограмма передает основной программе, включая грамматическую информацию, характеризующую употребление перевода в целевом языке, а основная подпрограмма выполняет грамматическое и синтаксическое согласование того или иного полученного перевода с переводом текста в целом.
Таким образом выполняют машинный перевод кодированного исходного текста.

Схема, отражающая процесс, представлена на Фиг. 4.

Некоторые характерные примеры, поясняющие операции смыслового кодирования и перевода.

1. Исх. фраза содержит многозначные слова:

To clear up the cause of trouble.

Из словарной статьи, приведенной в с.т.с. родного английского языка (см. приведенную ниже табл.), автор определил, что слово clear и соседние слова образуют словосочетание clear sth up и отметил в словарной статье одно из двух значений словосочетания в зависимости от смысла контекста; аналогично автор отметил одно из многих значений слова trouble. Служебная программа перенесла в исх. текст отмеченные автором значения, затем автор отметил границы словосочетания и выделил его жирным шрифтом. В результате получены следующие варианты кодированного текста и соответствующие варианты переводов, например, на русский язык (для краткости, варианты отделены друг от друга символом/):

(в контексте речь идет о действиях несоверш. вида)

<To clear{clear v.t.  ~ sth up  remove … / ~ sth up  solve … (morphm) (a) (imperf-ve)} up> the cause of trouble{trouble n. 1 grief, anxiety  /  2 … (tech.)  /  2 …: I am having ~ with the car  /   3 predicament /   8 unrest, civil …}
Удалять или
 прояснять причину волнения или дефекта или неполадок или неприятности или 
волнений

(в контексте речь идет о действиях соверш. вида)

<To clear{clear v  ~ sth up  remove… / ~ sth up  solve… (morphm) (b) (perf-ve)} up>

Удалить или прояснить причину …

 

с.т.с. англ. языка

clear  v.t. make ~, empty;  ~ (sth) up make (sth) tidy; ~ sth up remove doubt about sth; solve sth: ~ up a mystery, difficulty
(morphm) (a) (imperf-ve); (b) (perf-ve)

англо – русск. с.д.с.
clear  v.t. о|чищать, -чистить; ~ (sth) up  уб|ирать,-рать; ~ sth up удал|ять, -ить, устран|ять, -ить сомнение, неопред.; проясн|ять,-ить, объясн|ять, -ить: ~ up a mystery, difficulty прояснить тайну  …
(morphm) (a) (несоверш.); (b) (соверш.)
trouble n. 1 grief, anxiety  2 difficulties; (tech.): I am having ~ with the car  3 predicament … 8 unrest, civil commotion trouble n. 1 волнение, тревога, беспокойство 2 хлопоты; (tech.) дефект: I am having …  у меня неполадки с3 неприятность… 8 волнения; беспорядки

2. Исх. фраза содержит словосочетание с переменным словарным составом:

We’d better find out how the land lies before taking any action…

В словарной статье land n автор отметил идиому see, etc. how the land lies, в которой могут употребляться разные глаголы; затем, автор указал границы и выделил жирным шрифтом слова, совпадающие с идиомой, включая глагол find out:

 

We’d better <find out how the land{land nsee, etc. how the land lies} lies> before taking any action…

(переводы на русский):

Стоило бы получше знакомиться с ситуацией (изучать положение дел) прежде, чем предпринимать какие-л. действия ...

(для сравнения - перевод, выполненный обычной программой МП без учёта смысловых дополнений):

Стоило бы получше узнать как ложь земли(?) прежде, чем предпринимать какие-л. действия ...

Из сравнения следует, что обычная программа МП не обнаружила словосочетание в данном тексте (из-за свободного словарного состава) и выполнила лишь пословный перевод.

с.т.с. англ. языка

land n … see, etc. how the land lies learn what the situation is, how matters stand, etc.

англо–русск. с.д.с.
land n… see, etc. how the land lies знако-миться с ситуацией, изучать полож. дел

3. Исх. фразы содержат многозначное словосочетание:

This construction can give way.

My brother has heard this news and began to give way.

If it is in reality a heart attack, his good mood can give way.

 

с.т.с. англ. языка

way n give ~ fail to resist; collapse; make concessions: The bridge gave ~ under the weight of the lorry; His health gave ~ ; The bashfulness of the guests soon gave ~ ; Something gave ~ in him, and words came welling up

англо – русск. с.д.с.

way n … give ~ fail to resist поддаваться; collapse рухнуть; make concessions уступать: The bridge … Мост рухнул под весом грузовика; His health … Его здоровье надломилось; The bashfulness … Застенчи-вость гостей быстро рассеялась; Something gave …Что-то прорвалось в нём, и слова посыпались одно за другим

Автор проанализировал в словарной статье значения словосочетания give way и отметил следующие подходящие значения:

- в первом предложении говорится о состоянии конструкции, поэтому автор отметил илл.п.: The bridge gave ~ under the weight of the lorry;

- во втором предложении говорится о состоянии духа человека, поэтому автор отметил значение give ~ make concessions;

- наконец в третьем – говорится о здоровье человека, поэтому автор отметил илл.п. : His health gave ~

В результате автоматически формируется следующий текст, содержащий универсальные смысловые дополнения:

This construction can <give way{way n... give ~: The bridge gave ~ under the weight of the lorry}>.

My brother has heard this news and began to <give way{way n... give ~ make concessions}> .

If it is in reality a heart attack, his good mood can <give way{way n... give ~: His health gave ~ }>.

(переводы на русский):

♦ Эта конструкция может рухнуть. Мой брат услышал эту новость и начал уступать. Если это действительно инфаркт, то его хорошее расположение духа может надломиться.
♦♦ Эта конструкция может уступить дорогу(?). Мой брат услышал эту новость и начал уступать дорогу. Если это действительно инфаркт, то его хорошее настроение может уступить дорогу(?).

Из сравнения следует, что обычная программа МП выполняет лишь пословный перевод всех предложений.

4. Исх. фраза содержит многозначное притяжательное местоимение-существительное mine (для краткости различные варианты исходной фразы отделены друг от друга символом //).

Исх. текст: It is your pistol// your rifle //your gun? I was surprised by this question and I have answered: yes, it’s mine.

Из словарной статьи, приведенной в с.т.с. английского языка (см. табл.), автор определил, что местоимение  mine (ours, yours) может в сочетании с контекстом выражать принадлежность человека мужского или женского пола или принадлежность неодушевленного объекта или принадлежность животного неопределенного пола или принадлежность того, что перечислено, но во множественном числе; выбор конкретной формы местоимения зависит от рода/числа контекстного существительного, заменяемого данным местоимением. В тех случаях, когда местоимение выражает принадлежность неодушевленного предмета или животного неопределенного пола, род в целевом языке может не совпадать с родом в исходном языке. В этих случаях всегда необходимо отмечать в исходном тексте контекстное существительное (c.w.), заменяемое данным местоимением.

В приведенных ниже фразах автор отметил в с.т.с. то или иное значение местоимения mine и контекстное существительное, заменяемое данным местоимением. В результате получен следующий кодированный текст и его перевод на русский язык:

It is your pistol/ your rifle /your gun? I was surprised by this question and I have answered: yes, it’s mine{mine(morphm) (c) …c.w. pistol // c.w. rifle // c.w. gun}.

Это ваш пистолет // ваша винтовка // ваше ружьё? Я был удивлён … и ответил: да, мой // моя // моё.

Как видим, в переводах, выполненных с учетом смысловых дополнений, формы местоимений соответствуют роду контекстных существительных, которые они заменяют; для сравнения - МП без учета смысловых дополнений:

Это - ваш пистолет/ ваша винтовка/ ваше ружьё? Я был удивлен … и ответил: да, это моё(?) // моё(?) //моё.

Как видим, в переводах, выполненных без учета смысловых дополнений, формы местоимений не соответствуют роду контекстных существительных, которые они заменяют:

с.т.с. англ. языка

mine (ours, yours) the one or ones belonging to me (us, you) [7]
(morphm) (a) the one belonging to me (to us; to you) is person or animal of the definite sex (mask) (b) … of the definite sex (fem) (c)  the one belonging to me (to us; to you)  is inanimate object or animal of the indefinite sex (it is necessary to mark a c.w. instead of which the pronoun mine (ours, yours) is used): Their house /villa has some children's rooms, but mine (ours, yours) has a bigger garden.
(d) the ones belonging to me (to us; to you)

англо – русск. с.д.с. 

mine (ours, yours) мой,-я,-ё,-и (наш,-а,-е,-и; ваш,-а,-е,-и)
(morphm) (a)… мой (наш; ваш) (b)… моя (наша, ваша)
(c) (местоимение употреблено вместо отмеченного к.с.) мой,-я,-ё; наш,-а,-е; ваш,-а,-е: Their house /villaИх дом /вилла имеет несколько детских комнат, но у моего/-й (нашего/-й; вашего/-й) - больше сад.
(d) … мои (наши; ваши)

 

5. Исх. фразы содержат многозначные глагольные формы:

The bathyscaph was safely dipped on the ocean floor.

The bathyscaph was safely dipped on the ocean floor during several hours. At last moment …

The bathyscaph was safely dipped on the ocean floor during several hours.

Из словарной статьи, приведенной в с.т.с. родного английского языка (см.табл.), автор определил, что во всех предложениях глагол dip употреблен в форме страдательного залога, причём в 1-м предложении говорится о состоянии, достигнутом в результате действий, а во 2-м и в 3-м предложениях говорится о действиях, т.к. в конце предложений указывается на интервал времени … during several hours.

Далее, автор пришел к выводу о том, что в контексте второго предложения речь идет о действии несоверш. вида, а в контексте третьего предложения речь идет о действии соверш. вида.

На основании выполненного анализа автор отметил в секции дифференцированных (морфологических) значений форму страдательного залога 2. passive form в разных вариантах. В результате получены следующие кодированные тексты:

The bathyscaph was safely dipped{dip… (morphm) 2. passive form (a) (state)} on the ocean floor.

was safely dipped{dip… (morphm) 2. passive form (c) (imperf-ve)} on the ocean floor during several hours. At last moment…

was safely dipped{dip… (morphm) 2. passive form (d) (perf-ve)} on the ocean floor during several hours.

(переводы на русский язык):

Батискаф был благополучно погружен на дно океана.

… благополучно погружали на дно океана в течение нескольких часов. В последний момент …

… благополучно погрузили на дно океана в течение нескольких часов.

(для сравнения – МП без учета смысловых дополнений):

был благополучно погружен (во всех предложениях)

Как видим, без учета смысловых дополнений не отражается фактический смысл контекста.

с.т.с. англ. языка

dip v.t. 1 immerse …

(morphm) 1. Inf., Indef. T. (a) (imperf-ve (b) (perf-ve) 2. passive form (a) (state) (b) (action) (c) (imperf-ve) (d) (perf-ve)

англо – русск. с.д.с. 

dip v.t. 1 погру|жать, -зить …

(morphm) 1. (a) (несоверш) (b) (соверш)

2. страдат. (a) (состояние) (b) (действие) (c) (несоверш.) (d) (соверш.)

 

6. Фразы, обладающие синтаксической неоднозначностью.

Наконец, приведем характерные примеры, которые касаются упомянутых дифференцированных (синтаксических) значений [12*]. Как было отмечено выше, использование синтаксических значений при смысловом кодировании позволяет исключить погрешности машинного перевода в трактовке таких исходных предложений, которые обладают синтаксической неоднозначностью или, точнее, синтаксической неполнотой.

a) Исх. текст: Всё это была лишь идея, основанная на анализе исторических событий, опережающая время.

Автор определил, что слово опережающая является частью обособленного удаленного определения к к.с. идея; на основании этого автор отметил в словарной статье опере|жать соответствующее синтаксическое значение (см. табл.), а также отметил к.с. идея.

Всё это была лишь идея, основанная на анализе исторических событий, опережающая{опереать...2 забегать вперёд (syntaxm) (a) опере|жающий ... часть обособл. определения/ приложения к к.с. идея} время.

В процессе машинного перевода специальная подпрограмма обнаружила, что слово опережающая входит в состав автономной части предложения – обособленного причастного оборота. На основании этого подпрограмма трансформировала характер составных частей предложения, а именно – преобразовала удалённый причастный оборот во второе самостоятельное предложение, которое дополнила к.с. идея (т.е. idea) и формальным именным составным сказуемым это была (т.е. it was).

В результате получен следующий МП на английский язык, а также обратный перевод на русский язык:

All this was only idea based on analysis of historical experiences. It was the idea anticipatory the time.

(обратный перевод на русский язык):

Всё это была только идея, основанная на анализе исторических событий. Это была идея, опережающая время.

Таким образом обеспечена прямая синтаксическая связь между словами идея и опережающая (idea and anticipatory); для сравнения - МП на английский язык (без учета смысловых дополнений):

All this was only idea based on analysis of historical experiences(?) anticipatory the time.

(обратный перевод на русский язык): 

Всё это была лишь идея, основанная на анализе исторических событий(?), упреждающих время.

Как видим, без учета дополнений, синтаксические связи в пословном переводе становятся неоднозначными, поскольку причастие anticipatory не имеет признаков рода и числа и может быть отнесено как к дополнению experiences, так и к слову idea.

с.т.с. русск. языка

опере|жать,-дить 1 обгонять (в беге, в развитии) 2 делать что-л. раньше времени 3 превосходить

(syntaxm) (a) сказуемое, выражающее действие или состояние относительно к.с.*

(b) опере|жающий,-жаемый, -дивший, -жавший часть обособл. определения/ приложения к к.с.* (bопере|жая,-див часть обособл. обстоятельства к к.с.*, выражающему действие

русско – англ. с.д.с. 

опере|жать ... 1 overtake … 2 forestall; anticipate

3 outstrip, surpass, excel
(syntaxm) (a) a predicate (its part) expressing an action or a state relative to remote c.w.* (b) a separated attribute/ apposition (its part) to c.w.*

(c) a separated adverbial modifier (its part) to c.w.*

Как было отмечено выше, в секциях дифференцированных (синтаксических) значений приняты следующие обозначения:

к.с.* / c.w.* определенное контекстное слово, которое автор должен отметить в исх. тексте.

б) Исх. текст: The syntactic links characterize the some predicative (i.e. relating to a predicate) and non-predicative (i.e. including attributive, adverbial) syntactic relations.

Служебная программа дополнила некоторые слова символом (syntax?). Анализируя текст, автор определил:

- слова predicative, non-predicative, attributive, adverbial являются обособленными определениями к слову relations(018),

- слово relating является обособленным приложением к слову predicative(07),

- слово including является обособленным приложением к слову non-predicative(013).

На Фиг. 5 графически представлены достаточно сложные синтаксические связи в данной фразе.

 

На основании этого автор отметил в словарных статьях слов predicative, non-predicative, relate, include, attributive, adverbial синтаксические значения (см. табл.), а также отметил соответствующие контекстные слова.

В результате получен следующий кодированный текст:

The syntactic links characterize the some predicative{predic adj … (syntaxm) a separated attribute / apposition (its part) to c.w. 018} (i.e. relating{relate v ... relat|ing,-ed a separated attribute/ apposition (its part) to c.w. 07} to a predicate) and non-predicative{non-predic adj … (syntaxm) a separated attribute / apposition (its part) to c.w. 018} (i.e. including{include v includ|ing, -ed a separated attribute/ apposition (its part) to c.w. 013} attributive{attrib adj … (syntaxm) a separated attribute / apposition (its part) to c.w. 018}, adverbial{adv adj … (syntaxm) a separated attribute / apposition (its part) to c.w. 018}) syntactic relations.

(перевод на русский язык):

Синтаксические связи характеризуют некоторые предикативные (т.е. относящиеся к сказуемому) и непредикативные (т.е. включающие атрибутивные, обстоятельственные) синтаксические отношения.

Таким образом, обеспечена прямая синтаксическая связь между всеми определениями/ приложениями и определяемыми словами.

Для сравнения - МП на русский язык (без учета смысловых дополнений):

Синтаксические связи характеризуют некоторый предикативный (относящийся к сказуемому) и непредикативный (включающий атрибутивный, обстоятельственный) синтаксические отношения.

Как видим, в МП, выполненном без учета дополнений, нарушена связь между словами, а именно, обособленные определения/ приложения оторваны от слова отношения.

 

с.т.с. англ. языка

predicative, non-predic adj … (syntaxm) a separated attribute/ apposition (its part) to  c.w.
 

англо–русск. с.д.с.

predic…, non-predic… предикатив-ный, не-

(syntaxm) часть обособл. определ. /приложения к к.с.*

attributive adj…

(syntm) …”…

attributive атрибутивный

(syntm)…”…

adverbial adj…

(syntm) …”…

adverbial обстоятельственный

(syntm)…”…

relate v ... connect two things …

(morphm) (a(imperf-ve) (b) (perf-ve)

(syntaxm) (a) a predicate (its part) expressing an action or a state relative to remote c.w.* (b) relat|ing,-ed a separated attribute/ apposition (its part) to c.w.*  (c) relating, having been related a separated adverbial modifier (its part) to c.w.*  expressing action

relate v относиться, отнестись

(morphm) (a) (несоверш) (b) (соверш)

(syntaxm) (a) сказуемое, выражающее действие или состояние относительно к.с.*

(b) часть обособл. определ./ приложения к к.с.* (c) часть обособл. обстоятельства к к.с.*, выражающему действие

include v have sb/sth as a part of a whole … (morphm) (a) (imperf-ve) (b) (perf-ve)

(syntaxm) (a) a predicate (its part) expressing an action or a state relative to remote c.w.* (b) includ|ing, -ed a separated attribute/ apposition (its part) to c.w.*  (c) including, having been included a separated adverbial modifier (its part) to c.w.* expressing action

include v включ|ать, -ить …

(morphm) (a) (несоверш) (b) (соверш)

(syntaxm) (a) сказуемое, выражающее действие или состояние относитеьно к.с.*

(b) часть обособл. определ. /приложения к к.с.*

(c) часть обособл. обстоятельства к к.с.*, выражающему действие

 

Некоторые соображения общего характера. Как было отмечено выше, служебная программа смыслового кодирования обладает некоторыми инициативными функциями, например, указывает автору на несовпадение употребления слова или словосочетания в исходном тексте и в отмеченном элементе словарной статьи, а также указывает автору на слова, пропущенные в процессе анализа исходного текста, но, возможно, обладающие той или иной неоднозначностью (см. Фиг. 3).

Некоторое повышение точности идентификации исходного текста может быть достигнуто с помощью прямого и обратного перевода на один из конкретных целевых языков. С этой целью описанная выше служебная программа предварительной идентификации содержит дополнительную подпрограмму МП кодированного текста на один из конкретных целевых языков с помощью согласованного двуязычного словаря, а также подпрограмму обратного перевода полученного целевого текста на исходный язык. Автор сравнивает начальный и обратный исходные тексты и вносит изменения в некоторые ранее сделанные смысловые дополнения и /или вносит смысловые дополнения к другим словам / словосочетаниям.

Схема модифицированной системы представлена на Фиг. 6.

Исходный текст может иметь широкий спектр значений (кажущихся) как сигнал, содержащий множество дополнительных частотных составляющих. Предварительная идентификация – это фильтр, позволяющий сократить этот спектр.

Предварительная идентификация не зависит от того, на какие целевые языки потенциально будет осуществляться перевод: фрагмент словарной статьи исполняет функцию кода - он дает точный путь от отмеченного элемента к заглавному слову в толковом словаре, и от заглавного слова к переводу этого элемента в любом из согласованных двуязычных словарей.
Как было отмечено выше, каждое из смысловых дополнений может быть представлено также и в более компактной форме - в виде порядковых номеров, которые однозначно обозначают в согласованных словарях положение элемента словарной статьи.

Создание систем согласованных словарей требует усилий лингвистов, но не связано с решением каких-либо трансцендентных задач.
Правила предварительной идентификации могут быть изложены в виде  инструкций - не более сложных, чем ряд грамматических и синтаксических правил, а также правил пользования словарём.

Кодированные исходные тексты (описания изобретений, научные статьи и т.п.), при их публикации в электронной форме могут содержать “невидимые”, на первый взгляд, смысловые дополнения; это касается также личных документов (автобиографий и т.п.), направляемых работодателям в различных странах.

Ссылки (References).

специальные источники:

1. US Patent 5,285,386 Machine translation apparatus having means for translating polysemous words using
dominated codes.
2. US Patent 5,845,306 Context based system for accessing dictionary entries.
3. Universal Networking Language (UNL) Specifications. Version 2005.  Universal Networking Digital Language Foundation, www.undl.org/unlsys/unl/unl2005/  
3*. UNL home page http://www.unl.ias.unu.edu/ 
Толковые словари:
5. Большой толковый словарь русского языка  (2000), НОРИНТ, С.-Петербург 
6. Oxford Advanced Learner’s Dictionary of current English (1989), Oxford University Press
7. The Concise Oxford Dictionary of current  English (1995), Clarendon Press Oxford
14. Langenscheidts Großwörterbuch Deutsch als Fremdsprache (1998), Neubearbeitung
11**. The Concise Sapphire Dictionary, Editor in Chief: Eitan Avneyon,  (1997), Israel
Двуязычные словари:
8. Oxford Russian Dictionary, Russian-English, English-Russian (2000), Oxford University Press
9.  Рымашевская Э.Л., Немецко-русский и русско-немецкий словарь // Русский язык, М.:1990.
9* Langenscheidts Taschenwörterbuch Russisch (Russisch - Deutsch, Deutsch – Russisch), Langenscheidt                                       
10. Смирницкий А.И. и др. (2002) Большой русско-английский словарь, Русский язык, М. / Comprehensive Russian –English Dictionary, A. I. Smirnitsky (2002), Russky Yazyk Publishers, Moscow
11. Русско – Ивритский словарь под редакцией Подольского Б. (1992), Русский язык, М.   
11***. The Сomplete Hebrew – English Dictionary by Reuben Alcalay,  Massada Publishing Co. Ramat-Gan-Jerusalem
15. Мюллер В.К. (2000) Англо – русский словарь, Золотой век, Диамант, С.-П. / English – Russian Dictionary, V.K. Müller (2000), “Zolotoi Vek”, “Diamant” St.-Petersburg
другие источники:

4. Кунин А. В. (1967), Англо-русский фразеологический словарь,  Советская энциклопедия, М.,  1233 – 1264
13. Циммерман М., Веденеева К. (1999) Русско – английский научно – технический словарь переводчика, Наука, М.  / Mikhail Zimmerman, Claudia Vedeneeva (1999), Russian - English Translators Dictionary (A Guide to Scientific and Technical Usage), John Wiley & Sons, 50, 340, 509
11*. Склонение предлогов и др. частей речи с помощью местоименных суффиксов (1992), Дфус Эфи, Израиль, Т.-А.  
12. Качалова К. Н., Израилевич Е. Е. (1999), Практическая грамматика английского языка, ЮНВЕСТ ЛИСТ, М., 72-76, 113-162, 166-184, 214-216, § 131, 279-287, 439-445
12* Современный русский язык, под ред. Д.Е. Розенталя (1979), Часть 2, Синтаксис. М., Высшая школа, 123-135
16. И.М. Богуславский, Л.Л. Иомдин, А.В. Лазурский, Л.Г. Митюшин, А.С. Бердичевский  (2005): Интерактивное разрешение неоднозначности различных типов в машинном переводе, труды конференции Диалог 2005, Секция Разрешение неоднозначностей
http://www.dialog-21.ru

16*. Интерактивное разрешение лексической и синтаксической неоднозначности в системах автоматической обработки естественного языка. Лазурский А.В., Бердичевский А.С. ., Крейдлин Л.Г., МитюшинЛ.Г. ., Сизов В.Г. Институт проблем передачи информации РАН, http://company.yandex.ru/grant/2005/01_Lazursky_102921.pdf
17. Панич Ю.В. Универсальное смысловое кодирование исходного текста и его перевод с использованием системы согласованных словарей (I,II),
http://www.elektron2000.com 2007.

18. Panich Iuli. The expanded system of coordinated dictionaries and its using for universal semantic coding and translation of the polysemous source text, (также русская версия: Расширенная система согласованных словарей и её применение для смыслового кодирования и перевода многозначного исходного текста), http://www.translationdirectoty.com 2008.

 

Дата публикации: 24 декабря 2008
Источник: SciTecLibrary.ru

Вы можете оставить свой комментарий по этой статье или прочитать мнения других в следующих разделах ФОРУМА:
Свернуть Защита интеллектуальной собственности и авторских прав
Диспуты по темам изобретательства. Вопросы по изобретениям, проблемы на пути изобретателей и методы их решения.
Патентование. Все о патентовании изобретений, полезных моделей, промышленных образцов и товарных знаков.
Нерешенные задачи. Здесь идет обсуждение нерешенных задач: безопорный двигатель, вечный двигатель, преодоление гравитации и пр.
Свернуть Точные науки и дисциплины
Дебаты по Теории Относительности Эйнштейна. Все кому не лень хотят опровергнуть Теорию Относительности Эйнштейна. Вам предоставляется слово для аргументации.
Физика, астрономия, математические решения. Физико-математические вопросы, наблюдения, исследования, теории и их решение.
Физика альтернативная. Новые взгляды на физические законы, теории, эксперименты, не вписывающиеся в общепринятые законы физики.
Teхника, узлы, механизмы, электроника и аппаратура. Все про технику, приборы, детали, узлы и механизмы. Электроника, компьютеры, программное обеспечение. Новые технические решения в самых разных областях.
Биология, Генетика, Все о жизни. Генетика и другие вопросы биологии. Их развитие. Медицина. Биотехнологии, агротехника и сельское хозяйство. Эволюционные теории и альтернативные им.
Химия. Вопросы по химическим технологиям, разработкам и применению химических материалов. Химические элементы и их свойства.
Геология, все о Земле и ее обитателях. Геология, метеорология, антропология, сейсмология, атмосферные явления и непознанные эффекты природы.
Свернуть Мозговой штурм
Генератор решений. Здесь Вы можете заработать реальные деньги, помогая решать фирмам, предприятиям и частным лицам те или иные технические задачи, которые перед ними стоят. Те, кто ставят задачи перед участниками должны обозначить гонорар за ее решение и перевести указанную сумму на общий счет генератора.
Головоломки. Если у Вас есть желание поломать голову над интересными логическими задачами - Вам сюда.
Гипотезы. В этой теме идет обсуждение гипотез и предположений, основанных чисто на теории и логике.
Найди ляп! Этот раздел для тех, кто хочет мысленно расслабиться. Он посвящен задачам по поискам ляпов, которые встречаются в литературе, интернете, кино и на телевидении.
Свернуть Взгляд в будущее и настоящее
Глобальные темы. Вопросы касающиеся всех. Глобальные угрозы и злободневные темы современности.
Наука и ее развитие. Все о развитии науки, направлениях и перспективах движения научной мысли и знаний.
Новая Цивилизация. Принципы социального устройства новой цивилизации. Увеличение роли созидательного интеллекта... Отдалённые перспективы развития человечества...
Вопросы без ответов. Этот раздел посвящен вопросам и проблемам, которые до сих пор не решены. Предлагайте свои решения.
Военная стратегия и тактика современных боевых действий. Об особенностях современного военного искусства. Проблемные вопросы теории и практики подготовки вооруженных сил к войне, её планирование и ведение в различных конфликтах на планете.
Свернуть Гуманитарные науки и дисциплины
Философские дискуссии. Диспуты по вопросам жизни, сознания, бытия и иных философских понятий.
Экономика. Вопросы по экономике и о путях развития России и других стран.
Социология, Политология, Психология. В этом разделе обсуждаются вопросы, как отдельных частных исследований данных наук, так и проблема соотношения этих наук с остальными.
Образование. Все об образовании: как учить, кому учить, чему учить и кого учить.
Религия и атеизм. Вопросы религий и атеистические взгляды, религиозные споры.

Хотите разместить свою статью или публикацию, чтобы ее читали все?
Как это сделать - узнайте здесь.

Назад

 
О проекте Контакты Архив старого сайта

Copyright © SciTecLibrary © 2000-2017

Агентство научно-технической информации Научно-техническая библиотека SciTecLibrary. Свид. ФС77-20137 от 23.11.2004.