Добавить в цитаты Настройки чтения

Страница 32 из 37

2. Преобразование структуры входного предложения в промежуточную (ядерную) структуру по правилам ма­шинной грамматики. Например, по правилам грамматики непосредственно составляющих такое преобразование бу­дет иметь вид:

NVN=>NV=>V.

3. Синтез синтаксической структуры выходного пред­ложения. Для нашего простого примера она может быть двоякой:

- для предложения с глаголом-сказуемым в действи­тельном залоге:

Nl(nomin) V(active) N2(accus.);

- для предложения с глаголом-сказуемым в страдатель­ном залоге:

N2(nomin) V(passive) Nl (instr.).

После этапа трансфера следует этап лексического синте­за элементов выходного предложения, т.е. выбор эквива­лентов по синтаксическим и семантическим признакам.

За лексическим синтезом следует графемный синтез (преобразование словарных форм переводных эквивален­тов в соответствующие текстовые формы - в нужном па­деже, лице, числе и т.д.). В результате выходное предложе­ние принимает вид:

свинец (лот / грузило / проводник) всасывает (впиты­вает / абсорбирует / амортизирует / поглощает) излуче­ние (радиацию) или

излучение (радиация) впитывается (абсорбируется / амортизируется / поглощается) свинцом (лотом / гру­зилом / проводником).

Так в общих чертах работает переводящий автомат второго уровня, построенный по схеме синтактико-семан-тического трансфера. Такой автомат строится для опреде­ленной пары языков и, как вы сами можете судить, ис­пользует алгоритмические процедуры анализа и синтеза на основе синтаксической и семантической информации.

Как уже говорилось, большинство коммерческих пере­водящих систем работает на этом принципе. В некоторых из них синтактико-семантическая информация более пол­ная и алгоритмы анализа более тонкие, чем в других. Такие "электронные переводчики" переводят чуть лучше, чем их более примитивно устроенные "братья по классу", но в лю­бом случае без привлечения фоновой информации они не в состоянии конкурировать с человеком.

Кроме схемы трансфера в переводящих системах второ­го уровня применяется также так называемый язык-посредник. Язык-посредник (interlingua, pivot language) -это некий универсальный код, с помощью которого мож­но единым образом выразить грамматическую и семанти­ческую информацию, содержащуюся в тексте на любом языке.

Задача переводящего автомата, применяющего язык-посредник, будет состоять в том, чтобы преобразовать текст на одном языке в форму языка-посредника, а затем, используя средства другого языка, генерировать выходной текст из форматов языка-посредника.

Привлекательность этой идеи достаточно очевидна, но ее практическое воплощение оказалось очень непростым. И хотя некоторые зарубежные системы в своих рекламных буклетах пишут об использовании единого языка-посредника для автоматического перевода с разных язы­ков, это, насколько мне известно, скорее рекламный при­ем, чем действительное положение вещей.

Описать в едином формате даже структурно подобные языки достаточно сложная задача сама по себе, не говоря уже о ее алгоритмической реализации. Поэтому в настоя­щее время, несмотря на обширный теоретический матери­ал, едва ли можно говорить о коммерческих системах ма­шинного перевода, работающих на принципе языка-посредника.

Такова ситуация с практической реализацией систем второго уровня.

Что же касается систем третьего уровня, то, как уже го­ворилось выше, экспериментальные системы такого типы разработаны лишь для некоторых очень ограниченных тематических сфер.

В этих системах окончательное решение о выборе пере­водного эквивалента принимается "блоком принятия ре­шений" на основе так называемой базы знаний - формаль­ного описания фрагмента реального мира (его составляю­щих и отношений между ними). Сложность концептуаль­ной и программной реализации таких систем, я думаю, очевидна.

Особое место в теории и практике машинного перевода занимают системы, основанные на статистических моделях переводных соответствий.

Согласно статистическому подходу к конструированию систем автоматического перевода, любое слово одного языка может быть переведено любым словом другого, только с разной вероятностью.





Задача переводящего автомата, работающего на веро­ятностном принципе достаточно проста.

На первом этапе, называемом этапом обучения, этот

автомат должен сравнивать оригинальные тексты и вы­полненные человеком переводы этих текстов и регистри­ровать величины вероятности разных переводных эквива­лентов.

Параллельно на этапе обучения автомата в зависимости от используемой модели регистрируется либо порядок слов в исходном и переводном предложении, либо вероят­ность перевода двух-, трехсловных словосочетаний.

В итоге на основании анализа параллельных двуязыч­ных текстов автомат после этапа обучения составляет сло­варь наиболее вероятных эквивалентов.

После этого следует этап перевода, когда автомат, поль­зуясь составленным таким образом вероятностным слова­рем, переводит новый текст. В случае неполноты словаря обучение автомата продолжают на новом массиве парал­лельных текстов.

Такова общая идея. Конечно, она представлена упро­щенно - в действительности вычисление вероятности пе­реводных эквивалентов производится по сложным много­параметрическим формулам, учитывающим текстовое ок­ружение исходного и переводного слова.

Идея статистического машинного перевода появилась еще в пятидесятые годы, но сейчас она снова становится популярной. Возрождение идеи статистического машин­ного перевода можно объяснить следующим:

• Огромными технологическими возможностями со­временных компьютеров (память, быстродействие).

• Наличием больших объемов двуязычных параллель­ных текстов на машинных носителях.

• Отсутствием стройной и непротиворечивой теории перевода, которая смогла бы выдержать проверку на компьютерной модели.

Статистические модели перевода активно разрабатыва­ются в США и в некоторых других странах, и, на мой взгляд, у них большое будущее.

Учитывая огромное число факторов, определяющих качество перевода (значительная часть которых либо не

известна, либо не поддается формализации), статистиче­ские модели представляются пока единственным надеж­ным способом описания переводческого процесса.

Такова сегодня в общих чертах ситуация с автоматиче­ским переводом. Возможно, кто-то из читателей уже купил себе переводящий пакет, возлагая на него какие-то более или менее радужные надежды. И разочарование, увы, не­избежно. Я думаю, что, прочтя эту маленькую главу, вы несколько лучше представляете себе причины постигшего вас разочарования.

Таким образом, господа переводчики могут не волно­ваться - в обозримом будущем безработица им не грозит. Но вот как быть с "электронными переводчиками"? Нуж­ны ли они переводчикам "живым"?

Я думаю, что те "электронные переводчики", которые сейчас выпускаются, переводчику-профессионалу ни к че­му. Вот что действительно необходимо - так это большой электронный словарь, который вы можете "напустить" на иностранный текст и получить все возможные эквивален­ты, а дальше уж, я думаю, вы сами.разберетесь.

Возможно, "электронный переводчик" сможет помочь специалисту в какой-либо области переводить интересую­щие его тексты. Возможно, но берегитесь скрытых оши­бок!

Пока что единственное, на что годится автомат, - это помочь нам еще раз убедиться в собственном превосходст­ве. Давайте избавляться от столь распространенного и по­нятного у переводчика комплекса неполноценности. Про­чтите этот текст: вы бы никогда так не перевели, правда?!

"Ученик Cabanel, Comerre посетил(сопровождал) Ecole des Beaux - искусства в Париже. Академическое обучение художника ведомого его в направлении живописи чис-ла(фигуры), со специфической склонностью к типу вялой и чувственной представительницы женского пола нагой, что Cabanel так часто окрашиваемый также. В 1875 Comerre выиграл престижный Prix Рим, привлекая внима­ние публики с его портретами и картинами истории. По-