Добавить в цитаты Настройки чтения

Страница 13 из 13

Первые попытки машинного перевода

С появлением компьютеров у нескольких ученых одновременно возникло желание применить их к автоматизированному переводу с одного естественного языка на другой (Machine Translation, MT). Но задача оказалась сложнее, чем они предполагали, только через полвека, когда MT стал одним из направлений в AI, бесплатные сервисы условно справляются с переводом текстов на уровне, достаточном для ознакомления с содержанием, но делают они это чисто формально и не имеют ничего общего с теми первыми системами.

У задачи МТ есть своя давняя предыстория. В IX веке арабский криптограф Аль-Кинди хотел упростить процесс перевода, он применил методы, которые мы сегодня отнесли бы частотному анализу, теории вероятностей и статистике. В последующем, в XVII–XIX веках предпринимались и теоретические, и даже практические попытки упростить перевод с помощью разного рода механических устройств. За редчайшим исключением все они заканчивались провалом, относительного успеха добился лишь Жорж Арцруни, француз армянского происхождения, эмигрант из России, получивший образование в Санкт-Петербургском университете. Он смог в 30–40-е годы прошлого века создать механизм помогавший переводчику. В СССР механизацией перевода занимался Петр Петрович Смирнов-Троянский (1894–1950), его машина представляла собой фотоаппарат, синхронизированный с печатной машинкой, автор получил на нее патент, но она была слишком сложной и осталась невостребованной.

Первенство в использовании электронного компьютера для MT принадлежит математику Уоррену Уиверу (Warren Weaver, 1894–1978). В 1947 году он выразил свой замысел в форме письма, адресованного Норберту Винеру, а позже в 1949 году оформил его, как тогда было приято, в виде пространного меморандума. В нем Уивер обосновал целый ряд подходов к решению задачи MT, в том числе ориентацию на нейронные сети. Идеи Уивера были приняты, он продолжил исследования в Массачусетском технологическом институте. В начале 50-х им была написана программа MT, работавшая на компьютере SWAC (Standards Western Automatic Computer), одном из двух уникальных компьютеров, разработанных в 1950 году Гарри Хаски (Harry Huskey, 1916–2017) для Национального бюро стандартов США. В 1954 году удалось перевести несколько предложений с русского на английский, но дальше дело не пошло, однако работа стимулировала исследования в области MT.

Более громкую и куда менее заслуженную известность получил другой эксперимент по МТ, известный как Джорджтаунский. Если работа Уивера была глубоким исследованием, то это начинание – ни чем иным, как типичным примером «наивного» MT. Его авторы стремились побыстрее решить актуальную на тот момент задачу – перевод технической документации с русского на английский. В эксперименте участвовали представители IBM и Джорджтаунского университета. А отличие от Уивера авторы пошли к цели в лоб – они загрузили в мэйнфрейм IBM 701 программу, оперировавшую 250 словами и 6 грамматическим правилами. Русские и английские слова и правила хранились на магнитных барабанах, переводимые предложения вводились с перфокарт, а результат выводился на принтер. Алгоритм перевода заключался в формальном подборе маски из английских слов, которая накладывалась на последовательность русских слов. Избранный метод неплохо подходил для перевода тривиальных фраз типа «качество угля определяется калорийностью» транслитерированной в «kachyestvo uglya opryedyelyayetsya kaloryiynostjyu», именно эта фраза почему-то оказалась первой из переведенных. Для более сложных фраз этот метод явно не годился. Если учесть только стоимость IBM 701, составлявшую порядка 1 миллиона долларов того времени, когда автомобиль стоил около 1000, то рациональным все, что было сделано в Джорджтаунском университете, нельзя признать никак. Тем не менее этот эксперимент, невзирая на примитивность по-своему интересен, он остался в истории как редкий для пятидесятых случай применения компьютера не по прямому назначению.

Несмотря на очевидную ограниченность решения, внимание к Джорджтаунскому эксперименту оказалось колоссальным, практически вся американская пресса писала о достигнутом успехе, используя самые восторженные эпитеты. Как только ни называли компьютер IBM: и «машиной-билингвой», и «вундеркиндом-полиглотом», и «электронным мозгом, переводящим с русского». Впрочем, можно предположить, что Джорджтаунский эксперимент потребовался корпорации IBM, скорее всего, для поднятия реноме, она задержалась на старте компьютерной гонки. На первых порах в ней лидировала компания UNISYS, прославившаяся тем, что ее компьютер UNIVAC 1 помог предсказать победу Дуайта Эйзенхауэра на президентских выборах 1952 года. Во многом благодаря рекламе машинного перевода за короткий срок IBM удалось стать монополистом на рынке мэйнфреймов. И еще стоит учесть, что эксперимент с переводом имел явно выраженный политический характер, коммунистическая угроза рассматривалась как вполне реальная со всеми вытекающими выводами.





Конец ознакомительного фрагмента.

Текст предоставлен ООО «

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.