Страница 13 из 13
Первые попытки машинного перевода
С появлением компьютеров у нескольких ученых одновременно возникло желание применить их к автоматизированному переводу с одного естественного языка на другой (Machine Translation, MT). Но задача оказалась сложнее, чем они предполагали, только через полвека, когда MT стал одним из направлений в AI, бесплатные сервисы условно справляются с переводом текстов на уровне, достаточном для ознакомления с содержанием, но делают они это чисто формально и не имеют ничего общего с теми первыми системами.
У задачи МТ есть своя давняя предыстория. В IX веке арабский криптограф Аль-Кинди хотел упростить процесс перевода, он применил методы, которые мы сегодня отнесли бы частотному анализу, теории вероятностей и статистике. В последующем, в XVII–XIX веках предпринимались и теоретические, и даже практические попытки упростить перевод с помощью разного рода механических устройств. За редчайшим исключением все они заканчивались провалом, относительного успеха добился лишь Жорж Арцруни, француз армянского происхождения, эмигрант из России, получивший образование в Санкт-Петербургском университете. Он смог в 30–40-е годы прошлого века создать механизм помогавший переводчику. В СССР механизацией перевода занимался Петр Петрович Смирнов-Троянский (1894–1950), его машина представляла собой фотоаппарат, синхронизированный с печатной машинкой, автор получил на нее патент, но она была слишком сложной и осталась невостребованной.
Первенство в использовании электронного компьютера для MT принадлежит математику Уоррену Уиверу (Warren Weaver, 1894–1978). В 1947 году он выразил свой замысел в форме письма, адресованного Норберту Винеру, а позже в 1949 году оформил его, как тогда было приято, в виде пространного меморандума. В нем Уивер обосновал целый ряд подходов к решению задачи MT, в том числе ориентацию на нейронные сети. Идеи Уивера были приняты, он продолжил исследования в Массачусетском технологическом институте. В начале 50-х им была написана программа MT, работавшая на компьютере SWAC (Standards Western Automatic Computer), одном из двух уникальных компьютеров, разработанных в 1950 году Гарри Хаски (Harry Huskey, 1916–2017) для Национального бюро стандартов США. В 1954 году удалось перевести несколько предложений с русского на английский, но дальше дело не пошло, однако работа стимулировала исследования в области MT.
Более громкую и куда менее заслуженную известность получил другой эксперимент по МТ, известный как Джорджтаунский. Если работа Уивера была глубоким исследованием, то это начинание – ни чем иным, как типичным примером «наивного» MT. Его авторы стремились побыстрее решить актуальную на тот момент задачу – перевод технической документации с русского на английский. В эксперименте участвовали представители IBM и Джорджтаунского университета. А отличие от Уивера авторы пошли к цели в лоб – они загрузили в мэйнфрейм IBM 701 программу, оперировавшую 250 словами и 6 грамматическим правилами. Русские и английские слова и правила хранились на магнитных барабанах, переводимые предложения вводились с перфокарт, а результат выводился на принтер. Алгоритм перевода заключался в формальном подборе маски из английских слов, которая накладывалась на последовательность русских слов. Избранный метод неплохо подходил для перевода тривиальных фраз типа «качество угля определяется калорийностью» транслитерированной в «kachyestvo uglya opryedyelyayetsya kaloryiynostjyu», именно эта фраза почему-то оказалась первой из переведенных. Для более сложных фраз этот метод явно не годился. Если учесть только стоимость IBM 701, составлявшую порядка 1 миллиона долларов того времени, когда автомобиль стоил около 1000, то рациональным все, что было сделано в Джорджтаунском университете, нельзя признать никак. Тем не менее этот эксперимент, невзирая на примитивность по-своему интересен, он остался в истории как редкий для пятидесятых случай применения компьютера не по прямому назначению.
Несмотря на очевидную ограниченность решения, внимание к Джорджтаунскому эксперименту оказалось колоссальным, практически вся американская пресса писала о достигнутом успехе, используя самые восторженные эпитеты. Как только ни называли компьютер IBM: и «машиной-билингвой», и «вундеркиндом-полиглотом», и «электронным мозгом, переводящим с русского». Впрочем, можно предположить, что Джорджтаунский эксперимент потребовался корпорации IBM, скорее всего, для поднятия реноме, она задержалась на старте компьютерной гонки. На первых порах в ней лидировала компания UNISYS, прославившаяся тем, что ее компьютер UNIVAC 1 помог предсказать победу Дуайта Эйзенхауэра на президентских выборах 1952 года. Во многом благодаря рекламе машинного перевода за короткий срок IBM удалось стать монополистом на рынке мэйнфреймов. И еще стоит учесть, что эксперимент с переводом имел явно выраженный политический характер, коммунистическая угроза рассматривалась как вполне реальная со всеми вытекающими выводами.
Конец ознакомительного фрагмента.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.