Страница 63 из 74
Гигантские ускорители… Центры ядерных исследований… Трансконтинентальные энергетические, телевизионные, радиоастрономические системы… Глобальная сеть спутников связи или космических метеостанций…
Сверхглубокие скважины…
Без обмена информацией вообще немыслимо создание никаких технических «чудес» — ни сущих, ни грядущих.
«Нужно выработать радикально лучшее средство общения, — считает английский ученый-марксист профессор Джон Бернал, — особенно ныне, когда мир становится действующим научным и экономическим комплексом, в котором вавилонская мешанина языков является ужасающими путами».
Поможет ли робот создать «радикально лучшее средство общения»?
Специалисты осторожны в своих оценках.
«Достижения машинного перевода пока еще достаточно скромны, — признает академик Аксель Иванович Берг, председатель Научного совета по комплексной проблеме „Кибернетика“ АН СССР, — трудно ожидать серьезных, имеющих значение для практики результатов ранее чем через 8–10 лет».
Анализируя возникающие здесь трудности, профессор Колумбийского университета (США) Мортимер Таубе касается и экономического аспекта: «Кодирование печатного текста — дорогая операция. Даже самые пылкие машинопоклонники не отрицали, что автоматический перевод останется экономически невыгодным до тех пор, покуда не будет создано читающее устройство, способное автоматически преобразовывать печатный текст в последовательность отверстий на перфокартах или иной код, легко воспринимаемый машиной. Имеются читающие устройства, которым доступны шрифты стандартной формы и стандартного размера при строго определенном положении букв. Но никто еще не придумал устройства, способного правильно считывать любой шрифт».
Над технической задачей, о которой упоминает Таубе, много лет подряд бились ведущие кибернетики США (Оливер Селфридж, Фрэнк Розенблат) и других стран. Проблема оказалась не из легких.
Соотечественник Таубе, математик Уолтер Питтс, как-то заметил: «Даже определение абсолютно точных и строгих правил узнавания буквы А во всех видах, встречающихся хотя бы в печатном тексте, — грандиозная задача». И тут же выразил сомнение, что ее вообще удастся когда-нибудь решить.
7 февраля 1962 года собрание Академии наук заслушало доклад директора Института автоматики и телемеханики академика В. А. Трапезникова о работе советского ученого Э. М. Бравермана, предложившего весьма перспективный подход к проблеме.
Видеть букву, понимать дух!
Когда мы разглядываем какой-нибудь вензель, его изображение проецируется хрусталиком на глазное дно, которое похоже на соты — оно состоит из великого множества тесно примыкающих друг к другу клеток (палочек и колбочек). Каждый из этих зрительных рецепторов воспринимает лишь кусочек общей картины. Если ячейка оказалась затененной, от нее в мозг по нервному волокну идет иной сигнал, чем от незатененной.
Сетчатку можно моделировать мозаикой, составленной из фотоэлементов. Допустим, их 60 (это несравненно меньше, чем светочувствительных клеток на внутренней стенке глаза, но принципиальной разницы тут нет). И расположены они 10 горизонтальными рядами друг под другом, по 6 штук в каждом ряду. Получилась прямоугольная сетка. Представьте, что на нее упало изображение плоской черно-белой фигуры. Пятерка, не правда ли? Неказистая, но все же не тройка, не семерка, не иная цифра. Мы сразу узнали ее выразительный абрис. А вот машине надо втолковать: мол, данный орнамент есть не что иное, как «5». Пусть от темных участочков в электронный мозг по проводам тотчас понеслись импульсы.
Обозначим элемент, попавший в область тени, единицей, а освещенный — нулем. Обегая картинку слева направо и сверху вниз, развернем последовательность единиц и нулей в строку: 111111 100000 100000 111100 000010 000001 000001 000001 10010 111100.
Если на «сетчатке» машины появятся другие паркетажи, то и соответствующие им комбинации единиц и нулей (импульсов и пауз) будут иными. Каждое сочетание черных и белых клеточек описывается одним-единственным кодовым числом. Геометрически это интерпретируется так: любому из графических вариантов буквы или цифры отвечает только одна точка со своим, «персональным» набором координат (единиц и нулей). Все возможные начертания той же арабской «пятерки», славянского «буки» или иного образа составят целую семью точек, тесно сгрудившихся в некоем многомерном пространстве. Браверман высказал гипотезу, что каждое такое скопление компактно: оно расположено густой галактикой, не перекрывается соседней, даже не имеет выступов, глубоко вклинивающихся в чуждые пределы.
Такие «рои» довольно легко отграничить друг от друга демаркационной линией, а вернее — поверхностью. Правда, семейства могут соприкасаться в некоторых точках, являющихся «местами общего пользования». Скажем, угловатое 6, оно же округлое Б, относится к классу всех «шестерок» и одновременно к классу всех «буки». А некоторые «уродцы» из множества всех Б окажутся «эрзац-пятерками». Но в большинстве случаев водораздел между множествами удается проложить без труда. К этому и свел Браверман задачу автоматического узнавания созерцаемых объектов.
Сперва машина обучалась. Ей представляли карточку за карточкой: вот это сплошь пятерки, хотя они и отличаются друг от друга, это тройки, а это двойки. В запоминающем устройстве после каждой демонстрации оседало число — координаты данной точки. В предположении, что точки каждого образа должны ложиться кучно, электронный мозг размежевывал пространство на объемные доли: тут собралась компания из нескольких пятерок, продемонстрированных машине, значит, здесь же удел всех возможных, в том числе еще не показанных, графических вариантов символа 5; там сконцентрировалось несколько троек, стало быть, туда же попадут и все прочие, пока еще незнакомые их сородичи, когда их предъявят машине.
Затем начался экзамен. Машине предъявляли знак такой формы, какой она еще не видывала. Вычислив координаты новой точки, она определяла, куда отнести незнакомца — к вместилищу ли всех двоек, троек или пятерок.
Сотни правильных и лишь несколько ошибочных ответов — такую уверенность дала опознающей машине программа Бравермана.
Трудно переоценить значение этого и других подобных исследований. Уже говорилось, что одна из проблем автоматического перевода заключается именно в создании читающего устройства. (Одно из таких устройств — ЧАРС-65 — разработано недавно в Институте кибернетики АН УССР. Оно воспринимает буквы и цифры, напечатанные любым шрифтом.
Скорость считывания во много раз выше, чем у человека, — 200 знаков в секунду.) Но дело не только в новых возможностях, которые открываются перед конструкторами электронных «обозревателей» и «архивариусов».
«Если машину можно научить отличать букву А в любом начертании от буквы Б, — пишет харьковский кибернетик Ю. Н. Соколовский, — то ее можно принципиально научить и отличать собаку от кошки, несмотря на разнообразие пород и мастей. А если так, то почему бы не научить машину, снабженную фотоэлектрическим глазом, давать словесные описания того, что она видит перед собой?»
Автоматическое опознавание рассматриваемых объектов пригодится прежде всего там, где анализируются изображения (треки ядерных частиц, снимки небесных гаи, топографические карты, конструкторские чертежи, типографские корректуры, всевозможные кривые — от кардиограмм до сейсмограмм, наконец, почерки, отпечатки пальцев и так далее). А по мнению специалистов США, электронный оператор следя за экраном радиолокатора, смог бы быстрее человека определять тип судов, самолетов или ракет, попавших в поле его зрения. Не случайно работы над устройством «персептрон» (от латинского «понимать», «познавать») велись Ф. Розенблатом в лаборатории аэронавтики Корнельского университета под пристальным надзором «медных касок», как величают военных сами американцы…
«Узнающую» программу несколько иного типа составил советский ученый М. М. Бонгард. Правда, машину «натаскивали» не на рисунках, ей показывали таблицы. Они содержали по три числа в каждой строке. Скажем, 2, 5 и минус 30 в первой.