Алло, робот - Кондратов Александр Михайлович - Страница 24
- Предыдущая
- 24/32
- Следующая
Но первые же попытки применить ее к задачам перевода сразу показали, что этот орешек будет покрепче. Да и к расшифровке древних письменностей эта методика не применима. Когда мы расшифровываем секретное донесение, мы твердо знаем, что оно написано на .каком-то из известных нам языков. Форма, структура языка не затрагивается шифром, он является подобием «морзянки». Поэтому возможно раскодировать самый запутанный секретный шифр.
При дешифровке древних письмен язык неизвестен, и нет никакой уверенности, что можно подыскать среди «живых» языков мира подходящий. Напротив, почти с полной уверенностью можно утверждать, что такой язык не найти.
Вы, наверное, читали рассказ Эдгара По «Золотой жук». Его герой Уильям Легран нашел пожелтевший пергамент с загадочной надписью:
Пользуясь статистикой, Легран сумел прочесть эту шифрованную надпись. Зная, кал часто встречаются буквы английского языка, он приравнял самый частый знак надписи к самой частой букве алфавита; второй по частоте знак шифровки — ко второй букве, и т. д. Но если бы Легран попробовал применить свой метод к расшифровке древних письмен, он не получил бы желаемого результата.
Например, стремясь расшифровать рукописи майя, он быстро бы зашел в тупик. Как отождествлять знаки рукописи? Древний язык майя неизвестен, и неоткуда взять «самую частую букву языка» и сопоставить ее с «самым частым знаком». К тому же знаки майя могут передавать не только одну букву, но и целые слоги и даже слова. И сколько бы ни бился дешифровщик над письменами, при такой методике он ни за что не смог бы прочесть древние знаки. Не помогли бы и электронные вычислительные машины, будь они во времена Эдгара По.
Задача машинного перевода еще бодее сложна, чем дешифровка древних письмен. Ведь при переводе с языка на язык, как замечает один из пионеров машинного перевода в нашей стране Дмитрий Юрьевич Панов, мы «меняем всю ту сложнейшую и тончайшую систему выражения мыслей, которая веками вырабатывалась тем или иным народом и теснейшим образом связана с его мышлением, историей, обычаями, образом жизни».
А это значит, что для машинного перевода нужно искать новые методы, новые программы, а не слепо идти проторенной, но ведущей в тупик «шифровальной» дорожкой.
ВПЕРВЫЕ В МИРЕ
Идея перевода с помощью машины долгое время считалась утопией. Уж слишком невероятным казалось, чтобы робот мог выполнить такую тонкую работу. Даже Норберт Винер, создатель кибернетики, не верил в возможность машинного перевода. «Механизация языка представляется весьма преждевременной», — заявил он в 1947 году. А между тем задолго до этого в нашей стране было запатентовано устройство «для подбора и печатания слов при переводе с одного языка на другой или несколько других одновременно». Придумал его талантливый советский инженер П. П. Троянский. В 1933 году ему было выдано авторское свидетельство на это изобретение.
Переводческая машина Троянского представляла собой автоматический словарь. Ведь именно поиск нужного слова занимает большую часть времени при переводе с языка на язык. Человек, по мысли Троянского, сначала подготавливает иностранный текст: все изменяемые слова записываются в основных формах. Существительное — в именительном падеже и единственном числе, глагол — в инфинитиве, и т. д. Например, слова «приказывающий машинам» были бы записаны как «приказывать машина». Правила грамматики, или, как называл их Троянский, «знаки логического разбора», также ставятся человеком, «препарирующим» текст.
Затем машина заменяет слова препарированного текста на слова чужого языка. Разумеется, они также даются в препарированном виде: без грамматики и в основных формах. Человеку остается произвести «обратное препарирование» — придать словам чужого языка грамматические формы, согласно «знакам логического разбора», и перевод с языка на язык- готов.
В этом проекте автоматического перевода машина выполняет самый трудоемкий, но промежуточный этап работы. Изобретатель, однако, указывал, что в принципе можно поручить машине весь процесс перевода. Она сама будет препарировать текст на одном языке и делать «обратное препарирование» на другом. Ибо грамматика, записанная в виде четких логических правил, также может быть доступна механическому переводчику.
Для того чтобы воплотить свой проект в жизнь, Троянский предложил в 1933 году модель переводческой машины. Она состояла из передвигающейся по столу ленты с нанесенными на ней словами на различных языках. Принцип работы был чисто механический. Это и понятно — ведь в то время не было не только кибернетики, но и электронных вычислительных машин.
В 1941 году изобретатель построил электромеханический вариант своей машины. А в 1948 году предложил сделать ее на электромагнитной аппаратуре связи. Но все эти модели так и не получили путевки в жизнь. Не было необходимой технической базы — электронных вычислителей-гигантов. Именно им был поручен машинный перевод.
«МЫ МОГЕМ СДЕЛАТЬ»
В конце 40-х годов вопрос о возможности машинного перевода только обсуждался американскими и английскими учеными; в 50-х началась совместная работа математиков и лингвистов. В январе 1954 года в конторе фирмы «Интернейшнл бизнес мэшинз» была проведена первая публичная демонстрация перевода с русского языка на английский. В конце следующего года был проведен первый опыт машинного перевода в нашей стране.
Идея Троянского о том, что перевод с помощью машины надо членить на части, «препарировать» текст, получила практическое подтверждение. Только «препарирование» это производит сама машина. Вот как выглядит схема автоматического перевода с русского на английский:
Программа, вложенная в «память» машины, должна учитывать грамматику языка, с которого переводится текст. Точно так же нужно учесть и грамматику языка, на который переводится текст; конечно же, нужен англо-русский словарь, если переводят с английского на русский язык, и т. п.
Все это — и правила грамматики, и словарь — записывается в виде чисел. В последовательность чисел преобразуется и текст, который нужно переводить. Сделать это нетрудно. Каждую букву надо обозначить числом, например: а = 00, б = 01, в = 02, и т. д. Любой текст таким образом можно перевести на машинный язык чисел. Точно так же в виде чисел записывают и словарь.
Первый опыт машинного перевода в нашей стране был проделан под руководством Д. Ю. Панова. Машина БЭСМ переводила с английского языка на русский. Вот как выглядели некоторые английские слова в числовой записи:
the = 212608 (21 — t, 26 —h, 08—е);
method = 110821262830 (11 —m, 08 —e, 21—t, 26 —h, 28 —o, 30 —d).
Встретив в тексте, который нужно переводить, последовательность чисел 212608 110821262830, машина легко может сопоставить их с записанными в «памяти» такими же последовательностями чисел и дать русский перевод — «метод».
А как быть с записью грамматики? Например, в английском языке есть артикли, а в русском их нет. Зато в русском языке есть показатель рода, отсутствующий в английском. В других языках, например полинезийских, вообще отсутствуют грамматические формы склонения,
спряжения, рода — их передают служебные слова, а не грамматические окончания.
Поэтому в словарь для машинного перевода рядом со словами ставят целый ряд их дополнительных признаков. Например, указывают род, склонение, обозначает ли данное слово одушевленный предмет. Вот часть из такого англо-русского машинного словаря:
- Предыдущая
- 24/32
- Следующая