WikiDer > Евротра
Эта статья не цитировать любой источники. (Декабрь 2009 г.) (Узнайте, как и когда удалить этот шаблон сообщения) |
Евротра был амбициозным машинный перевод проект создан и финансируется Европейская комиссия с 1978 по 1992 гг.
Вдохновленный скромным успехом старой коммерческой системы машинного перевода SYSTRAN, большая сеть европейских компьютерных лингвистов приступила к проекту Eurotra в надежде создать современную систему машинного перевода для семи, а позднее девяти официальных языков европейское сообщество.
Однако со временем ожидания стали умеренными; «Полностью автоматический перевод высокого качества» не был разумно достижимой целью. В конечном итоге было признано, что истинный характер Eurotra - это доконкурентные исследования, а не разработка прототипов.
Проект был продиктован одним из основополагающих принципов ЕС: все граждане имеют право читать любые и все отчеты Комиссии на своем родном языке. По мере присоединения большего числа стран это произвело комбинаторный взрыв из-за количества задействованных языковых пар и необходимости переводить каждый документ, речь и даже комплект протоколов заседаний, выпускаемых ЕС, на другие восемь языков, означало, что перевод быстро стал подавляющим компонентом административного бюджета. Для решения этой проблемы была разработана Евротра.
Этот проект был необычен тем, что состоял не из одной исследовательской группы, а в том, что в нем были группы участников, распределенные по странам-членам, организованные по языковому, а не по национальному признаку (например, группы в Лёвене и Утрехте работали в тесном сотрудничестве), а секретариат был на основе Европейская комиссия в Люксембург. Хотя это внесло значительный вклад в культуру проекта, оно также продемонстрировало наглядно Brooks'утверждение в Мифический человеко-месяц что добавление персонала к проекту требует больше времени для его завершения; чем больше задействовано групп, тем больше времени тратится на администрирование и коммуникацию, а не на фактическое исследование как таковое.
Фактический дизайн проекта был необычным для проектов MT. Старые системы, такие как SYSTRAN, в значительной степени основывались на словарях с незначительной поддержкой изменения порядка слов. В более поздних системах часто используется вероятностный подход, основанный на параллельных корпусах. Евротра обратилась к составляющая структура текста для перевода, пройдя сначала синтаксический разбирать с последующим вторым синтаксическим анализом для создания структуры зависимостей, за которым следует последний синтаксический анализ с использованием третьей грамматики, чтобы произвести то, что внутренне называется промежуточным представлением (IR). Поскольку все три модуля были реализованы как Пролог программ, тогда в принципе было бы возможно переместить эту структуру назад через соответствующие модули для другого языка, чтобы произвести переведенный текст на любой из других языков. Однако на практике языковые пары были реализованы не так.
Первый "живой" перевод занимал 4Мб. Microvax Бег Ultrix и C-Prolog на полные выходные в начале 1987 года. Предложение, переведенное с английский в Датский, было «Япония делает компьютеры». Основная проблема, с которой столкнулась система, заключалась в создании так называемых «синтаксических лесов» - часто к любой конкретной фразе можно было применить большое количество различных правил грамматики, создавая сотни, даже тысячи (часто идентичных) деревьев синтаксического анализа. Это израсходовало огромное количество компьютерного магазина, излишне замедляя весь процесс.
Хотя Eurotra так и не представила «работающую» систему машинного перевода, проект оказал далеко идущее долгосрочное влияние на зарождающуюся языковую индустрию в европейских странах-членах, в частности, в южных странах Греция, Италия, Испания, и Португалия. Существует как минимум одна коммерческая система машинного перевода (разработанная академическим / коммерческим консорциумом в Дания) получено из технологии Eurotra.