WikiDer > Спецификация слова произношения
В Словарь терминов произношения (PLS) - это W3C Рекомендация, которая предназначена для обеспечения возможности взаимодействия спецификации информации о произношении для обоих распознавание речи и синтез речи движки в приложениях голосового просмотра. Язык предназначен для облегчения использования разработчиками, одновременно поддерживая точную спецификацию информации о произношении для международного использования.
Язык позволяет указать одно или несколько произношений для слова или фразы с использованием стандартного алфавита произношения или, при необходимости, с использованием алфавитов конкретного производителя. Произношения сгруппированы в документ PLS, на который можно ссылаться из других языков разметки, таких как Спецификация грамматики распознавания речи. SRGS и язык разметки синтеза речи SSML.
Применение
Вот пример документа PLS:
 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"      xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"     xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"      xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon        http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "     алфавит ="ипа" xml: lang ="en-US">   <lexeme>     <grapheme>суждение</grapheme>     <grapheme>суждение</grapheme>     <phoneme>ˈDʒʌdʒ.mənt</phoneme>            "ˈDʒʌdʒ.mənt" ->    </lexeme>   <lexeme>     <grapheme>жених</grapheme>     <grapheme>жених</grapheme>     <phoneme>fiˈɒns.eɪ</phoneme>            "fiˈɒns.eɪ" ->      <phoneme>ˌFiː.ɑːnˈseɪ</phoneme>            "ˌFiː.ɑːnˈseɪ" ->    </lexeme> </lexicon>что можно использовать для улучшения TTS как показано в следующем SSML 1.0 документ:
 <?xml version="1.0" encoding="UTF-8"?> <говорить версия ="1.0"      xmlns ="http://www.w3.org/2001/10/synthesis"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"     xsi: schemaLocation ="http://www.w3.org/2001/10/synthesis       http://www.w3.org/TR/speech-synthesis/synthesis.xsd "     xml: lang ="en-US">   <словарь uri ="http://www.example.org/lexicon_defined_above.xml"/>   <p> По мнению моего жениха, Лас-Вегас - лучшее место для медового месяца. Я ответил, что предпочитаю Венецию и не считаю венецианское казино приемлемым компромиссом.</p> </speak>но и улучшить ASR В следующих SRGS 1.0 грамматика:
 <?xml version="1.0" encoding="UTF-8"?> <грамматика версия ="1.0"     xmlns ="http://www.w3.org/2001/06/grammar"     xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"      xsi: schemaLocation ="http://www.w3.org/2001/06/grammar        http://www.w3.org/TR/speech-grammar/grammar.xsd "     xml: lang ="en-US" корень ="фильмы" режим ="голос">   <словарь uri ="http://www.example.org/lexicon_defined_above.xml"/>   <правило id ="фильмы" сфера действия ="общественный">     <one-of>             <item>Терминатор 2: Судный день</item>              <item>Мой большой толстый неприятный жених</item>              <item>Судный день Плутона</item>     </one-of>    </rule> </grammar>Общие варианты использования
Несколько произношений для одной и той же орфографии
За ASR В системах часто используется несколько вариантов произношения одного и того же слова или фразы, чтобы справиться с вариациями произношения в пределах одного языка. В языке лексики произношения несколько вариантов произношения представлены более чем одним элементом 
В следующем примере слово «Ньютон» имеет два возможных произношения.
 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-GB">   <lexeme>     <grapheme>Ньютон</grapheme>     <phoneme>ˈNjuːtən</phoneme>     <!-- IPA string is: "ˈnjuːtən" -->     <phoneme>ˈNuːtən</phoneme>     <!-- IPA string is: "ˈnuːtən" -->   </lexeme> </lexicon>Множественные орфографии
В некоторых ситуациях существуют альтернативные текстовые представления одного и того же слова или фразы. Это может возникнуть по ряду причин. Подробности см. В разделе 4.5 PLS. Поскольку это представления, имеющие одно и то же значение (в отличие от омофонов), рекомендуется их представлять с помощью одного элемента 
Вот два простых примера множественной орфографии: альтернативное написание английского слова и множественное написание японского слова.
 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-US">   <!-- English entry showing how alternative spellings are handled -->   <lexeme>     <grapheme>цвет</grapheme>     <grapheme>цвет</grapheme>     <phoneme>ˈKʌlər</phoneme>     <!-- IPA string is: "ˈkʌlər" -->   </lexeme> </lexicon> <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="jp">             орфографии ромадзи, кандзи и хирагана ->   <lexeme>     <grapheme>нихонго</grapheme>     <grapheme>日本語</grapheme>     <grapheme>に ほ ん ご</grapheme>     <phoneme>ihoŋɡo</phoneme>     <!-- IPA string is: "ɲihoŋɡo" -->   </lexeme> </lexicon>Омофоны
В большинстве языков есть омофоны, слова с одинаковым произношением, но разными значениями (и, возможно, разным написанием), например, «семя» и «уступить». Рекомендуется представлять их в виде разных лексем.
 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-US">   <lexeme>     <grapheme>уступать</grapheme>     <phoneme>Сид</phoneme>     <!-- IPA string is: "siːd" -->   </lexeme>   <lexeme>     <grapheme>семя</grapheme>     <phoneme>Сид</phoneme>     <!-- IPA string is: "siːd" -->   </lexeme> </lexicon>Омографы
В большинстве языков есть слова с разными значениями, но с одинаковым написанием (а иногда и с различным произношением), называемые омографы. Например, в английском языке слова bass (рыба) и слово bass (в музыке) имеют одинаковое написание, но разные значения и произношение. Хотя рекомендуется, чтобы эти слова были представлены с использованием отдельных элементов 
В этом примере показано произношение омографа «бас».
 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-US">   <lexeme>     <grapheme>бас</grapheme>     <phoneme>bs</phoneme>     <!-- IPA string is: bæs -->     <phoneme>быть</phoneme>     <!-- IPA string is: beɪs -->   </lexeme> </lexicon>Обратите внимание, что английский язык содержит множество примеров пар существительное-глагол, которые можно трактовать как омографы или как альтернативные варианты произношения, в зависимости от предпочтений автора. Двумя примерами являются существительное / глагол «отказаться» и существительное / глагол «адрес».
 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      xmlns: mypos ="http://www.example.org/my_pos_namespace"      алфавит ="ипа" xml: lang ="en-US">   <лексема роль ="mypos: глагол">     <grapheme>отказаться</grapheme>     <phoneme>Rfjuːz</phoneme>     <!-- IPA string is: "rɪˈfjuːz" -->   </lexeme>   <лексема роль ="mypos: существительное">     <grapheme>отказаться</grapheme>     <phoneme>ˈRɛfjuːs</phoneme>     <!-- IPA string is: "ˈrɛfjuːs" -->   </lexeme> </lexicon>Произношение по орфографии
Для некоторых слов и фраз произношение может быть быстро и удобно выражено как последовательность других. орфографии. От разработчика необязательно иметь лингвистические знания, вместо этого он использует произношение которые, как ожидается, уже будут доступны. Для выражения произношения с использованием других орфографий можно использовать элемент 
Эта функция может быть очень полезна при расширении аббревиатуры.
 <?xml version="1.0" encoding="UTF-8"?> <словарь версия ="1.0"       xmlns ="http://www.w3.org/2005/01/pronuction-lexicon"      xmlns: xsi ="http://www.w3.org/2001/XMLSchema-instance"       xsi: schemaLocation ="http://www.w3.org/2005/01/pronuction-lexicon         http://www.w3.org/TR/2007/CR-pronuction-lexicon-20071212/pls.xsd "      алфавит ="ипа" xml: lang ="en-US">   <!--      Расширение аббревиатуры   -->   <lexeme>     <grapheme>W3C</grapheme>     <alias>Консорциум World Wide Web</alias>   </lexeme>   <!--      представление числа   -->   <lexeme>     <grapheme>101</grapheme>     <alias>сто один</alias>   </lexeme>   <!--      механизм грубого произношения   -->   <lexeme>     <grapheme>Таиланд</grapheme>     <alias>связать землю</alias>   </lexeme>   <!--      грубый механизм произношения и расширение акронима   -->   <lexeme>     <grapheme>BBC 1</grapheme>     <alias>будь морским</alias>   </lexeme> </lexicon>Статус и будущее
- PLS 1.0 получил статус рекомендации W3C 14 октября 2008 г.