WikiDer > CJK персонажи
В интернационализация, CJK персонажи собирательный термин для Китайский, Японский, и Корейский языки, все из которых включают Китайские символы и производные в их системах письма, иногда в сочетании с другими скриптами. Время от времени, вьетнамский включен, поэтому сокращение CJKV, поскольку вьетнамцы исторически использовали китайские иероглифы. В совокупности символы CJKV часто включают Ханзи в Китайский, кандзи, Кана в Японский, ханья, хангыль в Корейский, и Хан Ту или chữ nôm в вьетнамский.
Репертуар персонажей
Стандартный китайский и стандартный кантонский диалект написаны почти исключительно китайскими иероглифами. Требуется более 3000 символов для общего грамотность, но до 40 000 знаков для достаточно полного охвата. В японском языке используется меньше символов - общая грамотность японского языка составляет 2136 символов. Использование китайских иероглифов в Корее становится все более редким, хотя идиосинкразическое использование китайских иероглифов в собственных именах требует знания (и, следовательно, наличия) гораздо большего числа символов. Однако даже сегодня студентов в Южной Корее учат 1800 иероглифам.
Другие скрипты, используемые для этих языков, например бопомофо и латинский-на основании пиньинь для китайцев, хирагана и катакана для японцев и хангыль для корейского языка они не являются строго «символами CJK», хотя наборы символов CJK почти всегда включают их по мере необходимости для полного охвата целевых языков.
До начала 20 века Классический китайский был письменным языком правительства и ученых во Вьетнаме. Популярная литература в вьетнамский было написано в chữ Nôm сценарий, состоящий из заимствованных китайских иероглифов вместе со многими иероглифами, созданными локально. К концу 1920-х годов оба шрифта были заменены написанием на вьетнамском языке с использованием латиницы. Вьетнамский алфавит.[1][2]
В китаевед Карл Лебан (1971) произвел ранний обзор систем кодирования CJK.
Кодирование
Количество символов, необходимое для полного покрытия потребностей всех этих языков, не может поместиться в 256-символьном кодовом пространстве 8-битного кодировки символов, требуя по крайней мере 16-битного кодирования с фиксированной шириной или многобайтового кодирования с переменной длиной. 16-битные кодировки с фиксированной шириной, например, из Unicode до версии 2.0 включительно, в настоящее время устарели из-за требования кодировать больше символов, чем может вместить 16-битная кодировка (Unicode 5.0 содержит около 70 000 символов хань), а также требование китайского правительства о том, что программное обеспечение в Китае поддерживает ГБ 18030 набор символов.
Хотя кодировки CJK имеют общие наборы символов, часто используемые для их представления кодировки были разработаны отдельно правительствами разных стран Восточной Азии и компаниями-разработчиками программного обеспечения и несовместимы друг с другом. Unicode попытался, с некоторыми противоречиями, унифицировать наборы символов в процессе, известном как Ханьское объединение.
Кодировки символов CJK должны состоять как минимум из символов хань плюс языковые фонетические сценарии, такие как пиньинь, бопомофо, хирагана, катакана и хангыль.
Кодировки символов CJK включают:
- Big5 (наиболее распространенная кодировка до внедрения Unicode)
- CCCII
- CNS 11643 (официальный стандарт Китайская республика)
- EUC-JP
- EUC-KR
- GB2312 (подмножество и предшественник GB18030)
- GB18030 (обязательный стандарт в Китайская Народная Республика)
- Набор символов Giga (GCS)
- ISO 2022-JP
- KS C 5861
- Shift-JIS
- TRON
- Unicode
Наборы символов CJK занимают большую часть назначенных Unicode кодовое пространство. Среди японских экспертов по китайским иероглифам существует много противоречий относительно желательности и технических достоинств китайских иероглифов. Ханьское объединение процесс, используемый для сопоставления нескольких наборов китайских и японских символов в один набор унифицированных символов.[нужна цитата]
На всех трех языках можно писать как слева направо и сверху вниз (справа налево и сверху вниз в древних документах), но обычно рассматриваются как сценарии с написанием слева направо при обсуждении вопросов кодирования.
Легальное положение
Библиотеки сотрудничали по стандартам кодирования для ДЖЕКФИ персонажей в начале 1980-х. Согласно с Кен Лунде, сокращение "CJK" было зарегистрированным торговая марка из Группа исследовательских библиотек[3] (который слился с OCLC в 2006 г.). Срок действия товарного знака, принадлежавшего OCLC с 1987 по 2009 год, истек.[4]
Смотрите также
- Языки описания китайских иероглифов
- Кодировка китайских символов
- Китайские методы ввода для компьютеров
- Идеографы совместимости CJK
- CJK удары
- Единые иероглифы CJK
- Языки со сложной компоновкой текста (CTL)
- Редактор метода ввода
- Японский язык и компьютеры
- Корейский язык и компьютеры
- Список шрифтов CJK
- Синоксеник
- Кодирование переменной ширины
использованная литература
- ^ Coulmas (1991)С. 113–115.
- ^ ДеФрансис (1997).
- ^ Кен Лунде, 1996
- ^ Листинг Justia
Статья основана на материалах, взятых из Бесплатный онлайн-словарь по вычислительной технике до 1 ноября 2008 г. и зарегистрированы в соответствии с условиями «перелицензирования» GFDL, версия 1.3 или новее.
- ДеФрансис, Джон. Китайский язык: факты и фантазии. Гонолулу: Гавайский университет Press, 1990. ISBN 0-8248-1068-6.
- Ханнас, Уильям С. Орфографическая дилемма Азии. Гонолулу: Гавайский университет Press, 1997. ISBN 0-8248-1892-X (мягкая обложка); ISBN 0-8248-1842-3 (твердый переплет).
- Лемберг, Вернер: Пакет CJK для LATEX2ε - многоязычная поддержка за пределами babel. TUGboat, Том 18 (1997), № 3 - Труды годового собрания 1997 года.
- Ливан, Карл. Автоматизированные орфографические системы для языков Восточной Азии (китайский, японский, корейский), Отчет о состоянии дел, подготовленный для совета директоров Ассоциации азиатских исследований. 1971 г.
- Лунде, Кен. CJKV Обработка информации. Севастополь, Калифорния: O'Reilly & Associates, 1998. ISBN 1-56592-224-7.