WikiDer > Шестибитный символьный код
А шестибитный код символа это кодировка символов разработан для использования на компьютерах с длина слова кратное 6. Шесть битов могут кодировать только 64 различных символа, поэтому эти коды обычно включают только прописные буквы, цифры, некоторые знаки пунктуации и иногда управляющие символы. Такие коды с дополнительными бит четности были естественным способом хранения данных на 7-трековый магнитная лента.
Типы шестибитных кодов
Ранний шестибитный двоичный код использовался для Шрифт Брайля, система чтения для слепых, разработанная в 1820-х годах.
Самые ранние компьютеры имели дело только с числовыми данными и не предусматривали символьных данных. Шестибитный BCD использовался IBM на ранних компьютерах, таких как IBM 704 в 1954 г.[1]:стр.35 Эта кодировка была заменена 8-битной EBCDIC код, когда Система / 360 стандартизован на 8-битный байты. Есть несколько вариантов этого типа кода (см. ниже).
Шестибитные коды символов обычно заменяли пятибитные. Код Бодо и предшествующий семибитный ASCII. Один из популярных вариантов был DEC ШЕСТИБИТ. Это просто коды символов ASCII от 32 до 95, закодированные как от 0 до 63, путем вычитания 32 (т. Е. Столбцов 2, 3, 4 и 5 таблицы ASCII (16 символов в столбце), сдвинутых в столбцы с 0 по 3, путем вычитания 2 из старших битов); он включает пробелы, знаки препинания, цифры и заглавные буквы, но не управляющие символы. Поскольку он не содержал управляющих символов, даже конца строки, он не использовался для общей обработки текста. Однако шестизначные имена, такие как имена файлов и ассемблер символы можно хранить в одном 36-битный слово PDP-10, и в каждое слово PDP-1 и два символа помещаются в каждое слово PDP-8.
Шестибитные коды могут кодировать более 64 символов с помощью Shift Out и Shift In символы, по сути включающий два различных набора из 62 символов и переключение между ними. Например, популярный IBM 2741 Терминал связи поддерживал различные наборы символов до 88 печатных символов плюс управляющие символы.
А UTF-6 кодировка была предложена для Unicode[2] но был заменен Punycode.
Шестибитный код BCD
Шестибитный BCD код был адаптацией код перфокарты к бинарный код. IBM применил условия двоично-десятичный и BCD к вариациям BCD альфамеры использовался в большинстве ранних компьютеров IBM, включая IBM 1620, IBM 1400 серии, и недесятичная архитектура члены IBM 700/7000 серии.
Базы данных COBOL шестибитный код
Шестибитный код также использовался в базах данных COBOL, где информация о конце записи хранилась отдельно.[нужна цитата]
Карта с магнитной полосой, шестибитный код
Шестибитный код с добавленным нечетным бит четности, используется на дорожке 1 карты с магнитной полосой, как указано в ISO / IEC 7811-2.
Шестибитный код DEC
Код DEC SIXBIT, включающий несколько управляющих символов вместе с SO / SI, разрешающее расширение кода - было указано как ECMA-1 в 1963 г. (см. ниже). Другой, менее распространенный вариант получается простым удалением старшего бита кода ASCII в диапазоне 32-95 (коды 32-63 остаются на своих позициях, из более высоких значений вычитается 64). Такой вариант иногда использовался на DEC. PDP-8 (1965).
Шестибитный код FIELDATA
FIELDATA был семибитным кодом (с необязательной проверкой четности), из которого формально были определены только 64 позиции кода (занимающие шесть битов).[3] Вариант был использован UNIVACкомпьютеры 1100-й серии.[4] Рассматривая код как шестибитный код, эти системы использовали 36-битное слово (способное хранить шесть таких сокращенных символов FIELDATA).[5]
Шестибитный код Брайля
Шрифт Брайля символы представлены с помощью шести точек, расположенных в прямоугольнике. Каждая позиция может содержать или не содержать выпуклую точку, поэтому шрифт Брайля можно рассматривать как шестибитный двоичный код. Некоторые более современные системы Брайля добавляют две дополнительные точки, превращая эти системы в восьмибитный код.
Шестибитные коды для двоичного кодирования текста
Передача двоичных данных по системам, предназначенным только для текста, иногда может вызывать проблемы. Например, электронное письмо исторически поддерживал только 7-битные коды ASCII и удалял 8-й бит, тем самым искажая двоичные данные, отправляемые напрямую через любой проблемный почтовый сервер. Другие системы могут вызывать проблемы из-за неправильной интерпретации управляющих символов во время хранения или передачи. Существует ряд схем для упаковки 8-битных данных в текстовые представления, которые могут проходить через системы текстовой почты для декодирования в месте назначения. Примеры подмножеств 6-битных символов, используемых для упаковки двоичных данных, включают: Uuencode и Base64. Эти наборы не содержат управляющих символов (только цифры, буквы, некоторые знаки препинания и, возможно, пробелы) и позволяют передавать данные через любой носитель, который также может передавать читаемый человеком текст.
Примеры шестибитных кодов BCD
Персонажи показаны со своими Unicode эквиваленты.
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0_ | 1 0031  | 2 0032  | 3 0033  | 4 0034  | 5 0035  | 6 0036  | 7 0037  | 8 0038  | 9 0039  | 0 0030  | # 0023  | @ 0040  | ЛЕНТА ОТМЕТКА  | |||
| 1_ | SP 0020  | / 002F  | S 0053  | Т 0054  | U 0055  | V 0056  | W 0057  | Икс 0058  | Y 0059  | Z 005A  | ЗАПИСЫВАТЬ ОТМЕТКА  | , 002C  | % 0025  | |||
| 2_ | - 002D  | J 004A  | K 004B  | L 004C  | M 004D  | N 004E  | О 004F  | п 0050  | Q 0051  | р 0052  | -0 002D 0030  | $ 0024  | * 002A  | |||
| 3_ | & 0026  | А 0041  | B 0042  | C 0043  | D 0044  | E 0045  | F 0046  | грамм 0047  | ЧАС 0048  | я 0049  | +0 002B 0030  | . 002E  | ¤ 00A4  | ГРУППА ОТМЕТКА  | 
Письмо Число Пунктуация Символ Другой Неопределенный
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0_ | 1 0031  | 2 0032  | 3 0033  | 4 0034  | 5 0035  | 6 0036  | 7 0037  | 8 0038  | 9 0039  | 0 0030  | = 003D  | − 2212  | ||||
| 1_ | SP 0020  | / 002F  | S 0053  | Т 0054  | U 0055  | V 0056  | W 0057  | Икс 0058  | Y 0059  | Z 005A  | , 002C  | ( 0028  | ||||
| 2_ | — 2014  | J 004A  | K 004B  | L 004C  | M 004D  | N 004E  | О 004F  | п 0050  | Q 0051  | р 0052  | -0 002D 0030  | $ 0024  | * 002A  | |||
| 3_ | + 002B  | А 0041  | B 0042  | C 0043  | D 0044  | E 0045  | F 0046  | грамм 0047  | ЧАС 0048  | я 0049  | +0 002B 0030  | . 002E  | ) 0029  | 
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0_ | : 003A  | 1 0031  | 2 0032  | 3 0033  | 4 0034  | 5 0035  | 6 0036  | 7 0037  | 8 0038  | 9 0039  | 0 0030  | = 003D  | ≠ 2260  | ≤ 2264  | ! 0021  | [ 005B  | 
| 1_ | SP 0020  | / 002F  | S 0053  | Т 0054  | U 0055  | V 0056  | W 0057  | Икс 0058  | Y 0059  | Z 005A  | ] 005D  | , 002C  | ( 0028  | → 2192  | ≡ 2261  | ~ 007E  | 
| 2_ | − 2212  | J 004A  | K 004B  | L 004C  | M 004D  | N 004E  | О 004F  | п 0050  | Q 0051  | р 0052  | % 0025  | $ 0024  | * 002A  | ↑ 2191  | ↓ 2193  | > 003E  | 
| 3_ | + 002B  | А 0041  | B 0042  | C 0043  | D 0044  | E 0045  | F 0046  | грамм 0047  | ЧАС 0048  | я 0049  | < 003C  | . 002E  | ) 0029  | ≥ 2265  | ? 003F  | ; 003B  | 
Примеры шестибитных вариантов ASCII
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0_ | SP 0020  | ! 0021  | " 0022  | # 0023  | $ 0024  | % 0025  | & 0026  | ' 0027  | ( 0028  | ) 0029  | * 002A  | + 002B  | , 002C  | - 002D  | . 002E  | / 002F  | 
| 1_ | 0 0030  | 1 0031  | 2 0032  | 3 0033  | 4 0034  | 5 0035  | 6 0036  | 7 0037  | 8 0038  | 9 0039  | : 003A  | ; 003B  | < 003C  | = 003D  | > 003E  | ? 003F  | 
| 2_ | @ 0040  | А 0041  | B 0042  | C 0043  | D 0044  | E 0045  | F 0046  | грамм 0047  | ЧАС 0048  | я 0049  | J 004A  | K 004B  | L 004C  | M 004D  | N 004E  | О 004F  | 
| 3_ | п 0050  | Q 0051  | р 0052  | S 0053  | Т 0054  | U 0055  | V 0056  | W 0057  | Икс 0058  | Y 0059  | Z 005A  | [ 005B  | 005C  | ] 005D  | ^ 005E  | _ 005F  | 
Письмо Число Пунктуация Символ Другой Неопределенный
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0_ | SP 0020  | HT 0009  | LF 000A  | VT 000B  | FF 000C  | CR 000D  | ТАК 000E  | SI 000F  | ( 0028  | ) 0029  | * 002A  | + 002B  | , 002C  | - 002D  | . 002E  | / 002F  | 
| 1_ | 0 0030  | 1 0031  | 2 0032  | 3 0033  | 4 0034  | 5 0035  | 6 0036  | 7 0037  | 8 0038  | 9 0039  | : 003A  | ; 003B  | < 003C  | = 003D  | > 003E  | ? 003F  | 
| 2_ | NUL 0000  | А 0041  | B 0042  | C 0043  | D 0044  | E 0045  | F 0046  | грамм 0047  | ЧАС 0048  | я 0049  | J 004A  | K 004B  | L 004C  | M 004D  | N 004E  | О 004F  | 
| 3_ | п 0050  | Q 0051  | р 0052  | S 0053  | Т 0054  | U 0055  | V 0056  | W 0057  | Икс 0058  | Y 0059  | Z 005A  | [ 005B  | 005C  | ] 005D  | ESC 001B  | DEL 007F  | 
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0_ | 0 0030  | 1 0031  | 2 0032  | 3 0033  | 4 0034  | 5 0035  | 6 0036  | 7 0037  | 8 0038  | 9 0039  | : 003A  | ; 003B  | < 003C  | = 003D  | > 003E  | ? 003F  | 
| 1_ | SP 0020  | ! 0021  | " 0022  | # 0023  | £ 00A3  | % 0025  | & 0026  | ' 0027  | ( 0028  | ) 0029  | * 002A  | + 002B  | , 002C  | - 002D  | . 002E  | / 002F  | 
| 2_ | @ 0040  | А 0041  | B 0042  | C 0043  | D 0044  | E 0045  | F 0046  | грамм 0047  | ЧАС 0048  | я 0049  | J 004A  | K 004B  | L 004C  | M 004D  | N 004E  | О 004F  | 
| 3_ | п 0050  | Q 0051  | р 0052  | S 0053  | Т 0054  | U 0055  | V 0056  | W 0057  | Икс 0058  | Y 0059  | Z 005A  | [ 005B  | $ 0024  | ] 005D  | ↑ 2191  | ← 2190  | 
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0_ | @ 0040  | А 0041  | B 0042  | C 0043  | D 0044  | E 0045  | F 0046  | грамм 0047  | ЧАС 0048  | я 0049  | J 004A  | K 004B  | L 004C  | M 004D  | N 004E  | О 004F  | 
| 1_ | п 0050  | Q 0051  | р 0052  | S 0053  | Т 0054  | U 0055  | V 0056  | W 0057  | Икс 0058  | Y 0059  | Z 005A  | [ 005B  | 005C  | ] 005D  | ^ 005E  | _ 005F  | 
| 2_ | SP 0020  | ! 0021  | " 0022  | # 0023  | $ 0024  | % 0025  | & 0026  | ' 0027  | ( 0028  | ) 0029  | * 002A  | + 002B  | , 002C  | - 002D  | . 002E  | / 002F  | 
| 3_ | 0 0030  | 1 0031  | 2 0032  | 3 0033  | 4 0034  | 5 0035  | 6 0036  | 7 0037  | 8 0038  | 9 0039  | : 003A  | ; 003B  | < 003C  | = 003D  | > 003E  | ? 003F  | 
6-битный код ГОСТ
| _0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0_ | 0 0030  | 1 0031  | 2 0032  | 3 0033  | 4 0034  | 5 0035  | 6 0036  | 7 0037  | 8 0038  | 9 0039  | + 002B  | - 002D  | / 002F  | , 002C  | . 002E  | SP 0020  | 
| 1_ | ⏨ 23E8  | ↑ 2191  | ( 0028  | ) 0029  | × 00D7  | = 003D  | ; 003B  | [ 005B  | ] 005D  | * 002A  | ‘ 2018  | ’ 2019  | ≠ 2260  | < 003C  | > 003E  | : 003A  | 
| 2_ | А 0410  | Б 0411  | В 0412  | Г 0413  | Д 0414  | Е 0415  | Ж 0416  | З 0417  | И 0418  | Й 0419  | К 041A  | Л 041B  | М 041C  | Н 041D  | О 041E  | П 041F  | 
| 3_ | Р 0420  | С 0421  | Т 0422  | У 0423  | Ф 0424  | Х 0425  | Ц 0426  | Ч 0427  | Ш 0428  | Щ 0429  | Ы 042B  | Ь 042C  | Э 042D  | Ю 042E  | Я 042F  | DEL 007F  | 
Письмо Число Пунктуация Символ Другой Неопределенный
Пример шестибитных кодов Брайля
В следующей таблице показано расположение символов с шестнадцатеричным значением, соответствующим символом ASCII, 6-битными кодами Брайля (комбинации точек), шрифтом Брайля. Unicode глиф и общее значение (фактическое значение может меняться в зависимости от контекста).[7][8]
  | 
  | 
Смотрите также
- Десятичное число с двоичным кодом
 - BCD (кодировка символов)
 - Код дисплея CDC
 - ДЕКАБРЬ RADIX 50 / MOD40
 - IBM SQUOZE
 - IBM Transcode
 - ASCII
 - Код Бодо
 - EBCDIC
 - Unicode
 - ANSI X3.64
 - UTF-8
 - UTF-16
 
Рекомендации
- ^ Корпорация IBM (1954). 704 электронная машина обработки данных: руководство по эксплуатации (PDF).
 - ^ Велтер, Марк; Сполярич, Брайан В. (2000-11-16). «UTF-6 - еще одна кодировка, совместимая с ASCII для идентификаторов». Инженерная группа Интернета. В архиве из оригинала от 23.05.2016. Получено 2016-04-09.
 - ^ Маккензи, Чарльз Э. (1980). Наборы кодированных символов, история и развитие. Серия системного программирования (1-е изд.). Addison-Wesley Publishing Company, Inc. п. 64. ISBN 0-201-14460-3. LCCN 77-90165. ISBN 978-0-201-14460-4. Получено 2016-05-22.
 - ^ Уокер, Джон (1996-08-06). "Код FIELDATA для UNIVAC серии 1100". Воспоминания UNIVAC. В архиве из оригинала от 22.05.2016. Получено 2016-05-22.
 - ^ Дженнингс, Томас Дэниел (2016-04-20) [1999]. «Аннотированная история некоторых кодов символов или ASCII: американский стандартный код для проникновения информации». Мировые энергетические системы (WPS). В архиве из оригинала от 22.05.2016. Получено 2016-05-22.
 - ^ Раймонд, Эрик С. (2017-08-29). «Типы данных полезной нагрузки AIS». catb.org. Получено 2017-11-16.
 - ^ «Представление и отображение шрифта Брайля». DotlessBraille.org. 2002-02-20. Получено 2009-08-09.
 - ^ Халлек, Джон (2000-08-24). "braille-ascii.ads". Брайль.Ascii. Получено 2009-08-10.
 
внешняя ссылка
- "Справочное руководство компьютера Control Data 1604-C" (PDF). (7,44 МБ)
 - «Стандарт ECMA для 6-битного кода символов ввода / вывода» (PDF). (1,53 МБ)
 - Справочник по коду символов SIXBIT Система кодирования символов SIXBIT от Digital Equipment Corporation