Unicode

  1. кодовая таблица Unicode, кодировка Unicode

#

стандарт ISO10646 (1992 г.) кодирования (представления) письменных символов всех национальных алфавитов. По состоянию на 2017 годв Unicodeопределено более 100 тыс. знаков. В этом универсальном, не зависящем от платформы коде для представления каждого знака используется один из трёх форматов записи символов: UTF-8, UTF-16 или UTF-32 (8-, 16- и 32-битовые форматы представления символов соответственно). В ЯВУ, например Java, код символа в кодировке Unicode набирается в апострофах четырьмя шестнадцатеричными цифрами, следующими после обратной наклонной черты и латинской буквы u, например '\u0054 ' – латинская буква T, '\u0420' – буква Р. Прописные русские буквы в кодировке Unicode занимают диапазон от '\u0410 ' (заглавная буква А), до '\u042F' (заглавная буква Я), а строчные буквы от '\u0430' (буква а), до '\044F' (буква я). Отметим, что ОС Windows95/98/ME не работают с Unicode. Продвижением стандарта занимается консорциум Unicode. Пример: All source code in the Java programming environment is written in Unicode. – Все исходные тексты в среде программирования Java пишутся в Unicode.


Связные термины

ASCII, DBCS, ISO 8859, Unicode character, Unicode code point, UTF-8, www.unicode.org

Все термины