Кодиране на символи - тя
Набор от знаци (английски набор от знаци.) - маса определено ограничен набор от кодиране на знаците. Тази таблица сравнява всяка дължина характер последователност в една или повече байта.
Често, също така вместо "набор от символи" терминът неправилно се използва терминът "код страницата", което означава всъщност специален случай на еднобайтовата набор от символи за кодиране.
В момента се използва основно три типа криптиране: Съвместим с EBCDIC и Unicode базирани 16-битов, с преобладаващото преобладаването на първия. Представяне на Unicode е съвместим с ASCII. Encoding базирани DKOI-8) се използват за някои мейнфрейм. Първоначално един набор от символи, използвани от всяка операционна система. Сега се използват кодови [5]. зависи от вида на операционната система само от традицията и се определя в зависимост от локал.
Wikipedia и други проекти на Фондация Уикимедия, използващи Unicode UTF-8.
Автоматично разпознаване на кодировки
Използването на множество знакови набори в днешния софтуер създава много неудобства, не само програмисти. но също така и за потребителите. Според едно мнение, опа, боклук може да се справи с това, ако програмата автоматично ще открие кодировката на входящия текст.
За еднобайтови кодировки може да се обърне внимание на факта, че честотата на използване на различни букви са много различни (например, в българо-често се използва "на", но рядко "б"). Следователно, познаването на езика на текста, можете лесно да изберете кодова таблица, в която честотата на байта по-добре съответства на честотата на писмата на езика.
Един алтернативен поглед смята, че подобни евристични алгоритми за определяне на кодиране на текста вредно, защото съвременните информационни технологии разполагат с необходимите средства, за да се сравни текста на разпоредбите, изрично го страницата код (вж. Например, създаване на програми за текстови данни, които нарушават стандартите.
общата кодиране
- ISO 646
- EBCDIC
- ISO 8859.
- ISO 8859-1. ISO 8859-2. ISO 8859-3. ISO 8859-4. ISO 8859-5. ISO 8859-6, ISO 8859-7, ISO 8859-8, ISO 8859-9, ISO 8859-10, 8859-11 ISO, ISO 8859-13, 8859-14 ISO, ISO 8859-15
- Cp850, CP852, CP866, CP869
- Encoding Microsoft Windows.
- Windows-1252 за западни езици
- Windows-1254 за турския език
- Windows-1255 за еврейски
- Windows-1256 за арабски
- Windows-1257 за балтийските езици
- Windows-1258 за виетнамски
- MacRoman, KOI8 (KOI8-R, KOI8-U ...), koi7
- българската кодиране
- ISCII
- VISCII
- Big5 (най-известната версия на Microsoft CP950)
- GB2312
- GBK (Microsoft CP936)
- GB18030
- Shift JIS за японски (Microsoft CP932)
- EUC-KR за корейски (Microsoft CP949)
- ISO-2022 и по Хартата за китайската писменост
- UTF-16 кодиран Unicode набор от символи
бележки
Вижте това, което "кодиране на знаците" в други речници:
Encoding на българския език в областта на компютърните програми и интернет - - Всички символи, които могат да бъдат показани на екрана на компютъра, са описани в таблицата със символи. В първата таблица на символите не е български букви. За да работи с българските букви, те трябваше да влиза в този набор от символи вместо ненужно ... ... академично издание на речника медии
Encoding - набор от знаци (английски набор от знаци.) Таблица определен ограничен набор от кодиране на знаците. Тази таблица сравнява всяка дължина характер последователност в една или повече байта. Въпреки че терминът "набор от символи" (инж. Набор от знаци, ... ... Wikipedia
Алтернативен кодиране - Проверете информацията. Необходимо е да се провери достоверността на фактите, както и точността на информацията, съдържаща се в тази статия. На страницата на дискусия трябва да е обяснение. "Алтернатива за кодиране" под ... Wikipedia
Character Set - маса, която указва кодировката на ограничен набор от азбуката (обикновено текстови елементи: букви, цифри, препинателни знаци) (на английски набор от знаци.). Тази таблица сравнява всяка дължина характер последователност в една или повече ... ... Wikipedia
Кодирането шест-малко - шест-битово кодиране, използван в компютри, произведени в САЩ през 1950 1960. Следователно, размерът на машина дума на тези компютри кратно на 6 бита (например, 12, 18, 24, 36, 48, 60 бита). Този размер символ позволено ... ... Wikipedia
Основната кодиране - в съответствие с ГОСТ 19768 87 е приет през 1987 г., за да замени KOI 8, но малко използвани. Основно кодиране поддържа само хардуер и софтуер, който се произвежда в Съветския съюз (ЕС PC, Lexicon, ...), както и някои принтери Epson ... Уикипедия
UTF-8 - (. От трансформация Format английската Unicode, 8 битов «Unicode Transformation Format, 8-битов") обща кодиране на Unicode символи, който е съвместим с 8-битов формат предаване на текст. Е широко използван в инструкциите за работа ... ... Wikipedia
- Алтернативен кодиране. Dzhessi Rassel. Тази книга ще бъде направено в съответствие с вашата поръчка на технологии технология за печат при поискване. Високо качество на съдържанието от статиите в Уикипедия! "? Vnaya алтернативи кодира Application" - въз основа на CP437 ... Прочети повече купи за 998 рубли