Кодиране на символи - тя

Набор от знаци (английски набор от знаци.) - маса определено ограничен набор от кодиране на знаците. Тази таблица сравнява всяка дължина характер последователност в една или повече байта.







Често, също така вместо "набор от символи" терминът неправилно се използва терминът "код страницата", което означава всъщност специален случай на еднобайтовата набор от символи за кодиране.

В момента се използва основно три типа криптиране: Съвместим с EBCDIC и Unicode базирани 16-битов, с преобладаващото преобладаването на първия. Представяне на Unicode е съвместим с ASCII. Encoding базирани DKOI-8) се използват за някои мейнфрейм. Първоначално един набор от символи, използвани от всяка операционна система. Сега се използват кодови [5]. зависи от вида на операционната система само от традицията и се определя в зависимост от локал.

Wikipedia и други проекти на Фондация Уикимедия, използващи Unicode UTF-8.

Автоматично разпознаване на кодировки

Използването на множество знакови набори в днешния софтуер създава много неудобства, не само програмисти. но също така и за потребителите. Според едно мнение, опа, боклук може да се справи с това, ако програмата автоматично ще открие кодировката на входящия текст.

За еднобайтови кодировки може да се обърне внимание на факта, че честотата на използване на различни букви са много различни (например, в българо-често се използва "на", но рядко "б"). Следователно, познаването на езика на текста, можете лесно да изберете кодова таблица, в която честотата на байта по-добре съответства на честотата на писмата на езика.

Един алтернативен поглед смята, че подобни евристични алгоритми за определяне на кодиране на текста вредно, защото съвременните информационни технологии разполагат с необходимите средства, за да се сравни текста на разпоредбите, изрично го страницата код (вж. Например, създаване на програми за текстови данни, които нарушават стандартите.

общата кодиране

  • ISO 646
    • EBCDIC
    • ISO 8859.
      • ISO 8859-1. ISO 8859-2. ISO 8859-3. ISO 8859-4. ISO 8859-5. ISO 8859-6, ISO 8859-7, ISO 8859-8, ISO 8859-9, ISO 8859-10, 8859-11 ISO, ISO 8859-13, 8859-14 ISO, ISO 8859-15
      • Cp850, CP852, CP866, CP869






    • Encoding Microsoft Windows.
      • Windows-1252 за западни езици
      • Windows-1254 за турския език
      • Windows-1255 за еврейски
      • Windows-1256 за арабски
      • Windows-1257 за балтийските езици
      • Windows-1258 за виетнамски
    • MacRoman, KOI8 (KOI8-R, KOI8-U ...), koi7
    • българската кодиране
    • ISCII
    • VISCII
    • Big5 (най-известната версия на Microsoft CP950)
      • GB2312
      • GBK (Microsoft CP936)
      • GB18030
    • Shift JIS за японски (Microsoft CP932)
    • EUC-KR за корейски (Microsoft CP949)
    • ISO-2022 и по Хартата за китайската писменост
    • UTF-16 кодиран Unicode набор от символи

    бележки

    Вижте това, което "кодиране на знаците" в други речници:

    Encoding на българския език в областта на компютърните програми и интернет - - Всички символи, които могат да бъдат показани на екрана на компютъра, са описани в таблицата със символи. В първата таблица на символите не е български букви. За да работи с българските букви, те трябваше да влиза в този набор от символи вместо ненужно ... ... академично издание на речника медии

    Encoding - набор от знаци (английски набор от знаци.) Таблица определен ограничен набор от кодиране на знаците. Тази таблица сравнява всяка дължина характер последователност в една или повече байта. Въпреки че терминът "набор от символи" (инж. Набор от знаци, ... ... Wikipedia

    Алтернативен кодиране - Проверете информацията. Необходимо е да се провери достоверността на фактите, както и точността на информацията, съдържаща се в тази статия. На страницата на дискусия трябва да е обяснение. "Алтернатива за кодиране" под ... Wikipedia

    Character Set - маса, която указва кодировката на ограничен набор от азбуката (обикновено текстови елементи: букви, цифри, препинателни знаци) (на английски набор от знаци.). Тази таблица сравнява всяка дължина характер последователност в една или повече ... ... Wikipedia

    Кодирането шест-малко - шест-битово кодиране, използван в компютри, произведени в САЩ през 1950 1960. Следователно, размерът на машина дума на тези компютри кратно на 6 бита (например, 12, 18, 24, 36, 48, 60 бита). Този размер символ позволено ... ... Wikipedia

    Основната кодиране - в съответствие с ГОСТ 19768 87 е приет през 1987 г., за да замени KOI 8, но малко използвани. Основно кодиране поддържа само хардуер и софтуер, който се произвежда в Съветския съюз (ЕС PC, Lexicon, ...), както и някои принтери Epson ... Уикипедия

    UTF-8 - (. От трансформация Format английската Unicode, 8 битов «Unicode Transformation Format, 8-битов") обща кодиране на Unicode символи, който е съвместим с 8-битов формат предаване на текст. Е широко използван в инструкциите за работа ... ... Wikipedia

    • Алтернативен кодиране. Dzhessi Rassel. Тази книга ще бъде направено в съответствие с вашата поръчка на технологии технология за печат при поискване. Високо качество на съдържанието от статиите в Уикипедия! "? Vnaya алтернативи кодира Application" - въз основа на CP437 ... Прочети повече купи за 998 рубли