[ Страница назад | Страница вперед | Содержание | Индекс | Библиотека | Юридическая информация | Поиск ]

Программирование: Разработка и отладка программ


Функции преобразования - Информация для программистов

Если вашему продукту требуется поддержка национальных языков (NLS), скорее всего, вы столкнетесь с необходимостью применения различных кодовых страниц для представления информации. В AIX входят несколько программ, предназначенных для перекодирования данных. Эти программы обычно называют перекодировщиками. В этом разделе вы найдете сведения по следующим темам:

Вводная информация о перекодировщиках

При передаче данных из одного компьютера в другой может потребоваться преобразование из кодировки исходной машины в кодировку машины-получателя. Например, при передаче данных в систему VM рабочие станции преобразуют их из формата ISO8859-1 в формат EBCDIC.

Кодовым набором называется соответствие между кодовыми знаками и графическим представлением символов, а также между кодовыми знаками и управляющими символами. Преобразование данных требуется во всех случаях, когда они должны быть показаны пользователю не в той кодировке, в которых они получены или хранятся в системе.

В AIX предусмотрены два интерфейса перекодировки:

команда iconv Позволяет преобразовать данные из кодировки FromCode в кодировку ToCode.
функции libiconv (Библиотека libiconv) Вы можете напрямую вызывать процедуры этой библиотеки из ваших программ.

В AIX предусмотрены библиотеки преобразования данных. Процедуры из этих библиотек можно напрямую вызывать из пользовательских программ. Эти библиотеки находятся в каталогах /usr/lib/nls/loc/iconv/* и /usr/lib/nls/loc/iconvTable/*.

В эти библиотеки входят не только стандартные, но и сетевые процедуры преобразования кодовых наборов. В сетевой среде способ преобразования данных зависит от кодовых наборов удаленных систем и применяемых протоколов связи.

Сетевые перекодировщики применяются для преобразования информации, передаваемой между компьютерами по сети. Для преобразования данных из одного внутреннего кодового набора в другой требуются специальные функции перекодировки. Для удобства пользователей в AIX был предусмотрен единый унифицированный интерфейс перекодировки, не зависящий от конкретных кодовых страниц. Такой интерфейс предоставляют функции iconv.

Стандартные перекодировщики

В AIX предусмотрено несколько стандартных перекодировщиков, которые применяются с функциями и командой iconv. В следующем списке перечислены типы перекодировщиков:

Типы перекодировщиков Описание
Табличный перекодировщик (Список перекодировщиков для кодовых наборов PC, ISO и EBCDIC) Преобразует однобайтовые кодовые наборы. Выполняет побайтное преобразование по таблице.
Алгоритмический перекодировщик (Список перекодировщиков многобайтовых кодовых наборов) Выполняет преобразования, которые невозможно сделать с помощью простого табличного перекодировщика. Примерами могут служить преобразования многобайтовых наборов символов.

Сетевые перекодировщики Описание
Список перекодировщиков для сетевого обмена--7-разрядные Выполняет перекодирование между внутренними кодовыми наборами систем и стандартными 7-разрядными кодовыми наборами стандарта ISO2022.
Список перекодировщиков для сетевого обмена--8-разрядные Выполняет перекодирование между внутренними кодовыми наборами систем и стандартными 8-разрядными кодовыми наборами стандарта ISO2022.
Список перекодировщиков для сетевого обмена--Сложный текст Выполняет преобразование между сложным текстом и внутренними кодовыми наборами.
Список перекодировщиков для сетевого обмена--uucode Функционально эквивалентен командам uuencode и uudecode.
Список перекодировщиков UCS-2 Преобразует данные UCS-2 в другие кодировки и обратно.
Список перекодировщиков для UTF-8 Преобразует данные UTF-8 в другие кодировки и обратно.

Прочие перекодировщики Описание
Список прочих перекодировщиков Применяются некоторыми перекодировщиками из числа описанных выше.

Библиотека libiconv

Интерфейс прикладных программ (API) iconv включает три функции, необходимые для перекодирования:

iconv_open Выполняет инициализацию процесса преобразования данных из кодировки FromCode в кодировку ToCode. Строка вызова будет зависеть от того, какие именно перекодировщики установлены в системе. Если инициализация выполнена успешно, эта процедура возвращает дескриптор перекодировщика iconv_t.
Функция iconv Вызывает функцию преобразования через дескриптор, полученный от функции iconv_open. Принимает следующие параметры: inbuf - ссылку на начало преобразуемых данных, inbytesleft - объем данных в байтах, outbuf - ссылку на выходной буфер, и outbytesleft - размер выходного буфера.

Если процесс перекодирования зависит от состояния входных данных, то для сброса функции в начальное состояние ее нужно вызвать с нулевым указателем в качестве значения inbuf. Если после сброса эта функция будет вызвана с ненулевым значением параметра inbuf, ее состояние будет откорректировано соответствующим образом.

iconv_close Закрывает и освобождает дескриптор преобразования, определенный параметром cd.

В сетевой среде способ преобразования данных зависит от следующих факторов:

В следующей таблице приведены рекомендации по применению различных методов перекодировки. Дополнительная информация приведена в разделах Список перекодировщиков для сетевого обмена--7-разрядные и Список перекодировщиков для сетевого обмена--8-разрядные.

Обзор методов и рекомендации


Передача данных между системами с одинаковыми кодовыми наборами Передача данных между системами с разными или неизвестными кодовыми наборами


Протокол Протокол
Рекомендуемый метод Только 7-разрядные данные 8-разрядные данные Только 7-разрядные данные 8-разрядные данные
без перекодирования Недопустим Оптимальный выбор Недопустим Недопустим, если кодовый набор удаленного компьютера неизвестен
fold7 OK OK Оптимальный выбор OK
fold8 Недопустим OK Недопустим Оптимальный выбор
uucode Оптимальный выбор OK Недопустим Недопустим

Если кодировки отправителя и получателя совпадают, возможны следующие варианты:

Если кодировки отправителя и получателя не совпадают, то возможны следующие варианты:

Применение функции iconv_open

Ниже приведены примеры применения функции iconv_open в различных ситуациях:

Поиск перекодировщиков функцией iconv_open

Функция iconv_open использует для поиска перекодировщика переменную среды LOCPATH; при этом имя перекодировщика должно быть указано в формате

iconv/старый-кодовый-набор_новый-кодовый-набор

старый-кодовый-набор обозначает кодовый набор отправителя, а новый-кодовый-набор - кодовый набор получателя. Строки разделяются символом подчеркивания.

Примечание: все программы setuid и setgid игнорируют значение переменной среды LOCPATH.

Поскольку перекодировщик iconv представляет собой загружаемый объектный модуль, в 32- и 64-разрядных средах должны применяться различные модули. В 64-разрядной среде применяется процедура iconv_open, которая пользуется перекодировщиками следующего вида:

iconv/FromCodeSet_ToCodeSet__64.

Библиотека iconv автоматически определяет тип загружаемого объекта (для 32- или 64-разрядной среды).

Если функция iconv_open не может найти перекодировщик, она использует значения исходного/целевого кодового набора для поиска файла табличного преобразования. Файлы, в котором хранятся таблицы преобразования создаются командой genxlt.

Перекодировщик iconvTable использует для поиска файла переменную среды LOCPATH; при этом имя файла должно быть задано в формате

iconvTable/старый-кодовый-набор_новый-кодовый-набор

Если перекодировщик найден, он загружает и иинициализирует его. Дескриптор перекодировщика iconv_t сбрасывается в свое исходное состояние.

Сравнение таблиц перекодировки и перекодировщиков

Перекодировщики - это исполняемые функции, которые преобразуют данные согласно некоторому набору правил. Таблицы перекодировки - это массивы данных, задающие однозначное побайтовое преобразование информации. Перекодировщики и таблицы хранятся в разных каталогах:

/usr/lib/nls/loc/iconv Перекодировщики
/usr/lib/nls/loc/iconvTable Таблицы перекодировки

После того как программа перекодировки откомпилирована и скомпонована с библиотекой libiconv.a, ее помещают в каталог /usr/lib/nls/loc/iconv.

Для того чтобы создать табличный перекодировщик, сначала создайте файл таблицы преобразования. Затем с помощью команды genxlt преобразуйте эти таблицы в формат, применяемый табличными перекодировщиками. Поместите полученный файл в каталог /usr/lib/nls/loc/iconvTable .

Универсальные кодировщики и перекодировщики Unicode

Таблицы преобразования для кодировки Unicode (или UCS-2) хранятся в следующем каталоге:

$LOCPATH/uconvTable/*CodeSet*

Перекодировщик $LOCPATH/uconv/UCSTBL предназначен для преобразования данных в кодировку UCS-2 и обратно с помощью утилит iconv. Для того чтобы функции iconv могли работать с таблицами преобразования uconvTable, в каталоге $LOCPATH/iconv нужно настроить необходимые связи. Например, для кодового набора "X":

ln -s /usr/lib/nls/loc/uconv/UCSTBL /usr/lib/nls/loc/iconv/X_UCS-2
ln -s /usr/lib/nls/loc/uconv/UCSTBL /usr/lib/nls/loc/iconv/UCS-2_X

Программа "Универсальный перекодировщик" может выполнять преобразования между любыми двумя кодовыми наборами, для каждого из которых возможно преобразование в UCS-2 и обратно. Предположим, что существуют следующие таблицы перекодировки:

X     -> UCS-2
UCS-2 -> Y

Тогда можно однозначно определить следующее преобразование:

X -> UCS-2 -> Y

Это преобразование можно будет выполнить с помощью $LOCPATH/iconv/Universal_UCS_Conv. Преобразование X->Y задается путем установки связей с универсальным перекодировщиком, например:

ln-s /usr/lib/nls/loc/iconv/Universal_UCS_Conv /usr/lib/nls/loc/iconv/X_Y

Работа с перекодировщиками

Интерфейс iconv представляет собой набор функций инициализации, выполнения и сброса процессов перекодировки:

Пример фильтра преобразования кодовых наборов

Ниже показано, каким образом с помощью указанных функций вы можете создать фильтр-перекодировщик, принимающий в качестве исходных аргументов параметры ИсходныйКодовыйНабор и ЦелевойКодовыйНабор.

#include <stdio.h>
#include <nl_types.h>
#include <iconv.h>
#include <string.h>
#include <errno.h>
#include <locale.h>
 
#define ICONV_DONE() (r>=0)
#define ICONV_INVAL() (r<0) && (errno==EILSEQ))
#define ICONV_OVER() (r<0) && (errno==E2BIG))
#define ICONV_TRUNC() (r<0) && (errno==EINVAL))
 
#define USAGE 1
#define ERROR 2
#define INCOMP 3
 
char ibuf[BUFSIZ], obuf[BUFSIZ];
 
extern int errno;
 
main (argc,argv)
int argc;
char **argv;
{

 size_t  ileft,oleft;
 nl_catd      catd;
 iconv_t cd;
 int r;
 char *ip,*op;
 
 setlocale(LC_ALL,"");
 catd = catopen (argv[0],0);
 
 if(argc!=3){
  fprintf(stderr,
   catgets (catd,NL_SETD,USAGE,"usage;conv fromcode tocode\n"));
  exit(1);
 }
 
 cd=iconv_open(argv[2],argv[1]);
 
ileft=0;
 
while(!feof(stdin)) {

 /*
 * After the next operation,ibuf will
 * contain new data plus any truncated
 * data left from the previous read.
 */
 ileft+=fread(ibuf+ileft,1,BUFSIZ-ileft,stdin);
 do {
  ip=ibuf;
  op=obuf;
  oleft=BUFSIZ;
 
  r=iconv(cd,&ip,&ileft,&op,&oleft);
 
  if(ICONV_INVAL()){
   fprintf(stderr,
      catgets(catd,NL_SETD,ERROR,"invalid input\n"));
   exit(2);
 }
 
 fwrite(obuf,1,BUFSIZ-oleft,stdout);
 
 if(ICONV_TRUNC() || ICONV_OVER())
  /*
  *Data remaining in buffer-copy
  *it to the beginning
  */
 
  memcpy(ibuf,ip,ileft);
 
  /*
  *loop until all characters in the input
  *buffer have been converted.
  */
 } while(ICONV_OVER());
}
 
 if(ileft!=0){
  /*
  *This can only happen if the last call
  *to iconv() returned ICONV_TRUNC, meaning
  *the last data in the input stream was
  *incomplete.
  */
 fprintf(stderr,catgets(catd,NL_SETD,INCOMP,"input incomplete\n"));
 exit(3);
 }
 
 iconv_close(cd);
 exit(0);
}

Имена перекодировщиков

Кодовым наборам присвоены имена в формате CodesetRegistry-CodesetEncoding, где:

CodesetRegistry Указывает организацию, разработавшую кодовый набор. Значение CodesetRegistry должно состоять только из прописных латинских букв и цифр (A-Z, 0-9).
CodesetEncoding Идентификатор кодового набора.

Переменная from,to, используемая командой iconv и функцией iconv_open, определяет файл с именем в формате /usr/lib/nls/loc/iconv/%f_%t или /usr/lib/nls/loc/iconvTable/%f_%t, где:

%f Указывает имя кодового набора отправителя (FromCode).
%t Указывает имя кодового набора получателя (ToCode).

Список перекодировщиков

Перекодировщики преобразуют данные из одного кодового набора в другой. Перекодировщики, поддерживаемые библиотекой ICONV, описаны в разделах, следующих ниже. Все перекодировщики, поставляемые совместно с BOS, находятся в каталоге /usr/lib/nls/loc/iconv/* или /usr/lib/nls/loc/iconvTable/*.

В этих каталогах также содержатся частные перекодировщики; то есть те, к которым обращаются только другие перекодировщики. Однако, пользователи и программы никогда не используют их, а лишь те перекодировщики, которые приведенных в следующих списках.

Если перекодировщик, поставляемый с BOS Runtime Environment отсутствует в этом списке, то они считаются частными и подлежат изменению или удалению. Перекодировщики, поставляемые с другими продуктами можно также помещать в каталоги /usr/lib/nls/loc/iconv/* и /usr/lib/nls/loc/iconvTable/*.

Программистам рекомендуется использовать либо зарегистрированные имена кодовых наборов, или имена связанные с конкретным приложением. "X Consortium" поддерживает справочный реестр имен кодовых наборов. Дополнительная информация о кодовых наборах приведена в разделе Кодовые наборы - Обзор.

Список перекодировщиков для кодовых наборов PC, ISO и EBCDIC

Эти перекодировщики выполняют преобразования между однобайтовыми кодовыми наборами PC, ISO и EBCDIC. Они позволяют выполнять двухсторонние перекодировки между PC и ISO, PC и EBCDIC, ISO и EBCDIC.

Возможны преобразования между совместимыми кодовыми наборами, например из латиницы-1 в латиницу-1, из греческого в греческий. Однако, эти перекодировщики не поддерживают преобразования между различными кодовыми наборами EBCDIC для национальных языков. Более подробные сведения о перекодировках между несовместимыми кодовыми наборами приведены в разделах Список перекодировщиков для сетевого обмена--7-разрядные и Список перекодировщиков для сетевого обмена--8-разрядные.

Для создания перекодировочных таблиц в каталоге iconvTable предназначена команда genxlt.

Названия совместимых кодовых наборов

Эта таблица содержит список названий совместимых кодовых наборов. В каждой строке таблицы указаны названия исходного и конечного кодового набора, которые потребуются для запуска перекодировки.

Примечание: Кодовые наборы PC и ISO основаны на кодировке ASCII.

Совместимость кодовых наборов
Набор символов Языки PC ISO EBCDIC
Латиница-1 Английский (США), Португальский, Французский (Канада) IBM-850 ISO8859-1 IBM-037
Латиница-1 Датский, Норвежский IBM-850 ISO8859-1 IBM-277
Латиница-1 Финский, Шведский IBM-850 ISO8859-1 IBM-278
Латиница-1 Итальянский IBM-850 ISO8859-1 IBM-280
Латиница-1 Японский IBM-850 ISO8859-1 IBM-281
Латиница-1 Испанский IBM-850 ISO8859-1 IBM-284
Латиница-1 Английский (Великобритания) IBM-850 ISO8859-1 IBM-285
Латиница-1 Немецкий IBM-850 ISO8859-1 IBM-273
Латиница-1 Французский IBM-850 ISO8859-1 IBM-297
Латиница-1 Бельгийский, Немецкий (Швейцария) IBM-850 ISO8859-1 IBM-500
Латиница-2 Хорватский, Чехословацкий, Венгерский, Польский, Румынский, Сербский латинский, Словацкий, Словенский IBM-852 ISO88859-2 IBM-870
Кириллица Болгарский, Македонский, Сербский (кириллица), Русский IBM-855 ISO8859-5 IBM-880 IBM-1025
Кириллица Русский IBM-866 ISO8859-5 IBM-1025
Иврит Иврит IBM-856 IBM-862 ISO8859-8 IBM-424 IBM-803
Турецкие символы Турецкий IBM-857 ISO8859-9 IBM-1026
Арабские символы Арабский IBM-864 IBM-1046 ISO8859-6 IBM-420
Греческие символы Греческий IBM-869 ISO8859-7 IBM-875
Греческие символы Греческий IBM-869 ISO8859-7 IBM-875
Балтийские символы Литовский, Латвийский, Эстонский IBM-921 IBM-922

IBM-1112 IBM-1122

Примечание: Если определенный символ отсутствует в целевом кодовом наборе, то он будет преобразован в некоторый символ замещения, определяемый данным кодовым набором.

Файлы

Следующая таблица содержит описание перекодировщиков inconvTable, расположенных в каталоге /usr/lib/nls/loc/iconvTable:

Перекодировщик iconvTable
Таблица преобразования Описание Язык
IBM-037_IBM-850 из IBM-037 в IBM-850 Английский (США), Португальский, Французский (Канада)
IBM-273_IBM-850 из IBM-273 в IBM-850 Немецкий
IBM-277_IBM-850 из IBM-277 в IBM-850 Датский, Норвежский
IBM-278_IBM-850 из IBM-278 в IBM-850 Финский, Шведский
IBM-280_IBM-850 из IBM-280 в IBM-850 Итальянский
IBM-281_IBM-850 из IBM-281 в IBM-850 Японский (латинские символы)
IBM-284_IBM-850 из IBM-284 в IBM-850 Испанский
IBM-285_IBM-850 из IBM-285 в IBM-850 Английский (Великобритания)
IBM-297_IBM-850 из IBM-297 в IBM-850 Французский
IBM-420_IBM_1046 из IBM-420 в IBM-1046 Арабский
IBM-424_IBM-856 из IBM-424 в IBM-856 Иврит
IBM-424_IBM-862 из IBM-424 в IBM-862 Иврит
IBM-500_IBM-850 из IBM-500 в IBM-850 Бельгийский, Немецкий (Швейцария)
IBM-803_IBM-856 из IBM-803 в IBM-856 Иврит
IBM-803_IBM-862 из IBM-803 в IBM-862 Иврит
IBM-850_IBM-037 из IBM-850 в IBM-037 Английский (США), Португальский, Французский (Канада)
IBM-850_IBM-273 из IBM-850 в IBM-273 Немецкий
IBM-850_IBM-277 из IBM-850 в IBM-277 Датский, Норвежский
IBM-850_IBM-278 из IBM-850 в IBM-278 Финский, Шведский
IBM-850_IBM-280 из IBM-850 в IBM-280 Итальянский
IBM-850_IBM-281 из IBM-850 в IBM-281 Японский (латинские символы)
IBM-850_IBM-284 из IBM-850 в IBM-284 Испанский
IBM-850_IBM-285 из IBM-850 в IBM-285 Английский (Великобритания)
IBM-850_IBM-297 из IBM-850 в IBM-297 Французский
IBM-850_IBM-500 из IBM-850 в IBM-500 Бельгийский, Немецкий (Швейцария)
IBM-856_IBM-424 из IBM-856 в IBM-424 Иврит
IBM-856_IBM-803 из IBM-856 в IBM-803 Иврит
IBM-856_IBM-862 из IBM-856 в IBM-862 Иврит
IBM-862_IBM-424 из IBM-862 в IBM-424 Иврит
IBM-862_IBM-803 из IBM-862 в IBM-803 Иврит
IBM-862_IBM-856 из IBM-862 в IBM-856 Иврит
IBM-864_IBM-1046 из IBM-864 в IBM-1046 Арабский
IBM-921_IBM-1112 из IBM-921 в IBM-1112 Литовский, Латвийский
IBM-922_IBM-1122 из IBM-922 в IBM-1122 Эстонский
IBM-1112_IBM-921 из IBM-1121 в IBM-921 Литовский, Латвийский
IBM-1122_IBM-922 из IBM-1122 в IBM-922 Эстонский
IBM-1046_IBM-420 из IBM-1046 в IBM-420 Арабский
IBM-1046_IBM-864 из IBM-1046 в IBM-864 Арабский
IBM-037_ISO8859-1 из IBM-037 в ISO8859-1 Английский (США), Португальский, Французский (Канада)
IBM-273_ISO8859-1 из IBM-273 в ISO8859-1 Немецкий
IBM-277_ISO8859-1 из IBM-277 в ISO8859-1 Датский, Норвежский
IBM-278_ISO8859-1 из IBM-278 в ISO8859-1 Финский, Шведский
IBM-280_ISO8859-1 из IBM-280 в ISO8859-1 Итальянский
IBM-281_ISO8859-1 из IBM-281 в ISO8859-1 Японский (латинские символы)
IBM-284_ISO8859-1 из IBM-284 в ISO8859-1 Испанский
IBM-285_ISO8859-1 из IBM-285 в ISO8859-1 Английский (Великобритания)
IBM-297_ISO8859-1 из IBM-297 в ISO8859-1 Французский
IBM-420_ISO8859-6 из IBM-420 в ISO8859-6 Арабский
IBM-424_ISO8859-8 из IBM-424 в ISO8859-8 Иврит
IBM-500_ISO8859-1 из IBM-500 в ISO8859-1 Бельгийский, Немецкий (Швейцария)
IBM-803_ISO8859-8 из IBM-803 в ISO8859-8 Иврит
IBM-852_ISO8859-2 из IBM-852 с ISO8859-2 Хорватский, Чехословацкий, Венгерский, Польский, Румынский, Сербский латинский, Словацкий, Словенский
IBM-855_ISO8859-5 из IBM-855 в ISO8859-5 Болгарский, Македонский, Сербский (кириллица), Русский
IBM-866_ISO8859-5 из IBM-866 в ISO8859-5 Русский
IBM-869_ISO8859-7 из IBM-869 в ISO8859-7 Греческий
IBM-875_ISO8859-7 из IBM-875 в ISO8859-7 Греческий
IBM-870_ISO8859-2 из IBM-870 с ISO8859-2 Хорватский Чехословацкий, Венгерский, Польский, Румынский, Сербский, Словацкий, Словенский
IBM-880_ISO8859-5 из IBM-880 в ISO8859-5 Болгарский, Македонский, Сербский (кириллица), Русский
IBM-1025_ISO8859-5 из IBM-1025 в ISO8859-5 Болгарский, Македонский, Сербский (кириллица), Русский
IBM-857_ISO8859-9 из IBM-857 в ISO8859-9 Турецкий
IBM-1026_ISO8859-9 из IBM-1026 в ISO8859-9 Турецкий
IBM-850_ISO8859-1 из IBM-850 в ISO8859-1 Латинский
IBM-856_ISO8859-8 из IBM-856 в ISO8859-8 Иврит
IBM-862_ISO8859-8 из IBM-862 в ISO8859-8 Иврит
IBM-864_ISO8859-6 из IBM-864 в ISO8859-6 Арабский
IBM-1046_ISO8859-6 из IBM-1046 в ISO8859-6 Арабский
ISO8859-1_IBM-850 из ISO8859-1 в IBM-850 Латинский
ISO8859-6_IBM-864 из ISO8859-6 в IBM-864 Арабский
ISO8859-6_IBM-1046 из ISO8859-6 в IBM-1046 Арабский
ISO8859-8_IBM-856 из ISO8859-8 в IBM-856 Иврит
ISO8859-8_IBM-862 из ISO8859-8 в IBM-862 Иврит
ISO8859-1_IBM-037 из ISO8859-1 в IBM-037 Английский (США), Португальский, Французский (Канада)
ISO8859-1_IBM-273 из ISO8859-1 в IBM-273 Немецкий
ISO8859-1_IBM-277 из ISO8859-1 в IBM-277 Датский, Норвежский
ISO8859-1_IBM-278 из ISO8859-1 в IBM-278 Финский, Шведский
ISO8859-1_IBM-280 из ISO8859-1 в IBM-280 Итальянский
ISO8859-1_IBM-281 из ISO8859-1 в IBM-281 Японский (латинские символы)
ISO8859-1_IBM-284 из ISO8859-1 в IBM-284 Испанский
ISO8859-1_IBM-285 из ISO8859-1 в IBM-285 Английский (Великобритания)
ISO8859-1_IBM-297 из ISO8859-1 в IBM-297 Французский
ISO8859-1_IBM-500 из ISO8859-1 в IBM-500 Бельгийский, Немецкий (Швейцария)
ISO8859-2_IBM-852 из ISO8859-2 в IBM-852 Хорватский, Чехословацкий, Венгерский, Польский, Румынский, Сербский латинский, Словацкий, Словенский
ISO8859-2_IBM-870 из ISO8859-2 в IBM-870 Хорватский Чехословацкий, Венгерский, Польский, Румынский, Сербский (латинские символы), Словацкий, Словенский
ISO8859-5_IBM-855 из ISO8859-5 в IBM-855 Болгарский, Македонский, Сербский (кириллица), Русский
ISO8859-5_IBM-880 из ISO8859-5 в IBM-880 Болгарский, Македонский, Сербский (кириллица), Русский
ISO8859-5_IBM-1025 из ISO8859-5 в IBM-1025 Болгарский, Македонский, Сербский (кириллица), Русский
ISO8859-6_IBM-420 из ISO8859-6 в IBM-420 Арабский
ISO8859-5_IBM-866 из ISO8859-5 в IBM-866 Русский
ISO8859-7_IBM-869 из ISO8859-7 в IBM-869 Греческий
ISO8859-7_IBM-875 из ISO8859-7 в IBM-875 Греческий
ISO8859-8_IBM-424 из ISO8859-8 в IBM-424 Иврит
ISO8859-8_IBM-803 из ISO8859-8 в IBM-803 Иврит
ISO8859-9_IBM-857 из ISO8859-9 в IBM-857 Турецкий
ISO8859-9_IBM-1026 из ISO8859-9 в IBM-1026 Турецкий

Список перекодировщиков многобайтовых кодовых наборов

Перекодировщики кодовых наборов многобайтовых символов преобразуют данные между следующими кодировками:

Эта таблица содержит список названий совместимых кодовых наборов. В каждой строке таблицы указаны названия исходного и конечного кодового набора, которые потребуются для запуска перекодировки.

Совместимость кодовых наборов
Язык PC ISO EBCDIC
Японский IBM-932 IBM-eucJP IBM-930, IBM-939
Японский
(совместимый с MS)
IBM-943 IBM-eucJP IBM-930, IBM-939
Корейский IBM-934 IBM-eucKR IBM-933
Традиционный китайский IBM-938, big-5 IBM-eucTW IBM-937
Упрощенный китайский IBM-1381 IBM-eucCN IBM-935
  1. Предусмотрена возможность преобразования между символами упрощенного и традиционного китайского языка (IBM-eucTW <--> IBM-eucCN и big5 <--> IBM-eucCN).
  2. UTF-8 - это дополнительный кодовый набор. Дополнительная информация по этому вопросу приведена в разделе Список перекодировщиков для UTF-8.

Файлы

Этот список содержит описания перекодировщиков кодовых наборов многобайтовых символов из каталога /usr/lib/nls/loc/iconv.

Перекодировщик Описание
IBM-eucJP_IBM-932 из IBM-eucJP в IBM-932
IBM-eucJP_IBM-943 из IBM-eucJP в IBM-943
IBM-eucJP_IBM-930 из IBM-eucJP в IBM-930
IBM-eucCN_IBM-936(PC5550) из IBM-eucCN в IBM-936(PC5550)
IBM-eucCN_IBM-935 из IBM-eucCN в IBM-935
IBM-eucJP_IBM-939 из IBM-eucJP в IBM-939
IBM-eucCN_IBM-1381 из IBM-eucCN в IBM-1381
IBM-943_IBM-932 из IBM-943 в IBM-932
IBM-932_IBM-943 из IBM-932 в IBM-943
IBM-930_IBM-932 из IBM-930 в IBM-932
IBM-930_IBM-943 из IBM-930 в IBM-943
IBM-930_IBM-eucJP из IBM-930 в IBM-eucJP
IBM-932_IBM-eucJP из IBM-932 в IBM-eucJP
IBM-932_IBM-930 из IBM-932 в IBM-930
IBM-943_IBM-eucJP из IBM-943 в IBM-eucJP
IBM-943_IBM-930 из IBM-943 в IBM-930
IBM-936(PC5550)_IBM-935 из IBM-936(PC5550) в IBM-935
IBM-936_IBM-935 из IBM-936 в IBM-935
IBM-932_IBM-939 из IBM-932 в IBM-939
IBM-939_IBM-932 из IBM-939 в IBM-932
IBM-943_IBM-939 из IBM-943 в IBM-939
IBM-939_IBM-943 из IBM-939 в IBM-943
IBM-935_IBM-936(PC5550) из IBM-935 в IBM-936(PC5550)
IBM-935_IBM-936 из IBM-935 в IBM-936
IBM-1381_IBM-935 из IBM-1381 в IBM-935
IBM-935_IBM-1381 из IBM-935 в IBM-1381
IBM-935_IBM-eucCN из IBM-935 в IBM-eucCN
IBM-936(PC5550)_IBM-eucCN из IBM-936(PC5550) в IBM-eucCN
IBM-eucTW_IBM-eucCN из IBM-eucTW в IBM-eucCN
big5_IBM-eucCN из big5 в IBM-eucCN
IBM-1381_IBM-eucCN из IBM-1381 в IBM-eucCN
IBM-939_IBM-eucJP из IBM-939 в IBM-eucJP
IBM-eucKR_IBM-934 из IBM-eucKR в IBM-934
IBM-934_IBM-eucKR из IBM-934 в IBM-eucKR
IBM-eucKR_IBM-933 из IBM-eucKR в IBM-933
IBM-933_IBM-eucKR из IBM-933 в IBM-eucKR
IBM-eucTW_IBM-937 из IBM-eucTW в IBM-937
IBM-938_IBM-937 из IBM-938 в IBM-937
big-5_IBM-937 из big-5 в IBM-937
IBM-eucCN_IBM-eucTW из IBM-eucCN в IBM-eucTW
IBM-937_IBM-eucTW из IBM-937 в IBM-eucTW
IBM-937_IBM-938 из IBM-937 в IBM-938
IBM-eucTW_IBM-938 из IBM_eucTW в IBM_938
IBM-eucCN_big5 из IBM-eucCN в big5
IBM-eucTW_big-5 из IBM_eucTW в big-5_938
IBM-937_big-5 из IBM-937 в big-5
CNS11643.1992-3_IBM-eucTW из CNS11643.1992-3 в IBM_eucTW
CNS11643.1992-3-GL_IBM-eucTW из CNS11643.1992-3-GL в IBM_eucTW
CNS11643.1992-3-GR_IBM-eucTW из CNS11643.1992-3-GR в IBM_eucTW
CNS11643.1992-4_IBM-eucTW из CNS11643.1992-4 в IBM_eucTW
CNS11643.1992-4-GL_IBM-eucTW из CNS11643.1992-4-GL в IBM_eucTW
CNS11643.1992-4-GR_IBM-eucTW из CNS11643.1992-4-GR в IBM_eucTW
IBM-eucTW_CNS11643.1992-3 из IBM_eucTW в CNS11643.1992-3
IBM-eucTW_CNS11643.1992-3-GL из IBM_eucTW в CNS11643.1992-3-GL
IBM-eucTW_CNS11643.1992-3-GR из IBM_eucTW в CNS11643.1992-3-GR
IBM-eucTW_CNS11643.1992-4 из IBM_eucTW в CNS11643.1992-4
IBM-eucTW_CNS11643.1992-4-GL из IBM_eucTW в CNS11643.1992-4-GL
IBM-eucTW_CNS11643.1992-4-GR из IBM_eucTW в CNS11643.1992-4-GR
IBM-eucCN_GB2312.1980-1 из IBM-eucCN в GB2312.1980-1
IBM-eucCN_GB2312.1980-1-GL из IBM-eucCN в GB2312.1980-1-GL
IBM-eucCN_GB2312.1980-1-GR из IBM-eucCN в GB2312.1980-1-GR
IBM-937_csic из IBM-937 в csic
csic_IBM-937 из csic в IBM-937
IBM-938_csic из IBM-938 в csic
csic_IBM-938 из csic в IBM-938
IBM-eucTW_ccdc из IBM-eucTW в ccdc
ccdc_IBM-eucTW из ccdc в IBM-eucTW
IBM-eucTW_cns из IBM-eucTW в cns
cns_IBM-eucTW из cnd в IBM-eucTW
IBM-eucTW_csic из IBM-eucTW в csic
csic_IBM-eucTW из csic в IBM-eucTW
IBM-eucTW_sops из IBM-ecuTW в sops
sops_IBM-eucTW из sops в IBM-eucTW
IBM-eucTW_tca из IBM-eucTW в tca
tca_IBM-eucTW из tca в IBM-eucTW
big5_cns из big5 в cns
cns_big5 из cns в big5
big5_csic из big5 в csic
csic_big5 из csic в big5
big5_ttc из big5 в ttc
ttc_big5 из ttc в big5
big5_ttcmin из big5 в ttcmin
ttcmin_big5 из ttcmin в big5
big5_unicode из big5 в unicode
unicode_big5 из unicode в big5
big5_wang из big5 в wang
wang_big5 из wang в big5
ccdc_csic из ccdc в csic
csic_ccdc из csic в ccdc
csic_sops из csic в sops
sops_csic из sops в csic
CNS11643.1986-1_big5 из CNS11643.1986-1 в big5
big5_CNS11643.1986-1 из big5 в CNS11643.1986-1
CNS11643.1986-1-GR_big5 из CNS11643.1986-1-GR в big5
big5_CNS11643.1986-1-GR из big5 в CNS11643.1986-1-GR
CNS11643.1986-2_big5 из CNS11643.1986-2 в big5
big5_CNS11643.1986-2 из big5 в CNS11643.1986-2
CNS11643.1986-2-GR_big5 из CNS11643.1986-2-GR в big5
big5_CNS11643.1986-2-GR из big5 в CNS11643.1986-2-GR
CNS11643.CT-GR_big5 из CNS11643.CT-GR в big5
big5_CNS11643.CT-GR из big5 в CNS11643.CT-GR
IBM-sbdTW-GR_big5 из IBM-sbdTW-GR в big5
big5_IBM-sbdTW-GR из big5 в IBM-sbdTW-GR
IBM-sbdTW.CT-GR_big5 из IBM-sbdTW.CT-GR в big5
big5_IBM-sbdTW.CT-GR из big5 в IBM-sbdTW.CT-GR
IBM-sbdTW_big5 из IBM-sbdTW в big5
big5_IBM-sbdTW из big5 в IBM-sbdTW
IBM-udcTW-GR_big5 из IBM-udcTW-GR в big5
big5_IBM-udcTW-GR из big5 в IBM-udcTW-GR
IBM-udcTW.CT-GR_big5 из IBM-udcTW.CT-GR в big5
big5_IBM-udcTW.CT-GR из big5 в IBM-udcTW.CT-GR
ISO8859-1_big5 из ISO8859 в big5
big5_ISO8859-1 из big5 в ISO8859
IBM-sbdTW_big5 из IBM-sbdTW в big5
big5_IBM-sbdTW из big5 в IBM-sbdTW
big5_ASCII-GR из big5 в ASCII-GR
ASCII-GR_big5 из ASCII-GR в big5
GBK_big5 из GBK в big5
big5_GBK из big5 в GBK
GBK_IBM-eucTW из GBK в IBM-eucTW
IBM-eucTW_GBK из IBM-eucTW в GBK
CNS11643.1986-1_GBK из CNS11643.1986-1 в GBK
GBK_CNS11643.1986-1 из GBK в CNS11643.1986-1
CNS11643.1986-2_GBK из CNS11643.1986-2 в GBK
GBK_CNS11643.1986-2 из GBK в CNS11643.1986-2
CNS11643.1986-1-GR_GBK из CNS11643.1986-1-GR в GBK
GBK_CNS11643.1986-1-GR из GBK в CNS11643.1986-1-GR
CNS11643.1986-2-GR_GBK из CNS11643.1986-2-GR в GBK
GBK_CNS11643.1986-2-GR из GBK в CNS11643.1986-2-GR
CNS11643.1986-1-GL_GBK из CNS11643.1986-1-GL в GBK
GBK_CNS11643.1986-1-GL из GBK в CNS11643.1986-1-GL
CNS11643.1986-2-GL_GBK из CNS11643.1986-2-GL в GBK
GBK_CNS11643.1986-2-GL из GBK в CNS11643.1986-2-GL
CNS11643.CT-GR_GBK из CNS11643.CT-GR в GBK
GBK_CNS11643.CT-GR из GBK в CNS11643.CT-GR
GB2312.1980.CT-GR_GBK из GB2312.1980.CT-GR в GBK
GBK_GB2312.1980.CT-GR из GBK в GB2312.1980.CT-GR
GB2312.1980-0_GBK из GBK2312.1980-0 в GBK
GBK_GB2312.1980-0 из GBK в GBK2312.1980-0
GB2312.1980-0-GR_GBK из GB2312.1980-0-GR в GBK
GBK_GB2312.1980-0-GR из GBK в GB2312.1980-0-GR
GB2312.1980-0-GL_GBK из GB2312.1980-0-GL в GBK
GBK_GB2312.1980-0-GL из GBK в GB2312.1980-0-GL
ASCII-GR_GBK из ASCII-GR в GBK
GBK_ASCII-GR из GBK в ASCII-GR
ISO8859-1_GBK из ISO8859-1 в GBK
GBK_ISO8859-1 из GBK в ISO8859-1
IBM-eucCN_GBK из IBM-eucCN в GBK
GBK_IBM-eucCN из GBK в IBM-eucCN

Список перекодировщиков для сетевого обмена--7-разрядные

Этот перекодировщик позволяет преобразовывать данные между внутренним кодом и стандартными форматами для сетевого обмена 7-разрядными данными (fold7). Называние fold7 обозначает, что эта кодировка позволяет передавать данные по 7-разрядным почтовым протоколам. Это кодировки на основе ISO2022. Дополнительные сведения о кодировках fold7 вы найдете в разделе Библиотека libiconv.

Перекодировщики fold7 преобразуют символы из кодового набора в каноническую 7-разрядную кодировку, в которой идентифицируется каждый отдельный символ. Преобразование такого типа оказывается целесообразным в сетях, где кодовые наборы клиентов различны, но наборы символов - одинаковые. Например:

IBM-850 <--> ISO8859-1 Стандартные латинские символы
IBM-932<-->IBM-eucJP Стандартные японские символы

Следующие управляющие последовательности обозначают стандартные кодовые наборы:

Управляющая последовательность Стандартный кодовый набор
01/11 02/04 04/00 GL JIS X0208.1978-0.
01/11 02/04 02/08 04/01 GL левая часть GB2312.1980-0.
01/11 02/08 04/02 GL 7-разрядные символы ASCII или левая часть ISO8859-1.
01/11 02/14 04/01 GL правая часть ISO8859-1.
01/11 02/14 04/02 GL правая часть ISO8859-2.
01/11 02/14 04/03 GL правая часть ISO8859-3.
01/11 02/14 04/04 GL правая часть ISO8859-4.
01/11 02/14 04/06 GL правая часть ISO8859-7.
01/11 02/14 04/07 GL правая часть ISO8859-6.
01/11 02/14 04/08 GL правая часть ISO8859-8.
01/11 02/14 04/12 GL правая часть ISO8859-5.
01/11 02/14 04/13 GL правая часть ISO8859-9.
01/11 02/08 04/09 GL правая часть JIS X0201.1976-0.
01/11 02/08 04/10 GL левая часть JIS X0201.1976.
01/11 02/04 04/02 GL JIS X0208.1983-0.
01/11 02/04 02/08 04/02 GL JIS X0208.1983-0.
01/11 02/04 02/08 04/00 GL JISX0208.1978-0.
01/11 02/05 02/15 03/01 M L 06/09 06/02 06/13 02/13 03/08 03/05 03/00 00/02 GL правая часть набора уникальных символов IBM-850. К стандартным символам ISO8859-1 данная управляющая последовательность не относится.
01/11 02/05 02/15 03/02 M L 06/09 06/02 06/13 02/13 07/05 06/04 06/03 04/10 05/00 00/02 GL японские пользовательские символы (IBM-udcJP).
01/11 02/04 02/08 04/03 GL KSC5601-1987.
01/11 02/04 02/09 03/00 GL CNS11643-1986-1.
01/11 02/04 02/10 03/01 GL CNS11643-1986-2.
01/11 02/05 02/15 03/00 M L 05/05 05/04 04/06 02/13 03/07 00/02 UCS-2 в кодировке base64; предназначена только для символов, которые не кодирует ни одна из приведенных выше 7-разрядных управляющих последовательностей.

При преобразовании данных из кодового набора в fold7 управляющую последовательность, обозначающую данных кодовый набор, выбирают по порядку, в соответствии со списком. Например, символы JISX0208.1983-0 обозначает управляющая последовательность 01/11 01/04 04/02.

Файлы

В следующем списке приведены описания перекодировщиков fold7, расположенных в каталоге /usr/lib/nls/loc/iconv:

Перекодировщик Описание
fold7_IBM-850 Из формата сетевого обмена в IBM-850
fold7_IBM-921 Из формата сетевого обмена в IBM-921
fold7_IBM-922 Из формата сетевого обмена в IBM-922
fold7_IBM-932 Из формата сетевого обмена в IBM-932
fold7_IBM-943 Из формата сетевого обмена в IBM-943
fold7_IBM_1124 Из формата сетевого обмена в IBM-1124
fold7_IBM_1129 Из формата сетевого обмена в IBM-1129
fold7_IBM_eucCN Из формата сетевого обмена в IBM-eucCN
fold7_IBM-eucJP Из формата сетевого обмена в IBM-eucJP
fold7_IBM-eucKR Из формата сетевого обмена в IBM-eucKR
fold7_IBM-eucTW Из формата сетевого обмена в IBM-eucTW
fold7_ISO8859-1 Из формата сетевого обмена в ISO8859-1
fold7_ISO8859-2 Из формата сетевого обмена в ISO8859-2
fold7_ISO8859-3 Из формата сетевого обмена в ISO8859-3
fold7_ISO8859-4 Из формата сетевого обмена в ISO8859-4
fold7_ISO8859-5 Из формата сетевого обмена в ISO8859-5
fold7_ISO8859-6 Из формата сетевого обмена в ISO8859-6
fold7_ISO8859-7 Из формата сетевого обмена в ISO8859-7
fold7_ISO8859-8 Из формата сетевого обмена в ISO8859-8
fold7_ISO8859-9 Из формата сетевого обмена в ISO8859-9
fold7_TIS-620 Из формата сетевого обмена в TIS-620
fold7_UTF-8 Из формата сетевого обмена в UTF-8
fold7_big5 Из формата сетевого обмена в big5
fold7_GBK Из формата сетевого обмена в GBK
IBM-921_fold7 из IBM-921 в формат сетевого обмена
IBM-922_fold7 из IBM-922 в формат сетевого обмена
IBM-850_fold7 из IBM-850 в формат сетевого обмена
IBM-932_fold7 из IBM-932 в формат сетевого обмена
IBM-943_fold7 из IBM-943 в формат сетевого обмена
IBM-1124_fold7 из IBM-1124 в формат сетевого обмена
IBM-1129_fold7 из IBM-1129 в формат сетевого обмена
IBM-eucCN_fold7 из IBM-eucCN в формат сетевого обмена
IBM-eucJP_fold7 из IBM-eucJP в формат сетевого обмена
IBM-eucKR_fold7 из IBM-eucKR в формат сетевого обмена
IBM-eucTW_fold7 из IBM-eucTW в формат сетевого обмена
ISO8859-1_fold7 из ISO8859-1 в формат сетевого обмена
ISO8859-2_fold7 из ISO8859-2 в формат сетевого обмена
ISO8859-3_fold7 из ISO8859-3 в формат сетевого обмена
ISO8859-4_fold7 из ISO8859-4 в формат сетевого обмена
ISO8859-5_fold7 из ISO8859-5 в формат сетевого обмена
ISO8859-6_fold7 из ISO8859-6 в формат сетевого обмена
ISO8859-7_fold7 из ISO8859-7 в формат сетевого обмена
ISO8859-8_fold7 из ISO8859-8 в формат сетевого обмена
ISO8859-9_fold7 из ISO8859-9 в формат сетевого обмена
TIS-620_fold7 из TIS-620 в формат сетевого обмена
UTF-8_fold7 из UTF-8 в формат сетевого обмена
big5_fold7 из big5 в формат сетевого обмена
GBK_fold7 из GBK в формат сетевого обмена

Список перекодировщиков для сетевого обмена--8-разрядные

Этот перекодировщик позволяет преобразовывать данные между внутренним кодом и стандартными форматами для сетевого обмена 8-разрядными данными (fold8). Называние fold8 обозначает, что эта кодировка позволяет передавать данные по 8-разрядным почтовым протоколам. Это кодировки на основе ISO2022. Дополнительные сведения о кодировках fold8 вы найдете в разделе Библиотека libiconv.

Перекодировщики fold8 преобразуют символы из определенного кодового набора в каноническую 8-разрядную кодировку, в которой идентифицируется каждый отдельный символ. Преобразование такого типа оказывается целесообразным в сетях, где кодовые наборы клиентов различны, но наборы символов - одинаковые. Например:

IBM-850 <--> ISO8859-1 Стандартные латинские символы
IBM-932 <--> IBM-eucJP Стандартные японские символы

Следующие управляющие последовательности обозначают стандартные кодовые наборы.

Управляющая последовательность Стандартный кодовый набор
01/11 02/04 02/09 04/01 GR правая часть GB2312.1980-0.
01/11 02/13 04/01 GR правая часть ISO8859-1.
01/11 02/13 04/02 GR правая часть ISO8859-2.
01/11 02/13 04/03 GR правая часть ISO8859-3.
01/11 02/13 04/04 GR правая часть ISO8859-4.
01/11 02/13 04/06 GR правая часть ISO8859-7.
01/11 02/13 04/07 GR правая часть ISO8859-6.
01/11 02/13 04/08 GR правая часть ISO8859-8.
01/11 02/13 04/13 GR правая часть ISO8859-5.
01/11 02/13 04/13 GR правая часть ISO8859-9.
01/11 02/09 04/09 GR правая часть JIS X0201.1976-1.
01/11 02/04 02/09 04/02 GR JIS X0208.1983-1.
01/11 02/04 02/09 04/00 GR JISX0208.1978-1.
01/11 02/09 04/02 GR 7-разрядные символы ASCII или левая часть ISO8859-1.
01/11 02/05 02/15 03/01 M L 04/09 04/02 04/13 02/13 03/08 03/05 03/00 00/02 GR правая часть набора уникальных символов IBM-850. К стандартным символам ISO8859-1 данная управляющая последовательность относится не должна.
01/11 02/05 02/15 03/02 M L 04/09 04/02 04/13 02/13 07/05 06/04 06/03 04/10 05/00 00/02 GR правая часть японских пользовательских символов.
01/11 02/08 04/02 GL 7-разрядные символы ASCII или левая часть ISO8859-1.
01/11 02/14 04/01 GL правая часть ISO8859-1.
01/11 02/14 04/02 GL правая часть ISO8859-2.
01/11 02/14 04/03 GL правая часть ISO8859-3.
01/11 02/14 04/04 GL правая часть ISO8859-4.
01/11 02/14 04/06 GL правая часть ISO8859-7.
01/11 02/14 04/07 GL правая часть ISO8859-6.
01/11 02/14 04/08 GL правая часть ISO8859-8.
01/11 02/14 04/12 GL правая часть ISO8859-5.
01/11 02/14 04/13 GL правая часть ISO8859-9.
01/11 02/08 04/09 GL правая часть JIS X0201.1976-0.
01/11 02/08 04/10 GL левая часть JIS X0201.1976.
01/11 02/04 02/08 04/02 GL JIS X0208.1983-0.
01/11 02/04 04/02 GL JIS X0208.1983-0.
01/11 02/04 04/00 GL JIS X0208.1978-0.
01/11 02/05 02/15 03/01 M L 06/09 06/02 06/13 02/13 03/08 03/05 03/00 00/02 GL правая часть набора уникальных символов IBM-850. К стандартным символам ISO8859-1 данная управляющая последовательность не относится.
01/11 02/05 02/15 03/02 M L 06/09 06/02 06/13 02/13 07/05 06/04 06/03 04/10 05/00 00/02 GL японские пользовательские символы (IBM-udcJP).
01/11 02/04 02/09 04/03 GR KSC5601-1987.
01/11 02/04 02/09 03/00 GR CNS11643-1986-1.
01/11 02/04 02/10 03/01 GR CNS11643-1986-2.
01/11 02/05 02/15 03/02 M L 04/09 04/02 04/13 02/13 07/05 06/04 06/03 05/05 05/08 00/02 GR правая часть пользовательских символов традиционного китайского языка.
01/11 02/05 02/15 03/02 M L 04/09 04/02 04/13 02/13 07/03 06/02 06/04 05/05 05/08 00/02 GR правая часть набора уникальных символов IBM-850.
01/11 02/04 02/08 04/03 GL KSC5601-1987.
01/11 02/05 02/15 03/02 M L 06/09 06/02 06/13 02/13 07/05 06/04 06/03 05/05 05/08 00/02 GL пользовательские символы традиционного китайского языка (IBM-udcTW).
01/11 02/05 02/15 03/02 M L 06/09 06/02 06/13 02/13 07/03 06/02 06/04 05/05 05/08 00/02 GL пользовательские уникальные символы традиционного китайского языка IBM-850 (IBM-shdTW).
01/11 02/05 02/15 03/00 M L 05/05 05/04 04/06 02/13 03/08 00/02 UCS-2 в кодировке UTF-8; предназначена только для символов, которые не кодирует ни одна из приведенных выше управляющих последовательностей.

При преобразовании данных из кодового набора в fold8 управляющую последовательность, обозначающую данных кодовый набор, выбирают по порядку, в соответствии со списком. Например, символы JISX0208.1983-0 обозначает управляющая последовательность 01/11 02/04 02/08 04/02 .

Файлы

Этот список содержит описания перекодировщиков fold8 из каталога /usr/lib/nls/loc/iconv:

Перекодировщик Описание
fold8_IBM-850 Из формата сетевого обмена в IBM-850
fold8_IBM-921 Из формата сетевого обмена в IBM-921
fold8_IBM-922 Из формата сетевого обмена в IBM-922
fold8_IBM-932 Из формата сетевого обмена в IBM-932
fold8_IBM-943 Из формата сетевого обмена в IBM-943
fold8_IBM-1124 Из формата сетевого обмена в IBM-1124
fold8_IBM-1129 Из формата сетевого обмена в IBM-1129
fold8_IBM-eucCN Из формата сетевого обмена в IBM-eucCN
fold8_IBM-eucJP Из формата сетевого обмена в IBM-eucJP
fold8_IBM-eucKR Из формата сетевого обмена в IBM-eucKR
fold8_IBM-eucTW Из формата сетевого обмена в IBM-eucTW
fold8_IBM-eucCN Из формата сетевого обмена в IBM-eucCN
fold8_ISO8859-1 Из формата сетевого обмена в ISO8859-1
fold8_ISO8859-2 Из формата сетевого обмена в ISO8859-2
fold8_ISO8859-3 Из формата сетевого обмена в ISO8859-3
fold8_ISO8859-4 Из формата сетевого обмена в ISO8859-4
fold8_ISO8859-5 Из формата сетевого обмена в ISO8859-5
fold8_ISO8859-6 Из формата сетевого обмена в ISO8859-6
fold8_ISO8859-7 Из формата сетевого обмена в ISO8859-7
fold8_ISO8859-8 Из формата сетевого обмена в ISO8859-8
fold8_ISO8859-9 Из формата сетевого обмена в ISO8859-9
fold8_TIS-620 Из формата сетевого обмена в TIS-620
fold8_UTF-8 Из формата сетевого обмена в UTF-8
fold8_big5 Из формата сетевого обмена в big5
fold8_GBK Из формата сетевого обмена в GBK
IBM-921_fold8 из IBM-921 в формат сетевого обмена
IBM-922_fold8 из IBM-922 в формат сетевого обмена
IBM-850_fold8 из IBM-850 в формат сетевого обмена
IBM-932_fold8 из IBM-932 в формат сетевого обмена
IBM-943_fold8 из IBM-943 в формат сетевого обмена
IBM-1124_fold8 из IBM-1124 в формат сетевого обмена
IBM-1129_fold8 из IBM-1129 в формат сетевого обмена
IBM-eucCN_fold8 из IBM-eucCN в формат сетевого обмена
IBM-eucJP_fold8 из IBM-eucJP в формат сетевого обмена
IBM-eucKR_fold8 из IBM-eucKR в формат сетевого обмена
IBM-eucTW_fold8 из IBM-eucTW в формат сетевого обмена
IBM-eucCN_fold8 из IBM-eucCN в формат сетевого обмена
ISO8859-1_fold8 из ISO8859-1 в формат сетевого обмена
ISO8859-2_fold8 из ISO8859-2 в формат сетевого обмена
ISO8859-3_fold8 из ISO8859-3 в формат сетевого обмена
ISO8859-4_fold8 из ISO8859-4 в формат сетевого обмена
ISO8859-5_fold8 из ISO8859-5 в формат сетевого обмена
ISO8859-6_fold8 из ISO8859-6 в формат сетевого обмена
ISO8859-7_fold8 из ISO8859-7 в формат сетевого обмена
ISO8859-8_fold8 из ISO8859-8 в формат сетевого обмена
ISO8859-9_fold8 из ISO8859-9 в формат сетевого обмена
TIS-620_fold8 из TIS-620 в формат сетевого обмена
UTF-8_fold8 из UTF-8 в формат сетевого обмена
big5_fold8 из big5 в формат сетевого обмена
GBK_fold8 из GBK в формат сетевого обмена

Список перекодировщиков для сетевого обмена--Сложный текст

Такие перекодировщики выполняют преобразование между сложным текстом и внутренними кодовыми наборами.

Сложный текст представляет собой кодировку для сетевого обмена, которая была определена X Consortium. Применяется для передачи текста между клиентами X. Сложный текст основан на стандарте ISO2022 и может кодировать большинство символов с помощью стандартных управляющих последовательностей. Кроме того, в нем предусмотрены расширения для кодирования частных кодовых наборов. Все поддерживаемые кодовые наборы предоставляют возможность преобразования данных в/из сложного текста. Обозначение сложного текста - ct.

Ниже по порядку приведен список управляющих последовательностей, обозначающих стандартные кодовые наборы.

01/11 02/05 02/15 03/01 M L 04/09 04/02 04/13 02/13 03/08 03/05 03/00 00/02
                          GR правая часть набора уникальных символов IBM-850. К стандартным символам ISO8859-1 данная управляющая последовательность относится не должна.
01/11 02/05 02/15 03/02 M L 04/09 04/02 04/13 02/13 07/05 06/04 06/03 04/10 05/00 00/02
                          GR правая часть японских пользовательских символов.
01/11 02/05 02/15 03/01 M L 06/09 06/02 06/13 02/13 03/08 03/05 03/00 00/02
                          GL правая часть набора уникальных символов IBM-850. К стандартным символам ISO8859-1 данная управляющая последовательность не относится.
01/11 02/05 02/15 03/02 M L 06/09 06/02 06/13 02/13 07/05 06/04 06/03 04/10 05/00 00/02
                          GL японские пользовательские символы (IBM-udcJP).

Файлы

Этот список содержит описания перекодировщиков сложного текста из каталога /usr/lib/nls/loc/iconv:

Перекодировщик Описание
ct_IBM-850 Из формата сетевого обмена в IBM-850
ct_IBM-921 Из формата сетевого обмена в IBM-921
ct_IBM-922 Из формата сетевого обмена в IBM-922
ct_IBM-932 Из формата сетевого обмена в IBM-932
ct_IBM-943 Из формата сетевого обмена в IBM-943
ct_IBM-1124 Из формата сетевого обмена в IBM-1124
ct_IBM-1129 Из формата сетевого обмена в IBM-1129
ct_IBM-eucCN Из формата сетевого обмена в IBM-eucCN
ct_IBM-eucJP Из формата сетевого обмена в IBM-eucJP
ct_IBM-eucKR Из формата сетевого обмена в IBM-eucKR
ct_IBM-eucTW Из формата сетевого обмена в IBM-eucTW
ct_ISO8859-1 Из формата сетевого обмена в ISO8859-1
ct_ISO8859-2 Из формата сетевого обмена в ISO8859-2
ct_ISO8859-3 Из формата сетевого обмена в ISO8859-3
ct_ISO8859-4 Из формата сетевого обмена в ISO8859-4
ct_ISO8859-5 Из формата сетевого обмена в ISO8859-5
ct_ISO8859-6 Из формата сетевого обмена в ISO8859-6
ct_ISO8859-7 Из формата сетевого обмена в ISO8859-7
ct_ISO8859-8 Из формата сетевого обмена в ISO8859-8
ct_ISO8859-9 Из формата сетевого обмена в ISO8859-9
ct_TIS-620 Из формата сетевого обмена в TIS-620
ct_big5 Из формата сетевого обмена в big5
ct_GBK Из формата сетевого обмена в GBK
IBM-850_ct из IBM-850 в формат сетевого обмена
IBM-921_ct из IBM-921 в формат сетевого обмена
IBM-922_ct из IBM-922 в формат сетевого обмена
IBM-932_ct из IBM-932 в формат сетевого обмена
IBM-943_ct из IBM-943 в формат сетевого обмена
IBM-1124_ct из IBM-1124 в формат сетевого обмена
IBM-1129_ct из IBM-1129 в формат сетевого обмена
IBM-eucCN_ct из IBM-eucCN в формат сетевого обмена
IBM-eucJP_ct из IBM-eucJP в формат сетевого обмена
IBM-eucKR_ct из IBM-eucKR в формат сетевого обмена
IBM-eucTW_ct из IBM-eucTW в формат сетевого обмена
ISO8859-1_ct из ISO8859-1 в формат сетевого обмена
ISO8859-2_ct из ISO8859-2 в формат сетевого обмена
ISO8859-3_ct из ISO8859-3 в формат сетевого обмена
ISO8859-4_ct из ISO8859-4 в формат сетевого обмена
ISO8859-5_ct из ISO8859-5 в формат сетевого обмена
ISO8859-6_ct из ISO8859-6 в формат сетевого обмена
ISO8859-7_ct из ISO8859-7 в формат сетевого обмена
ISO8859-8_ct из ISO8859-8 в формат сетевого обмена
ISO8859-9_ct из ISO8859-9 в формат сетевого обмена
TIS-620_ct из TIS-620 в формат сетевого обмена
big5_ct из big5 в формат сетевого обмена
GBK_ct из GBK в формат сетевого обмена

Список перекодировщиков для сетевого обмена--uucode

Этот перекодировщик выполняет точно такие же преобразования, как и команды uuencode и uudecode.

Перекодировка из uucode происходит порциями по 62 байт (включая замыкающий запись символ начала строки), которые преобразуются в 45 байт в буфере outbuf.

Файлы

Этот список содержит описания перекодировщиков uucode из каталога /usr/lib/nls/loc/iconv:

Перекодировщик Описание
IBM-850_uucode из IBM-850 в uucode
IBM-921_uucode из IBM-921 в uucode
IBM-922_uucode из IBM-922 в uucode
IBM-932_uucode из IBM-932 в uucode
IBM-943_uucode из IBM-943 в uucode
IBM-1124_uucode из IBM-1124 в uucode
IBM-1129_uucode из IBM-1129 в uucode
IBM-eucJP_uucode из IBM-eucJP в uucode
IBM-eucKR_uucode из IBM-eucKR в uucode
IBM-eucTW_uucode из IBM-eucTW в uucode
IBM-eucCN_uucode из IBM-eucCN в uucode
ISO8859-1_uucode из ISO8859-1 в uucode
ISO8859-2_uucode из ISO8859-2 в uucode
ISO8859-3_uucode из ISO8859-3 в uucode
ISO8859-4_uucode из ISO8859-4 в uucode
ISO8859-5_uucode из ISO8859-5 в uucode
ISO8859-6_uucode из ISO8859-6 в uucode
ISO8859-7_uucode из ISO8859-7 в uucode
ISO8859-8_uucode из ISO8859-8 в uucode
ISO8859-9_uucode из ISO8859-9 в uucode
TIS-620_uucode из TIS-620 в uucode
big5_uucode из big5 в uucode
GBK_uucode из GBK в uucode
uucode_IBM-850 из uucode в IBM-850
uucode_IBM-921 из uucode в IBM-921
uucode_IBM-922 из uucode в IBM-922
uucode_IBM-932 из uucode в IBM-932
uucode_IBM-943 из uucode в IBM-943
uucode_IBM-1124 из uucode в IBM-1124
uucode_IBM-1129 из uucode в IBM-1129
uucode_IBM-eucCN из uucode в IBM-eucCN
uucode_IBM-eucJP из uucode в IBM-eucJP
uucode_IBM-eucKR из uucode в IBM-eucKR
uucode_IBM-eucTW из uucode в IBM-eucTW
uucode_ISO8859-1 из uucode в ISO8859-1
uucode_ISO8859-2 из uucode в ISO8859-2
uucode_ISO8859-3 из uucode в ISO8859-3
uucode_ISO8859-4 из uucode в ISO8859-4
uucode_ISO8859-5 из uucode в ISO8859-5
uucode_ISO8859-6 из uucode в ISO8859-6
uucode_ISO8859-7 из uucode в ISO8859-7
uucode_ISO8859-8 из uucode в ISO8859-8
uucode_ISO8859-9 из uucode в ISO8859-9
uucode_TIS-1124 из uucode в TIS-1129
uucode_big5 из uucode в big5
uucode_GBK из uucode в GBK

Список перекодировщиков UCS-2

UCS-2 - это универсальная 16-разрядная кодировка. Ее описание приведено в разделе Кодовые наборы - Обзор. Эти перекодировщики выполняют преобразования в обе стороны между любым кодовым набором и UCS-2.

Перекодировщики UCS-2 находятся в каталогах /usr/lib/nls/loc/uconvTable и /usr/lib/nls/loc/uconv. Для создания новых перекодировщиков UCS-2 или настройки уже существующих предусмотрена команда uconvdef.

Перекодировщик /usr/lib/nls/loc/iconv/Universal_UCS_Conv преобразует любой кодовый набор X в любой кодовый набор Y путем установки необходимых связей:

cd /usr/lib/nls/loc/iconv
В -s /usr/lib/nls/loc/uconv/Universal_UCS_Conv X_Y
В -s /usr/lib/nls/loc/uconv/UCSTBL X_UCS-2
В -s /usr/lib/nls/loc/uconv/UCSTBL UCS-2_Y
В -s /usr/lib/nls/loc/uconv/UCSTBL X
В -s /usr/lib/nls/loc/uconv/UCSTBL Y


Перекодировщик Описание
ISO8859-1 UCS-2 <--> ISO Латиница-1
ISO8859-2 UCS-2 <--> ISO Латиница-2
ISO8859-3 UCS-2 <--> ISO Латиница-3
ISO8859-4 UCS-2 <--> ISO Латиница-4
ISO8859-5 UCS-2 <--> ISO Кириллица
ISO8859-6 UCS-2 <--> Символы ISO для арабского языка
ISO8859-7 UCS-2 <--> Символы ISO для греческого языка
ISO8859-8 UCS-2 <--> Символы ISO для иврита
ISO8859-9 UCS-2 <--> Символы ISO для турецкого языка
JISX0201.1976-0 UCS-2 <--> Кодировка JISX0201-0 для японского языка
JISX0208.1983-0 UCS-2 <--> Кодировка JISX0208-0 для японского языка
CNS11643.1986-1 UCS-2 <--> Кодировка CNS11643-1 для китайского языка
CNS11643.1986-2 UCS-2 <--> Кодировка CNS11643-2 для китайского языка
KSC5601.1987-0 UCS-2 <--> Кодировка KSC5601-0 для корейского языка
IBM-eucCN UCS-2 <--> Кодировка EUC для упрощенного китайского языка
IBM-udcCN UCS-2 <--> Пользовательские символы для упрощенного китайского языка
IBM-sbdCN UCS-2 <--> Специальные символы IBM для упрощенного китайского языка
GB2312.1980-0 UCS-2 <--> Кодировка GB для упрощенного китайского языка
IBM-1381 UCS-2 <--> Кодовая страница PC для упрощенного китайского языка
IBM-935 UCS-2 <--> Кодировка EBCDIC для упрощенного китайского языка
IBM-936 UCS-2 <--> Кодировка PC5550 для упрощенного китайского языка
IBM-eucJP UCS-2 <--> Кодировка EUC для японского языка
IBM-eucKR UCS-2 <--> Кодировка EUC для корейского языка
IBM-eucTW UCS-2 <--> Кодировка EUC для традиционного китайского языка
IBM-udcJP UCS-2 <--> Пользовательские символы для японского языка
IBM-udcTW UCS-2 <--> Пользовательские символы для традиционного китайского языка
IBM-sbdTW UCS-2 <--> Специальные символы IBM для традиционного китайского языка
UTF-8 UCS-2 <--> UTF-8
IBM-437 UCS-2 <--> Кодовая страница PC для США
IBM-850 UCS-2 <--> Кодовая страница PC для Латиницы-1
IBM-852 UCS-2 <--> Кодовая страница PC для Латиницы-2
IBM-857 UCS-2 <--> Кодовая страница PC для турецкого языка
IBM-860 UCS-2 <--> Кодовая страница PC для бразильского языка (Португалия)
IBM-861 UCS-2 <--> Кодовая страница PC для исландского языка
IBM-863 UCS-2 <--> Кодовая станица PC для французского языка (Канада)
IBM-865 UCS-2 <--> Кодовая страница PC для языков скандинавских стран
IBM-869 UCS-2 <--> Кодовая страница PC для греческого языка
IBM-921 UCS-2 <--> Кодовая страница для языков балтийских стран
IBM-922 UCS-2 <--> Кодовая страница для эстонского языка
IBM-932 UCS-2 <--> Кодовая страница PC для японского языка
IBM-943 UCS-2 <--> Кодовая страница PC для японского языка
IBM-934 UCS-2 <--> Кодовая страница PC для корейского языка
IBM-936 UCS-2 <--> Кодовая страница PC для китайского языка (КНР)
IBM-938 UCS-2 <--> Кодовая страница PC для китайского языка (Тайвань)
IBM-942 UCS-2 <--> Расширенная кодовая страница PC для японского языка
IBM-944 UCS-2 <--> Кодовая страница PC для корейского языка
IBM-946 UCS-2 <--> Кодовая страница SAA для китайского языка (КНР)
IBM-948 UCS-2 <--> Кодовая страница PC для традиционного китайского языка
IBM-1124 UCS-2 <--> Кодовая страница PC для украинского языка
IBM-1129 UCS-2 <--> Кодовая страница PC для вьетнамского языка
TIS-620 UCS-2 <--> Кодовая страница PC для тайского языка
IBM-037 UCS-2 <--> Кодировка EBCDIC (США и Канада)
IBM-273 UCS-2 <--> Кодировка EBCDIC (Германия и Австрия)
IBM-277 UCS-2 <--> Кодировка EBCDIC (Дания и Норвегия)
IBM-278 UCS-2 <--> Кодировка EBCDIC (Финляндия и Швеция)
IBM-280 UCS-2 <--> Кодировка EBCDIC (Италия)
IBM-284 UCS-2 <--> Кодировка EBCDIC (Испания и Латинская Америка)
IBM-285 UCS-2 <--> Кодировка EBCDIC (Великобритания)
IBM-297 UCS-2 <--> Кодировка EBCDIC (Франция)
IBM-500 UCS-2 <--> Интернациональная кодировка EBCDIC
IBM-875 UCS-2 <--> Кодировка EBCDIC (Греция)
IBM-930 UCS-2 <--> Кодировка EBCDIC (японские символы Катакана-Канжи)
IBM-933 UCS-2 <--> Кодировка EBCDIC (Корея)
IBM-937 UCS-2 <--> Кодировка EBCDIC (традиционный китайский язык)
IBM-939 UCS-2 <--> Кодировка EBCDIC (японские символы Латиница-Канжи)
IBM-1026 UCS-2 <--> Кодировка EBCDIC (Турция)
IBM-1112 UCS-2 <--> Кодировка EBCDIC (кодировка для языков балтийских стран)
IBM-1122 UCS-2 <--> Кодировка EBCDIC (Эстония)
IBM-1124 UCS-2 <--> Кодировка EBCDIC (Украина)
IBM-1129 UCS-2 <--> Кодировка EBCDIC (Вьетнам)
GBK UCS-2<--> Упрощенный китайский язык
TIS-620 UCS-2 <--> Кодировка EBCDIC (Таиланд)

Список перекодировщиков для UTF-8

UTF-8 - это универсальная многобайтовая кодировка. Ее описание приведено в разделе UCS-2 и UTF-8. Перечисленные перекодировщики выполняют преобразования в обе стороны между любым кодовым набором и UTF-8.

Как правило, перекодировка UTF-8 выполняется с помощью Universal_UCS_Conv (см. Список перекодировщиков UCS-2) и /usr/lib/nls/loc/uconv/UTF-8.

Перекодировщик Описание
ISO8859-1 UTF-8 <--> ISO Латиница-1
ISO8859-2 UTF-8 <--> ISO Латиница-2
ISO8859-3 UTF-8 <--> ISO Латиница-3
ISO8859-4 UTF-8 <--> ISO Латиница-4
ISO8859-5 UTF-8 <--> ISO Кириллица
ISO8859-6 UTF-8 <--> Символы ISO для арабского языка
ISO8859-7 UTF-8 <--> Символы ISO для греческого языка
ISO8859-8 UTF-8 <--> Символы ISO для иврита
ISO8859-9 UTF-8 <--> Символы ISO для турецкого языка
JISX0201.1976-0 UTF-8 <--> Кодировка JISX0201-0 для японского языка
JISX0208.1983-0 UTF-8 <--> Кодировка JISX0208-0 для японского языка
CNS11643.1986-1 UTF-8 <--> Кодировка CNS11643-1 для китайского языка
CNS11643.1986-2 UTF-8 <--> Кодировка CNS11643-2 для китайского языка
KSC5601.1987-0 UTF-8 <--> Кодировка KSC5601-0 для корейского языка
IBM-eucCN UTF-8 <--> Кодировка EUC для упрощенного китайского языка
IBM-eucJP UTF-8 <--> Кодировка EUC для японского языка
IBM-eucKR UTF-8 <--> Кодировка EUC для корейского языка
IBM-eucTW UTF-8 <--> Кодировка EUC для традиционного китайского языка
IBM-udcJP UTF-8 <--> Пользовательские символы для японского языка
IBM-udcTW UTF-8 <--> Пользовательские символы для традиционного китайского языка
IBM-sbdTW UTF-8 <--> Специальные символы IBM для традиционного китайского языка
UCS-2 UTF-8 <--> UCS-2
IBM-437 UTF-8 <--> Кодовая страница PC для США
IBM-850 UTF-8 <--> Кодовая страница PC для Латиницы-1
IBM-852 UTF-8 <--> Кодовая страница PC для Латиницы-2
IBM-857 UTF-8 <--> Кодовая страница PC для турецкого языка
IBM-860 UTF-8 <--> Кодовая страница PC для бразильского языка (Португалия)
IBM-861 UTF-8 <--> Кодовая страница PC для исландского языка
IBM-863 UTF-8 <--> Кодовая станица PC для французского языка (Канада)
IBM-865 UTF-8 <--> Кодовая страница PC для языков скандинавских стран
IBM-869 UTF-8 <--> Кодовая страница PC для греческого языка
IBM-921 UTF-8 <--> Кодовая страница данных для языков балтийских стран
IBM-922 UTF-8 <--> Кодовая страница для эстонского языка
IBM-932 UTF-8 <--> Кодовая страница PC для японского языка
IBM-943 UTF-8 <--> Кодовая страница PC для японского языка
IBM-934 UTF-8 <--> Кодовая страница PC для корейского языка
IBM-935 UTF-8 <--> Кодировка EBCDIC для упрощенного китайского языка
IBM-936 UTF-8 <--> Кодовая страница PC для китайского языка (КНР)
IBM-938 UTF-8 <--> Кодовая страница PC для китайского языка (Тайвань)
IBM-942 UTF-8 <--> Расширенная кодовая страница PC для японского языка
IBM-944 UTF-8 <--> Кодовая страница PC для корейского языка
IBM-946 UTF-8 <--> Кодовая страница SAA для китайского языка (КНР)
IBM-948 UTF-8 <--> Кодовая страница PC для традиционного китайского языка
IBM-1124 UTF-8 <--> Кодовая страница PC для украинского языка
IBM-1129 UTF-8 <--> Кодовая страница PC для вьетнамского языка
TIS-620 UTF-8 <--> Кодовая страница PC для тайского языка
IBM-037 UTF-8 <--> Кодировка EBCDIC (США и Канада)
IBM-273 UTF-8 <--> Кодировка EBCDIC (Германия и Австрия)
IBM-277 UTF-8 <--> Кодировка EBCDIC (Дания и Норвегия)
IBM-278 UTF-8 <--> Кодировка EBCDIC (Финляндия и Швеция)
IBM-280 UTF-8 <--> Кодировка EBCDIC (Италия)
IBM-284 UTF-8 <--> Кодировка EBCDIC (Испания и Латинская Америка)
IBM-285 UTF-8 <--> Кодировка EBCDIC (Великобритания)
IBM-297 UTF-8 <--> Кодировка EBCDIC (Франция)
IBM-500 UTF-8 <--> Интернациональная кодировка EBCDIC
IBM-875 UTF-8 <--> Кодировка EBCDIC (Греция)
IBM-930 UTF-8 <--> Кодировка EBCDIC (японские символы Катакана-Канжи)
IBM-933 UTF-8 <--> Кодировка EBCDIC (Корея)
IBM-937 UTF-8 <--> Кодировка EBCDIC (традиционный китайский язык)
IBM-939 UTF-8 <--> Кодировка EBCDIC (японские символы Катакана-Канжи)
IBM-1026 UTF-8 <--> Кодировка EBCDIC (Турция)
IBM-1112 UTF-8 <--> Кодировка EBCDIC (многоязыковая кодировка для балтийских стран)
IBM-1122 UTF-8 <--> Кодировка EBCDIC (Эстония)
IBM-1124 UTF-8 <--> Кодировка EBCDIC (Украина)
IBM-1129 UTF-8 <--> Кодировка EBCDIC (Вьетнам)
IBM-1381 UTF-8 <--> Кодовая страница PC для упрощенного китайского языка
GBK UTF-8<--> Упрощенный китайский язык
TIS-620 UTF-8 <--> Кодировка EBCDIC (Таиланд)

Список прочих перекодировщиков

Прочие перекодировщики работают на более низком уровне и используются обычными перекодировщиками и перекодировщиками сетевого обмена. К ним иногда обращаются некоторые перекодировщики для сетевого обмена. Использовать эти перекодировщики не рекомендуется, так как они предназначены для поддержки других перекодировщиков.

Файлы

Приведенный ниже список содержит описания прочих перекодировщиков из каталогов /usr/lib/nls/loc/iconv и /usr/lib/nls/loc/iconvTable:

Перекодировщик Описание
IBM-932_JISX0201.1976-0 из IBM-932 в JISX0201.1976-0
IBM-932_JISX0208.1983-0 из IBM-932 в JISX0208.1983-0
IBM-932_IBM-udcJP из IBM-932 в IBM-udcJP (пользовательские символы японского языка)
IBM-943_JISX0201.1976-0 из IBM-943 в JISX0201.1976-0
IBM-943_JISX0208.1983-0 из IBM-943 в JISX0208.1983-0
IBM-943_IBM-udcJP из IBM-943 в IBM-udcJP (пользовательские символы японского языка)
IBM-eucJP_JISX0201.1976-0 из IBM-eucJP в JISX0201.1976-0
IBM-eucJP_JISX0208.1983-0 из IBM-eucJP в JISX0208.1983-0
IBM-eucJP_IBM-udcJP из IBM-eucJP в IBM-udcJP (пользовательские символы японского языка)
IBM-eucKR_KSC5601.1987-0 из IBM_eucKR в KSC5601.1987-0
IBM-eucTW_CNS11643.1986-1 из IBM-eucTW в CNS11643.1986.1
IBM-eucTW_CNS11643.1986-2 из IBM-eucTW в CNS11643.1986-2
IBM-eucCN_GB2312.1980-0 из IBM-eucCN в GB2312.1980-0

Связанная информация

Глава 16, Поддержка национальных языков, Список функций поддержки национальных языков.

Раздел Кодовые наборы - Обзор в руководстве AIX 5L Version 5.1 Kernel Extensions and Device Support Programming Concepts.

Команды iconv, uuencode и uudecode.

Функции iconv_open, iconv, iconv_close.


[ Страница назад | Страница вперед | Содержание | Индекс | Библиотека | Юридическая информация | Поиск ]