|
|
java.io.InputStreamReader、java.io.OutputStreamWriter、java.lang.String、および java.nio.charset パッケージのクラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。 サポートされるエンコーディングは、Java 2 Platform の実装によって異なります。 Java 2 Platform, Standard Edition (J2SE), v1.4 の各実装でサポートする必要のあるエンコーディングの一覧は、java.lang パッケージの仕様およびjava.nio.charset.Charset のクラスの説明を参照してください。
注 - java.io.* クラスと java.lang.* クラスでは、サポートの必要なエンコーディングに対して Sun の実装で使用される正準名が、この仕様に示されているエンコーディング名と異なる場合があります。 これらのエンコーディング名は、別名機構がサポートされます。US-ASCII は ASCII に、ISO-8859-1 は ISO8859_1 に、UTF-8 は UTF8 に、UTF-16BE は UnicodeBigUnmarked に、UTF-16LE は UnicodeLittleUnmarked にマップされます。 java.nio.charset のクラスには、指定された名前が直接使用されます。
Sun の Java 2 Software Development Kit, Standard Edition, v1.4 (Solaris 版、Linux 版、Microsoft Windows 版)、および Java 2 Runtime Environment, Standard Edition, v1.4 の Solaris 版と Linux 版では、このページに示すエンコーディングがすべてサポートされています。 Sun の Java 2 Runtime Environment, Standard Edition, v1.4 の Microsoft Windows 版には、米国語版と国際化版があります。 米国語版では、最初の表に示すエンコーディングだけがサポートされています。 lib/charsets.jar ファイルを含む国際化版では、このページに示すエンコーディングがすべてサポートされています。
次の各表は、J2SE 1.4 でサポートされているエンコーディングセットを示します。 新しい java.nio API で使用される正準名は、多くの場合、java.io API および java.lang API で使用される名前とは異なります。
基本エンコーディングセット (lib/rt.jar に含まれる)
java.nio API でサポートされる
正準名 |
説明 |
---|---|
US-ASCII |
American Standard Code for Information Interchange |
Cp1252 |
Windows ラテン文字-1 |
ISO-8859-1 |
ISO 8859-1、ラテンアルファベット No. 1 |
ISO-8859-15 |
ラテンアルファベット No. 9 |
UTF-8 |
8 ビット UCS Transformation Format |
UTF-16 |
16 ビット UCS Transformation Format、オプションのバイト順マークによって識別されるバイト順 |
UTF-16BE |
16 ビット UCS Transformation Format、ビッグエンディアンバイト順 |
UTF-16LE |
16 ビット UCS Transformation Format、リトルエンディアンバイト順 |
基本エンコーディングセット (lib/rt.jar に含まれる)
java.io API と java.lang API でサポートされる
正準名 |
説明 |
---|---|
ASCII |
American Standard Code for Information Interchange |
Cp1252 |
Windows ラテン文字-1 |
ISO8859_1 |
ISO 8859-1、ラテンアルファベット No. 1 |
UnicodeBig |
16 ビット Unicode Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き |
UnicodeBigUnmarked |
16 ビット Unicode Transformation Format、ビッグエンディアンバイト順 |
UnicodeLittle |
16 ビット Unicode Transformation Format、リトルエンディアンバイト順、バイト順マーク付き |
UnicodeLittleUnmarked |
16 ビット Unicode Transformation Format、リトルエンディアンバイト順 |
UTF8 |
8 ビット Unicode Transformation Format |
UTF-16 |
16 ビット Unicode Transformation Format、必須の初期バイト順マークによって指定されたバイト順 |
正準名 |
説明 |
---|---|
Big5 |
Big5、中国語 (繁体字) |
Big5_HKSCS |
Big5 (香港拡張付き)、中国語 (繁体字) |
Big5_Solaris |
Big5 (Solaris zh_TW.BIG5 ロケール用の 7 つの追加 Hanzi 表意文字マッピング付き) |
Cp037 |
米国、カナダ (2 か国語、フランス語)、オランダ、 ポルトガル、ブラジル、オーストラリア |
Cp273 |
IBM オーストリア、ドイツ |
Cp277 |
IBM デンマーク、ノルウェー |
Cp278 |
IBM フィンランド、スウェーデン |
Cp280 |
IBM イタリア |
Cp284 |
IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ |
Cp285 |
IBM 英国、アイルランド |
Cp297 |
IBM フランス |
Cp420 |
IBM アラビア語 |
Cp424 |
IBM ヘブライ語 |
Cp437 |
MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ |
Cp500 |
EBCDIC 500V1 |
Cp737 |
PC ギリシャ文字 |
Cp775 |
PC バルト諸語 |
Cp838 |
IBM タイ拡張 SBCS |
Cp850 |
MS-DOS ラテン文字-1 |
Cp852 |
MS-DOS ラテン文字-2 |
Cp855 |
IBM キリル文字 |
Cp856 |
IBM ヘブライ語 |
Cp857 |
IBM トルコ語 |
Cp858 |
Cp850 の拡張でユーロ文字を含む |
Cp860 |
MS-DOS ポルトガル語 |
Cp861 |
MS-DOS アイスランド語 |
Cp862 |
PC ヘブライ語 |
Cp863 |
MS-DOS カナダ系フランス語 |
Cp864 |
PC アラビア語 |
Cp865 |
MS-DOS 北欧 |
Cp866 |
MS-DOS ロシア語 |
Cp868 |
MS-DOS パキスタン |
Cp869 |
IBM 近代ギリシャ語 |
Cp870 |
IBM 多言語ラテン文字-2 |
Cp871 |
IBM アイスランド |
Cp874 |
IBM タイ |
Cp875 |
IBM ギリシャ語 |
Cp918 |
IBM パキスタン (ウルドゥー語) |
Cp921 |
IBM ラトビア、リトアニア (AIX、DOS) |
Cp922 |
IBM エストニア (AIX、DOS) |
Cp930 |
UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット |
Cp933 |
UDC 1880 文字を含む韓国語、5029 のスーパーセット |
Cp935 |
UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット |
Cp937 |
UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット |
Cp939 |
UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット |
Cp942 |
IBM OS/2 日本語、Cp932 のスーパーセット |
Cp942C |
Cp942 の拡張 |
Cp943 |
IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット |
Cp943C |
Cp943 の拡張 |
Cp948 |
OS/2 中国語 (台湾)、938 のスーパーセット |
Cp949 |
PC 韓国語 |
Cp949C |
Cp949 の拡張 |
Cp950 |
PC 中国語 (香港、台湾) |
Cp964 |
AIX 中国語 (台湾) |
Cp970 |
AIX 韓国語 |
Cp1006 |
IBM AIX パキスタン (ウルドゥー語) |
Cp1025 |
IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国) |
Cp1026 |
IBM ラテン文字-5、トルコ |
Cp1046 |
IBM アラビア語 - Windows |
Cp1097 |
IBM イラン (現代ペルシャ語)/ペルシャ語 |
Cp1098 |
IBM イラン (現代ペルシャ語)/ペルシャ語 (PC) |
Cp1112 |
IBM ラトビア、リトアニア |
Cp1122 |
IBM エストニア |
Cp1123 |
IBM ウクライナ |
Cp1124 |
IBM AIX ウクライナ |
Cp1140 |
Cp037 の拡張でユーロ文字を含む |
Cp1141 |
Cp273 の拡張でユーロ文字を含む |
Cp1142 |
Cp277 の拡張でユーロ文字を含む |
Cp1143 |
Cp278 の拡張でユーロ文字を含む |
Cp1144 |
Cp280 の拡張でユーロ文字を含む |
Cp1145 |
Cp284 の拡張でユーロ文字を含む |
Cp1146 |
Cp285 の拡張でユーロ文字を含む |
Cp1147 |
Cp297 の拡張でユーロ文字を含む |
Cp1148 |
Cp500 の拡張でユーロ文字を含む |
Cp1149 |
Cp871 の拡張でユーロ文字を含む |
Cp1250 |
Windows 東欧 |
Cp1251 |
Windows キリル文字 |
Cp1253 |
Windows ギリシャ文字 |
Cp1254 |
Windows トルコ語 |
Cp1255 |
Windows ヘブライ語 |
Cp1256 |
Windows アラビア語 |
Cp1257 |
Windows バルト諸語 |
Cp1258 |
Windows ベトナム語 |
Cp1381 |
IBM OS/2、DOS 中国 (中華人民共和国) |
Cp1383 |
IBM AIX 中国 (中華人民共和国) |
Cp33722 |
IBM-eucJP - 日本語 (5050 のスーパーセット) |
EUC_CN |
GB2312、EUC エンコーディング、中国語 (簡体字) |
EUC_JP |
JIS X 0201、0208、0212、EUC エンコーディング、日本語 |
EUC_KR |
KS C 5601、EUC エンコーディング、韓国語 |
EUC_TW |
CNS11643 (Plane 1-3)、EUC エンコーディング、中国語 (繁体字) |
GB18030 |
中国語 (簡体字)、中華人民共和国標準 |
GBK |
GBK、中国語 (簡体字) |
ISCII91 |
インド語派 ISCII91 エンコーディング |
ISO2022CN |
ISO 2022 CN、中国語 (Unicode への変換のみ) |
ISO2022CN_CNS |
ISO 2022 CN 形式の CNS 11643、繁体字中国語 (Unicode からの変換のみ) |
ISO2022CN_GB |
ISO 2022 CN 形式の GB 2312、簡体字中国語 (Unicode からの変換のみ) |
ISO2022JP |
JIS X 0201、ISO 2022 形式の 0208、日本語 |
ISO2022KR |
ISO 2022 KR、韓国語 |
ISO8859_2 |
ISO 8859-2、ラテンアルファベット No. 2 |
ISO8859_3 |
ISO 8859-3、ラテンアルファベット No. 3 |
ISO8859_4 |
ISO 8859-4、ラテンアルファベット No. 4 |
ISO8859_5 |
ISO 8859-5、ラテン/キリル文字アルファベット |
ISO8859_6 |
ISO 8859-6、ラテン/アラビア文字アルファベット |
ISO8859_7 |
ISO 8859-7、ラテン/ギリシャ文字アルファベット |
ISO8859_8 |
ISO 8859-8、ラテン/ヘブライ語アルファベット |
ISO8859_9 |
ISO 8859-9、ラテンアルファベット No. 5 |
ISO8859_13 |
ISO 8859-13、ラテンアルファベット No. 7 |
ISO8859_15_FDIS |
ISO 8859-15、ラテンアルファベット No. 9 |
JIS0201 |
JIS X 0201、日本語 |
JIS0208 |
JIS X 0208、日本語 |
JIS0212 |
JIS X 0212、日本語 |
JISAutoDetect |
Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ) |
Johab |
Johab、韓国語 |
KOI8_R |
KOI8-R、ロシア語 |
MS874 |
Windows タイ語 |
MS932 |
Windows 日本語 |
MS936 |
Windows 簡体字中国語 |
MS949 |
Windows 韓国語 |
MS950 |
Windows 繁体字中国語 |
MacArabic |
Macintosh アラビア語 |
MacCentralEurope |
Macintosh ラテン文字-2 |
MacCroatian |
Macintosh クロアチア語 |
MacCyrillic |
Macintosh キリル文字 |
MacDingbat |
Macintosh Dingbat |
MacGreek |
Macintosh ギリシャ語 |
MacHebrew |
Macintosh ヘブライ語 |
MacIceland |
Macintosh アイスランド語 |
MacRoman |
Macintosh Roman |
MacRomania |
Macintosh ルーマニア |
MacSymbol |
Macintosh シンボル |
MacThai |
Macintosh タイ |
MacTurkish |
Macintosh トルコ語 |
MacUkraine |
Macintosh ウクライナ |
SJIS |
Shift-JIS、日本語 |
TIS620 |
TIS620、タイ |
Copyright © 2002 Sun Microsystems, Inc. All Rights Reserved. コメントの送付先: java-intl@java.sun.com |
|