Java

サポートされているエンコーディング

 

java.io.InputStreamReader、java.io.OutputStreamWriter、java.lang.String、および java.nio.charset パッケージのクラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。 サポートされるエンコーディングは、Java 2 Platform の実装によって異なります。 Java 2 Platform, Standard Edition (J2SE), v1.4 の各実装でサポートする必要のあるエンコーディングの一覧は、java.lang パッケージの仕様およびjava.nio.charset.Charset のクラスの説明を参照してください。

- java.io.* クラスと java.lang.* クラスでは、サポートの必要なエンコーディングに対して Sun の実装で使用される正準名が、この仕様に示されているエンコーディング名と異なる場合があります。 これらのエンコーディング名は、別名機構がサポートされます。US-ASCII は ASCII に、ISO-8859-1 は ISO8859_1 に、UTF-8 は UTF8 に、UTF-16BE は UnicodeBigUnmarked に、UTF-16LE は UnicodeLittleUnmarked にマップされます。 java.nio.charset のクラスには、指定された名前が直接使用されます。

Sun の Java 2 Software Development Kit, Standard Edition, v1.4 (Solaris 版、Linux 版、Microsoft Windows 版)、および Java 2 Runtime Environment, Standard Edition, v1.4 の Solaris 版と Linux 版では、このページに示すエンコーディングがすべてサポートされています。 Sun の Java 2 Runtime Environment, Standard Edition, v1.4 の Microsoft Windows 版には、米国語版と国際化版があります。 米国語版では、最初の表に示すエンコーディングだけがサポートされています。 lib/charsets.jar ファイルを含む国際化版では、このページに示すエンコーディングがすべてサポートされています。

次の各表は、J2SE 1.4 でサポートされているエンコーディングセットを示します。 新しい java.nio API で使用される正準名は、多くの場合、java.io API および java.lang API で使用される名前とは異なります。

基本エンコーディングセット (lib/rt.jar に含まれる)
java.nio API でサポートされる

正準名

説明

US-ASCII

American Standard Code for Information Interchange

Cp1252

Windows ラテン文字-1

ISO-8859-1

ISO 8859-1、ラテンアルファベット No. 1

ISO-8859-15

ラテンアルファベット No. 9

UTF-8

8 ビット UCS Transformation Format

UTF-16

16 ビット UCS Transformation Format、オプションのバイト順マークによって識別されるバイト順

UTF-16BE

16 ビット UCS Transformation Format、ビッグエンディアンバイト順

UTF-16LE

16 ビット UCS Transformation Format、リトルエンディアンバイト順

基本エンコーディングセット (lib/rt.jar に含まれる)
java.io API と java.lang API でサポートされる

正準名

説明

ASCII

American Standard Code for Information Interchange

Cp1252

Windows ラテン文字-1

ISO8859_1

ISO 8859-1、ラテンアルファベット No. 1

UnicodeBig

16 ビット Unicode Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き

UnicodeBigUnmarked

16 ビット Unicode Transformation Format、ビッグエンディアンバイト順

UnicodeLittle

16 ビット Unicode Transformation Format、リトルエンディアンバイト順、バイト順マーク付き

UnicodeLittleUnmarked

16 ビット Unicode Transformation Format、リトルエンディアンバイト順

UTF8

8 ビット Unicode Transformation Format

UTF-16

16 ビット Unicode Transformation Format、必須の初期バイト順マークによって指定されたバイト順

拡張エンコーディングセット (lib/charsets.jar に含まれる)
java.io API と java.lang API でサポートされる

正準名

説明

Big5

Big5、中国語 (繁体字)

Big5_HKSCS

Big5 (香港拡張付き)、中国語 (繁体字)

Big5_Solaris

Big5 (Solaris zh_TW.BIG5 ロケール用の 7 つの追加 Hanzi 表意文字マッピング付き)

Cp037

米国、カナダ (2 か国語、フランス語)、オランダ、 ポルトガル、ブラジル、オーストラリア

Cp273

IBM オーストリア、ドイツ

Cp277

IBM デンマーク、ノルウェー

Cp278

IBM フィンランド、スウェーデン

Cp280

IBM イタリア

Cp284

IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ

Cp285

IBM 英国、アイルランド

Cp297

IBM フランス

Cp420

IBM アラビア語

Cp424

IBM ヘブライ語

Cp437

MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ

Cp500

EBCDIC 500V1

Cp737

PC ギリシャ文字

Cp775

PC バルト諸語

Cp838

IBM タイ拡張 SBCS

Cp850

MS-DOS ラテン文字-1

Cp852

MS-DOS ラテン文字-2

Cp855

IBM キリル文字

Cp856

IBM ヘブライ語

Cp857

IBM トルコ語

Cp858

Cp850 の拡張でユーロ文字を含む

Cp860

MS-DOS ポルトガル語

Cp861

MS-DOS アイスランド語

Cp862

PC ヘブライ語

Cp863

MS-DOS カナダ系フランス語

Cp864

PC アラビア語

Cp865

MS-DOS 北欧

Cp866

MS-DOS ロシア語

Cp868

MS-DOS パキスタン

Cp869

IBM 近代ギリシャ語

Cp870

IBM 多言語ラテン文字-2

Cp871

IBM アイスランド

Cp874

IBM タイ

Cp875

IBM ギリシャ語

Cp918

IBM パキスタン (ウルドゥー語)

Cp921

IBM ラトビア、リトアニア (AIX、DOS)

Cp922

IBM エストニア (AIX、DOS)

Cp930

UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット

Cp933

UDC 1880 文字を含む韓国語、5029 のスーパーセット

Cp935

UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット

Cp937

UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット

Cp939

UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット

Cp942

IBM OS/2 日本語、Cp932 のスーパーセット

Cp942C

Cp942 の拡張

Cp943

IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット

Cp943C

Cp943 の拡張

Cp948

OS/2 中国語 (台湾)、938 のスーパーセット

Cp949

PC 韓国語

Cp949C

Cp949 の拡張

Cp950

PC 中国語 (香港、台湾)

Cp964

AIX 中国語 (台湾)

Cp970

AIX 韓国語

Cp1006

IBM AIX パキスタン (ウルドゥー語)

Cp1025

IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国)

Cp1026

IBM ラテン文字-5、トルコ

Cp1046

IBM アラビア語 - Windows

Cp1097

IBM イラン (現代ペルシャ語)/ペルシャ語

Cp1098

IBM イラン (現代ペルシャ語)/ペルシャ語 (PC)

Cp1112

IBM ラトビア、リトアニア

Cp1122

IBM エストニア

Cp1123

IBM ウクライナ

Cp1124

IBM AIX ウクライナ

Cp1140

Cp037 の拡張でユーロ文字を含む

Cp1141

Cp273 の拡張でユーロ文字を含む

Cp1142

Cp277 の拡張でユーロ文字を含む

Cp1143

Cp278 の拡張でユーロ文字を含む

Cp1144

Cp280 の拡張でユーロ文字を含む

Cp1145

Cp284 の拡張でユーロ文字を含む

Cp1146

Cp285 の拡張でユーロ文字を含む

Cp1147

Cp297 の拡張でユーロ文字を含む

Cp1148

Cp500 の拡張でユーロ文字を含む

Cp1149

Cp871 の拡張でユーロ文字を含む

Cp1250

Windows 東欧

Cp1251

Windows キリル文字

Cp1253

Windows ギリシャ文字

Cp1254

Windows トルコ語

Cp1255

Windows ヘブライ語

Cp1256

Windows アラビア語

Cp1257

Windows バルト諸語

Cp1258

Windows ベトナム語

Cp1381

IBM OS/2、DOS 中国 (中華人民共和国)

Cp1383

IBM AIX 中国 (中華人民共和国)

Cp33722

IBM-eucJP - 日本語 (5050 のスーパーセット)

EUC_CN

GB2312、EUC エンコーディング、中国語 (簡体字)

EUC_JP

JIS X 0201、0208、0212、EUC エンコーディング、日本語

EUC_KR

KS C 5601、EUC エンコーディング、韓国語

EUC_TW

CNS11643 (Plane 1-3)、EUC エンコーディング、中国語 (繁体字)

GB18030

中国語 (簡体字)、中華人民共和国標準

GBK

GBK、中国語 (簡体字)

ISCII91

インド語派 ISCII91 エンコーディング

ISO2022CN

ISO 2022 CN、中国語 (Unicode への変換のみ)

ISO2022CN_CNS

ISO 2022 CN 形式の CNS 11643、繁体字中国語 (Unicode からの変換のみ)

ISO2022CN_GB

ISO 2022 CN 形式の GB 2312、簡体字中国語 (Unicode からの変換のみ)

ISO2022JP

JIS X 0201、ISO 2022 形式の 0208、日本語

ISO2022KR

ISO 2022 KR、韓国語

ISO8859_2

ISO 8859-2、ラテンアルファベット No. 2

ISO8859_3

ISO 8859-3、ラテンアルファベット No. 3

ISO8859_4

ISO 8859-4、ラテンアルファベット No. 4

ISO8859_5

ISO 8859-5、ラテン/キリル文字アルファベット

ISO8859_6

ISO 8859-6、ラテン/アラビア文字アルファベット

ISO8859_7

ISO 8859-7、ラテン/ギリシャ文字アルファベット

ISO8859_8

ISO 8859-8、ラテン/ヘブライ語アルファベット

ISO8859_9

ISO 8859-9、ラテンアルファベット No. 5

ISO8859_13

ISO 8859-13、ラテンアルファベット No. 7

ISO8859_15_FDIS

ISO 8859-15、ラテンアルファベット No. 9

JIS0201

JIS X 0201、日本語

JIS0208

JIS X 0208、日本語

JIS0212

JIS X 0212、日本語

JISAutoDetect

Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ)

Johab

Johab、韓国語

KOI8_R

KOI8-R、ロシア語

MS874

Windows タイ語

MS932

Windows 日本語

MS936

Windows 簡体字中国語

MS949

Windows 韓国語

MS950

Windows 繁体字中国語

MacArabic

Macintosh アラビア語

MacCentralEurope

Macintosh ラテン文字-2

MacCroatian

Macintosh クロアチア語

MacCyrillic

Macintosh キリル文字

MacDingbat

Macintosh Dingbat

MacGreek

Macintosh ギリシャ語

MacHebrew

Macintosh ヘブライ語

MacIceland

Macintosh アイスランド語

MacRoman

Macintosh Roman

MacRomania

Macintosh ルーマニア

MacSymbol

Macintosh シンボル

MacThai

Macintosh タイ

MacTurkish

Macintosh トルコ語

MacUkraine

Macintosh ウクライナ

SJIS

Shift-JIS、日本語

TIS620

TIS620、タイ


Copyright © 2002 Sun Microsystems, Inc. All Rights Reserved.

コメントの送付先: java-intl@java.sun.com

Sun
Java ソフトウェア