Java

サポートされているエンコーディング

java.io.InputStreamReader、java.io.OutputStreamWriter、java.lang.String の各クラス、および java.nio.charset パッケージに含まれるクラスでは、Unicode とその他のいくつかの文字エンコーディング間で変換を行うことができます。サポートされるエンコーディングは、Java 2 Platform の実装によって異なります。Java 2 Platform Standard Edition 5 の各実装がサポートする必要のあるエンコーディングの一覧は、java.nio.charset.Charset クラスの解説を参照してください。

Sun の J2SE Development Kit 5.0 は全プラットフォーム (SolarisTM オペレーティング環境、Linux、Microsoft Windows) で、また、J2SE Runtime Environment 5.0 は Solaris および Linux で、このページに掲載されているすべてのエンコーディングをサポートしています。Sun の J2SE Runtime Environment 5.0 の Windows 版は、完全な国際化版またはヨーロッパ言語版としてインストールすることができます。JRE のインストールプログラムは、ホストオペレーティングシステムがヨーロッパ言語だけをサポートしていることを識別すると、デフォルトでヨーロッパ言語版をインストールします。インストールプログラムが他の言語の必要性を識別した場合、またはカスタマイズされたインストールでユーザがヨーロッパ言語以外のサポートを要求した場合は、完全な国際化版がインストールされます。ヨーロッパ言語版では、最初の表に掲載されているエンコーディングだけがサポートされます。国際化版 (lib/charsets.jar ファイルが含まれている) では、このページに掲載されているすべてのエンコーディングがサポートされます。

次の各表は、J2SE 5.0 でサポートされているエンコーディングセットを示します。新しい java.nio API で使用される正準名は、多くの場合、java.io API および java.lang API で使用される名前とは異なります。

基本エンコーディングセット (lib/rt.jar に含まれている)

java.nio API 用の正準名

java.io および java.lang API 用の正準名

説明

ISO-8859-1

ISO8859_1

ISO 8859-1、ラテンアルファベット No. 1

ISO-8859-2

ISO8859_2

ラテンアルファベット No. 2

ISO-8859-4

ISO8859_4

ラテンアルファベット No. 4

ISO-8859-5

ISO8859_5

ラテン/キリル文字アルファベット

ISO-8859-7

ISO8859_7

ラテン/ギリシャ文字アルファベット

ISO-8859-9

ISO8859_9

ラテンアルファベット No. 5

ISO-8859-13

ISO8859_13

ラテンアルファベット No. 7

ISO-8859-15

ISO8859_5

ラテンアルファベット No. 9

KOI8-R

KOI8_R

KOI8-R、ロシア語

US-ASCII

ASCII

American Standard Code for Information Interchange

UTF-8

UTF8

8 ビット UCS Transformation Format

UTF-16

UTF-16

16 ビット UCS Transformation Format、オプションのバイト順マークによって識別されるバイト順

UTF-16BE

UnicodeBigUnmarked

16 ビット Unicode Transformation Format、ビッグエンディアンバイト順

UTF-16LE

UnicodeLittleUnmarked

16 ビット Unicode Transformation Format、リトルエンディアンバイト順

windows-1250

Cp1250

Windows 東欧

windows-1251

Cp1251

Windows キリル文字

windows-1252

Cp1252

Windows ラテン文字-1

windows-1253

Cp1253

Windows ギリシャ文字

windows-1254

Cp1254

Windows トルコ語

windows-1257

Cp1257

Windows バルト諸語

利用できない

UnicodeBig

16 ビット Unicode Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き

利用できない

UnicodeLittle

16 ビット Unicode Transformation Format、リトルエンディアンバイト順、バイト順マーク付き

 

拡張エンコーディングセット (lib/charsets.jar に含まれている)

java.nio API 用の正準名

java.io および java.lang API 用の正準名

説明

Big5

Big5

Big5、中国語 (繁体字)

Big5-HKSCS

Big5_HKSCS

Big5 (香港の拡張付き)、中国語 (繁体字、2001 改訂を組み込み)

EUC-JP

EUC_JP

JISX 0201、0208、0212、EUC エンコーディング、日本語

EUC-KR

EUC_KR

KS C 5601、EUC エンコーディング、韓国語

GB18030

GB18030

中国語 (簡体字)、中華人民共和国標準

GB2312

EUC_CN

GB2312、EUC エンコーディング、中国語 (簡体字)

GBK

GBK

GBK、中国語 (簡体字)

IBM-Thai

Cp838

IBM タイ拡張 SBCS

IBM00858

Cp858

Cp850 の拡張でユーロ文字を含む

IBM01140

Cp1140

Cp037 の拡張でユーロ文字を含む

IBM01141

Cp1141

Cp273 の拡張でユーロ文字を含む

IBM01142

Cp1142

Cp277 の拡張でユーロ文字を含む

IBM01143

Cp1143

Cp278 の拡張でユーロ文字を含む

IBM01144

Cp1144

Cp280 の拡張でユーロ文字を含む

IBM01145

Cp1145

Cp284 の拡張でユーロ文字を含む

IBM01146

Cp1146

Cp285 の拡張でユーロ文字を含む

IBM01147

Cp1147

Cp297 の拡張でユーロ文字を含む

IBM01148

Cp1148

Cp500 の拡張でユーロ文字を含む

IBM01149

Cp1149

Cp871 の拡張でユーロ文字を含む

IBM037

Cp037

米国、カナダ (2 か国語、フランス語)、オランダ、 ポルトガル、ブラジル、オーストラリア

IBM1026

Cp1026

IBM ラテン文字-5、トルコ

IBM1047

Cp1047

ラテン文字-1 (EBCDIC ホスト用)

IBM273

Cp273

IBM オーストリア、ドイツ

IBM277

Cp277

IBM デンマーク、ノルウェー

IBM278

Cp278

IBM フィンランド、スウェーデン

IBM280

Cp280

IBM イタリア

IBM284

Cp284

IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ

IBM285

Cp285

IBM 英国、アイルランド

IBM297

Cp297

IBM フランス

IBM420

Cp420

IBM アラビア語

IBM424

Cp424

IBM ヘブライ語

IBM437

Cp437

MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ

IBM500

Cp500

EBCDIC 500V1

IBM775

Cp775

PC バルト諸語

IBM850

Cp850

MS-DOS ラテン文字-1

IBM852

Cp852

MS-DOS ラテン文字-2

IBM855

Cp855

IBM キリル文字

IBM857

Cp857

IBM トルコ語

IBM860

Cp860

MS-DOS ポルトガル語

IBM861

Cp861

MS-DOS アイスランド語

IBM862

Cp862

PC ヘブライ語

IBM863

Cp863

MS-DOS カナダ系フランス語

IBM864

Cp864

PC アラビア語

IBM865

Cp865

MS-DOS 北欧

IBM866

Cp866

MS-DOS ロシア語

IBM868

Cp868

MS-DOS パキスタン

IBM869

Cp869

IBM 近代ギリシャ語

IBM870

Cp870

IBM 多言語ラテン文字-2

IBM871

Cp871

IBM アイスランド

IBM918

Cp918

IBM パキスタン (ウルドゥー語)

ISO-2022-CN

ISO2022CN

ISO 2022 CN 形式の GB2312 および CNS11643、簡体字および繁体字中国語 (Unicode への変換のみ)

ISO-2022-JP

ISO2022JP

ISO 2022 形式の JIS X 0201、0208、日本語

ISO-2022-KR

ISO2022KR

ISO 2022 KR、韓国語

ISO-8859-3

ISO8859_3

ラテンアルファベット No. 3

ISO-8859-6

ISO8859_6

ラテン/アラビア語アルファベット

ISO-8859-8

ISO8859_8

ラテン/ヘブライ語アルファベット

Shift_JIS

SJIS

Shift-JIS、日本語

TIS-620

TIS620

TIS620、タイ

windows-1255

Cp1255

Windows ヘブライ語

windows-1256

Cp1256

Windows アラビア語

windows-1258

Cp1258

Windows ベトナム語

windows-31j

MS932

Windows 日本語

x-Big5_Solaris

Big5_Solaris

Big5 (Solaris zh_TW.BIG5 ロケール用の 7 つの追加 Hanzi 表意文字マッピング付き)

x-euc-jp-linux

EUC_JP_LINUX

JISX 0201、0208、EUC エンコーディング、日本語

x-EUC-TW

EUC_TW

CNS11643 (Plane 1-7,15)、EUC エンコーディング、中国語 (繁体字)

x-eucJP-Open

EUC_JP_Solaris

JISX 0201、0208、0212、EUC エンコーディング、日本語

x-IBM1006

Cp1006

IBM AIX パキスタン (ウルドゥー語)

x-IBM1025

Cp1025

IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国)

x-IBM1046

Cp1046

IBM アラビア語 - Windows

x-IBM1097

Cp1097

IBM イラン (現代ペルシャ語)/ペルシャ語

x-IBM1098

Cp1098

IBM イラン (現代ペルシャ語)/ペルシャ語 (PC)

x-IBM1112

Cp1112

IBM ラトビア、リトアニア

x-IBM1122

Cp1122

IBM エストニア

x-IBM1123

Cp1123

IBM ウクライナ

x-IBM1124

Cp1124

IBM AIX ウクライナ

x-IBM1381

Cp1381

IBM OS/2、DOS 中国 (中華人民共和国)

x-IBM1383

Cp1383

IBM AIX 中国 (中華人民共和国)

x-IBM33722

Cp33722

IBM-eucJP - 日本語 (5050 のスーパーセット)

x-IBM737

Cp737

PC ギリシャ文字

x-IBM856

Cp856

IBM ヘブライ語

x-IBM874

Cp874

IBM タイ

x-IBM875

Cp875

IBM ギリシャ語

x-IBM921

Cp921

IBM ラトビア、リトアニア (AIX、DOS)

x-IBM922

Cp922

IBM エストニア (AIX、DOS)

x-IBM930

Cp930

UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット

x-IBM933

Cp933

UDC 1880 文字を含む韓国語、5029 のスーパーセット

x-IBM935

Cp935

UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット

x-IBM937

Cp937

UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット

x-IBM939

Cp939

UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット

x-IBM942

Cp942

IBM OS/2 日本語、Cp932 のスーパーセット

x-IBM942C

Cp942C

Cp942 の拡張

x-IBM943

Cp943

IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット

x-IBM943C

Cp943C

Cp943 の拡張

x-IBM948

Cp948

OS/2 中国語 (台湾)、938 のスーパーセット

x-IBM949

Cp949

PC 韓国語

x-IBM949C

Cp949C

Cp949 の拡張

x-IBM950

Cp950

PC 中国語 (香港、台湾)

x-IBM964

Cp964

AIX 中国語 (台湾)

x-IBM970

Cp970

AIX 韓国語

x-ISCII91

ISCII91

インド語派 ISCII91 エンコーディング

x-ISO2022-CN-CNS

ISO2022_CN_CNS

ISO 2022 CN 形式の CNS11643、繁体字中国語 (Unicode からの変換のみ)

x-ISO2022-CN-GB

ISO2022_CN_GB

ISO 2022 CN 形式の GB2312、簡体字中国語 (Unicode からの変換のみ)

x-iso-8859-11

x-iso-8859-11

ラテン/タイ語アルファベット

x-JISAutoDetect

JISAutoDetect

Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ)

x-Johab

x-Johab

韓国語、Johab 文字セット

x-MacArabic

MacArabic

Macintosh アラビア語

x-MacCentralEurope

MacCentralEurope

Macintosh ラテン文字-2

x-MacCroatian

MacCroatian

Macintosh クロアチア語

x-MacCyrillic

MacCyrillic

Macintosh キリル文字

x-MacDingbat

MacDingbat

Macintosh Dingbat

x-MacGreek

MacGreek

Macintosh ギリシャ語

x-MacHebrew

MacHebrew

Macintosh ヘブライ語

x-MacIceland

MacIceland

Macintosh アイスランド語

x-MacRoman

MacRoman

Macintosh Roman

x-MacRomania

MacRomania

Macintosh ルーマニア

x-MacSymbol

MacSymbol

Macintosh シンボル

x-MacThai

MacThai

Macintosh タイ

x-MacTurkish

MacTurkish

Macintosh トルコ語

x-MacUkraine

MacUkraine

Macintosh ウクライナ

x-MS950-HKSCS

MS950_HKSCS

Windows 繁体字中国語 (香港の拡張付き)

x-mswin-936

MS936

Windows 簡体字中国語

x-PCK

PCK

Solaris 版の Shift_JIS

x-windows-874

MS874

Windows タイ語

x-windows-949

MS949

Windows 韓国語

x-windows-950

MS950

Windows 繁体字中国語


Copyright © 2004 Sun Microsystems, Inc. All Rights Reserved.

連絡先

Sun
Java ソフトウェア