javaで文字列のエンコード方法を確認する方法

文字エンコードを確認するには、次のいずれかの方法を使用します。

  1. getBytes()
String str = "Hello, World!";
byte[] bytes = str.getBytes();
System.out.println(Arrays.toString(bytes));

これはバイト配列の内容を出力します。例:[72, 101, 108, 108, 111, 44, 32, 87, 111, 114, 108, 100, 33]。

  1. Charset.defaultCharset()
Charset charset = Charset.defaultCharset();
System.out.println(charset.displayName());

これは、UTF-8 などのデフォルトエンコーディングの名前を出力します。

  1. getBytes(文字コード名 charset)
String str = "你好,世界!";
byte[] bytes = str.getBytes(StandardCharsets.UTF_8);
System.out.println(Arrays.toString(bytes));

例えば[-28, -67, -96, -27, -91, -67, -17, -68, -120, -26, -106, -121, -17, -68, -126, -27, -91, -67, -17, -68, -76] のように、指定したエンコード方式で変換されたバイト配列の内容が出力されます。

文字自体にはエンコーディングはありません。文字列をバイト配列に変換する過程においてエンコーディングが行われます。そのため、この関数は文字列がバイト配列に変換されたときのエンコーディングを知るためだけに利用できます。

bannerAds