JavaのUNICODEと中文のインタコンバートを実装する

Javaでは、java.nio.charset.StandardCharsets と java.lang.String を用いてUnicodeと中文の相互変換が可能だ。

Java.nio.charset.StandardCharsetsクラスのUTF_8エンコーディングを使用して、文字列をバイトシーケンスに変換し、java.lang.Stringクラスのコンストラクタを使用して、バイトシーケンスから文字列を作成します。

import java.nio.charset.StandardCharsets;
public class UnicodeConverter {
public static void main(String[] args) {
String chineseString = "你好";
byte[] bytes = chineseString.getBytes(StandardCharsets.UTF_8);
String unicodeString = new String(bytes, StandardCharsets.UTF_8);
System.out.println("Unicode: " + unicodeString);
}
}

StringクラスのオブジェクトにUnicode文字列をそのまま代入すると、Unicode文字列を中文字列に変換できます。

public class ChineseConverter {
public static void main(String[] args) {
String unicodeString = "\u4F60\u597D";
String chineseString = unicodeString;
System.out.println("Chinese: " + chineseString);
}
}

上記のコードでは「\u4F60\u597D」は「こんにちは」のUnicodeコードです。

Java の文字列はデフォルトで UTF-16 エンコーディングされているので注意してください、そのため、UTF-8 エンコーディングを使用することで変換の正しさが保証されます。

bannerAds