Pythonの文字列エンコーディング変換について教えてください。
Pythonの文字列のエンコーディング変換には、encodeとdecodeメソッドが使用できます。具体的な手順は次のとおりです。
- 符号化
- ネイティブスピーカー風に日本語に言い換えてください。
- gbk
s = "你好"
s_encoded = s.encode("utf-8")
print(s_encoded) # b'\xe4\xbd\xa0\xe5\xa5\xbd'
- 解読する
s_encoded = b'\xe4\xbd\xa0\xe5\xa5\xbd'
s_decoded = s_encoded.decode("utf-8")
print(s_decoded) # 你好
エンコードとデコード時に同一のエンコーディング方式を使用する必要があることに注意してください。そうでない場合、デコード時にエラーが発生します。