python コードを日本語として定義する方法

2年 ago

海斗, 葵

1 minute

Pythonでは、Unicode文字を使用して、中国語を定義および処理することができます。Unicode は、中国語を含んだほぼあらゆる文字をサポートする文字集合を表すための規格です。

Pythonコードで中国語を定義する例を以下に示します。

現地の住民は中国語を直接使う

# -*- coding: utf-8 -*-
print("你好，世界！")

Unicodeエスケープシーケンスを使用する:

print("\u4f60\u597d\uff0c\u4e16\u754c\uff01")

中文字符列変数を使用する：

# -*- coding: utf-8 -*-
chinese_str = "你好，世界！"
print(chinese_str)

コードファイル内で漢字を使用する場合は、ファイルの先頭にエンコーディングを指定してください (# -*- coding: utf-8 -*-)。これにより、Python インタープリタが漢字を正しく解釈できます。

文字ベースの端末で日本語文字列を入力する場合は、利用する OS や端末の設定に応じて文字エンコードの調整が必要となる場合があります。Windows では既定のエンコード方式は gbk、ほとんどの Linux ディストリビューションでは utf-8 が既定のエンコード方式です。現在の文字エンコードは sys.stdin.encoding を利用して確認できます。また、 sys.stdin.reconfigure(encoding=’文字エンコード’) を利用してエンコード方式を変更できます。