python コードを日本語として定義する方法
Pythonでは、Unicode文字を使用して、中国語を定義および処理することができます。Unicode は、中国語を含んだほぼあらゆる文字をサポートする文字集合を表すための規格です。
Pythonコードで中国語を定義する例を以下に示します。
- 現地の住民は中国語を直接使う
# -*- coding: utf-8 -*-
print("你好,世界!")
- Unicodeエスケープシーケンスを使用する:
print("\u4f60\u597d\uff0c\u4e16\u754c\uff01")
- 中文字符列変数を使用する:
# -*- coding: utf-8 -*-
chinese_str = "你好,世界!"
print(chinese_str)
コードファイル内で漢字を使用する場合は、ファイルの先頭にエンコーディングを指定してください (# -*- coding: utf-8 -*-)。これにより、Python インタープリタが漢字を正しく解釈できます。
文字ベースの端末で日本語文字列を入力する場合は、利用する OS や端末の設定に応じて文字エンコードの調整が必要となる場合があります。Windows では既定のエンコード方式は gbk、ほとんどの Linux ディストリビューションでは utf-8 が既定のエンコード方式です。現在の文字エンコードは sys.stdin.encoding を利用して確認できます。また、 sys.stdin.reconfigure(encoding=’文字エンコード’) を利用してエンコード方式を変更できます。