pythonのユニコードエンコーディングを設定する方法は?

Python においてUnicodeエンコードは以下のように設定できます。

  1. スクリプトの先頭に「# -*- coding: utf-8 -*-」を追加すると、Pythonインタプリタに、ソースコードをUTF-8エンコーディングで処理するように指示されます。utf-16やlatin-1など、必要に応じて他のエンコーディングを選択することもできます。
  2. unicode_literals モジュールを使用すると、全ての文字列リテラルをユニコード文字列として扱うことができます。スクリプトの冒頭にモジュールをインポートします: from __future__ import unicode_literals。
  3. encode()メソッドは文字列を指定されたエンコーディングのバイト列に変換します。例えば、s.encode(‘utf-8’)はUTF-8エンコードされたバイト文字列を返します。
  4. decode()メソッドを使用してバイトシーケンスを特定のエンコードの文字列に変換できます。例えば、b.decode(‘utf-8’)はUTF-8エンコードされた文字列を返します。

Python 3.x では Unicode 文字列がデフォルトで、Python 2.x では ASCII 文字列がデフォルトなので注意してくださいそのため、Python 2.x では Unicode エンコーディングの設定が一般的に必要です。

bannerAds