Linuxで文字セットのエンコーディングを確認する方法を教えてください。
Linux上で文字セットのエンコーディングを確認するためには、以下のコマンドを使用することができます。
- 地元
- 場所 or 地域
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=
LANGとLC_CTYPEフィールドは、現在の文字セットエンコーディングを表示しています。
- ファイル
- ファイル名 <ファイルめい>
- テキストファイル”test.txt”
test.txt: UTF-8 Unicode text
UTF-8で、ファイルの文字セットのエンコーディングがUTF-8であることを示しています。
- 文字エンコーディング識別ライブラリ「chardet」
- chardetを利用してください。
- chardet <ファイル名>
- test.txtの文字コードを自動判定する
test.txt: utf-8 with confidence 0.99
utf-8は、ファイルの文字セットエンコーディングがUTF-8であることを示しています。
上記方法では、ファイルやシステムの文字セットエンコーディングを見るだけであり、文字セットエンコーディングを変更する場合は関連する設定ファイルや環境変数を変更する必要があります。