漢字コードの変換

「文字化け」とは

文字バケ」というのは,本来は可読なテキストファイルのはずなのに, エディタなどで開いて読もうとすると意味不明な文字列が表示されてしまう現象のことです. 文字化けを起こす典型的なケースは,ファイルと端末の漢字コードがあっていないことです. 実際には下の例のように表示されます.

漢字コードの不一致が原因で起こる文字化けは,漢字コードを変換すれば簡単になおります.

文字化けのなおし方(漢字コードの変換)

漢字コードの不一致による文字化けは, nkfというプログラムを使って漢字コードを変換することで簡単になおすことができます. 例えば,文字化けを起こして正しく読めないファイルのファイル名を mojibake.txtとすると,

$ nkf -e mojibake.txt > yomeru.txt

というコマンドを実行すると,yomeru.txtに変換された結果が保存されます (「$」はプロンプトですので入力してはいけません. タイプするのはnkf以降の部分です). エディタでyomeru.txtを開くと読めるようになっているはずです.

参考


Takashi HATAI
Nov. 12, 1999.