やっぱり Sun がスキ! : Weblog やっぱり Sun がスキ!

やっぱり Sun がスキ!

http://blogs.sun.com/yappri/date/20071218 2007年 12月 18日 火曜日

文字コードを判別するコマンドご紹介 = auto_ef

今回は、結構知らない人も多い Solaris 上で文字コード(EUC,SJIS,JIS,UTF-8 等)を 判別する auto_ef(1)をご紹介します。

コマンド名は auto encoding finder の略なので、覚えるのも 簡単かと。

以下試してみた結果です

% setenv LANG ja_JP.eucJP
% echo "文字コード" > txt.euc
% iconv -f EUC-JP -t SHIFT-JIS txt.euc > txt.sjis
% iconv -f EUC-JP -t ISO-2022-JP txt.euc > txt.jis
% iconv -f EUC-JP -t UTF-8 txt.euc > txt.utf8
% auto_ef *
txt.euc: eucJP
txt.jis: ISO-2022-JP
txt.sjis: PCK
txt.utf8: UTF-8

基本は auto_ef "ファイル名" で文字コードの判別が可能です。 オプションでどの文字コードの可能性があるかの一覧を見ることも出来ますので、 ご興味のある方は auto_ef(1) をご覧ください。

知っていると便利だと思いますので、何かの時にご使用ください。