エラー iconv: 位置 355200 に不正な入力シーケンスがあります

カテゴリ: テック系 | タグ:

iconvでShiftJISのファイルをutf8に変更しようとした時に、下記の不正な入力シーケンスがありますというエラーが発生しました。

$ cat input.txt | iconv -f SJIS -t UTF8
iconv: 位置 355200 に不正な入力シーケンスがあります

該当位置のデータを見ると丸付き数字が含まれた行で、Windowsの機種依存文字が含まれていたのが原因でした。

対処法は、変換元文字コードの-f SHIS指定をcp932に変更することで、エラーを解消できました。

$ cat input.txt | iconv -f cp932 -t UTF8

ちなみに、位置 355200が何行目かわからない場合ですが、人力での調査でよければ、下記のように先頭N行だけ変換させながら2分探索するとサクッと位置特定ができました。

$ head input.txt -n 10000 | iconv -f cp932 -t UTF8
こちらもおススメ

コメントを残す

メールアドレスが公開されることはありません。