iconvでShiftJISのファイルをutf8に変更しようとした時に、下記の不正な入力シーケンスがあります
というエラーが発生しました。
$ cat input.txt | iconv -f SJIS -t UTF8
iconv: 位置 355200 に不正な入力シーケンスがあります
該当位置のデータを見ると丸付き数字が含まれた行で、Windowsの機種依存文字が含まれていたのが原因でした。
対処法は、変換元文字コードの-f SHIS
指定をcp932に変更することで、エラーを解消できました。
$ cat input.txt | iconv -f cp932 -t UTF8
ちなみに、位置 355200
が何行目かわからない場合ですが、人力での調査でよければ、下記のように先頭N行だけ変換させながら2分探索するとサクッと位置特定ができました。
$ head input.txt -n 10000 | iconv -f cp932 -t UTF8
こちらもおススメ