[ 新規に投稿する ]

推定エンコーディングのカラムNo.11787
Y_H さん 26/03/04 15:01 [ コメントを投稿する ]
  推定エンコーディングのカラムについて、質問を書かせていただきます。

この機能、フォルダ内のエンコーディングの混在を確認するのにすごく便利です。
ありがとうございます。

ちなみに、秀丸エディタでUTF-8と認識されるXMLファイルが、ASCIIと表示されるのですが、
秀丸エディタのように、XML宣言などは参照されていないということになりますでしょうか。

また、ヘルプには「ファイルサイズが1MB以上では取得しません」とあったのですが、
無視するだけでなく、先頭の1MBだけ見て推測するような動作はできませんでしょうか。

よろしくお願いいたします。
[ ]
RE:11787 推定エンコーディングのカラムNo.11790
秀丸担当 さん 26/03/04 17:33 [ コメントを投稿する ]
  推定エンコーディングの列についてですが、ご指摘の通り、XML宣言や、HTMLのmetaタグといった記述内容までは参照していません。あくまでファイル内容からの簡易的な推測となります。そのため、秀丸エディタでUTF-8と認識されるXMLファイルが、ASCIIと表示されるケースはありえます。

また、ファイルサイズについても、ヘルプ記載の通り1MB以上のファイルは取得していません。
先頭の1MBで切るといった動作自体は実装上それほど難しくはありませんが、途中で切った場合、その部分に判定材料が含まれていると正確性に影響が出る可能性があります。

秀丸エディタ側では、切れるような場合も含めて比較的高度な判定処理を行っていますが、秀丸ファイラーClassicでは一覧表示時の速度や安定性を優先して、あくまで簡易的な判定にとどめています。複雑な判定を行うことで動作が重くなったり、不安定になる可能性もあるため、現状は仕様としてご理解いただければと思います。

[ ]
RE:11790 推定エンコーディングのカラムNo.11792
Y_H さん 26/03/04 17:51 [ コメントを投稿する ]
  了解しました。
とりあえず現状では、全角文字やBOMが入っていないファイルは、
UTF-8と見分けが付かずに、ASCIIと表示されてしまうということですね。

解説ありがとうございます。
[ ]

[ 新規に投稿する ]