タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

C#に関するgurennantokaのブックマーク (1)

  • ReadJEncを使って文字エンコーディングを推定するには?[C#、VB]

    任意のWebページの内容を取得するには、現状では文字コードの推定が必要になる。「.NET TIPS:HttpClientクラスでシフトJISのWebページを取得するには?[C#、VB]」では、W3Cの推奨方式に準じて実装してみた。それでも文字化けしてしまうWebサイトでは、どうしたらよいだろうか? それには、Webページの内容を単にbyteの並びとして取得し、そのbyte列のパターンから文字エンコーディングを推定することになるだろう。稿では、文字エンコーディングを推定して文字列に変換してくれるオープンソースのライブラリ「ReadJEnc」の使い方を解説する。 文字エンコーディングを推定するライブラリ バイト列のパターンから文字エンコーディングを確実に判定できるアルゴリズムは存在しない。そこで、文字コードの「自動判別」とよくいわれるが、稿では「推定」という言葉を使うことにする。そのような

    ReadJEncを使って文字エンコーディングを推定するには?[C#、VB]
  • 1