[B! 文字コード] faibouのブックマーク

PHP 正規表現について

faibou 2016/02/01

文字コード

リンク

C#で高精度なテキストファイル文字コード自動判別（2014年版） - hnx8のブログ

C#（.NET Framework）に限ったことではありませんが、汎用的にテキストファイルを扱うようなアプリケーションを作っていると、よく特定の文字コードのファイルしか読み出せないのでは困る ⇒文字コードを自動判別し、テキストの内容を取り出したい読み出したファイルと同じ文字コードでファイルを書き出したい ⇒読み出したファイルの文字コードを知りたいといった場面に出くわします。ですが、C#（.NET Framework）標準のライブラリではそのような機能は提供されていないため、文字コードを判定するには、自前で文字コード判定のロジックを実装する出来合いの外部ライブラリ、Windows版NKF32.dll、ICU4Cなどを利用する IE用の文字コード判別ライブラリ（mlang.dll）を利用する ※COMコンポーネント呼び出し要のいずれかの方法を取ることになります。 HNXgrepと

faibou 2015/01/04

リンク

Unicodeを斬りたい

※2014/4/17　記事の内容に関していくつか訂正させていただきました。ご指摘いただいた皆様ありがとうございました。誤字脱字を修正しました。ソースコードの間違いを修正しました。 BOMの記述を分かりやすい表現に修正しました。合字に関する記載を追記いたしました。こんにちは。 Yahoo! JAPANで通知プラットフォームの開発をおこなっています佐々木海（@Lewuathe）と申します。普段は全社向けのPush通知プラットフォームやメール配信プラットフォームの開発、保守をしています。通知というのはPush通知にしろ、メール配信にしろ基本的には「テキストデータ」を送ることになります。プラットフォーム内ではこれらのテキストに対してさまざまな処理をかけることになるのですが、さすが日本語といったところでしょうか、一筋縄ではいかない部分が出てきました。具体的にはUTF-8でエンコーディング

faibou 2014/04/16

文字コード

リンク

文字コードの脆弱性はこの3年間でどの程度対策されたか?

2019/01 JSUG勉強会の資料です。この資料でDisっているのはJPAではなく、・何も考えずに「標準だから」というだけでJPAを選ぶ人・OSSに全くコントリビュートせずにフリーライドする人です。

faibou 2014/02/26

リンク

ExcelのCSVインポート・エクスポート機能を強化する「Excel CSV I/O」NOT SUPPORTED

faibou 2014/02/14

エクセル

リンク

IBM Developer

IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant techno logies such as generative AI, data science, AI, and open source.

faibou 2012/06/19

HTMLユニコード変換

リンク

いいから聞け！俺が文字コードについて教えてやるよその１（前提知識編） - 谷本心 in せろ部屋

ちょっと久々のJavaネタですが、前から書き溜めていた、文字コードやエンコードについてのノウハウを書きます。今回は、詳細な説明に入る前に、前提になる知識や用語について説明しておきます。文字コードとエンコードって違うの？新人くん「では、HTMLの文字コードはUTF-8でお願いします」先輩社員「文字コードじゃなくてエンコーディングでしょ？」新人くん「えっ。あぁ、はい、それで」文字コードとエンコード（エンコーディング）を混同して使ったりすると、ちょっと原理主義的な人に怒られたりするんですけど、大まかに言えば、「文字コード」は文字に割り当てられた「数字」のことで、「エンコード」は文字と数字をマッピングする「方式」のことだと捉えていれば、大きくは外れません。ただ、「文字コード」という言葉は、「数字」「方式」の両方で使われるほか、文字一覧を示す「Charset」という意味で使わ