[B! UTF-8] uneasyのブックマーク

uneasy id:uneasy

UTF-8に関するuneasyのブックマーク (4)

UTF-8からSJISに文字化けすると糸偏の漢字がよく出てくる - Qiita
はじめに Twitterで、文字化けネタを幾つかつぶやきました。サッちゃんはねサチコっていうんだほんとはねだけどちっちゃいから自分のこと SJISで保存するんだよおかしいな繧ｵ繝ちゃん — ロボ太 (@kaityo256) 2017年10月10日「私魔女のキキです。こっちはSJISの繧ｸ繧ｸ」 — ロボ太 (@kaityo256) 2018年1月6日 UTF-8「もしかして…」 SJIS「私達…」「「入れ替わ縺縺ｦ繧九≦縲懶ｼ†」」 — ロボ太 (@kaityo256) 2018年2月13日どれもUTF-8で保存された文字をSJISとして解釈したための文字化けを表現したものですが、パッと見で「糸偏の漢字が多いな」ということがわかるかと思います。なぜそうなるかを簡単に説明してみようと思います。なお、文字コードはいろいろ面倒なので、ここではざっくりとしたことしか言い
uneasy 2018/02/16
UTF-8
リンク
Linux のコマンドラインでオフライン英和辞書 - Qiita
「英単語の意味を調べようとブラウザ開いてぐぐったら2秒以上かかって、イライラしてPCを蹴ったらバタフライ効果で地球が消滅した」といった事態を未然に防ぐための記事。考え方によってはこの記事が地球を救ったとも言える。「なんか apt-get で取れるいい感じの英和辞書があるだろう」と思ったけど意外にも見つからないので、それなら英単語とその意味だけがズラズラ載ってるテキストファイル無いかな、と思って探したらあった。 GENE95 辞書デフォルトでは SHIFT-JIS なので UTF-8 にしておく。
uneasy 2015/05/08
UTF-8

linux
リンク
ActiveRecordでデフォルトの照合順序を変更する - Qiita
MySQLには文字列の照合順序(collation)というのがあって、MySQL側でのcharset utf8のときのデフォルトの照合順序はutf8_general_ciです。 ActiveRecord::Migrationでは明示的に照合順序を指定しない場合、charset utf8で照合順序utf8_unicode_ciのデータベースを作成しますが、これは少なくとも日本語圏では多くの人が期待する挙動ではないと思われるので注意が必要です。たとえば、以下のようなファミリーテーブルをrake db:migrateすると # coding: utf-8 class CreateFamilies < ActiveRecord::Migration def change create_table :families do |t| t.string :name t.string :relation
uneasy 2015/03/09
MySQL

UTF-8

unicode

データベース
リンク
PHPのmb_ereg関数群は不正な文字エンコーディングをチェックしない
PHPのbasename関数には、マルチバイトに対応していないという誤解（実際にはロケールの設定をすればマルチバイトでも使える）があったり、不正な文字エンコーディングをチェックしないという課題があったりで、イマイチだなーと思っている方も多いと思います。そういう方々が、preg_replace（u修飾子つき）やmb_ereg_replaceを用いて代替関数を作成している解説も見かけますが、それではこれら正規表現関数は不正な文字エンコーディングをチェックしているのだろうかという疑問が生じます。ざっと調べたところ、以下の様な状況のようです。 preg_replace : 不正な文字エンコーディングをチェックしている mb_ereg_replcae : 不正な文字エンコーディングをチェックしていないここでは、mb_ereg_replaceが不正な文字エンコーディングをチェックしない状況と、そ
uneasy 2015/02/23
UTF-8

PHP
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx