タグ

ブックマーク / blog.tmtms.net (3)

  • MySQLの日本語コレーション - tmtms のメモ

    4月にMySQLの日語コレーションについて語り合う場に呼ばれていろいろ話を聞いてきました。すぐにブログを書こうと思ったんですが、はや2ヶ月経過…。 ときどき、自分がMySQLの文字コードに関して発表する際に、次のようなスライドをいれてるんですが、 MySQL 8.0 でとうとう日語コレーションが入ることになったのに、なんか期待してたのと違いました。 で、その辺の話を聞きました(2ヶ月も経ってるのでうろ覚え)。 Q. わざわざ日語ロケール作るんだったら日人が扱いやすいロケールにしてほしい utf8mb4_ja_0900_as_csはMySQLが独自に考えたものではない。Unicode規格に従っている。過去にいろいろ独自にやって失敗してきてるので、もう独自にやるのは避けたい。 ai(accent insensitive)で「ハ」=「パ」=「バ」になるのも、ci(case insensi

    MySQLの日本語コレーション - tmtms のメモ
  • プロジェクト毎のフォーマッタ - tmtms のメモ

    Redmine は Wiki フォーマッタがプラガブルになっているので、プラグインを入れて複数のフォーマットから選択することができます。 Redmine 404 error によると、Redmin 標準の Textile の他に Markdown, Markdown Extra, RD, reStructuredText, WikiCreole などがあるようです。 ですが、フォーマッタは Redmine システム全体で一つしか選択することができません。新しいプロジェクトMarkdown を使いたいけど、古いプロジェクトの Wiki を今さら変更できないからしょうがなく Textile を使ったりしてました。 ということで、プロジェクト毎にフォーマッタを選択できるようなパッチを作ってみました(プラグイン化しようとしたんですが断念しました)。 --- app/helpers/applic

    プロジェクト毎のフォーマッタ - tmtms のメモ
    hidemail
    hidemail 2014/04/30
    “フォーマッタが異なる別のプロジェクトにチケット移動した場合は、”
  • Rubyのエンコーディング - tmtms のメモ

    Ruby 1.9 から文字列や正規表現オブジェクトはそれぞれエンコーディング(いわゆる文字コード)を保持するようになりました。 たとえば 0xB1 0xB2 という2バイトは EUC-JP エンコーディングでは「渦」、SHIFT_JIS エンコーディングでは「アイ」という文字になります。つまり同じバイト列でもエンコーディングが異なれば異なる文字として解釈されます。 1.8 では文字列はただのバイト列でした。なので、それがどのような文字を表しているのか、つまりエンコーディングが何なのかはプログラムが知っている必要がありました。 1.9 では文字列オブジェクト自身が自分が何のエンコーディングかを知っています。同じ 0xB1 0xB2 というバイト列でも、それが EUC-JP の「渦」なのか SHIFT_JIS の「アイ」なのかは、文字列自身が知っています。 スクリプトエンコーディング スクリプ

    Rubyのエンコーディング - tmtms のメモ
  • 1