タグ

utf-8に関するyifeのブックマーク (5)

  • Windows 10のInsider PreviewでシステムロケールをUTF-8にするオプションが追加される | スラド

    Windows Experience Blogの告知などでは一切言及されていないようだが、Windows 10 Redstone 4のInsider Previewでは、システムロケールの変更を行うダイアログに「ベータ:ワールドワイド言語サポートでUnicode UTF-8を使用」(英語では'Beta: Use Unicode UTF-8 for worldwide language support')というチェックボックスが追加されている。手もとにスナップショットが残っていた最古のRS4ビルド(17004)ですでに存在していたので、正確にいつ追加されたのかは不明。 このチェックボックスをチェックして再起動すると、Build 17035時点では以下のような動作が確認できた。 圧縮 (zip形式) フォルダーにファイル名がUTF-8で保存されるようになった。これに伴い、シフトJISに含まれな

    yife
    yife 2017/11/14
    これで「マルチバイト非対応な海外産ゲームのために、Windowsアカウント名はascii文字列にしておきましょう。日本語で作っちゃった?じゃあアカウント作り直してね」とかいうゲーマー作法がなくなるかな。よいことですね
  • PHPのmb_ereg関数群は不正な文字エンコーディングをチェックしない

    PHPのbasename関数には、マルチバイトに対応していないという誤解(実際にはロケールの設定をすればマルチバイトでも使える)があったり、不正な文字エンコーディングをチェックしないという課題があったりで、イマイチだなーと思っている方も多いと思います。 そういう方々が、preg_replace(u修飾子つき)やmb_ereg_replaceを用いて代替関数を作成している解説も見かけますが、それではこれら正規表現関数は不正な文字エンコーディングをチェックしているのだろうかという疑問が生じます。 ざっと調べたところ、以下の様な状況のようです。 preg_replace : 不正な文字エンコーディングをチェックしている mb_ereg_replcae : 不正な文字エンコーディングをチェックしていない ここでは、mb_ereg_replaceが不正な文字エンコーディングをチェックしない状況と、そ

    PHPのmb_ereg関数群は不正な文字エンコーディングをチェックしない
  • 目grep入門

    Kernel/VM探検隊 #6で発表したスライドです。 解説編はこちら→http://www.slideshare.net/murachue/grep-8132856

    目grep入門
  • ニコ動(SMILEVIDEO)用 タイトル&説明文 文字数制限チェッカー rev.3

    最大文字数:動画タイトルは 99 バイトまで、動画説明文は 999 バイトまで。UTF-8 でカウント。(2008/09/02 現在) 省略制限:動画タイトルは 24 カウントまで、動画説明文は 48 カウントまで。カウント規則は一部不明。(2008/10/05 現在) 入力エリア 動画タイトル 0 バイト 0 カウント 動画説明文 0 バイト 0 カウント 折りたたまれている場合 全部表示する場合 注意点 プレミアム会員で使える XHTML タグの修正(たとえば <br> を <br /> に変換するとか <font> で一部を除いて属性を削除するとか)は実装していません。 プレビュー領域で sm 番号等リンクになる文字列を太字で表示する機能も実装していません。 省略表示の計算をするときに、一部の文字を使っていると誤差が生じるかもしれません。JIS で定義される範囲の文字であれば、おおむ

  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • 1