[B! 文字コード] yamap_55のブックマーク

yamap_55 id:yamap_55

文字コードに関するyamap_55のブックマーク (3)

全角チルダ問題
「JJUG CCC 2017 Fall」（Japan Java User Group Cross Community Conference 2017 Fall）で発表しました。ローカルのテストが遅い、CIでのテストが遅すぎてあまり回せていないことなどありませんか？私のプロジェクトでは、１回のCIに４時間かかるようになってしまい、深夜に一度CIを回すような運用になっていました。時間がかかりすぎるため、段々とCI自体が負債化していっていました。今回はCI時間を劇的に短縮するまでにやった10のことをお話します。
yamap_55 2014/07/07
チルダ

波ダッシュ

文字コード

Windows

unicode
リンク
文字コード地獄秘話第1話：Unicodeにおける全角・半角 - ALBERT Engineering Blog
ごあいさつ皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。固定観念を捨てよう「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。しか
yamap_55 2014/04/22
文字コード

unicode

プログラミング
リンク
いまさらgrepが10倍高速化したのはなぜか – はむかず！
最近GNU grepコマンドの最新バージョンがリリースされ、速度が10倍になったとのアナウンスがあった。それを聞いて、なんであんな枯れた技術に10倍もの高速化の余地があったのだろうと不思議に思った人も多いだろう。ニュース記事：grepコマンド最新版、”-i”で10倍の高速化本家のリリースノート：grep – News: grep-2.17 released [stable] 今回のリリースでは正確には、マルチバイトロケールで、-iオプション（–ignore-case、つまり大文字小文字を区別しないオプション）をオンにした時の速度が10倍くらいになったそうだ。なぜそんなに速くなったのか？逆を言えば今までなぜそんなに遅かったのか？そもそも、多くの日本人にとって「大文字小文字の区別」というと英語のアルファベットか、せいぜいフランス語とかドイツ語とかのアクサン記号・ウムラウトがついたものく
yamap_55 2014/02/25
"世界には、大文字／小文字の変換を行うとUTF-8で表現した時のサイズが変わる言語がある"なので、効率が悪かったんだけどいい感じに処理できるようにしたよ。っという事らしい。

文字コード

Grep
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx