hate-urumaのブックマーク / 2019年6月20日

hate-uruma id:hate-uruma

2019年6月20日のブックマーク (6件)

Unicode Character Search
Unicode Character Search Query: include Han codepoints? Cancel A-Z index | Search options
hate-uruma 2019/06/20
tool

unicode

utf-8
リンク
Unicode Character 'UGARITIC LETTER DELTA' (U+10384)
hate-uruma 2019/06/20
tool

unicode

utf-8
リンク
String#codepoints (Ruby 3.3 リファレンスマニュアル)
hate-uruma 2019/06/20
ruby

codepoint
リンク
UTF-8のコードポイントはどうやって高速に数えるか - Qiita
UTF-8文字列からコードポイント数を計算するアルゴリズムについて紹介します。コードポイント数カウントは、シンプルに書くのはそれほど難しくないものの、高効率な実装は意外にややこしいです。内容は二本立てです。実践的な実装について、Ruby(CRuby)の内部実装(string.c)で使われているものを紹介します。標準Cの範囲を超えて、SIMD命令(AVX/AVX2)を使った実装についても述べます軽く検索する限りだと既知のアルゴリズムが見当たらなかったので、アドホックな実装をひねり出しましたが、そんなに効率は悪くなさそうですおまけで簡単な性能評価をやってみました。なお、UTF-8文字列はバリデーション済み（不正なシーケンスでないことが分かっている）であるとします。 Rubyの内部実装だとどうやっているかまずは、それがコードポイントの先頭バイト(leading byte)かを判定す
hate-uruma 2019/06/20
ruby

utf-8
リンク
「Linuxのしくみ」をもっと早く読んでおけばよかったと後悔した - ばーろぐわにる
きっかけ Linux エンジニアとしての基礎力のなさを見抜かれ、これ読んでみるといいよとおすすめされたのがきっかけ。 gihyo.jp 大変お恥ずかしい話だが、自分はエンジニア7年目にして初めてLinuxについての本を読んだ。それまではなにか上手くいかないことがあればブログやQiitaを参考にコピペしてその場しのぎしていただけだった。目次第1章　コンピュータシステムの概要第2章　ユーザモードで実現する機能第3章　プロセス管理第4章　プロセススケジューラ第5章　メモリ管理第6章　記憶階層第7章　ファイルシステム第8章　ストレージデバイスおもしろかったところメモリ管理プログラムは直接物理メモリにはアクセスしない。仮想メモリを通して物理メモリにアクセスする forkしたとき、仮想メモリは書き込み権限が付与されずに同じ物理アドレスが紐付いたままの状態。子プロセスで書き込みが走
hate-uruma 2019/06/20
linux
リンク
青春→鯖鰆みたいなやつ - アスペ日記
今日、こんなツイートを見かけました。娘１のクラスの寄せ書き、「楽しかったよ」「また会おうね」が多い中、キラリとひかる名文発見。「青春って魚編をつけると鯖鰆（サバサワラ）って読めるよね。似たような熟語を見つけたら教えて」By 町田高史(仮名) 彼が無事に社会に適応できますように。— 藤川ｵﾚﾝｼﾞｰﾅ (@Forangina) 2017年3月21日ぼくもこういうのは大好きです。（社会に適応できているかどうかは微妙なところです）それで、こういうのを探してみることにしました。漢字の構造については、漢字構造情報データベース（CHISE）というものがあります。（かなりの労力がかかっていると思われるデータベースです。作られた方に感謝します。）今回は、これを使わせていただきます。 % git clone http://git.chise.org/git/chise/ids.git この中の
hate-uruma 2019/06/20
漢字
リンク
- 2019年6月21日
- 2019年6月20日
- 2019年6月19日