[B! memo][google] kat0usiのブックマーク

IMEとして「変態」　開発陣が語るGoogle日本語入力 (4/5)

たった50MBに「ケタ違いの語彙データ」を徹底的に詰め込んだ ――　ところで、流行語なども含めると、データ量が相当大きくなるはずなのに、プログラムも含めてダウンロードサイズが50MBに収まっているのも驚きでした。及川　そこはかなり拘っています。圧縮技術は手前味噌ですが、スゴいです（笑）。小松　収録語彙数をお教えできないのが残念ですが、相当詰め込んであります。工藤　データは「TRIE」と呼ばれる構造になっており、ツリー状に、例えば「あ」に連なる言葉として「い」という枝が伸びて「愛」という言葉になるように、一文字ずつ辞書に収めています。これをプログラムに実装する手法として「LOUDS」と呼ばれるアルゴリズムを採用しています。LOUDSのメリットはデータの圧縮率が高いという点ですね。小松　圧縮率は高いのですが、速度はそれほどでもありません。速さだけを追求するならば他の選択肢もありましたが

kat0usi 2009/12/24

LOUDSのメリットはデータの圧縮率が高い。我々が実行ファイルに辞書を含めてあるのはアプリケーションがクラッシュ時に辞書も壊れてしまうを防ぐため。

memo
google

リンク

Google、「goo.gl」で独自のURL短縮サービス開始　

kat0usi 2009/12/15

グリーンランド(.gl)のトップレベルドメイン

memo
google

リンク

Cloud Computing考：Amazon ec2とGoogle App Engineの違いを私なりにまとめてみた

Cloud Computing の話が注目されるようになってしばらく経つが、商用での本格応用という意味ではまだまだ未熟な市場である。PhotoShareは去年の７月サービス開始時から Amazon の ec2＋S3 という組み合わせで運営しており、私から見れば当然の選択だったわけだが、あのタイミングで商用サービスへの採用に踏み切った会社も少なかったのか、何件かインタビューの申し込みが来たりして少し驚いている（参照）。すぐに陳腐化するハードウェアの資産はできるだけ持ちたくないし、自分でデータセンターにラックを借りるなんてことはコスト的に見合わない。かといって、通常のレンタルサーバーは初期費用がばかにならない（今は少しは改善されているのかも知れないが、去年の段階では「それじゃあハードが自分で買えるじゃん」と言わせるぐらいの初期費用を請求する企業がほとんどであった）。それに加えて、どのくらいの

kat0usi 2009/10/26

google
memo

リンク

はてなブックマーク

タグ

関連タグで絞り込む (0)

memoとgoogleに関するkat0usiのブックマーク (3)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

関連タグで絞り込む (0)

memoとgoogleに関するkat0usiのブックマーク (3)

IMEとして「変態」 開発陣が語るGoogle日本語入力 (4/5)

Google、「goo.gl」で独自のURL短縮サービス開始

Cloud Computing考：Amazon ec2とGoogle App Engineの違いを私なりにまとめてみた

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

IMEとして「変態」　開発陣が語るGoogle日本語入力 (4/5)

Google、「goo.gl」で独自のURL短縮サービス開始