タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

memoとgoogleに関するkat0usiのブックマーク (3)

  • IMEとして「変態」 開発陣が語るGoogle日本語入力 (4/5)

    たった50MBに「ケタ違いの語彙データ」を徹底的に詰め込んだ ―― ところで、流行語なども含めると、データ量が相当大きくなるはずなのに、プログラムも含めてダウンロードサイズが50MBに収まっているのも驚きでした。 及川 そこはかなり拘っています。圧縮技術は手前味噌ですが、スゴいです(笑)。 小松 収録語彙数をお教えできないのが残念ですが、相当詰め込んであります。 工藤 データは「TRIE」と呼ばれる構造になっており、ツリー状に、例えば「あ」に連なる言葉として「い」という枝が伸びて「愛」という言葉になるように、一文字ずつ辞書に収めています。これをプログラムに実装する手法として「LOUDS」と呼ばれるアルゴリズムを採用しています。LOUDSのメリットはデータの圧縮率が高いという点ですね。 小松 圧縮率は高いのですが、速度はそれほどでもありません。速さだけを追求するならば他の選択肢もありましたが

    IMEとして「変態」 開発陣が語るGoogle日本語入力 (4/5)
    kat0usi
    kat0usi 2009/12/24
    LOUDSのメリットはデータの圧縮率が高い。我々が実行ファイルに辞書を含めてあるのはアプリケーションがクラッシュ時に辞書も壊れてしまうを防ぐため。
  • Google、「goo.gl」で独自のURL短縮サービス開始 

    kat0usi
    kat0usi 2009/12/15
    グリーンランド(.gl)のトップレベルドメイン
  • Cloud Computing考:Amazon ec2とGoogle App Engineの違いを私なりにまとめてみた

    Cloud Computing の話が注目されるようになってしばらく経つが、商用での格応用という意味ではまだまだ未熟な市場である。PhotoShareは去年の7月サービス開始時から Amazon の ec2+S3 という組み合わせで運営しており、私から見れば当然の選択だったわけだが、あのタイミングで商用サービスへの採用に踏み切った会社も少なかったのか、何件かインタビューの申し込みが来たりして少し驚いている(参照)。 すぐに陳腐化するハードウェアの資産はできるだけ持ちたくないし、自分でデータセンターにラックを借りるなんてことはコスト的に見合わない。かといって、通常のレンタルサーバーは初期費用がばかにならない(今は少しは改善されているのかも知れないが、去年の段階では「それじゃあハードが自分で買えるじゃん」と言わせるぐらいの初期費用を請求する企業がほとんどであった)。それに加えて、どのくらいの

  • 1