タグ

2010年4月19日のブックマーク (18件)

  • Googleが推測やスペル補正機能を改良、地域や職業などで候補を提示

    サンフランシスコのユーザーが「bart」と検索すると、人名ではなく同市の高速鉄道「BART」と解釈し候補を表示する(Googleの資料より引用) 米Googleは米国時間2010年4月16日、同社のWeb検索サービスで、検索語リアルタイム推測機能「Google Suggest」やスペル補正機能に改良を施したと発表した。 Google Suggestは、検索語の入力中、検索窓にプルダウンメニュー形式で候補を表示する機能。これまではユーザーの住む国に合わせて候補を表示していたが、これを地域別に表示するよう変更した。「シアトルに住む人とダラスに住む人とは同じ単語を入力しても、求めている情報が違うからだ」と同社は説明している。 例えばサンフランシスコに住むユーザーが「bart」と入力した場合、人の名前でなく、同市の高速鉄道「BART(Bay Area Rapid Transit)」を意図しているこ

    Googleが推測やスペル補正機能を改良、地域や職業などで候補を提示
  • 大企業も使う個人サービス Twitterまとめ「Togetter」を作る人

    「1週間で作りました。Togetter(トゥギャッター)を使って」 ソフトバンクの孫正義社長は、3月28日にTwitterユーザーを招いて行ったイベント「ソフトバンクオープンデイ」でこう話し、会場に集まった約1300人のTwitterユーザーと、Ustreamのライブ配信を視聴していた数万人のユーザーに、「Togetter」の画面を見せた。 Togetterは、複数のつぶやきをドラッグアンドドロップで選び、1画面にまとめられるサービス。自分のつぶやきをまとめたり、他人のつぶやきから面白いものを抜き出してまとめるといったことが可能だ。 孫社長がスクリーンに映してみせたのは、自らがTwitterで、「やります」と宣言した内容についてのまとめ「やりましょう」リストなど。孫社長のつぶやきと、進ちょくに関する関係者のつぶやきを一画面に集約し、進み具合が分かるようになっている。 「まさかのUstrea

    大企業も使う個人サービス Twitterまとめ「Togetter」を作る人
  • グーグルのサーバー数を図にするとこんな感じ

    グーグルのサーバー数がものすごいことは有名ですが、それを図で表すと、こんなことになるらしいです。数でいうと100万台以上。 ただ、サーバーってみんな性能も違うし、バーチャルマシンはどうするんだとか考え出すとややこしいです。あくまで、ある基準で数えると他社と比較してこんなことになりますよ、というものとして見ていただければよいかと思います。 ちなみに、マイクロソフトは?ヤフーは?というと、各社データが古かったり非公開だったりの事情で、この図にはないのです。が、マイクロソフトは2008年半ば時点で21.8万台(推定)、ヤフー、アマゾン、イーベイ、GoDaddy、IBM、HP/EDSはそれぞれ5万台以上は持っているだろうとのこと。それらを全部合わせると、やっとグーグルと同じくらいになりそうですね。 (※なお、図中の文言について訂正です。iWebはアップルとはまったく関係ない「ホスティングとITイン

    グーグルのサーバー数を図にするとこんな感じ
  • 手書き感がなんとも素晴らしいアイコンセット集:phpspot開発日誌

    手書き感がなんとも素晴らしいアイコンセット集をまとめてみました。 アイコンというとキッチリしたものが多いですが、こうした手書きアイコンをサイトに盛り込むと温かみのある雰囲気に作れそう。 RM Kute Toolbar Icons by *Raindropmemory on deviantART 手書きなんですが、RSSとかスターとか、検索とかWEBアプリケーションに使えそうなアイコンセットです。 Red Little Shoes Icon set by *Raindropmemory on deviantART こちらもなんとも味のあるアイコンセット。WEBアプリに使えそうなものもいくつかありますね。 Watercolor Free Icon Pack | Tutorial9 こちらも少しテイストが違いますが手書きのアイコンセット。Twitterらしき鳥もありますね 絵を描くのが得意な方は

  • cassandra調査レポート

    3.  はじめに 現在 RDB が使われてきている部分に関して、 RDB 以外では出来ないのかを模索する noSQL(NotOnlySQL)と言う流れが急速に加速している。 特に Web アプリケーションにおいては RDB は冗長である傾向があり、 での sharding も RDB 限界がある。 そこで Facebook 社が開発した分散 DB「cassandra」について、実際どの程度使えるのかを 調査/検証してみた。 3 4.  概要 Cassandra は Facebook で作られた分散型 DB サーバである。 Dynamo 的な大規模分散管理と、HyperTable の様なカラム型データ構造を持った DB となっ ており、高可用性と冗長性を併せ持つ。 目標としては、これらを上手く利用することで今まで MySQL で行っているレプリケーショ ンとテーブル分割でサーバをスケール

    cassandra調査レポート
  • 首位をゆずらぬ「Xperia」 iPhone独走時代に終止符なるか?

    キャリア総合ランキングでは、前回初登場で1位を獲得したAndroid端末「Xperia」がその座を守った。予約が殺到したことを考えると、前回の首位は順当な結果だったと言えるが、今回もランキング上の勢いは衰えなかった。これまで日では「スマートフォンではなくiPhoneが売れている」という状況だったが、Xperiaの登場が状況を変えるかもしれない。次回の順位も引き続き注目だ。 上位5モデルには変化がなく、2位と4位は「iPhone 3GS」の16Gバイトモデルと32Gバイトモデルが獲得。3位には高機能ケータイの人気モデル「SH-01B」がランクインし、5位にはシンプル端末「Jelly Beans 840SH」が入った。 シニア層をターゲットにした「らくらくホン ベーシックII」は6位、“セパレートケータイ”として話題を集めている「F-04B」は7位とそれぞれランクアップ。一方、auの「T00

    首位をゆずらぬ「Xperia」 iPhone独走時代に終止符なるか?
    mzi
    mzi 2010/04/19
  • pLSI をハードクラスタリングに使おうとしたけどイマイチだった - nokunoの日記

    きっかけはPythonでpLSA(pLSI)を実装している人がいたので、文書クラスタリングに使えないかな、と考えたことでした。satomacoto: PythonでPLSAを実装してみるただpLSIはいわゆるソフトクラスタリングで、以下のような問題がありました。 結果の解釈が直接しづらい 処理時間がかかるこのうち1つ目の問題は文書が与えられたときのクラスタへの所属確率 P(z|d) の最大値を取ってハードなクラスタリングの結果を得れば解決します。しかし、処理時間のほうはEMアルゴリズムの途中で0でないパラメータが多いことが原因なので、単にP(z|d)をハード化しても他のパラメータ (P(z|w,d)など) がなくならないのでイマイチでした。そこで P(z|w,d), P(w|z), P(d|z) の各パラメータをハード化することで高速化できないかなと考えたのですが、結果はかなり劣化してしま

  • [ウェブサービスレビュー]バーコードリーダーにも対応した持ち物管理サービス「MonoColle(モノコレ)」

    内容:「MonoColle(モノコレ)」は、やCDなどの持ち物を登録してオンラインで管理できるサービスだ。商品名やISBNコードからの登録はもちろん、バーコードリーダーを利用しての登録にも対応している。大量の蔵書やライブラリの登録・管理に向いている。 「MonoColle(モノコレ)」は、やCDなどの持ち物をオンラインで管理するサービスだ。感想などを書き込んでデータベースとして活用できるほか、似た嗜好(しこう)を持つほかのユーザーを参考にしつつ、新しい商品の購入にもつながる。 登録できる商品は「書籍」「音楽」「映像」「ゲーム」の4カテゴリ。商品名やISBNコードを用いて登録し、感想を書き込んだり、レートをつけたりできる。すでに所持している商品はもちろん、気になる商品の登録も可能だ。これらの商品の登録数ランキングはトップページに表示されるので、多くのユーザーが興味をもっている商品や実際に

    [ウェブサービスレビュー]バーコードリーダーにも対応した持ち物管理サービス「MonoColle(モノコレ)」
  • Google、クラウド印刷サービス「Google Cloud Print」を発表

    Google、クラウド印刷サービス「Google Cloud Print」を発表:Chrome OSやiPhoneとプリンタを結ぶ 「Google Cloud Print」は、プリンタドライバ不要のクラウドを利用する印刷サービス。Googleはまず「Google Chrome OS」で採用し、将来的にはAndroid携帯やiPhoneなど、あらゆる端末で利用できるようにする計画だ。 米Googleは4月15日(現地時間)、クラウドを利用する印刷サービス「Google Cloud Print」の構想を発表した。年内公開予定のOS「Google Chrome OS」での印刷作業も、すべてこのサービスを利用することになる。このプロジェクトで同社は、「あらゆる端末上の、あらゆるアプリケーションからの、あらゆるプリンタでの印刷を可能にするサービス」を目指す。 現在は、プリンタでファイルを印刷するため

    Google、クラウド印刷サービス「Google Cloud Print」を発表
  • 格安で「本をスキャンしてPDFに変換する」お手伝いはじまる | スラド

    4月15日、合同会社大和印刷が「BOOKSCAN」という低価格・書籍スキャン代行サービスを行うサイトをオープンした(サービス開始は 4月下旬から) 客は書籍を宅配などでBOOKSCANへ送ればよいだけで、あとはBOOKSCAN側がを裁断し、スキャナーで読み取り、PDF化するという手順だ。PDF化したデータはメールもしくはCD-R形式で納品される。いくつか条件がついているが、それでも一冊100円からという信じられない破格の安さだ。しかも1冊からOKとのこと。ちなみに1回の注文の上限は1万冊!! ただし、発売後原則2年以上経過している書籍は受け付けないそうだ。また、裁断されたは破棄される。 その他もろもろの条件はリンク先をみていただきたい。 以前コルシカという会社が類似のサービスを提供していてすらどでも紹介されたなぁと思わず空目してしまいましたが、その顛末は皆さんも知るところですね。こうい

  • Google Transliteration IME - 武蔵野日記

    Googe 日本語入力が出たのは記憶に新しいが、Google Transliteration IMEというのもあるらしい。 Arabic, Bengali, Farsi (Persian), Greek, Gujarati, Hindi, Kannada, Malayalam, Marathi, Nepali, Punjabi, Tamil, Telugu and Urdu という14の言語をローマ字で入力できるようになる、と。日語と中国語くらいしか統計的インプットメソッドの恩恵がないと思っていたのだが、上記の言語も統計的手法が使えるのでは、という感じ。Transliteration (翻字)というと、たとえば America を「アメリカ」と表すようにある言語の言葉を違う言語の言葉に変換することを指すので、入力がローマ字であるだけで、英語を入力してアラビア語が出力されるわけではないから

    Google Transliteration IME - 武蔵野日記
  • webデザイナが使いそうな48px四方の究極のアイコン750個を無料でダウンロード

    思わず音速でクリップしてしまった究極系エントリー。 配布している方が究極だというのだから、きっと究極なんです。 webデザイナーが使いそうなアイコンパック ダウンロードは以下から。 どんなのが入ってるの? ちょいと量が量なので小さく表示してますが、サイズは48×48pxです。 興味のある方は是非。 The Ultimate Free Web Designer’s Icon Set (750 icons, incl. PSD sources) - Smashing Magazine こちらとあわせてどうぞ。 ハイクオリティ無料アイコンまとめ100パック2009年最新版*ホームページを作る人のネタ帳 それでは、また。

    webデザイナが使いそうな48px四方の究極のアイコン750個を無料でダウンロード
  • 情報爆発 : ネット&デジタル : YOMIURI ONLINE(読売新聞)

    第5回 生みの親に聞く「情報爆発」 〜後編〜 東京大学・生産技術研究所 喜連川優教授インタビュー 現代社会とは「情報爆発」社会であることを看破し、いち早く研究を立ち上げたのが東京大学の喜連川優教授だ。文部科学省と経済産業省で「情報爆発」をテーマにした研究プロジェクトを率い、多くの成果を出している。今回は教授に、集めた情報の活用方法と、情報活用の際に問題となりやすいプライバシーについて最新の研究動向を話してもらった。 【喜連川教授】企業の場合、膨大な情報を分析して新しい法則を見つけたとしても、それは企業秘密です。分析はどんな分野でも非常に重要で、実に精緻にやっていますよ。ただ、その結果は、やたら世間に公開するという性質のものではありません。 経済産業省の「情報大航海プロジェクト」では、3000人に携帯電話を持たせて、行動履歴やおサイフ携帯による物品購買履歴を集めて分析し、参加者に最適な商品情

  • 情報爆発 : ネット&デジタル : YOMIURI ONLINE(読売新聞)

    現代社会は日々、多くの情報を生み出し、それを膨大なデータとしてため込み始めている。前回はその状況証拠のひとつとして、ハードディスクの進化を紹介した。このような状況を「情報爆発」というキーワードでいち早く表現し、「情報爆発時代に向けた新しいIT基盤技術の研究」という文部科学省の研究プロジェクト(特定領域研究)を率いてきたのが、東京大学・生産技術研究所の喜連川優教授だ。 このプロジェクトは、2006年にスタート、今年2010年4月でいったんの区切りを付ける。2007年に「爆発する多種多様な情報を有効活用し、新たなビジネスやイノベーションを創出するために何をすべきか」をテーマにスタートした経済産業省の研究プロジェクト「情報大航海」も喜連川教授が率いている。 今、コンピューターの世界で何が起きているのか……喜連川教授に「情報爆発」というキーワードで切り取った現代社会の姿を説明してもらった。 【喜連

  • レコメンドサービスを「気持ち悪い」と感じるユーザー心理 KDDI研究所らがはじめて定量的解析に成功

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    レコメンドサービスを「気持ち悪い」と感じるユーザー心理 KDDI研究所らがはじめて定量的解析に成功
  • How I teach machine learning

    my biased thoughts on the fields of natural language processing (NLP), computational linguistics (CL) and related topics (machine learning, math, funding, etc.) I've had discussions about this with tons of people, and it seems like my approach is fairly odd. So I thought I'd blog about it because I've put a lot of thought into it over the past four offerings of the machine learning course here at

  • グーグル、第1四半期決算を発表--アナリスト予想を上回る増収増益に

    Googleは、少なくとも検索広告に関する限り、オンライン広告市場の回復が順調に進行中であることを証明し続けている。 同社は、米国時間3月31日に期末を迎えた2010年第1四半期(1-3月期)の決算を発表し、前年同期比で23%増となる67億7000万ドルの売上高を報告した。アナリストらは、Googleのパートナー企業に支払われた17億1000万ドルに上るトラフィック獲得コストを除外して、同社の業績のパフォーマンスを評価している。トラフィック獲得コストを除くと、第1四半期の売上高は50億6000万ドルとなり、わずかにアナリストが予測していた49億5000万ドルを上回った。 また、純利益は19億6000万ドルとなり、前年同期に記録した14億2000万ドルから38%増加している。特別計上経費を除くならば、1株利益は6.76ドルとなり、アナリストが予測していた1株あたり6.60ドルの利益を上回って

    グーグル、第1四半期決算を発表--アナリスト予想を上回る増収増益に
  • 「なんの役に立つんですか?」の暴力性 - 最果タヒ.blog

    テレビで魚に右利き左利きがあることを発見した教授が出ていて、その話がすごすぎた。餌をとるのに右にばかり曲がる魚とか、魚にも利きというのがあるらしく、しかもそうした魚を干物にすると、右利きは右に曲がって干からび、左利きは左に曲がって干からびる、つまり骨格から利きが決まっているらしい。その比較を見せてもらったときは鳥肌がたったわけで、偉大すぎるだろ、とびびっていたのだけれど、アナウンサーさんは変な研究、と言いたげに苦笑していて、しまいには「なんの役に立つんですか?」という自然科学でもっとも野暮な質問をしてしまっていた。 うーん。「なんの役に立つんですか?」という言葉は、実はいろんなことに投げかけられている。「マンガなんて読んで、なんの役に立つの?」「宇宙なんて研究して、なんの役に立つの?」「絵画なんて観て、なんの役に立つの?」大衆にとってもっとも価値があるのは「利便性」だ。「利便性>娯楽性>芸

    「なんの役に立つんですか?」の暴力性 - 最果タヒ.blog