2007年11月2日のブックマーク (6件)

  • コンピュータ中心の世界はまもなく終わる--米VCが描く未来

    たとえば、ECサイトでPCを販売する際に、液晶の大きさやCPUの性能などのスペックを掲載しますよね。でも、新しい会社がそれまでとはまったく違う特性を持った製品を出した場合、そのスペックが既存のデータベースに入らないんです。こうなると、新しい属性を追加しないといけなくなり、関連するシステムすべてを変更する必要が出てきます。 商品データベースであればまだましなほうで、鳥インフルエンザのデータのように、数分おきに全世界の研究者から新しい属性を加えてくれという要望が上がってくると、データベースそのものが作れないんです。今はエキスパートの人間が手書きの表でまとめている。これではリアルタイム性も低いし、管理も大変になります。 そこで、私が注目しているのはこういったアンストラクチャードデータを扱えるインデックスファブリック(IFX)という理論です。 編集部注:インデックスファブリック理論は2001年9月

    コンピュータ中心の世界はまもなく終わる--米VCが描く未来
    faw
    faw 2007/11/02
    Index Fabric, IFX
  • 空中停止、垂直離着陸も可能『トンボ型飛行機』:カメラも搭載 | WIRED VISION

    空中停止、垂直離着陸も可能『トンボ型飛行機』:カメラも搭載 2007年11月 2日 サイエンス・テクノロジー コメント: トラックバック (0) David Hambling 2007年11月02日 オランダのデルフト工業大学のチームが作成したトンボ型偵察用飛行機『DelFly II』の、印象的なビデオを見て欲しい。 『DelFly』サイトには、DelFlyにどのようにカメラが搭載されているかなどの説明や、搭載カメラで撮影された映像が含まれている動画(wmvファイル)などがある。 Delflyを開発したBart Remes氏は、一風変わったアプローチでの開発手法を説明してくれた。まず、小さな飛行機を機能するようにして、次にそれを小さくする。そしてさらに小さくするのだ。 「機能するシステム(DelFly I)から開始したが、これは前にしか飛ばなかった。これをより小型に、より高度なものにしてい

  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
    faw
    faw 2007/11/02
  • 開発者が明かす「ニコニコ動画」人気の“キモ” - ITmedia News

    「動画上で行う非同期コミュニケーションを普及させたい」――ニコニコ動画開発の出発点は、そんな思いだったという。「でも、流行るかどうかわからなかったので」開発は小さくスタートした。ドワンゴの戀塚(こいづか)昭彦さんが、1人でプロトタイプを開発。昨年末、最初に公開した「ニコニコ動画(仮)」は、戀塚さんと、同社の鈴木慎之介さんの2人で開発した。 アドビシステムズが11月1日開いた開発者向けイベント「Adobe MAX Japan 2007」に戀塚さんが登場し、Flashを使ったサービスとしてニコニコ動画を紹介。「みんながちょっとずつ参加できる」のが人気の秘密と語り、コメント機能がサービスのキモだと位置づける。「アイデア一発のサービスにしては、細かい調整に手間がかかってます」 ニコニコ動画は「視聴者の力が大きい」メディア ニコニコ動画の人気の秘密は「みんながいろんな手段で少しずつ参加できる」ことだ

    開発者が明かす「ニコニコ動画」人気の“キモ” - ITmedia News
    faw
    faw 2007/11/02
  • HTMLのドキュメントから繰り返し部分をみつける - bits and bytes

    RSSを生成していないページからRSSを生成するなんでもRSS 0.1bは、公開されているJSAI2005: なんでもRSS - HTML文書からのRSS自動生成によると、日付情報を目印にしてそのHTMLドキュメントの構造を推測して、各エントリ(item要素)のタイトルと文を単語の統計的に処理して決定し、フィードを生成していると書かれています。 ウェブ上にあるHTMLドキュメントは Ask.jp : "xml" Search results. のように、RSSitem要素に相当する部分に日付が含まれていないものもあります。 その中でも、大量のデータを複数のページにわけて表示しているHTMLドキュメントを対象に、ドキュメント中に含まれる繰り返し部分のXPathを生成するブログラムをjavascriptで作りました。 アプローチ 大量のデータを複数のページわけて表示しているドキュメントを

    faw
    faw 2007/11/02
    日本語処理
  • MOONGIFT: » 文句なしのWiki「MindTouch Deki Wiki」:オープンソースを毎日紹介

    完成形を見てしまった気がする。それくらいできが良い。 これまでWikiエンジンを幾つも紹介してきた。もちろん、機能面ではもの凄く充実しているものも数多い。だが、使い勝手や初期状態での機能等を考えると、これがまさに完成系と言えるのではないだろうか。 今回紹介するオープンソース・ソフトウェアはMindTouch Deki Wiki、エンタープライズ向けのWikiエンジンだ。 欠点がなさすぎる。日語はもちろんOK、Ajaxを使って遷移の少ない作り、履歴管理+差分表示にももちろん対応している。編集はWYSIWYGなテキストエリアでできる。 ヘッダを作れば、その中だけで編集できる。画像をアップロードして、埋め込むのも簡単。ページの階層管理もできて、タグも使える。ウォッチリストに登録、コメントをする、RSS配信など何でもござれだ。 さらに多言語対応、Google Analyticsを埋め込めるなどな

    MOONGIFT: » 文句なしのWiki「MindTouch Deki Wiki」:オープンソースを毎日紹介
    faw
    faw 2007/11/02
    MySQL使用