タグ

科学とgoogleに関するsagannのブックマーク (6)

  • Google 科学者の時代

    もう1つニュース。Google がオープンソースの科学データ、それもテラバイトの規模のものを公開するそうです: ■ Google to Host Terabytes of Open-Source Science Data (Wired.com) 公開されるのは Google Research の中において。現在計画中のものの中には、120TB におよぶハッブル望遠鏡のデータなどが含まれているそうです。まだ実際に発表される内容・形態を見てみなければ何とも言えませんが、例えばゴールドコープ・チャレンジ(※ Goldcorp 社が開催したイベントで、同社が所有する鉱山に関する情報をすべてオープンにし、そのデータを基に鉱山のどこに金が眠っているか当てた人に賞金を与えた。詳しくは『ウィキノミクス』をどうぞ)のように、プロ科学者(?)が気づかなかったような斬新な発想でデータを解析するアマチュア科学者が

  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
    sagann
    sagann 2007/11/02
    現在最大の日本語コーパスかな?
  • 株式会社ブライナ

    2023/12/11 年末年始の休業のお知らせ 下記の通り、休業とさせて頂きます。 休業期間中は何かとご迷惑をお掛けすることと存じますが、 何卒よろしくお願い申し上げます。 年末   最終営業日:2023年12月28日(木) 年末年始 休業期間 :2023年12月29日(金)~2024年1月3日(水) 2024年1月4日(木)から平常通り営業致します。 2023/12/07 12月8日(金)午後、特別休業のお知らせ 社内行事のため、特別休業とさせて頂きます。 ご迷惑をお掛けすることと存じますが、何卒よろしくお願い申し上げます。

  • シリコンバレーからの手紙 - 科学者に衝撃を与えた「ロマンティックでない」グーグル

    私の場合、九時間以上の国際線フライトに年に二十回くらい乗る。その機内での時間の使い方に、最近、私なりの小さなブレークスルーが生まれた。ふとしたことがきっかけで発見したのだが、機内は、講演を聞くのにじつに適した場所なのである。座席はあたかも講演会場のように窮屈だし、適度に暗い。途中で離席する自由がないからこそ逆にゆっくり話が聞ける。集中しても読書映画鑑賞と違い目が疲れない。気がつくと一時間半とか二時間が経過し、退屈な機内の残り時間がどんどん減っていくのは快感でもある。 この発見以来、「小林秀雄講演」全六巻、「司馬遼太郎が語る」全八集、「三島由紀夫 学生との対話」(いずれも新潮社)を買って「iPod」に収め、ここ数回の日米往復ですべて聞いてしまった。日出張を控え、さて次は何を聞こうかと思い、脳科学者・茂木健一郎がそのブログ「クオリア日記」に講演や対談の音声ファイルをこまめにアップしている

  • NASAとGoogleが正式提携、NASAの膨大なデータをインターネットに

    Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

  • 1