タグ

Googleとbookに関するjamadamのブックマーク (3)

  • 「世界の全書籍の数」:Googleはどう数えたのか | WIRED VISION

    前の記事 「光の軌跡」が撮れるアプリ『マジック・シャッター』 お金がもらえる自動車共有サービス『リレー・ライド』 次の記事 「世界の全書籍の数」:Googleはどう数えたのか 2010年12月22日 サイエンス・テクノロジーIT コメント: トラックバック (0) フィードサイエンス・テクノロジーIT Mark Brown 米Google社は『Google Books』(日語版記事)プロジェクトにおいて、まずは世界中にあるすべてのをカウントした。その際に利用された、徹底的で緻密なアルゴリズムについて説明している、同社ブログに掲載された[今年8月5日付けの]記事を紹介しよう。 全ての図書を登録する目録を制作するにあたり、公式の標準は存在しなかった。また、既存の多くのシステムは信頼できないものと見なされた。 例えばISBN(国際標準図書番号)を例にとってみよう。ISBNは1960年代以降に

  • グーグル、「Google Books Ngram Viewer」を公開--書籍中の語句使用頻度をグラフ化

    Googleは米国時間12月16日、特定の単語や成句がどの程度頻繁に書籍に出現しているかを過去5世紀にわたって追跡し、表示できるツール「Google Books Ngram Viewer」を公開した。 Google Labsの研究者たちが発表した同ツールは、書籍のデジタル化という、時として論議を呼ぶプロジェクトGoogleが2004年に開始して以来、1500万点以上という膨大な書籍をスキャンした結果を分析する。分析対象は、Googleが「コーパスのサブセット」と呼ぶ、これまでに出版された全書籍のおよそ4%にあたる500万点以上の書籍のデータだ。これら500万点以上の書籍に出現する約5000億もの語句を追跡することで、Ngram Viewerは過去に遡って言葉の歴史と使用頻度の推移を示してくれる。 Ngram Viewerの使い方は簡単だ。単語や成句(5語まで)を入力すると、検索した語句が

    グーグル、「Google Books Ngram Viewer」を公開--書籍中の語句使用頻度をグラフ化
  • 公共性とビジネスの狭間で 国会図書館、書籍電子配信の取り組み

    長尾館長はGoogleブック検索和解案について「著作権を尊重した形でやってもらわないといけないが、著作権者不明の書籍を積極的に世界中の人が利用できるようにする努力は評価できる」と話す 「Googleブック検索」和解案が出版業界に波紋を広げる中、国立国会図書館が電子化した書籍を、ネット上で安価に読めるようにしようという構想に注目が集まっている。 国会図書館の書籍を読むには現状、都内の館や京都の関西館などに直接足を運ぶしかない。だが、書籍の電子化が進み、データをネット配信できるようになれば、国会図書館の貴重な書籍を全国どこにいても読めるようになる。 「図書館は紙の書籍を貸し出す仕組みだが、電子的なデータを貸す、という概念もあるのではないか」――電子図書館の研究者としても知られる国会図書館の長尾真館長(元京都大学総長)は話す。 ただ同時に、出版社や著作者などの利益を損ねない仕組み作りも必要で、

    公共性とビジネスの狭間で 国会図書館、書籍電子配信の取り組み
  • 1