タグ

ブックマーク / www.itmedia.co.jp (11)

  • Google、把握するURLが1兆ページ突破と報告

    Googleは7月25日、同社が把握するWeb上のURL数が1兆ページを超えたことを、公式ブログで明らかにした。 同社によると、1998年に初めてインデックスを作成した時点で既に2600万ページを数えたが、2000年にはインデックスページが10億を突破。その後もURLは爆発的に増え続け、Googleが把握している独立したURLの数は、このほどついに1兆ページを突破したという。 Googleはページを数える方法として、まず頻繁に利用されるページを起点として定め、そこから新たなページへのリンクをたどっていくとしている。そのリンク先からまったく同じコンテンツを含むURLや、自動生成されたコピーを省いた残りが今回発表した1兆ページであり、現在1日に数十億ページが新たに生成されているという。 1兆ページの多くは内容が似通っているかWebカレンダーの自動生成コンテンツなどあまり検索の役に立たないもの

    Google、把握するURLが1兆ページ突破と報告
  • 元Google技術者、新たな検索エンジンを立ち上げ

    Googleエンジニアが立ち上げた企業Cuilが7月28日、従来とは異なる手法を使った新しい検索エンジンを発表した。 Cuil(「クール」と発音する)の検索エンジンは、従来のリンク分析やトラフィックランキングといった手法ではなく、Webページの内容を分析し、それに基づいて検索結果のランキングを決める。また類似の検索結果をグループ化し、検索結果を「雑誌スタイル」でテーマごとに表示したり、さらにカテゴリーごとに検索することもできる。 例えば「Harry Potter」を検索すると、検索結果ページは「すべての検索結果」「Harry Potter Books」「Harry Potter Games」などのテーマごとにタブで区切られ、右側には「Actors」「Movie Stars」「Directors」などのカテゴリーが表示される。 Cuilは「ほかの検索エンジンの3倍に上る1200億のWebペ

    元Google技術者、新たな検索エンジンを立ち上げ
  • Google書籍検索プロジェクトにプリンストン大学が参加

    Googleは2月5日、書籍検索プロジェクトにプリンストン大学図書館が参加することを明らかにした。 プリンストン大学図書館は600万冊を超える蔵書、500万以上の文書、200万以上の印刷物以外の作品を所有する。Googleと大学はこれらの中から、著作権の切れた約100万冊をデジタル化し、オンラインで閲覧できるようにする。 プリンストン大学はGoogle書籍検索プロジェクトに参加した12番目の大学となった。 同大学図書館は、米国がまだ植民地だった当時の米大陸会議の最初の開催場所であり、独立戦争をくぐりぬけ、修復と拡張を重ねて存続してきた、250年の歴史を誇る図書館だ。 関連記事 Google Books Libraryにテキサス大学オースティン校が参加 全米の大学図書館で第5位の規模を誇るテキサス大学オースティン校が、Google書籍検索プロジェクトへの参加を表明した。 Google Bo

    Google書籍検索プロジェクトにプリンストン大学が参加
  • 英政府、関連サイトを統合、500サイト以上を閉鎖へ

    英国政府は1月10日、「Transformational Government: enabled by technology」報告書を公布し、国民が情報をより効率よく収集できるよう、政府関連サイトの統合を行い、最低でも551サイトを閉鎖すると発表した。 現時点までに、政府が今後も維持すると決定したのはわずか26サイト。一方で551サイトの閉鎖は決定している。閉鎖するWebサイトに掲載されている情報は、「Directgov」「Buisiness Link」などのサイトに移転される見通しだ。 英政府はサイト閉鎖について、ユーザーはDirectgovやBBCのサイトなど、豊富な情報が集結した「スーパーサイト」に訪問する傾向が高まっているためと説明している。

    英政府、関連サイトを統合、500サイト以上を閉鎖へ
  • Googleが米国特許の検索サービス「Google Patent Search」公開

    Googleは12月13日、米国内の特許を網羅した検索サービス「Google Patent Search」をβ公開した。米特許商標庁に登録されている特許、700万件以上をキーワード検索することができる。同社が公式ブログで明らかにした。 検索オプションを使うと、特許取得者、発明者、タイトル、特許番号、申請日、発効日などによる絞り込みが可能。 例えば、2006年1月から12月までに取得された、Apple Computer申請による、ポータブル、ビデオをキーワードとした特許は、このように検索結果が表示される。 検索結果は米特許商標庁の検索とは異なり、文と画像が1つのページに表示されているため、分かりやすい。 ライト兄弟、トーマス・エジソンなどによる歴史的な特許も収録されている。Googleではさらに収録範囲を広げていくと述べている。 関連記事 OSDL、特許情報のライブラリを公開 OSDLは

    Googleが米国特許の検索サービス「Google Patent Search」公開
  • ITmedia Biz.ID:Office文書やWebページを即座にPDF化――だけでなく画像ファイルにも変換する

    Office文書やWebページなどを「今すぐPDFにしたい」という経験はないだろうか。さらにPDFだけでなく画像ファイルにも変換できるソフトが「PDFCreator」だ。 Officeソフトで作成した文書やInternet Explorerで閲覧しているWebページなどを「今すぐPDFにしたい」という経験はないだろうか。作成した文書ファイルや閲覧中のWebページを即座にPDFファイルにできるソフトが「PDFCreator」だ。 PDFCreatorは仮想プリンタとして動作し、印刷可能な各種ファイルをPDF形式に変換できる。Officeで作成したファイルやIEなどのWebブラウザで閲覧しているページを印刷する時に、プリンタ一覧から「PDFCreator」を選択すればPDF文書として保存できるのだ。

    ITmedia Biz.ID:Office文書やWebページを即座にPDF化――だけでなく画像ファイルにも変換する
  • Webページのデザインを崩さずにそのまま印刷する

    Webページを印刷すると、端っこが切れたりして上手に印刷できないケースが少なくない。そんな時は“見たまま”を印刷できる「WebPrintBrowser」を使ってみよう。 仕事でWebページを印刷するシーンは意外と多い。ニュースサイトやブラウザベースのグループウェアをきれいに印刷できると、インターネットに接続できない場所でも情報を確認できて便利だ。 とはいえ、ブラウザから印刷すると、画面の端が切れたりして上手に印刷できないことが結構ある。サイトのデザインにもよるが、どうにかならないものだろうか――。と、お困りの諸兄は、“見たまま”を印刷できる「WebPrintBrowser」を使ってみるといいだろう。 WebPrintBrowserは、Internet Explorerのコンポーネントを利用した印刷用Webブラウザで、ブラウザに表示したWebサイトをそのまま印刷できるのが特徴だ。たとえば、ブ

    Webページのデザインを崩さずにそのまま印刷する
  • ITmedia Biz.ID:再利用可能なコンテンツを探す6つの方法

    クリエイティブ・コモンズで提供されている写真や映像を効率よく検索できるサイト、GNUフリー文書ライセンスのPDFを検索する方法などを紹介。(Lifehacker) 自分がデザインしているパンフレットに画像を1点加えたい。それも今すぐに。だが勝手に他人のクリップアートに手を出せば、著作権違反に問われてしまう。クリエイティブ・コモンズのような組織、GNU Free Documentation Licenseのようなライセンス、そしてパブリックドメインのおかけで、そんな心配をせずにダウンロードして再利用できる、無料の写真、楽曲、映像、文書がたくさん存在している。 今回は、新学期を迎えるに当たって、あるいは強力なマルチメディアプレゼンテーションで上司を圧倒したい人のために、Web上で、合法的に再利用できるコンテンツを見つけ出す方法を6つ紹介しよう。 1. Creative Commons Sear

    ITmedia Biz.ID:再利用可能なコンテンツを探す6つの方法
  • 「過去に自分が見たページ」だけから検索する

    「ウノウサーチ」は、ブラウザの履歴を保存しておいて、過去に自分が訪問したページだけを対象に検索できる無料のソフトウェアだ。 「以前見たあのサイトを探しているんだけど、URLを思い出せないし、検索しても見つからない……」「社内イントラネットのあのページにたどり着きたいが、トップページからリンクをたどるのは面倒だ」 こんな経験をした読者は多いのではないだろうか。ウノウが提供するアプリケーション「ウノウサーチ」では、自分が訪問したページの内容をブラウザのキャッシュとは別の場所に記憶しておき、そのページだけを対象に検索する。自分が見たページであれば、一般のWeb検索エンジンでは探せないイントラネットや会員制サイトも検索の対象になる。 ウノウサーチは、これまでウノウのエンジニアによる実験的なサービスの1つとして「ウノウラボ」で提供されてきたが、8月28日から正式版となった。利用は無料で、対応するOS

    「過去に自分が見たページ」だけから検索する
  • 写真から3Dモデルを作る技術、MSと米大学が開発

    Microsoftとワシントン大学の研究者は8月2日、グラフィックス技術展示会SIGGRAPHで新しい写真閲覧システムを披露する。 このシステムでは、インターネット上で自分の手持ちの写真と他人が持っている数千枚の写真を合わせて、どのアングルからでも見られる詳細な3Dモデルを作ることができる。 このシステムのプロトタイプ「Photosynth」は年内にダウンロード提供される予定だ。これは、SIGGRAPHで発表される「Photo Tourism: Exploring Photo Collections in 3D」という研究論文を基にしている。 「これはスライドショーとゲーム体験を合わせたようなものだ。ズームインして(3Dモデルを)詳細に見たり、ズームアウトして広い視野で見ることができる」とMicrosoft Researchのインタラクティブビジュアルメディア部門マネジャー、リチャード・

    写真から3Dモデルを作る技術、MSと米大学が開発
    chatana
    chatana 2006/08/02
  • ITmedia News:Wikiは時間のムダだ (1/2)

    Wikiがいかに素晴らしいか、いかにして新しく創造的な方法で協力できるようにしてくれるか、いかにして集合知を活用できるか――そんなことばかり聞かされている。なんとくだらないことだ。 Wikiは、人々が有用な成果を生む手助けをするために作られた、そして結局ほとんどの人にとってそれほど便利ではないたくさんのツールの1つにすぎない。それを認めたまえ。 そう、わたしはWikipediaのことは全部知っている。また、その精度には深い疑問を持っている。どうしてWikipediaが信頼に値しないかについては、ニコラス・カー氏の方がわたしよりもうまく説明している。 それはそうと、要点に入ろう。Wikipediaはずっと前から、誰でも書き込んだり編集できる真の「Wiki」ではなかった。Wikipediaの管理者は「荒らし」を防ぐために、一部の項目を新規の投稿希望者から「半保護」にしなければならないと決めた。

    ITmedia News:Wikiは時間のムダだ (1/2)
    chatana
    chatana 2006/05/27
    確かに使ってもらえない。。
  • 1