タグ

2010年12月30日のブックマーク (2件)

  • テキストからWikipedia見出し語を抽出 - 人工知能に関する断創録

    WindowsでMeCab Pythonを使う(2010/11/21)のつづきです。形態素解析を使ってると単語が変なところで切れていたり、未知語が多かったりと不満点が出てきます。また、応用によっては、形態素ではなく、複合語単位で抽出したいということもしばしばあります。たとえば、 人工知能は、コンピュータに人間と同様の知能を実現させようという試み、あるいはそのための一連の基礎技術をさす。 人工知能という名前は1956年にダートマス会議でジョン・マッカーシーにより命名された。 現在では、機械学習、自然言語処理、パターン認識などの研究分野がある。(Wikipedia人工知能』を改変)という文章をMeCabで形態素解析して名詞のみ取り出すと、 人工 知能 コンピュータ 人間 同様 知能 実現 試み ため 一連 基礎 技術 人工 知能 名前 1956 年 ダート マス 会議 ジョン マッカーシー

    テキストからWikipedia見出し語を抽出 - 人工知能に関する断創録
  • ウィキリークス:その前夜: 暗いニュースリンク

    2007年1月15日、ワシントン・ポスト紙のエリザベス・ウィリアムソン記者が興味深い記事を公開した。オンライン百科事典サイトとしてすでに成功していたウィキペディアと同じアプリケーション環境を用い、「政府書類を匿名で投稿できるサイト」が2ヵ月後に公開されるというのだ。※1 そのサイトはウィキリークス(Wikileaks)という名称で、ジェイムズ・チェンという人物が主催し、Wikileaks.orgというドメイン名で公開される予定だった。正式公開前にも関わらず、すでにインターネット上では大変な話題になっているということだった。 「計画通りとはいえ予想外に早すぎますが、ウィキリークスは倫理的漏洩と開かれた政府を促進する人々にとって世界的なムーブメントになろうとしています。」チェン氏はポスト紙の取材にそう語っている。今や幻となった主催者のこの予言的な説明は、それから4年近く経過した今、現実の事態と

    ウィキリークス:その前夜: 暗いニュースリンク
    boxheadroom
    boxheadroom 2010/12/30
    つづく