タグ

nlpとresearchに関するfrsh_mtのブックマーク (8)

  • 自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記

    Twitter でグラフ理論に関する話題が上がっていたので、最近調べている距離学習(distance metric learning)について少しまとめてみる。カーネルとか距離(類似度)とかを学習するという話(カーネルというのは2点間の近さを測る関数だと思ってもらえれば)。 この分野では Liu Yang によるA comprehensive survey on distance metric learning (2005) が包括的なサーベイ論文として有名なようだが、それのアップデート(かつ簡略)版として同じ著者によるAn overview of distance metric learning (2007) が出ているので、それをさらに簡略化してお届けする(元論文自体文は3ページしかないし、引用文献のあとに表が2ページあって、それぞれ相違点と共通点がまとまっているので、これを見ると非

    自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記
    frsh_mt
    frsh_mt 2009/01/27
    研究対象にするドメインをどれだけ絞るかが結構精度にかかわる
  • 論文特集「Webインテリジェンスとインタラクション」論文募集

    論文特集「進化計算パラダイムのフロンティア」論文募集 近年,Web環境は大きく変革しようとしています.商用の検索エンジンで検索可能な静的なWebページ数は,200億を越えると言われ,ある調査では2000年の時点でDeepWeb中のWebページ数は5 000億を超えたと報告されております.また,データ量の観点だけでなく,近年blogやSNS(ソーシャルネットワーキングサービス)に代表されるような,人間関係を伴った活動も活発化しております.さらに,これらのデータやコミュニケーションは,実世界上の人間関係や物理オブジェクト,地図データなどとも融合を始めております. このような状況において,Webをより高度に活用するためには,人工知能に代表される知的情報処理技術,Web上の情報リソースに効率的にアクセスするためのデータベース技術,Webからの知識獲得を行うための自然言語処理技術,Web上のコミュ

  • http://japan.internet.com/webtech/20081204/7.html

    frsh_mt
    frsh_mt 2008/12/04
    Blogを対象にすると相当ゴミが多そうですけど。その辺どうやってうまいことやってんのか知りたいです。
  • みんなの経験:検索

    みんなの経験は、奈良先端科学技術大学院大学自然言語処理学講座とニフティ株式会社の共同研究により開発を行いました。 公開にあたりアクセラテクノロジ株式会社およびニフティ株式会社よりブログ記事の収集・解析について協力を受けました。 FAMFAMFAMのアイコンを一部改変して利用しています。 Copyright © 2008 Nara Institute of Science and Technology ご不明な点等ありましたら minna AT is.naist.jp までご連絡ください。

  • 単語感情極性対応表

    単語感情極性対応表 日語および英語の単語とその感情極性の対応表を、 研究目的の利用に限り公開します。 感情極性とは、その語が一般的に良い印象を持つか(positive) 悪い印象を持つか(negative)を表した二値属性です。 例えば、「良い」、「美しい」などはpositiveな極性、 「悪い」、「汚い」などはnegativeな極性を持ちます。 感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。 もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。 リソースとして、日語は「岩波国語辞書(岩波書店)」を、 英語はWordNet-1.7.1を使わせていただきました。 こちらからダウンロードしてください→[日語] [英語] フォーマットは、各行が一単語に対応し、 見出し語:読み:品

    frsh_mt
    frsh_mt 2008/11/12
    おぉ、こういうのを公開していただけると有難いです。
  • 「w」(ワラ)の意味も解析!?――NIIと国語研、Yahoo!ブログの記事を学術利用

    国立情報学研究所(NII)と国立国語研究所は4月23日、「Yahoo!ブログ」に投稿された記事データを利用した研究を始めると発表した。「w」(笑、ワラ)などネット独特の表現やくだけた文章を含んだブログの内容を分析できる言語解析ツールや、コーパス(言語分析用データベース)などの構築を目指す。データはヤフーが無償で提供する。 4月25日以降に投稿されるYahoo!ブログの記事から季節ごとに数回ずつ、合計500万語以上を抽出。固有名詞や個人の特定に結びつく可能性のある表現を除外し、研究に利用する。全体に公開している記事のみが対象。Yahoo!IDには、「ユーザーがYahoo!で発信したコンテンツを、ヤフーが無償で非独占的に複製する権利を許諾する」という規約があるため、規約に同意していないユーザーでも投稿できるブログコメントは提供データに含まない。 ブログデータは、言語学の研究や、ブログの内容を分

    「w」(ワラ)の意味も解析!?――NIIと国語研、Yahoo!ブログの記事を学術利用
  • Yahoo!検索語データを無償提供 研究プロジェクト向けに

    国立情報学研究所(NII)は2月28日、Yahoo!JAPANの検索語データを研究用に無償提供することでヤフーと合意したと発表した。大規模な検索語データの研究利用は国内初としており、新しい検索技術の研究が進むと期待している。 文部科学省が補助するプロジェクト「情報爆発時代に向けた新しいIT基盤技術の研究」(代表・喜連川優東京大教授)に参加する研究者に、NIIを通じて4月から提供する。 Yahoo!検索の検索語から、実際に検索された上位1万件の検索語と検索回数を抽出して提供する。NIIは「現実の検索エンジンに投入される検索語の特徴の分析が進めば、新しい検索手法の研究への大きなインパクトが期待できる」としている。 3月3日に東京・秋葉原で説明会を開く。試作システムのデモなども行う。

    Yahoo!検索語データを無償提供 研究プロジェクト向けに
  • onomatopedia.net - このウェブサイトは販売用です! - onomatopedia リソースおよび情報

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

    frsh_mt
    frsh_mt 2008/02/28
    オンラインオノマトペ用例辞典
  • 1