タグ

自然言語処理に関するhaseryo0801のブックマーク (4)

  • C:\hiji\ResearchIR\情報フィルタリング\IFtutorial.pdf.prn.pdf

    情報フィルタリングの基礎理論と ユーザプロファイリング技術 大阪大学大学院基礎工学研究科 土方 嘉徳 チュートリアル資料 (C) 2005 Yoshinori Hijikata パーソナライゼーション ユーザにとって適切な情報を適切な形式で提供                                         [CACM 2000] お勧め商品の提供 バナー広告変更 背景/レイアウト変更 コンテンツ選択 (C) 2005 Yoshinori Hijikata 情報推薦・フィルタリング ユーザの興味に基づいて情報を配信                         [CACM92, CACM97] 主な特徴 ・非構造化データ・半構造化データを扱う ・動的に発生するデータを扱う* ・フィルタリングはユーザプロファイルに基づく* ・ユーザプロファイルはインタラクティブに生成する

  • 今日の井原 - 文章要約プログラムを書いてみよう!その2 〜TF/IDFといっしょ!〜 

    Home > December 2003 > ʸ�������ץ��������񤤤Ƥߤ褦�� �����Σ�����TF/IDF�Ȥ��ä��硪���� December 19, 2003 ʸ�������ץ��������񤤤Ƥߤ褦�� �����Σ�����TF/IDF�Ȥ��ä��硪���� �����Ƥ��ơ������Ǥ�������³������ ���ͤ��񤤤�ʸ�������ץ����������󤷤ᤷ���������Τ��Ȥ͡ˡ��������ˤ�ô�äƤ����Τ���TF/IDF�٤Ȥ������르�ꥺ�����������Ϥ����ˤĤ��Ʋ��⤷�ƹԤ����������Ĥ�̾�������Τ����Ǥʤ��������񤷤������ȻפäƤ��ޤ������ºݤˤϴʷ��ǰ����䤹�����Τ���ľ��Ū�Ȥ������ȤäƤ���Ũ�ʥ��르�

  • 自然言語処理入門

    自然言語処理入門 澁谷 翔吾, 廣安 知之, 三木 光範 ISDL Report  No. 20091110003 2009年 6月 8日 Abstract レポートは自然言語処理で基的な処理について解説する.内容としては,文書内の単語の重み付け, および文書間のベクトル計算について解説する. これらを解説するにあたり,Introduction to Information Retrieval[1]の第6章, 「Scoring, term weighting and the vector space model」を参考にし, 得られた知見についてまとめた. 1  はじめに 近年, 検索エンジンでは検索対象となるドキュメント内の文字に重みを付与し, 候補となる情報に順位付けを行い, 効率的に情報を提供する仕組みが用いられている. これは, 検索クエリーとドキュメントの関連

  • Twitterの投稿内容から鬱度を測定する - Unchained Life

    もうすぐ5月です。 Twitterの投稿内容から度を測定するRubyスクリプトを書いてみました。 これには東京工業大学の高村さんが公開している単語感情極性対応表というものを使っています。 http://www.lr.pi.titech.ac.jp/~takamura/pndic_ja.html これはある単語がどの程度の感情を表すかを数値化した表で、-1 ~ +1 までの値が特定の単語に割り当てられています。 その単語がネガティブな感情表現だとマイナスの値、ポジティブな感情表現だとプラスの値になっています。 なので、度を測定といってもポジティブな投稿内容が多いときにはプラスの値を返します。 また日語文の形態素解析にはYahoo!の日形態素解析APIを使っています。 http://developer.yahoo.co.jp/webapi/jlp/ma/v1/parse.html

    Twitterの投稿内容から鬱度を測定する - Unchained Life
  • 1