osskのブックマーク / 2010年11月17日

ossk id:ossk

2010年11月17日のブックマーク (5件)

PDFより何が優れているのか？　事業仕分けで電子書籍中間フォーマットを議論
ossk 2010/11/17
PDF

電子書籍

総務省

ファイルフォーマット
リンク
Yahoo!APIで特徴語抽出を作る
cles::blog 平常心是道 blogs: cles::blog NP_cles() « GPLがVersion3に :: 自分の携帯番号を覚えていない » 2007/07/01 Yahoo!APIで特徴語抽出を作る Yahoo API nlp 78 4へぇ NP_MetaTagsではmetaタグのkeywordsを記事の本文から特徴後を抽出して自動的に生成する機能があり、これはBulkfeedsの特徴語抽出APIを使わせてもらっていました。ところが、このところBulkfeedsが落ちたままなので別の方法で特徴語抽出ができる方法がないか探してみました。 [を] 形態素解析と検索APIとTF-IDFでキーワード抽出目的：キーワード抽出対象テキストから、そのテキストを代表するキーワードを抽出します。TF-IDF という指標を用います。（この値が大きいほどその単語が代表キーワードっぽい
ossk 2010/11/17
Yahoo!

api

自然言語処理

TF-IDF

形態素解析

Webサービス

プログラミング
リンク
形態素解析と検索APIとTF-IDFでキーワード抽出
形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。教科書に載っているような基本中の基本ですが、あらためてエッセンスを簡単な例で解説したいと思います。目的：キーワード抽出対象テキストから、そのテキストを代表するキーワードを抽出します。TF-IDF という指標を用います。（この値が大きいほどその単語が代表キーワードっぽいということでよろしく。） TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード候補が含まれるドキュメ
ossk 2010/11/17
形態素解析

Yahoo!

api

自然言語処理

TF-IDF

プログラミング
リンク
Python による日本語自然言語処理
はじめにこの文書は、 Steven Bird, Ewan Klein, Edward Loper 著萩原正人、中山敬広、水野貴明　訳『入門自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも
ossk 2010/11/17
python

自然言語処理

プログラミング

あとで読む

日本語
リンク
ふわっと関連検索とは
ふわっと関連検索にもどる [ CiNii / CiNii著者 / NDLサーチ / レファ協 / J-STAGE / WorldCat / DPLA / Springer / 教育研究論文索引 / 一橋大学OPAC ] 目次ふわっと関連検索とは？検索できるデータベースは？ソースコードは公開されていますか？いま使っているデータベースでも、「ふわっと○○関連検索」してみたい検索結果の並び順は？もっと簡単に使うにはブックマークレット自分のWebサイトで使うには？（ブログパーツ）開発者向けAPIの提供名前の由来謝辞ふわっと関連検索とは？任意のテキストを対象に、文書類似度を使って文献検索できるツールです。いまのところ、CiNiiやNDL PORTAなどを対象にした文献検索を用意しています。また、外部のサイト上からも簡単に呼び出せるようにAPIにも対応しています。詳細は
ossk 2010/11/17
ふわっと関連検索

検索

情報検索

CiNii

プログラミング

api
リンク
- 2010年11月18日
- 2010年11月17日
- 2010年11月16日