akihiro0117のブックマーク / 2017年8月9日

テキストからキーワードを抽出する方法（非推奨） | 配電盤

Streaming APIで大量のつぶやきをリアルタイムに保存する方法（cURL編）で述べたように、Ustreamなどで重要な映像が配信されるときには、Twitterなどでその内容をtsudaってくれる人がいます。そうやって生み出される大量のテキストが、映像のメタ情報としてもっと活用されるとうれしい、という話です。最初に試したいのはキーワードの抽出です。テキストファイルからキーワードを取り出そうとするとき、多くの学生はまず「形態素解析」を試みます。自然言語処理についてちゃんと学びたいときは、こういうところからじっくり勉強するといいのでしょうが、単に形態素解析するだけではあまりいい結果は得られません。実際にやってみましょう。形態素解析システムの使い方は、『入門自然言語処理』（オライリー, 2010）などで紹介されていますが、環境によってはもう少し簡単です。たとえば、Ubuntuの場

はてなブックマーク

タグ

2017年8月9日のブックマーク (2件)

Python3系のurllibモジュールでHTTP/GET, POSTを行う

テキストからキーワードを抽出する方法（非推奨） | 配電盤

お知らせ

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

今週のはてなブックマーク数ランキング（2024年9月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス