[B! nlp] tsuwatchのブックマーク

言語処理100本ノック 2015

言語処理100本ノックは，実践的な課題に取り組みながら，プログラミング，データ分析，研究のスキルを楽しく習得することを目指した問題集です実用的でワクワクするような題材を厳選しました言語処理に加えて，統計や機械学習などの周辺分野にも親しめます研究やデータ分析の進め方，作法，スキルを修得できます問題を解くのに必要なデータ・コーパスを配布しています言語はPythonを想定していますが，他の言語にも対応しています

tsuwatch 2015/03/12

nlp

リンク

Python による日本語自然言語処理

はじめにこの文書は、 Steven Bird, Ewan Klein, Edward Loper 著萩原正人、中山敬広、水野貴明　訳『入門自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも

tsuwatch 2014/11/03

nlp

リンク

捗るリコメンドシステムの裏事情（ハッカドール）

ハッカドールの裏側を一部紹介。高校生でも理解できるくらいの内容でかいてみました。Read less

tsuwatch 2014/10/11

リンク

ニューラルネットによる単語のベクトル表現の学習〜 Twitterのデータでword2vecしてみた - 病みつきエンジニアブログ

最近にわかにword2vecが流行っています。ので、乗っかってみました的記事です。理論に関してはあまり詳しくしらないので、印象だけで語っているかもしれません。何かありましたらTwitterかコメント等でご指摘いただけますと幸いです。ちなみに、失敗した話が多いです。 word2vecと単語のベクトル表現 word2vecは、機械学習の分野で使われる、ニューラルネットというモデルを使ったツール／ライブラリです*1。名前の通り、wordをvectorにします。vectorにする、というのは、ベクトル表現を獲得するということで、意味(みたいなもの)の獲得というか、素性の獲得というか。単語のベクトル表現の獲得自体は、別にword2vecにしかないわけではありません。言い換えると、昔からあります。LDAを使って単語のトピック分布のようなものを学習したり(vingowでやりました)。余談ですが、こ

tsuwatch 2014/03/15

nlp

リンク

自然言語処理の最新手法"word2vec"で艦これ加賀さんから乳を引いてみる - あんちべ！

概要この記事は自然言語処理という分野の最新手法word2vec を利用して誰でも遊べるようにするための手順を説明するものです。 word2vecを利用すると意味の計算が実現できます。例えば"king"から"man"を引いて"woman"を足すと"queen"が出てきたり、 "東京"から"日本"を引いて"フランス"を足すと"パリ"が出てくるという面白い手法です。自然言語処理とは人間が日常的に用いる自然言語をコンピュータに処理させ、翻訳や要約、文字入力支援や質問応答システムを作るなどに活用されている分野です。自然言語処理と言うと耳慣れない言葉かもしれませんが、実は検索や推薦などで私たちが日常的に利用しているなじみ深い技術でもあります。自然言語処理の適用範囲や要素技術は幅広いのですが、その中でもword2vecの特色は、冒頭でも挙げたように「意味の計算」が出来ることです。これ

tsuwatch 2014/03/10

nlp

リンク

都立大自然言語処理研究室 - 自然言語処理を学ぶ推薦書籍

自然言語処理を学ぶ推薦書籍を紹介します。2021年03月現在、自然言語処理を勉強したい理工系の学生・エンジニアの人は、以下の本を推薦します。（概要）自然言語処理（放送大学出版）（理論）言語処理のための機械学習入門＋深層学習による自然言語処理（実装）Python 機械学習プログラミング第3版自然言語処理を勉強したい、非理工系・非エンジニアの人には、以下の本を推薦します。（数式なし）自然言語処理の基本と技術（数式あり）自然言語処理（放送大学出版）オライリーから出ている「入門自然言語処理」は特殊な本（詳しい人がこれを使ってレクチャーしてくれるならともかく、独習に向いていない）で、Python 2 で書かれているだけでなく、すでに動かなくなったコードも多々あり、2019年時点では読まない方がいい本です。（それでもどうしても、意地でも読みたい人は、本家にある Python 3 対応

tsuwatch 2014/03/09

リンク

Graham Neubig's Teaching

Classes Spring 2024: Advanced NLP (CS11-711 @ CMU) Fall 2022: Advanced NLP (CS11-711 @ CMU) Spring 2022: Multilingual NLP (CS11-737 @ CMU) Fall 2021: Advanced NLP (CS11-711 @ CMU) Spring 2021: Neural Networks for NLP (CS11-747 @ CMU) Fall 2020: Multilingual NLP (CS11-737 @ CMU) Spring 2020: Neural Networks for NLP (CS11-747 @ CMU) Fall 2019: Machine Translation and Sequence-to-sequence Models (CS1

tsuwatch 2013/05/05

リンク

ScalaNLP

Scala NLP Scientific Computing, Machine Learning, and Natural Language Processing Scala NLP is a suite of machine learning and numerical computing libraries. Scala NLP is the umbrella project for several libraries, including Breeze and Epic. Breeze is a set of libraries for machine learning and numerical computing. Epic is a high-performance statistical parser and structured prediction library.

tsuwatch 2013/05/01

Scala
nlp

リンク

Tnal研究室wikiページ -

#!/usr/bin/env python # -*- coding:utf-8 -*- """ feature_vector.py % python feature_vector.py file import feature_vector result = feature_vector.analyse(text) """ import MeCab def analyse(text): while node: surface = node.surface.decode('utf-8') node = node.next return feature_vector if __name__ == '__main__': import sys filename = sys.argv[1] file = open(filename).read() feature_vector = analyse(

tsuwatch 2013/04/24

Python
nlp

リンク

Wikipediaによるテキストマイニング入門 - nokunoの日記

発表してきました。第４回データマイニング+WEB 勉強会＠東京 (Tokyo.Webmining#4) ?WEB祭り? : ATNDDatamining04 textminingView more presentations from nokuno.処理に使ったコードはこちらにあります。 nokuno - Project Hosting on Google Code

tsuwatch 2013/04/15

リンク

情報アクセスと知的処理

概要本講義では、情報にアクセスするためのシステムを支える技術について幅広く学びます。まず情報検索システムを取り上げ、検索モデルとして、図書館の書誌情報の検索などで用いられているブーリアンモデル、全文検索で広く用いられているベクトル空間モデル、Webページの検索で広く用いられているリンク構造解析に基づくモデルを扱います。また、情報検索システムを知的なものにするための言語処理技術の基礎、検索をせずに情報を得ることを可能にする情報推薦の技術についても学びます。本科目では独自のWeb情報システムを構築する上での基盤となる技術を習得することを目的としています。お知らせ 11月12日(月)に学力考査を実施します。授業は14:00開始としますので、それまで教室にいる必要はありません。座席表に従って着席してください。参照不可・途中退室不可です。講義スライド情報アクセスと知的処理 - 概論

tsuwatch 2013/04/13

nlp

リンク

くさいセリフ判定 - Negative/Positive Thinking

はじめにくさいセリフを恋人につぶやいてドン引きされてしまう問題を自然言語処理の力で解決するため、くさいセリフかどうかを判定するプログラムを試してみる。 ,　-──-　、／::::::::::::::　　　 ::＼ /:::::::::::　　　　　　　 ::∨ﾄ､　　　　　　　　こいつはくせえッー！ ::::::::::　　　　　　　　 :: ﾚ'ﾉ ::::::::::::::　　　恋人　　　::: ﾚ'⌒ヽ　　　　　ゲロ以下のにおいがヽ-───i＝＝＝i─-}ｧ'　ﾉ　　　　プンプンするぜッ─────ッ！！、` ｰ-＝==-ﾟ---ﾟ=＝‐'　／､｀¨ﾌ＞;''ニニゞ,;ｱﾆニY´; ）　　　　　こんな奴には出会ったことが _、;;）¨´,ﾆ=ﾟ='" ,.ﾍ=ﾟ:く {ｯﾘ'　　　　　　　　ねえほどなァ────ッ i1(ﾘ　　　　　　 r;:ドヽＫヾ=、　　

tsuwatch 2013/03/28

リンク

Mecab Pythonを使ったTF・IDFによるWikipediaの重要単語抽出 - Y's note

入門自然言語処理作者: Steven Bird,Ewan Klein,Edward Loper,萩原正人,中山敬広,水野貴明出版社/メーカー: オライリージャパン発売日: 2010/11/11メディア: 大型本購入: 20人クリック: 639回この商品を含むブログ (44件) を見る TF・IDF計算自然言語処理の勉強としてTF・IDFによる重要単語の抽出をwikipediaのデータに対して試してみます。TF・IDFを一言でまとめると、とある単語の重要度を出現頻度から計算する手法です。計算結果は重みを表します。TFは単語の出現数(Term Frequency)、IDFは総文書数 / 単語が出現する文書の総数の対数(Inverted Document Frequency)、TFIDFはその積になります。数式にすると以下のようになりますが、Webを検索してみると人によって計算の仕方が異

tsuwatch 2013/02/15

nlp
Python

リンク

Python による日本語自然言語処理

はじめにこの文書は、 Steven Bird, Ewan Klein, Edward Loper 著萩原正人、中山敬広、水野貴明　訳『入門自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも

tsuwatch 2013/02/09

nlp

リンク

はてなブックマーク

タグ

関連タグで絞り込む (5)

nlpに関するtsuwatchのブックマーク (14)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス