[B! nlp] CLSmoothのブックマーク

CLSmooth id:CLSmooth

nlpに関するCLSmoothのブックマーク (55)

子供の言語獲得と機械の言語獲得
2016/03/17にPFIセミナーで話したスライドです。子供の言語獲得に関する非常に基本的な話と、関係しそうな機械学習の技術を紹介しました。素人なりのまとめなので、間違いなどご指摘いただけると助かります。
CLSmooth 2020/07/27
自然言語処理

機械学習

nlp

AI
リンク
社内でNLP2017 & DEIM2017読み会を開催しました - Hatena Developer Blog
こんにちは。ウェブアプリケーションエンジニアのid:syou6162です。はてな社内で機械学習や自然言語処理に興味のあるエンジニアが集まる機械学習サブ会という技術グループがあるのですが、その機械学習サブ会が主催で言語処理学会第23回年次大会(NLP2017)と第9回データ工学と情報マネジメントに関するフォーラム(DEIM2017)の論文読み会を行ないました。このエントリでは、その中でも特に面白かった論文を簡単にレポートしていきたいと思います。なお、論文PDFは各学会ページで公開されているものを参照しています。ニュース制作に役立つtweetの自動抽出手法疑似データの事前学習に基づくEncoder-decoder型日本語崩れ表記正規化データ拡張による感情分析のアスペクト推定文体の類似度を考慮したオンライン小説推薦手法の提案機械学習を用いた航空会社の業務支援システムの開発このユーザ
CLSmooth 2017/04/28
NLP

あとで読む
リンク
word2vec, fasttextの差と実践的な使い方 - にほんごのれんしゅう
word2vec, fasttextの差と実践的な使い方目次 Fasttextとword2vecの差を調査する実際にあそんでみよう Fasttext, word2vecで行っているディープラーニングでの応用例具体的な応用例として、単語のバズ検知を設計して、正しく動くことを確認したので、紹介する Appendix (発表用の資料も掲載いたします,小さくて見づらいので、直リンはこちら) 原理の表面的な説明 Skip gramではある特定の単語の前後の単語の出現確率を測定することでベクトル化する図1. ある目的の単語から、周辺の単語の確率を計算してベクトル化する Word2vecとfasttextではこれを実装したものただし、fasttextにはsubwordという仕組みが入っている図2. softmaxで共起確率を計算するあそんでみよう 2017年2～3月のTwitterのデータ
CLSmooth 2017/04/01
NLP

あとで読む

word2vec

fasttext
リンク
ニューラルネットワークの量子化についての最近の研究の進展と、その重要性 - SmartNews Engineering Blog
こんにちは、スマートニュースの徳永です。深層学習業界はGANだとか深層強化学習だとかで盛り上がっていますが、今日は淡々と、ニューラルネットワークの量子化の話をします。 TL;DR パラメータだけを量子化するのであれば、ほぼ精度を落とさずに、パラメータのデータ容量は1/16程度にまで削減できるパラメータ、アクティベーション、勾配のすべてを量子化し、推論だけでなく学習までもビット演算だけで実現する研究が進んできている現在は深層学習 = GPU必須というぐらいの勢いがあるけど、量子化の研究が進むと、今後はどうなるかわからないよはじめに情報理論における量子化とは、アナログな量を離散的な値で近似的に表現することを指しますが、本稿における量子化は厳密に言うとちょっと意味が違い、十分な（=32bitもしくは16bit）精度で表現されていた量を、ずっと少ないビット数で表現することを言います。ニュ
CLSmooth 2017/03/09
機械学習

研究

NLP

machinelearning

あとで読む
リンク
単純なキーワードマッチングを超えたWikiPediaの知識を利用した自然言語処理を行いたい方へ - Qiita
キーワードマッチングを超えた知識を利用する価値人間間の会話では"Twitter"や"Facebook"がSNSだなと分かって会話ができたり、"ヤマハ"と言われても前後の文脈で"ヤマハ"がバイクの"ヤマハ"かピアノの"ヤマハ"か分かります。これは単語の背景に関連する知識情報を利用できているからです。この単語を知識情報と繋げる手法として近年の自然言語処理ではエンティティリンキングという手法がよく用いられています。コードを使ってすぐに確認したい方は下記でインストールしてください。コード： https://github.com/SnowMasaya/WikiPedia_Entity_Vector_Get_Similarity_word 必要なデータ：分析したいデータ Wikificatation 日本語 Wikipedia エンティティベクトルユースケースこれを実際に使用する場合に
CLSmooth 2016/08/02
自然言語処理

あとで読む

NLP
リンク
新たなRNNと自然言語処理 - こんな夢を見た
先月のとある勉強会で使ったスライドを今更ながら貼ります。そこそこの「seq2seqやAttentionほどは脚光を浴びていない、RNNの基礎部分の改良や知見」を載せることを趣旨にしています。口頭のみでの説明も多かったり、読み込みが浅かったり、量重視だったりして、スライドの各説明は特に詳しくないです。まだまだ十分に検証されていないことや納得しきれない（論文著者の）言明も多々ありますので、読む際は、ふわふわと話半分に小耳に挟むくらいがちょうどいっか〜と思って読んでください。新たなRNNと自然言語処理 from hytae 需要と質はさておき英語版もあります。 Recent Progress in RNN and NLP from hytae
CLSmooth 2016/08/02
NLP

Deep Learning

あとで読む

自然言語処理

機械学習
リンク
Deep LearningとNLPの最新論文の情報を集める方法 - あおのたすのブログ
(5/29 追記：Deep Learning のGoogleグループコミュニティを追加) (6/8 追記：松尾研究室の勉強会ページを追加) (6/13 追記：neural language notesを追加) はじめまして。@aonotas（あおのたす）です。 Deep Learningと自然言語処理に興味があります。好きなフレームワークはChainerです。さて、Deep Learningが自然言語処理のタスクでも応用されています。 ACLやEM NLPなど国際会議でもタイトルに「Neural」が入ったものが多いですが、arxivにも査読前の論文がよくアップロードされています。（スピードが早くて追いつくの大変ですよねorz）そこで最新のDeep Learningの論文の集め方を紹介したいと思います。（あくまで私個人の方法です。皆さんどうしてるか教えてもらえると嬉しいです。）面白い
CLSmooth 2016/05/29
自然言語処理

NLP

論文

機械学習

あとで読む
リンク
Google、自然言語理解（NLU）の基礎となる「SyntaxNet」をオープンソース化
米Googleは5月12日（現地時間）、機械学習システム「TensorFlow」に統合されたニューラルネットワークフレームワーク「SyntaxNet」をオープンソースで公開したと発表した。GitHubで公開されている。自然言語理解（NLU）システムの基礎を提供するものという。SyntaxNetには、新たなモデルに学習させるのに必要なすべてのコードと、英語の文章の構文解析のためにGoogleが開発した英文解析ツールの「Parsey McParseface」が含まれる。 Parsey McParsefaceは、言語構造解析方法を学習する強力な機械学習アルゴリズム上に構築されており、文章内の各ワードの機能的役割（動詞、形容詞など）を解析できるという。Parsey McParsefaceは世界で最も正確な構文解析ツールだとGoogleは説明する。コンピュータにとって、人間の話す自然言語はあまり
CLSmooth 2016/05/14
Google

TensorFlow

NLP

あとで読む
リンク
日本語で読める自然言語処理のチュートリアルスライドまとめ
先日、自然言語処理の講演などをしていたときに、そもそも私なんかが話すよりも公開されているチュートリアルスライドを集めたほうが有用なんではないかと思い立って、これから自然言語処理を学びたい人や、ちょっと新しい分野を知りたい人向けに、日本語で読めるチュートリアルスライドを分野別にまとめてみました。主に、学会のチュートリアルや招待講演、それから研究者の方のWebページなどを参照しながら作りました。自然言語処理全般系の資料や、少し境界的なテーマは入っていません。また、ぱっと読めるスライドだけにしています。幾つか手前味噌な資料も載せてます・・。頑張って集めてみましたが、思ったほど集まりませんでした。作っていてわかったのですが、意外とスライドを公開している人は少ないようです。埋もれてしまうのはもったいないですね。いずれ、英語で読めるスライドを集めてみようと思います。そっちはそっちで、
CLSmooth 2015/09/22
NLP

あとで読む

自然言語処理

形態素解析
リンク
Chainerの使い方と自然言語処理への応用
第10回 NLP若手の会シンポジウム (YANS) のチュートリアルスライドです。ニューラルネットの（アルゴリズムとしての）おさらいと、Chainer v1.3.0の使い方を紹介しています。
CLSmooth 2015/09/22
deep learning

NLP

あとで読む
リンク
「統計学と機械学習の違い」はどう論じたら良いのか - 渋谷駅前で働くデータサイエンティストのブログ
何かこんなメディア記事が出ていたようです。これを読んで色々な人がツッコミを入れまくっている模様ですが、この記事の不思議なところは「完全に間違った説明というわけでもないのに何故か（両分野に詳しい）誰が読んでも猛烈な違和感を覚える」ところなんじゃないかなぁと。正直、これはライター・インタビュアー・コメンテーター・編集者の誰のせいなのかは全く分からないんですが、ツッコミ入れられまくっている内容について色々あげつらってもあまり建設的でないので、ここでは記事中で本題として取り上げられている「統計学と機械学習の違い」についてちょっとコメントしてみようと思います。あ、もちろん僕がこれから書くコメントも別に正しいとは全く限らないので、おかしいところや間違ってるところがあったらバンバン突っ込んでいただければ幸いです*1。そしてガチ勢向けのコメントでもないので何卒悪しからず。統計学はデータを「説明」す
CLSmooth 2015/09/20
NLP

機械学習

人工知能
リンク
ジャストシステムの形態素解析技術その2 機械学習編
書籍「Python FlaskによるWebアプリ開発入門物体検知アプリ&機械学習 APIの作り方」を通して伝えたいFlaskのプラクティス.pdf
CLSmooth 2015/08/10
自然言語処理

形態素解析

機械学習

あとで読む

NLP
リンク
ディープラーニングだけがAIじゃない。トピックモデルの第一人者に聞く機械学習の未来 | TheWave
ディープラーニングは、人間の脳の中のAI分野の若手経営者も注目するニューロンとシナプスの回路をコンピューターの電子回路で真似て、それを何層にも重ねた手法。この手法が思いの外、成果を上げているので、人工知能が急に進化し始めたことで注目が集まっている。英誌エコノミストも最近の号で人工知能を特集するなど、リクルートがAI研究所を開設するなど、ビジネスマンの間でも人工知能は今、ちょっとしたブームだ。しかしディープラーニングのように人間の脳を模倣しなくても、コンピューターを賢くさせる手法はほかにもある。例えば「トピックモデリング」。トピックモデリングは、多数の文書を読み込むことで傾向をつかみ、文書を幾つかのカテゴリーに自動分類する手法だ。このトピックモデリングも、近年急速に進歩してきているといわれる。トピックモデリングとはどんな技術なのか。最近ではどのような研究が最先端なのか。第一人者のコロンビア
CLSmooth 2015/05/26
AI

あとで読む

NLP

人工知能

機械学習

自然言語処理

LDA
リンク
CodeIQについてのお知らせ
2018年4月25日をもちまして、『CodeIQ』のプログラミング腕試しサービス、年収確約スカウトサービスは、 IT エンジニアのための年収確約スカウトサービス『moffers by CodeIQ』https://moffers.jp/ へ一本化いたしました。これまで多くのIT エンジニアの方に『CodeIQ』をご利用いただきまして、改めて心より深く御礼申し上げます。また、エンジニアのためのWebマガジン「CodeIQ MAGAZINE」は、リクナビNEXTジャーナル( https://next.rikunabi.com/journal/ )に一部の記事の移行を予定しております。今後は『moffers by CodeIQ』にて、 IT エンジニアの皆様のより良い転職をサポートするために、より一層努めてまいりますので、引き続きご愛顧のほど何卒よろしくお願い申し上げます。また、Cod
CLSmooth 2015/05/11
集合知

自然言語処理

あとで読む

NLP
リンク
ディープラーニングチュートリアル応用編
Transcript 1. 大規模データから単語の意味表現学習-word2vec ボレガラダヌシカ博士(情報理工学) 英国リバープール大学計算機科学科准教授 2. 2 2005 2008~10 学部修士博士助教/講師東京大学工学部東京大学大学院情報理工学系文書自動要約における重要文順序学習同姓同名抽出別名抽出属性類似性計測関係類似性計測評判分類の分野適応関係抽出の分野適応進化計算を用いたWeb 検索結果順序学習ソーシャルネットワークの関係予測対話型協調 Web検索エンジン潜在関係検索エンジン自己紹介専門分野：自然言語処理, 機械学習,データマイニング 2006~07 2010~13 2010~現在准教授リバープール大学深層学習 3. 今回の講演の背景 •深層学習に関する活動 •2014年9月に深層学習のチュートリアルをCyberAge
CLSmooth 2015/04/17
deep learning

NLP

あとで読む

word2vec
リンク
言語処理100本ノック 2015
言語処理100本ノックは，実践的な課題に取り組みながら，プログラミング，データ分析，研究のスキルを楽しく習得することを目指した問題集です実用的でワクワクするような題材を厳選しました言語処理に加えて，統計や機械学習などの周辺分野にも親しめます研究やデータ分析の進め方，作法，スキルを修得できます問題を解くのに必要なデータ・コーパスを配布しています言語はPythonを想定していますが，他の言語にも対応しています
CLSmooth 2015/03/13
python

機械学習

あとで読む

自然言語処理

NLP

データ
リンク
IntroNLP03 // Speaker Deck
NLP勉強会 #3 導入セッション資料（再）入門自然言語処理 #03 クラスタリング『言語処理のための機械学習入門』の3章を添えて
CLSmooth 2015/02/23
NLP

自然言語処理
リンク
はてなブックマークのトピックページの裏側 - Hatena Developer Blog
こんにちは、はてなアプリケーションエンジニアの id:skozawa です。現在は、ブックマークチーム、及び、プラットフォームチームで開発をしています。先日リリースされたはてなブックマークの新機能「トピック」の裏側について、Hatena Enginner Seminar #4で紹介しました。 Hatena Enginner Seminar #4で紹介した資料に少し加筆・修正を加えたものを公開します。内容「トピック」機能は、はてなブックマーク開発ブログにもある通り、これまで何人かのエンジニアが挑戦してきましたが、実現できていませんでした。その主な要因として、トピック生成の精度が低いトピックタイトル生成が難しいという問題があり、これらを検索技術と自然言語処理技術によって解決することによりベータリリースへとこぎつけました。トピック生成これまでキーワードなどを用いて記事をクラスタリ
CLSmooth 2015/02/13
自然言語処理

NLP

はてな

elasticsearch

あとで読む
リンク
言語処理学会第21回年次大会(NLP2015) プログラム
会場会場：京都大学吉田キャンパス所在地：〒606-8501 京都市左京区吉田本町アクセスは以下のHPをご覧下さい． http://www.kyoto-u.ac.jp/ja/access/campus/ 会場案内図（PDF) 無線インターネットアクセスについて無線LANは使用可能ですが，混雑のため繋がらない場合もあります．無線LANの利用には eduroam と MIAKO の二通りの方法があります．無線LANは各会場で利用することができます． [eduroam] eduroam（SSID:eduroam）による無線LANが利用可能です． eduroam アカウントをお持ちで無い方は，eduroam の臨時アカウントを発行いたしますので，無線LAN使用申請書に必要事項をご記入の上，受付にてお申込みください．eduroam 参加機関所属の方は予め所属機関でeduroam のアカウン
CLSmooth 2015/02/12
自然言語処理

NLP
リンク
オープンデータ連携へ用語共通化　「共通語彙基盤」プロジェクト:オープンデータ情報ポータル
2015/02/04 独立行政法人情報処理推進機構（IPA）は2月3日、オープンデータの連携促進を目的とした「共通語彙（い）基盤」プロジェクトの成果として、その中核となる語彙集の正式版を公開した。行政機関がデータを公開しても、その形式がまちまちだったり、同じ意味の用語が多数存在していては、複数データの横断的な利用や、ある地域で作成したアプリを他の地域でも使う、ということが難しい。そうした状況を打開するために、IPAは経済産業省とともにデータの構造やそこで使う用語を統一させる共通語彙基盤の整備を2013年から進めてきた。このほど正式版を公開したのは「コア語彙」と呼ばれる、行政事務に共通して使われる用語を構造化したもの。「人」「イベント」といった汎用性の高い48の「クラス用語」と、「氏名」「開催場所」といった具体的な情報を示す206の「プロパティ用語」から成る。今後はコア語彙に加え、交通
CLSmooth 2015/02/06
オープンデータ

NLP
リンク
1 2 3 次のページ