[B! NLP] skozawaのブックマーク

言語処理学会第24回年次大会(NLP2018)に参加 & 論文賞受賞しました - Gunosyデータ分析ブログ

はじめまして、データ分析部の小澤（id:skozawa）です。 3月12日(月)〜3月16日(金)に開催された言語処理学会第24回年次大会(NLP2018) @岡山コンベンションセンターに、Gunosyから、関、久保、茂木、桾澤（インターン生）、小澤の5名で参加しました。スポンサー発表今回、Gunosyはゴールドスポンサーとして参加し、スポンサーブースでは、Gunosyにおける自然言語処理や機械学習を活用した取り組みについて、ポスター発表しました。具体的には、以下のような発表をしました。記事・動画閲覧ログを利用したニュース・動画配信の最適化記事・動画閲覧ログを利用した広告配信の最適化クリックベイトの分析クリックされやすいがユーザの満足度を伴わないコンテンツの調査・定量化 DEIM 2018でも発表（タイトルと画像が一致しないニュース記事によるクリックベイトの文析, 関, D

skozawa 2018/03/27

gunosy
NLP

リンク

サブカルのためのword2vec | BLOG - DeNA Engineering

はじめに AIシステム部AI研究開発グループアルバイトの五十嵐です。（ @bonprosoft, ポートフォリオ：http://vbcpp.net/about/ ）現在、東北大学大学院の修士1年で、大学院では（自然言語ではなく）高速な文字列処理アルゴリズムに関する研究を行っています。私は2017年9月上旬から3週間ほど、アルバイト兼インターンとしてハッカドールチーム内のNLPのタスクに取り組んでいました。その後はアルバイトとして、期間中にできなかった追加実験と実際の製品への適用に取り組んでいます。取り組んだタスク突然ですが、みなさま、ハッカドールはインストールされていますか？ハッカドールは、主にサブカルチャーに関する記事に特化した、ニュースアプリケーションです。アプリケーション内のユーザーのクリックや「ホシイ/イラナイ」などのアクションを通して、ハッカドールがユーザーの好み

skozawa 2018/01/13

NLP

リンク

Char2Vec で文字の特性について調べてみた - mixi engineer blog

ミクシィ Vantage スタジオのAI・ロボットチームで自然言語処理関連の研究開発に関わっている原（@toohsk）です． Vantage スタジオでは人の感情に寄り添った会話ができるAIの研究開発を通じて，新しいコミュニケーションサービスを生み出そうとしています．今回， Char2Vec を用いた，文字毎の特性について実験を行いましたので，紹介したいと思います． Word2Vec とは Word2Vec は単語をベクトル表現に変換する方法です．これまでは自然言語処理の分野では単語を扱う場合， one-hot の形式で文章内の単語を表現することが多かったです．しかし，自然言語を機械学習で扱う場合や論文では，最近では必ずといっていいほど Embedding された状態，すなわち単語をベクトルに変換してから機械学習のアルゴリズムに与えています．ではなぜ one-hot の形式ではなく

skozawa 2017/10/13

nlp

リンク

ACL2017 の論文たちを一言でまとめてみた | CyberAgent Developers Blog

neural が約1.7倍増えていて、ニューラルモデルを利用した研究が前年よりも多いことがわかります。また、generation, extraction, prediction, framework, end-to-end などの単語が増えているので、基礎研究というよりも言語処理タスクをニューラルモデルで解決する応用研究な論文が増えているようです。たしかに、データセットやベンチマークが用意されている既存タスクに、ニューラルモデルを適用し既存手法よりも高い精度を実現していたものが多かったように感じました。さらに、knowledge, attention, discourse などの単語が出現する論文では、知識ベースやアテンションモデルをどう対話システムに利用するかというものが多く、今とてもアツい領域なのだとわかります。もちろん、上記には顕著に現れた傾向のみ挙げていますが、それ以外にも幅

skozawa 2017/08/23

acl
NLP

リンク

Deep Learning for NLP Best Practices

Deep Learning for NLP Best Practices Neural networks are widely used in NLP, but many details such as task or domain-specific considerations are left to the practitioner. This post collects best practices that are relevant for most tasks in NLP. This post gives an overview of best practices relevant for most tasks in natural language processing. Update July 26, 2017: For additional context, the Ha

skozawa 2017/07/28

リンク

クックパッドとエンコーダ・デコーダ/cookpad-and-encoder-decoder

JavaScript: Past, Present, and Future - NDC Porto 2020

skozawa 2017/07/19

cookpad
nlp

リンク

Gunosy における AWS 上での自然言語処理・機械学習の活用事例: AWS Summit dev day 2017 - Gunosyデータ分析ブログ

はじめにこんにちは。Gunosyデータ分析部の大曽根(@dr_paradi) です。最近はJOHN TROPEA BAND featuring STEVE GADD etcのライブを観に行きました。業務では主にニュースパスのユーザ行動分析、記事配信アルゴリズム開発全般を担当しています。先日開催されました、AWS Dev Day Tokyo 2017において、「Gunosy における AWS 上での自然言語処理・機械学習の活用事例」というタイトルで発表してきましたので、その内容について簡単ですが書きたいと思います。はじめに発表内容記事分類属性推定 + スコアリング属性推定スコアリング効果測定 (ABテスト) おわりに発表内容私が発表した内容は下記のスライドにまとまっています。弊社が提供するサービスのニュースドメインのもの(グノシー、ニュースパス)における処理の流れを大

skozawa 2017/07/06

gunosy
nlp

リンク

自然言語処理における前処理の種類とその威力 - Qiita

自然言語処理に前処理は不可欠です。テキストは文字の羅列であり構造化されていないため、そのままでは処理するのが難しいです。特にWebテキストの中には HTMLタグや JavaScript のコードといったノイズが含まれています。このようなノイズは前処理して取り除かなければ期待する結果は得られないでしょう。出典: Deep learning for computational biology 本記事では自然言語処理における前処理の種類とその威力について説明します。説明順序としては、はじめに前処理の種類を説明します。各前処理については、1.どんな処理なのか、2.なぜその処理をするのか、3.実装方法(なるべく) という観点から説明します。種類について説明した後、前処理の威力を測るために前処理をした場合としなかった場合での文書分類の結果を比較します。前処理の種類と実装この節では以下に示す5つ

skozawa 2017/04/18

nlp

リンク

Sentencepiece : ニューラル言語処理向けトークナイザ - Qiita

少し時間が経ってしまいましたが、Sentencepiceというニューラル言語処理向けのトークナイザ・脱トークナイザを公開しました。MeCabやKyTeaといった単語分割ソフトウエアとは趣旨や目的が異なるソフトウェアですので、少し丁寧にSentencepieceの背景、応用、実験結果等をお話したいと思います。サブワードニューラル言語処理の中心となる要素技術にLSTM (RNN)があります。テキスト(トークン列)を低次元のベクトルに符号化したり、ベクトルからテキストを復号化したり、その応用範囲は多岐にわたります。ニューラル機械翻訳 (NMT) は、LSTMによる符号化・復号化を組み合わせて翻訳を行います。 ↓↓↓↓↓↓↓ あなたの記事の内容 NMTのアーキテクチャは従来法と大きく異なりますが、入出力はこれまでと同様、なにかしらのトークン列です。どのような列でもよいのですが、慣習的に単語列が

skozawa 2017/04/07

NLP

リンク

word2vec, fasttextの差と実践的な使い方 - にほんごのれんしゅう

word2vec, fasttextの差と実践的な使い方目次 Fasttextとword2vecの差を調査する実際にあそんでみよう Fasttext, word2vecで行っているディープラーニングでの応用例具体的な応用例として、単語のバズ検知を設計して、正しく動くことを確認したので、紹介する Appendix (発表用の資料も掲載いたします,小さくて見づらいので、直リンはこちら) 原理の表面的な説明 Skip gramではある特定の単語の前後の単語の出現確率を測定することでベクトル化する図1. ある目的の単語から、周辺の単語の確率を計算してベクトル化する Word2vecとfasttextではこれを実装したものただし、fasttextにはsubwordという仕組みが入っている図2. softmaxで共起確率を計算するあそんでみよう 2017年2～3月のTwitterのデータ

skozawa 2017/04/03

NLP

リンク

RNNで「てにをは」を校正する - にほんごのれんしゅう

RNNで「てにをは」を校正する余談 2017/3/19に、どの深層学習フレームワークがこれから深層学習を始める人におすすめなのかというアンケートをtwitterで取らせていただきました。五位 Theano(個別カウント) はじめに RNNによる文章校正がリクルートによって提案されて以来、調査タスクとして私のものとに来たりして、「できるんでしょう？」とか軽く言われるけど、実際には簡単にはできません。 RNNによる文章生成ができるから、校正もできるというのが人間の自然な発想なのかもしれませんが、英語と日本語の違いに着目した場合、英語がアルファベットのみで構築されるのに比べて日本語は、漢字・ひらがな・カタカナと非常に多く、同じように問題を適応すると、すごい高次元の問題を解くこととなり、理想的なパフォーマンスになかなかなりません。まぁ、あんまり完成してるわけでない技術を完成したようにプレスリ

skozawa 2017/03/21

nlp

リンク

「統計数理」第64巻目次

[ 第1号 | 第2号 ] 第64巻第1号統合PDFをダウンロード特集「生態学における統計モデリング」「特集生態学における統計モデリング」について ..........久保拓弥 (64, 1-2) 全文pdf 動的サイト占有モデル ―状態の不確実性を考慮したサイト占有動態の統計的推測 ..........深谷肇一 (64, 3-22) 要旨全文pdf 多変量状態空間モデルを用いたリター分解実験のためのパラメータ推定 ..........仁科一哉 (64, 23-38) 要旨全文pdf 水産資源学における統計モデリング ..........岡村寛、市野川桃子 (64, 39-57) 要旨全文pdf 一般化状態空間モデルで漁業動態を記述する ―マサバ努力量管理効果の定量評価 ..........市野川桃子、岡村寛 (64, 59-75) 要旨全文pdf 安定同位

skozawa 2017/03/06

統計
nlp

リンク

TechCrunch

Reliance is nearing a deal to acquire Disney’s India business, according to a report, as Mukesh Ambani’s oil-to-telecom empire eyes broadening digital and television assets. Disney values Dating app users will often sit with friends as they swipe through their matches in order to gain feedback, or even hand over their phone and let their friends swipe for them. Now, that real-life expe

skozawa 2017/02/27

NLP

リンク

深層学習による自然言語処理 - RNN, LSTM, ニューラル機械翻訳の理論

本稿ではニューラルネットワーク，誤差逆伝播法，言語モデル，RNN，LSTM，ニューラル機械翻訳の一連の手法について数理的に解説する．前編の目次ニューラルネットワーク順伝播 (Forwardpropagation) 逆伝播 (Backpropagation) リカレントニューラルネットワーク (RNN) Recurrent Neural Network Language Model (RNNLM) Backpropagation Through Time (BPTT) Long Short-Term Memory (LSTM) Gated Recurrent Unit (GRU) RNN のドロップアウトとバッチ正規化ニューラル機械翻訳 (NMT) Sequence to Sequence (seq2seq) 注意 (Attention) 双方向エンコーダー・多層LSTM 評価手法

skozawa 2017/02/17

nlp

リンク

ML-Askでテキストの感情分析 - Qiita

ちゃお……† 今回は感情分析ライブラリML-Askについて紹介します。 ML-Askができること感情の推定 2,100語の辞書によるパターンマッチングで{喜, 怒, 哀, 怖, 恥, 好, 厭, 昂, 安, 驚}の10種類の感情を推定します。この2,100語は、感情表現辞典に基づいているそうです。感情の強さ間投詞、擬態語、がさつな言葉、顔文字、「！」や「？」の数で感情の強さを推定します。ネガポジ分類推定された感情から文を{ネガティブ、ポジティブ、ニュートラル}の３種類に分類します。文脈の考慮 Contextual Valence Shifters (CVS) という概念に基づいて, 文脈を考慮した感情推定を行います. たとえば, 「好きとは言えない」という文の場合、「好き」が否定されているので、「好き」の逆の感情である「厭」だと推定します。活性的かどうか推定された感情を元に

skozawa 2017/02/12

nlp

リンク

カジュアルトーク Vol.20 NLP×CNNの実現性は？〜自然言語処理の最先端はココまで来ている！〜 | AI専門ニュースメディア AINOW

最終更新日： 2017年7月3日こんばんは！AINOW編集長のかめきちです。先週開催された、全脳アーキテクチャ若手の会主催によるカジュアルトーク Vol20の模様をお届けしたいと思います。今回のテーマは「自然言語処理」。日本のAI界における永遠のテーマでしょうか… 難易度の高いこの分野の最新研究を聞くことが出来ましたので、まとめていきます。・イベントの詳細はコチラ https://wbawakate.connpass.com/event/48610/presentation/

skozawa 2017/02/09

リンク

全脳アーキテクチャ若手の会20170131

NIPS2013読み会: Distributed Representations of Words and Phrases and their Compo...Yuya Unno

skozawa 2017/02/03

NLP

リンク

Convolutional Neural Netwoks で自然言語処理をする

This document summarizes recent research on applying self-attention mechanisms from Transf ormers to domains other than language, such as computer vision. It discusses models that use self-attention for images, including ViT, DeiT, and T2T, which apply Transf ormers to divided image patches. It also covers more general attention modules like the Perceiver that aims to be domain-agnostic. Finally, it

skozawa 2017/02/03

NLP
CNN

リンク

yvespeirsman.be

This domain may be for sale!

skozawa 2017/01/30

リンク

CNNを利用した自然言語処理技術まとめ（2017年1月） - 終末 A.I.

年末に Language Modeling with Gated Convolutional Networks が一部界隈でバズったこともあり、CNNを用いた自然言語処理が注目を集め始めています。今年の後半あたりには、派生手法や関連手法が多く登場していくのではないかと思われます。 CNNはRNNに比べて並列処理に優れているため、処理速度が圧倒的に速いという利点がありますが、時系列データの処理に特化したRNNと比べると、特に言語モデルにおいては最終性能がやや劣っているという理解が一般的でした（テキストクラシフィケーションではタスクによってはCNNのほうが性能がいいものもありました）。 Gated Convolutional Networks では、Gated Linear Unit および Residual 層を利用し学習を効率化することにより、WikiText-103 のタスクで stat

skozawa 2017/01/24

リンク

はてなブックマーク

タグ

関連タグで絞り込む (91)

NLPに関するskozawaのブックマーク (157)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス