サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
猫
nzw.hatenablog.jp
今年も研究業績が無な一年でした.そろそろちゃんとしたいです.どうしたらいいでしょうか. 月ごと 01月.学会の準備、DMM英会話を始めたけど全然わからなくてつらい気持ちになりました. 02月.WSDMワークショップに論文が通っていたので2度目の海外.イギリスまた行きたいです.詳細は過去記事をご覧ください. 03月.言語処理学会年次大会@つくばにスタッフとして参加.人足りなさそうだったから全日程入れたのが失敗でした. 04月.DC1の書類をかいたりKerasの翻訳を再開したり. 05月.DC1の書類をかいたりKerasの翻訳したり.スタバのコーヒーのグランデサイズ2杯とか飲んでたら体調壊しました.DC1についてはこちら 06月.ICLR読み会@DeNAで発表しました.知人が増えたのでよかったです.研究ネタがボツになって勉強になりました.インターンに2つ申し込みました. 07月.インターンに通
11月5日追記 最下部に追記しました. 前置き 2つの確率分布の違いを表す指標にKullback-Leiblerダイバージェンス(以下KLダイバージェンス)とJensen-Shannonダイバージェンス(以下JSダイバージェンス)があります. 詳しいことは 言語処理のための機械学習入門 (自然言語処理シリーズ) 作者: 高村大也,奥村学出版社/メーカー: コロナ社発売日: 2010/07/01メディア: 単行本購入: 13人 クリック: 235回この商品を含むブログ (42件) を見るの1.6を参考にしてください. 本にもありますが,これらの指標が"距離"といわれることがありますが,厳密な距離の定義を満たしていないので気をつけましょう*1. PythonからJSダイバージェンスを使う必要があり 「どうせ,scipyかnumpyかscikit-learnにあるっしょwwww」 とかいってたら
はじめに word2vecよりも性能が高いとかなんとか / “GloVe: Global Vectors for Word Representation” http://t.co/cZPAafJ6Zl #自然言語処理— ηozawa kento (@nozawa0301) June 4, 2015 word2vecというツールが,かなり流行りました. そのあといくつも単語の分散表現に関する論文もでてきています. 最近,目にした中で,word2vecよりも性能がよいらしいGloVeが気になったので,簡単に触ってみました.nlp.stanford.edu 論文はこちら http://nlp.stanford.edu/projects/glove/glove.pdf 英語が拙いため,論文自体は理解できていませんが, word2vecと比べて,コーパス全体の情報もうまく使って学習してやろうというの
忘年会シーズンですが,2015年忘れたくないので振り返りをします. 月ごとに振り返り 1月 12月に研究室に配属されて年明け ずっと研究室にはいったら輪講をしたいと思っていたので,名著「言語処理のための機械学習入門」を週1章ペースで読んでた. ダーツを買った(あんまりやってない) 2月 DocomoのAPI使ったコンテストに研究室の同期4名と出ました. 開発期間は数ヶ月間設定されていたが,締め切りの前日から24hで開発. Newsを🍣に見たてて回すアンドロイドアプリをつくった. あとは,筑波大学図書館の新着図書が欲しかったのでクローラ書いてWebアプリをつくった. 春休み期間になったので,輪講がストップしたのでLDA関係の論文を読んだ. なんか後半からやる気が無くなって鬱々としていた. 3月 今年が割とうまく行った理由がここにあるような気がしている. 上旬にCookpadと日経電子版のハ
注意 深層学習じゃありません. はじめに 私はPではないので知りませんでしたが,今日は「アイドルマスターシンデレラガールズ」の城ヶ崎美嘉(CV:佳村はるか)の誕生日です.twitter.com おめでとうございます! ちなみに佳村はるかさんといえば「SHIROBAKO」の安原絵麻を演じていたのが記憶に新しいです*1. ちょうどよい機会なので,先日 Amazon.co.jp: 深層学習 (機械学習プロフェッショナルシリーズ): 岡谷 貴之: 本 の4章誤差逆伝播法を読んで実装した多層パーセプトロンを試しましょう. 数式については鴨川ηをご覧ください. 今回のタスクは以下のとおり セリフが城ヶ崎美嘉か城ヶ崎美嘉じゃないかを判別したい 本題 タスク自体はシンプルです*2. データ 肝心のセリフデータですが,Wikiのまとめにあったセリフをスクレイピングして使っています.1.5時間位でデータを作り
雑にですが,知ってるサイトやチュートリアルをまとめたくなったのでまとめてみました.夏ですし. 適宜更新しています. 最終更新 2018年02月03日 チュートリアル 言語処理100本ノック 言語処理100本ノック 2015 東工大の岡崎先生が作られたチュートリアルです. 他大学の研究室でも利用されています. 簡単な内容からはじまるので,プログラミングの導入としてもいいと思います. NLPプログラミングチュートリアル Graham Neubig's Teaching Carnegie Mellon UniversityのGraham Neubig先生のチュートリアルです. Githubにサンプルコードが公開されています. 各チュートリアルにはテストがついているので,実装が正しいかを確かめることができます. 扱っているトピックが広いので,かなり勉強になると思います. ソフト 形態素解析器 日本
はじめに 私的にNDLの全国書誌データのデータをRubyで集めてmongoDBに格納しています. 先日,mongoのgemをupdateしたら動かなくなったので,対処法を書きます. 環境 OS:centos mongo:2.6.9 gem mongo:2.0.3 本題 gemを1系のmongoから2.0.3にupdateしたら `<main>': uninitialized constant Mongo::Connection (NameError) のエラーが出ました. プログラムが機能していたときは, connection = Mongo::Connection.new() db = connection.db('ndl') coll = db.collection('hogehoge') で接続できました. 古いバージョンを使い続けるのも気がひけるので,新しいversionのmoog
2015-05-23 計量書誌学(図書館情報学)の指標をDMM.R18で試してみる Graph julia Ruby プログラミング 図書館 注意 当該記事は,DMM.R18に含まれるコンテンツに関して言及した記事です. そのような記事や表現が苦手な方は,お手数ですが,お戻りいただけると,良いかと思います. はじめに 講義で,計量書誌学を受講しています. その中で研究活動に関する指標をいくつか学んだ*1ので,DMM.R18を例にとって紹介します.計量書誌学とは 計量書誌学 - Wikipedia ざっくりいうと図書や雑誌,論文などの資料のデータを扱う学問です. 対象データ 本記事では,2015年5月22日22:00にDMMのアフィリエイトAPIから 2015年に配信が始まったコンテンツ ビデオコンテンツ(素人,アニメ,映画を含まないもの) を満たす10,242件のうち,DMM.R1
2015年5月8日に追記しました. はじめに 先日NDLで新しいデータとして図書館及び関連組織のための国際標準識別子(ISIL)が公開されました. オープンデータセット | 国立国会図書館-National Diet Library RDF形式のデータで馴染みがなかったので,簡単に触ってみました.*1 環境 Ruby:2.2.0p0 gem:linkeddata OS:yosemite RDF形式のファイルを扱うためには今回はlinkeddataというgemを使いました. RDF以外の形式のデータも扱うことができるGemです. $ gem isntall linkeddata データ NDLのサイトから公共図書館のデータをダウンロードすると isilpublic.rdf というデータがあるかと思います. このデータから図書館名,経度,緯度を取り出してみます. 1館分のデータは,以下のように
2015-04-05 知人に相談されたことをいかにして解くか(AV女優編) Ruby プログラミング Graph はじめに この記事にはAV女優に関する言及がいくつかあります. 苦手な方はスクロールせずに戻っていただけると幸いです. とある知り合い(以下Aさん)に深刻な面持ちでこのような相談を受けました. 「有村千佳っていう好きなAV女優が5月で引退してすごい困るんだけど,似てる女優調べるのが億劫なんだよね.どうにかならないかなぁ???」 これに対する私がとった簡易的な解決策をまとめました. 使用するデータについて ほとんどのAV女優の作品はDMM.R18にあります.(おそらく) DMM.R18の動画ページには,女優名や監督名などの他にもジャンルというフィールドがあり,いくつかのタグが付与されています.なので,女優名とジャンルのタグを今回は使用します. 直近1000件の動画ペ
追記(2015年3月9日03:15) こういう機会はあまりまだ多くないので,なんで楽しかったのか,何がよかったのかについて(主に環境)少し書こうかと思いました.本文下に追加しました. めっちゃ楽しかったし,こういうのが増えてほしい!!!!!111 前置き あくまで私個人が参加した感想です,あしからず. はじめに 3月7日に日経新聞社とクックパッド社で共同開催されたデータハッカソンに参加しました. 概要は以下のリンクから 参加したハッカソンはこれで2回目になりました. この日限定で公開されるデータなどを元にしてデータ解析を行いました. (参加した目的はこれです,データ大好き) (もちろんイベント後削除しました) 使ったもの Ruby(データ抽出など) word2vec Java(形態素解析kuromoji) 内容 今までのハッカソンと違ってプロダクトを作らなくてもアプローチや解析した結果で評
このページを最初にブックマークしてみませんか?
『nzw.hatenablog.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く