タグ

ブックマーク / komachi.hatenablog.com (8)

  • 行列とニューラルネットが手をつなぐ - 武蔵野日記

    昨晩から体調がまた悪化したが、情報理論の中間試験を準備しないといけないので、午前5時に起床して作業。しかしいろいろあって一時危ういことに。普段出席を必須としていないので、中間試験の日だけ来る学生もいるし、体調が悪いから、と延期できないため、相当焦る(試験問題を作るのも採点するのも大変だということ、理解していただきたい)。1学期に2回もそういう日があるとしんどいので、期末試験一発にしたほうが自分は楽だなぁ。学生はどっちが楽なのか分からないが……。 午前中、なんとか大学に来て無事中間試験を実施する(中間試験とはいえ、前半の45分は普通の授業)。 そういえば、夏のITエンジニアインターンの情報が集まる魔法のスプレッドシートに、インターンシップの内容や期間、報酬がまとまっているので、学部生たちに授業で紹介している。最近はインターンシップのでも待遇がかなりよいので、下手に夏休みを過ごすなら、こういう

    行列とニューラルネットが手をつなぐ - 武蔵野日記
    fuba
    fuba 2015/06/13
    “word2vec は shifted PMI(自己相互情報量)を求めているのと同じ、という話を聞いて、あー、だからかな、と思ったことがある”
  • 年俸が700万の准教授 - 武蔵野日記

    今朝は娘の予防接種。肺炎球菌とHibウイルス、そして四種混合である。この予防接種、同時に打てる数が決まっていたり、何日以内には打ってはいけないという制約があったりするので、スケジュールを自動で決めてくれるウェブサービスがあるのだが、裏では制約付き最適化問題(整数線形計画問題)を解いているのかと思うとワクワクする。このワクチンとこのワクチンを同時に打ちたい、などという制約をいろいろ入れても、一瞬で解を返してくれるのだが、これくらいの規模なら特別なことをしなくても解けるのだろうか。 で、予防接種の予約はが入れてくれていたので、行くだけかと思って娘を連れて(雨が降っていたので、抱っこひもで傘をさして)かかりつけの病院に行ったところ、(家にある)問診票を記入しないといけなかったらしい……。「お母さんは家にいるんですよね?持ってきてもらえます?」と言われたが、は土曜日には仕事なので、自分が取りに

    年俸が700万の准教授 - 武蔵野日記
    fuba
    fuba 2015/05/13
  • 取り方を知っても取れない博士号 - 武蔵野日記

    朝には歩けるくらいに回復したのだが、しばらく身体を起こしていると頭痛がする程度には病み上がりなので、職場に電話して有給休暇を使う。在宅で仕事をしようかと思ったのだが、仕事ができるような体調でもなかった……。 娘も今日から保育園に行ってよいと言われていたのだが、まだ動作が緩慢だし、下痢も治っていないので、家で過ごすことになる。親子仲良く家でまったりと過ごす。 そういえば先日「博士号の取り方」を読んだ。[twitter:@ceekz] さんが何回か取り上げていたので興味を持ったのである。 博士号のとり方 学生と指導教官のための実践ハンドブック 作者: エステール M フィリップス,デレック S ピュー,角谷快彦出版社/メーカー: 出版サポート大樹舎発売日: 2010/01/25メディア: 単行(ソフトカバー)購入: 7人 クリック: 42回この商品を含むブログ (9件) を見るタイトルからは

    取り方を知っても取れない博士号 - 武蔵野日記
    fuba
    fuba 2015/03/30
  • 全てプログラミングで解決しなければならないという思い込みを捨てる - 武蔵野日記

    2時間しか眠れなかったが、なんとか起きて出勤。朝はアルゴリズム演習の授業。先日台風で休講になった日の補講なのだが、3限以降は休講にならなかったので、1-2限だけの補講のはずなのに、1限の授業が休講だったので、実質自分の授業のためだけに学校に来ている人がほとんどだったらしい……(出席しなくてよいし、課題を出すだけでもよいと伝えていたところ、1/3の学生が出席。) 今年度の講義はこれで全部終了。来年は今年度やる予定でウォーミングアップに3回かかってしまったためにできなかったデータ構造と、ソートアルゴリズムをカバーしたいところである。 お昼は学内のお仕事に関係する説明会。どういう分担か事前に知らされていなかったのだが、1時間半あった説明のうち、自分に関するところは1分くらいで、残りは全部自分に関係ないところだった。説明会のあと、コース内の先生方に自分がやる予定の仕事がどういうものか教えていただい

    全てプログラミングで解決しなければならないという思い込みを捨てる - 武蔵野日記
    fuba
    fuba 2013/12/29
  • 人間の欲望に忠実なコーパスを見る - 武蔵野日記

    朝から涼しくて気持ちいい。ようやく秋かなぁ。 読書の秋、ということで、先日仙台で購入した「性欲の科学」をようやく読了。 性欲の科学 なぜ男は「素人」に興奮し、女は「男同士」に萌えるのか 作者: オギ・オーガス,サイ・ガダム,坂東智子出版社/メーカー: CCCメディアハウス発売日: 2012/02/10メディア: 単行購入: 2人 クリック: 81回この商品を含むブログ (22件) を見るサブカルチャーとか生物学とかそういうのを期待している人にはあまりおもしろくないかもしれないが、ウェブ (検索) 業界の人は読んでおいて損はない内容。というのも、著者の2人は機械学習・データマイニングの専門家であり、検索エンジンのウェブ検索クエリログやテキストのNグラム頻度から、インターネット上のアダルト情報の分析と性に関する分析を、詳細に行った大著だからである。注釈を辿ると、テキストデータや画像データの

    人間の欲望に忠実なコーパスを見る - 武蔵野日記
    fuba
    fuba 2012/09/13
  • 統計的機械翻訳は用例翻訳に段々近づいている - 武蔵野日記

    今日は機械翻訳勉強会で Michel Galley and Christopher D. Manning. Accurate Non-Hierarchical Phrase-Based Translation. NAACL 2010. Daniel Cer; Michel Galley; Daniel Jurafsky; Christopher D. Manning. Phrasal: A Statistical Machine Translation Toolkit for Exploring New Model Features. NAACL 2010. の2を紹介。簡単に言うと、これまでのフレーズベースの統計翻訳(研究・商用ともにフレーズベースのものが一番よく使われている)は、連続する単語しか扱えないという問題点があったが、研究では原言語側と目的言語側の両方にギャップがあるような

    統計的機械翻訳は用例翻訳に段々近づいている - 武蔵野日記
  • これからの10年は統計的機械翻訳が発展していく過渡期 - 武蔵野日記

    この日記の読者さんから、「ソフトウェアのマニュアルの翻訳を仕事としてやっていますが、今度こそ機械翻訳が技術翻訳の世界でも使われると思うので、勉強会を開きたい」ということでメールをいただき、それならこんな感じでやってみては、というアドバイスをしたりなどしているうちに、それなら統計的機械翻訳について1回お話しましょうか、ということで、「第2回統計的機械翻訳研究会」なるものにお呼ばれしてお話してきた。参加者は技術翻訳のプロの方々8名ほど。みなさん先進的な方々で、機械翻訳は毛嫌いするというわけではなく、使えるものがあったらぜひ使いたい、そのために統計翻訳がどういうものか勉強したい、という熱心な方々だったので、2時間の予定が2.5時間話してまだ話が尽きず、懇親会でも2時間くらいお話ししたりして(機械翻訳の問題点や技術翻訳でここが困っているなんていうことについて)、こちらがむしろ恐縮したり。 特に懇親

    これからの10年は統計的機械翻訳が発展していく過渡期 - 武蔵野日記
    fuba
    fuba 2010/03/31
  • 大規模データ処理のための行列の低ランク近似 -- SVD から用例ベースの行列分解まで -- - 武蔵野日記

    id:naoya さんのLatent Semantic Indexing の記事に触発されて、ここ1週間ほどちょくちょく見ている行列の近似計算手法について書いてみる。ここでやりたいのは単語-文書行列(どの単語がどの文書に出てきたかの共起行列)や購入者-アイテム行列(どの人がどのを買ったかとか、推薦エンジンで使う行列)、ページ-リンク行列(どのページからどのページにリンクが出ているか、もしくはリンクをもらっているか。PageRank などページのランキングの計算に使う)、といったような行列を計算するとき、大規模行列だと計算量・記憶スペースともに膨大なので、事前にある程度計算しておけるのであれば、できるだけ小さくしておきたい(そして可能ならば精度も上げたい)、という手法である。 行列の圧縮には元の行列を A (m行n列)とすると A = USV^T というように3つに分解することが多いが、も

    大規模データ処理のための行列の低ランク近似 -- SVD から用例ベースの行列分解まで -- - 武蔵野日記
  • 1