タグ

ブックマーク / www.yasuhisay.info (11)

  • ワークショップ「自然言語処理における企業と大学と学生の関係」 - yasuhisa's blog

    3部構成。自分としては最初のセッションが一番興味深かった。かなり極論が飛び交っていたし全体としての結論は出ていない(出す必要もないのだろうが)が、自分の中の結論としては「大学は基礎研究、企業は応用研究。ただし、(向かうベクトルこそ違うものの)それぞれが交流していく必要はあり。インターンとかはまさにそういうためにあるし、大学の人が企業にいる期間があってもいいし、その逆ももっとあってもいい」というもの。基礎研究のところもなかなか難しいのだが、自分の中では特に出口を考えるというのも重要だと思っている。Research that mattersってやつですね。もちろん自分の主軸は決める必要があると思うのだが、両方の立場を経験することでより見えてくる質があるのではないかと思うし、そういう理由で上のようなことを思ったのである。 残りの2つのセッションは正直な感想を書かせてもらうと学生にあまりにも優し

    ワークショップ「自然言語処理における企業と大学と学生の関係」 - yasuhisa's blog
    alfaladio
    alfaladio 2011/03/13
  • iGraphでTwitterのネットワークを表してみる - yasuhisa's blog

    今年の経営工学基礎演習ではRを使ったネットワークの可視化と分析をやっているということを聞きつけました。なんだか面白そうなので、僕もやってみることにしました。ただ、データを集めるのにみんな苦労しているようなので、僕はお手軽にTwitterのfollowersのつながりを見てみることにしました。Twitterのデータ200人分くらいをぶっこぬいてきたのですが、たくさんありすぎてよく分からなかったので50人分くらいにしときましたwww。 見づらかったり間違ってるっぽいところはあるんですが、今日はこんな感じで。plotにTkとかを使うと、見づらいところを動かしたりすることもできます。 コード コードは以下のとおり。01からなる隣接行列を作って、そこからグラフを生成しています。 #最初の行はperlで生成させといた users <- c("nipotan","uta","lurker_","tack

    iGraphでTwitterのネットワークを表してみる - yasuhisa's blog
  • 色々宣伝 - yasuhisa's blog

    回しものだったり、回しものではなかったり。 サマーブートキャンプ http://is-exam-www.naist.jp/blog/2010/06/2010_3.html サマーブートキャンプ2010 NAISTのサマーブートキャンプ。うちの自然言語処理講座は検索エンジン作りと、統計的機械翻訳システムの構築というどっちも面白そうなテーマであるようです。遠方の方もゲストハウスせんたんという、ほぼ学内にある施設に泊まれると思うので是非!! はてなインターン2010 はてなサマーインターン2010 去年の写真に自分が写っているのがうれしいですね。(おいしいランチとともに)一ヶ月開発に没頭するのも楽しいと思うので、是非!! 不自然言語処理 Baidu Japan タイトルを見て一瞬吹き出しそうになったのは私だけw?Webとか携帯の文字とかTwitterとか自然言語処理をやろうと思ったら、やっかいな

    色々宣伝 - yasuhisa's blog
    alfaladio
    alfaladio 2010/06/22
  • 指標を全部実装してみた - yasuhisa's blog

    この前の続き。先週の水曜で大体作ってしまっていたんだが、使い方ミスっててバグってると勘違いしていたorz。 出現頻度と連接頻度に基づく専門用語抽出 - Seeking for my unique color. とりあえずpneの1985年分のテキストをわせて、それぞれの指標で上位100個を出力させるとかそんな感じのプログラム。70ファイルくらいしかないですが、非常に遅いです。。。 今週の金曜には、これの評価をするプログラムを書いておきたい。次からは機械学習っぽいものを取り込んでいきたいんだけど、この指標を使ったやつをベースラインとしたいので、性能を知っておきたい。 プログラム # -*- coding: utf-8 -*- # implementation for this paper # http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/acade

    指標を全部実装してみた - yasuhisa's blog
    alfaladio
    alfaladio 2010/04/27
  • 自然言語処理の応用勉強会キックオフミーティング - yasuhisa's blog

    新しく今年できた勉強会(NLP.app)のキックオフミーティング。NLP.appは外部に公開して大丈夫と言われたのでなるべく書いていく方針で!!NLPのタスク的には 述語項構造解析(predicate-argument structure analysis) 意味役割付与(semantic role labeling) を主に扱うらしく、情報検索や情報抽出の論文紹介などもおkという感じらしい。勉強会が終わった後、M1の同期の人とかは「そもそもSRLとかって何??」という感じ(自分も2週間前にDMLAで分からなかったし)のようで、大分不安がっていたが、分からないなら質問しまくればいいよ!!と言ってみた。みんなどんぐりの背比べみたいなもんだし、きっとみんな分かってないから(自分を含め)。 この勉強会はそういう分野をターゲットにしつつ、特に大規模なWebデータを対象としたものに焦点が置かれている

    自然言語処理の応用勉強会キックオフミーティング - yasuhisa's blog
    alfaladio
    alfaladio 2010/04/27
  • ゼミで半教師あり学習のことを発表したのでスライドを公開します - yasuhisa's blog

    理解が不完全だし、ゼミで再生核ヒルベクト空間のことやってなかったから途中で混ざってたりとかで大分あれな資料になってますが、公開してみるテスト。 半教師あり学習 from syou6162 次回は何を発表するか。。。

    ゼミで半教師あり学習のことを発表したのでスライドを公開します - yasuhisa's blog
    alfaladio
    alfaladio 2010/01/27
  • 論文100本ノック始めます - yasuhisa's blog

    僕も就活の面接のときに「74論文読みました!」と言いたいので、というのは冗談で、せっかく新年になったので論文100ノックなるものを開始してみようかと思うわけです。 2010年12月31日に2010年に読んだ論文リストを書いておくと、はてダを開く度に今年読んだ論文リストを目に入れないといけないというライフ八苦になっております。 Seeking for my unique color.

    論文100本ノック始めます - yasuhisa's blog
    alfaladio
    alfaladio 2010/01/02
  • ollが凄い件について - yasuhisa's blog

    DBCLSのバイトでSVM-Light Support Vector Machineを使っていたんだけど、計算が一時間とかでは終わらなくなってきたので、気軽に実験できなくなってきていた。「この素性は効くのかなあ」とか出し入れして実験したい自分としては、気軽に実験できないのは致命的(少サンプルでやれ)。もう少し早くできるものはないかなーと思って、自分のブクマを漁っていたら、岡野原さんが作られたollがあった。 OLL は様々なオンライン学習をサポートした機械学習ライブラリであり、特に自然言語処理など、大規模、かつ疎な学習問題に最適化されています。これらのオンライン学習手法は速度面、作業領域面で非常に効率的(学習サンプル数、素性種類数に比例)でありながら、SVMsやMEsなどのバッチ学習と同程度の精度を達成します。 Google Code Archive - Long-term storage

    ollが凄い件について - yasuhisa's blog
    alfaladio
    alfaladio 2009/09/08
  • 写真で見てみるRubyKaigi - yasuhisa's blog

    とりあえずな感じで。参加されたみなさん、スタッフの皆さんお疲れ様でした!!

    写真で見てみるRubyKaigi - yasuhisa's blog
  • 特待生プロジェクト - yasuhisa's blog

    なんで、特待生? 研究室以外にも繋りを持つことができる NAISTでは、すぐに研究室所属というような流れなので、そのような繋りを持てることは大変魅力に感じる 横だけではなく、縦の繋りも持てる 自分は将来海外で活躍するような研究者、エンジニアになりたいと考えているが、海外研修や学会に見学に行くことができる 早いうちから世界のトップレベルがどのようなものかを実感できるのは非常に重要な体験であると思う そのような活動を支援してもらえるのは非常に魅力的 また、自分で計画したプロジェクトを成功させることができれば、自分に取って自信となると思うから やりたいプロジェクトについて教えて 自然言語処理に興味を持った人が、実際に手を動かして、理解していけるようなライブラリの作成 アルゴリズムやデータ構造が分かりやすいような形で提供することを目標にする チュートリアルのようなものも付属 自然言語処理に興味を持

    特待生プロジェクト - yasuhisa's blog
    alfaladio
    alfaladio 2009/07/12
  • 出現頻度と連接頻度に基づく専門用語抽出 - yasuhisa's blog

    この前の続き。先週の週末にやるつもりだったけど、暇がなかった。 MeCabで区切った単語を再びつなげる - yasuhisa's blog 前回の流れとしては 専門用語を一つの単語として取ってくるのは難しい MeCabを使うと細かくなりすぎる 専門用語には名詞のsequenceが多そう じゃあ、名詞つなげてみればいいんじゃね? ということで名詞を繋げてみるだけというところをやりました(それだけ。。。)。id:niamさんがコメントしてくださったように"出現頻度と連接頻度に基づく専門用語抽出",自然言語処理, 2003を使うと専門用語らしさ(?)のようなスコア付けができるようなので、それをやってみることにしました。とりあえずp6のLR(CN)のところまでを実装。あとはスコア付けの関数を2つくらい用意して、評価指標の関数を用意すれば、という感じです。 # -*- coding: utf-8 -

    出現頻度と連接頻度に基づく専門用語抽出 - yasuhisa's blog
    alfaladio
    alfaladio 2009/06/17
  • 1