タグ

ブックマーク / komachi.hatenablog.com (22)

  • いくら相手のためだと思っていても、押し付けてはいけない - 武蔵野日記

    午前中、大阪大学の留学生センターで日語を教えてらっしゃる先生が、研究で使う茶筌のインストールを手伝ってほしい、というので masakazu-i くんとお手伝い。 実はこちらの先生がマシンを買い替える (OS をアップグレードする) 度に「ChaSen が動かなくなりました、助けてください」と連絡があってお手伝いしているのだが、前回も MeCab を入れようとして「MeCab と ChaSen では出力形式が違うので困るのです」と結局 ChaSen を入れることになった、という経緯があったため、今回も ChaSen かなぁ、と腹をくくっていた。 MeCab に詳しい人は「あれ、mecab には出力形式で -Ochasen とすれば chasen 形式にできるんじゃないの?」と思うかもしれないが、先方が使っていた Excel マクロで利用する形式と微妙に出力形式が違うので、mecabrc を

    いくら相手のためだと思っていても、押し付けてはいけない - 武蔵野日記
  • 勉強会を立ち上げる勉強会を立ち上げる - 武蔵野日記

    情報通信特別講義の2日目。例によって詳しい内容は首都大情報通信特別講義2014まとめとうちの研究室 B4 の [twitter:@Ace12358] くんが書いてくれた 企業の方々の招待講演を聞いてきた(2日目)を参照されたい(あまり関係ないが、彼にはまとめブログを書く才能があると思う)。 今日は [twitter:@unnonouno] さんと [twitter:@hitoshi_ni] さんと [twitter:@overlast] さんの発表。朝に資料を印刷していこうと日野キャンパスに寄ったのだが(こういうところが南大沢がアウェイである悲しさ)、プリンタの調子が悪く全然刷れなかった。南大沢でプリンタを使う方法を調べた方がいいのかもしれない。あるいは、秘書さんがいてくれたら、事前に頼めるものは頼んで印刷しておいてもらうのだが……。 @unnonouno さんの話はかなり B1 の人たち

    勉強会を立ち上げる勉強会を立ち上げる - 武蔵野日記
  • Apple や Google でインターンシップをしたいなら、パッチを書きなさい - 武蔵野日記

    [twitter:@teenst] くんのTwitter経由で私がアップル社のインターンシップをTwitterで募集することになった経緯と結果を読む。たぶん日の大学生はApple (に限らずアメリカの大企業で求められている能力) を知らないので、「チャンスがあるなら挑戦したい!」と思うのかもしれないが、ほとんどの人の場合、応募以前の問題であることが多いのではなかろうか。たぶん日的感覚では、勉強のためにインターンシップに行きたい、というのだろうが、少なくともなにがしかの仕事ができる人でないと難しいのである。 Appleでのインターンシップについてはこちらの記事にも反応したことがあるのだが、コードを書ける人に言いたいのは、日常的に英語を使いましょうということ、逆に英語にはそんなに問題がないなら、開発しましょうということ。恐らく何らかの世界的なオープンソース開発コミュニティに2年以上継続して

    Apple や Google でインターンシップをしたいなら、パッチを書きなさい - 武蔵野日記
    nhayato
    nhayato 2014/08/01
  • クリックスルーログの論文に関する問い合わせ - 武蔵野日記

    来週火曜日の午前中だけ Yahoo! Labs に遊びに行くつもりなのだが、今年 Yahoo! Labs の研究者の人たちはクリックスルーやクエリのログを使った研究を立て続けに発表しているので、(Pantel さんではない別の人から)トークを頼まれる。社内の案内少しと、(Yahoo!仕事とはあまり関係のない博士論文の話をしつつ)ランチだけべに行くつもりだったし、先週金曜日トークも含めて半日丸々話しっぱなしでかなり疲れたので、迷いに迷ったのだが、これも縁かなぁ、と思って OK してみる。 でも来週月曜が休みで、告知まで時間がなかったので、人が集まらなかったら流れるかも? という話だったので、一応準備はするが、流れてくれても嬉しいし、流れてくれなくても大丈夫、みたいな……。 O 野原くんが各地で呼ばれて発表したりしているのを見ていて、同学年なのにすごいなぁ(いや、来なら同学年ではないの

    クリックスルーログの論文に関する問い合わせ - 武蔵野日記
    nhayato
    nhayato 2013/08/17
  • 自然言語処理ツールの開発を成功に導くには - 武蔵野日記

    CICLing 最終日は Chris Manning さんの基調講演でスタート。Manning さんといえば自然言語処理業界のバイブル的教科書である FSNLP Foundations of Statistical Natural Language Processing (The MIT Press) 作者: Christopher Manning,Hinrich Schuetze出版社/メーカー: The MIT Press発売日: 1999/05/28メディア: ハードカバー購入: 3人 クリック: 169回この商品を含むブログ (18件) を見るやIIRことIntroduction to Information Retrieval 作者: Christopher D. Manning,Prabhakar Raghavan,Hinrich Schuetze出版社/メーカー: Cambr

    自然言語処理ツールの開発を成功に導くには - 武蔵野日記
    nhayato
    nhayato 2013/06/24
  • 松本研の助教という仕事のpros and cons - 武蔵野日記

    ようやく修士論文のチェックに戻ってくる。午前中、午後合わせて2件コメント。合間に hiromi-o さんと今後の予定について話したりする。言語教育グループも、いろいろと変わりそうである。 実は昨日、松先生が自然言語処理のメーリングリストに松研の助教の公募を出していた。2月28日〆切。「デキ公募に見えるようにはしたくない」とおっしゃっていて、要件も割合一般的な感じで書かれている。ちなみに「Webデータマイニング、機械翻訳、言語教育」と3つ分野が上がっているのは、それぞれ今自分が関わっている「ソーシャルメディア解析勉強会、機械翻訳勉強会、言語教育勉強会」にそれぞれ対応していると思われる (機械翻訳勉強会は最近 [twitter:@kevinduh] さんと [twitter:@neubig] さんに任せっきりで、2ヶ月に1回くらいしか顔を出していないが……)。もっとも、これまでの研究グルー

    松本研の助教という仕事のpros and cons - 武蔵野日記
  • 学生のうちにチームワークを身につける - 武蔵野日記

    連日の終電で体力が削られていて、ちょっと寝坊してしまう。添削待ちの原稿が5。 午前中はよく分からないが研究紹介を頼まれたので、2時間身動きが取れなかった。5分でいいと言われていたのだが、この時期に2時間取られるのはしんどい。 昼、共著者と原稿・研究についてディスカッション。結局コミュニケーションをちゃんと取っているか、物理的に会える距離にいるならちゃんと顔を合わせて話しているか、といったことが大事なんだと思う。先日 [twitter:@yuchang] が言っていたようだが、企業の人が学生に求めるのは、チームワークであって、スタンドプレーでもいい学生と違うことであるそうだ。 確かに大事なのはちゃんと話を聞くこと、事前に相談すること、仕事を任したり任されたりできること、できないときはできないと報告すること、どういうスケジュールでどうなっているのか連絡すること、そういう基的なことができるか

    学生のうちにチームワークを身につける - 武蔵野日記
  • COLING 2012 ワークショップ: モバイルテキスト入力の最前線 - 武蔵野日記

    会議は終わったが最後のワークショップがあるので、荷物をまとめて会場の IIT (インドで一番有名な国立の工科大学。インド各地にある) に出発。スーツケースを持ち運ぶのも面倒で、ホテルで預かってもらい、ワークショップが終わったら一度ホテルに戻ってきてホテルから空港に行くことも考えたが、渋滞に巻き込まれると危険なので、会場から直接空港に行くことにしたのである。 Tuktuk で会場まで送ってもらったはいいが、昨日までの招待講演があった会場ではなくレジストレーションがある会場のほうだったので、スーツケースを引きずりながら移動。階段があるのでちょっとしんどい。ワークショップだけ参加の人もいるようで、「ワークショップの場所はどこですか?」と聞かれたので一緒に行く。インドの大学でちょうど英語の感情推定の研究を始めたばかりで、大きな国際会議が開かれると聞いたので発表に来てみた、とのこと。せっかく来るな

    COLING 2012 ワークショップ: モバイルテキスト入力の最前線 - 武蔵野日記
    nhayato
    nhayato 2012/12/20
  • 研究は問題設定が正しければ半分終わったようなもの - 武蔵野日記

    毎度のことながら、週明けはメールの処理が追いつかない。 午前中、書類書き。こういう書類のフォーマットは揃えてくれるとありがたいのだが、募集する側からすると内容が少しずつ変わってくるのは仕方ない。ある程度コピペできるのはありがたいが、論文の書誌情報書くときのエントリ順番を変えないといけないとか、質的でないところで時間を使うのは、その時間の長短に関わらず不毛な気がする……。 昼から学内実習のミーティング。今後の予定を相談し、とりあえずしばらく継続することに。個人的には年内くらいは自分でやりたいテーマがあればやってもらえばいいと思っていて (もちろん一緒にやりたいという人とは秋から一緒にやるが)、それで方向性が見えてくればそれでいいし、年が明けてもまだ迷走中の人にはちょっと相談に乗ってみる感じかな。 ひとまず研究テーマが決まっていない人は、年明けまでにメジャー国際会議の論文を100読んでみて

    研究は問題設定が正しければ半分終わったようなもの - 武蔵野日記
  • 人間の欲望に忠実なコーパスを見る - 武蔵野日記

    朝から涼しくて気持ちいい。ようやく秋かなぁ。 読書の秋、ということで、先日仙台で購入した「性欲の科学」をようやく読了。 性欲の科学 なぜ男は「素人」に興奮し、女は「男同士」に萌えるのか 作者: オギ・オーガス,サイ・ガダム,坂東智子出版社/メーカー: CCCメディアハウス発売日: 2012/02/10メディア: 単行購入: 2人 クリック: 81回この商品を含むブログ (22件) を見るサブカルチャーとか生物学とかそういうのを期待している人にはあまりおもしろくないかもしれないが、ウェブ (検索) 業界の人は読んでおいて損はない内容。というのも、著者の2人は機械学習・データマイニングの専門家であり、検索エンジンのウェブ検索クエリログやテキストのNグラム頻度から、インターネット上のアダルト情報の分析と性に関する分析を、詳細に行った大著だからである。注釈を辿ると、テキストデータや画像データの

    人間の欲望に忠実なコーパスを見る - 武蔵野日記
    nhayato
    nhayato 2012/09/14
  • 苦しくてもがんばれるのは仲間がいるから - 武蔵野日記

    午前中、原稿にコメント入れたりなんだり。e-mobile は割と安定してつながるので助かる。しかし MacBook Air 11 インチで PDF に書き込むのはやはりつらい。13インチはほしいなぁ。まあ、なんとなれば iPad でも書き込めるのであるが……。MacBook Air くらいの軽さでもう少し画面が広いのがあってもいいなぁ。MacBook Pro はちょっと重くて持ち歩くのは……。パワーがあるのは分かるのだけど (MacBook Air の13インチと Mac mini で、違いは CPU のクロックが1.7GHzと2.8GHz、メモリ容量が4GBか8GBかくらいしか違わないのだが、ScanSnap でスキャンしたときの処理速度がけっこう違う)。 研究費関連でなにやらお手数をおかけしている模様。申し訳ない。しかし年度末進行で、いろいろと大変。 夕方から [twitter:@hi

    苦しくてもがんばれるのは仲間がいるから - 武蔵野日記
  • 大学の教員になりたい全ての人のために - 武蔵野日記

    大学は4日が仕事始め。あまり人がいないのでゆったりと仕事ができる。 これまでにもらっていた修士論文のドラフトにコメントを入れ終わる。まだ送ってくれていない人もいるのだが、大丈夫なのだろうか……。とはいえ、例年は1月中旬がドラフト〆切で、今年だけ1ヶ月前倒ししているので、まだ例年並みなら書けていない人がたくさんいただろうし、そんなにビハインドがあるわけではないと思うが…… 昼過ぎ、とあるプロジェクトのミーティング。やはりいろいろな分野の人が集まると、刺激になるなぁ。問題は (実際に作る) 人手・時間が足りていないことで、こればかりはコツコツやる以外どうしようもないが……。 から「おもしろいよ」と言われて「1勝100敗! あるキャリア官僚の転職記 大学教授公募の裏側」を買って読む。 1勝100敗! あるキャリア官僚の転職記 大学教授公募の裏側 (光文社新書) 作者: 中野雅至出版社/メーカー

  • 社会がどんな技術を身につけた人材を必要としているかと、大学でどんな研究を行うのが社会から期待されているかは一致しない - 武蔵野日記

    ランチはいつも通り (?) レストラン MOMO で。そういえば masayu-a さんからいただいたケーキ、おいしかった。に「masayu-a さんが『奥さんならきっと気に入ると思います』と言われた」と伝えたところ、「同じ女子だからきっと好みが分かるんだ」という謎のお言葉をいただく。ありがとうございました。 昼から DSIRNLP 勉強会。当は来週の忘年会に出たかったのだが、いろいろな事情により来週東京に帰っている場合ではないので、代わりに勉強会に出る (兼発表する) ことに……。 会場はミクシィだったので、2回か3回行ったことあるし、余裕〜と思って北参道駅に来たのだが、どうも降りてから再度確認するとミクシィの場所は Google Maps で確認するとどう見ても渋谷にあるので、そういえばオフィスを移転したとか聞いたような……と思い出す。こんな落とし穴があったとは……。 結局30分ほ

    社会がどんな技術を身につけた人材を必要としているかと、大学でどんな研究を行うのが社会から期待されているかは一致しない - 武蔵野日記
  • 『入門ソーシャルデータ』で文書クラスタリングと文書要約を学ぶ - 武蔵野日記

    先日献いただいた「入門ソーシャルデータ データマイニング、分析、可視化のテクニック」 入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック 作者: Matthew A. Russell,奥野陽(監訳),佐藤敏紀(監訳),瀬戸口光宏(監訳),原川浩一(監訳),水野貴明(監訳),長尾高弘出版社/メーカー: オライリージャパン発売日: 2011/11/26メディア: 大型購入: 18人 クリック: 779回この商品を含むブログ (42件) を見るを読了 (多謝!)。tkng さんも書評を書かれているし echizen_tm さんも書評を書かれているので、いまさら感は否めないが、別の観点から少し寸評。書は、データを抽出してからの可視化の方法が全体の半分以上を占めていて、そういう方法を知らない人には参考になると思う。 研究のための実験をしていても、実は地味に重要なのは機械学習

    『入門ソーシャルデータ』で文書クラスタリングと文書要約を学ぶ - 武蔵野日記
  • makimoto was there. 10年前の @makimoto さんとその後 - 武蔵野日記

    退職のお知らせということで、@makimotoくんがヤフーを辞めるという話を耳にする。次の行き先はベンチャーだそうだ。寝耳に水でびっくりのことである。 でも最近は小さな会社で生き生きと働いている人も多いし、転職するくらいだからきっと楽しい職場なんだろうなぁと思う(@makimoto くんに限っては前の職場に不満があったようにはあまり思えないし、次の職場がよほど魅力的なところなのだろう)。 ガラパゴス化する就活という記事を読み、なるほどなぁと納得。 昨今、就職氷河期で、何十もエントリーシートを書いて、御社が第一志望ですといいながら必死に就職活動をしている真っ只中の人たちに時々聞かれることがある。どうすれば採用されるんでしょうか。 例えば、プログラミングをまったくやったことがなくて、プログラマー志望です、と言われるとちょっと困る。学部は理工系でなくても、独学でプログラミングを経験し、オープンソ

    makimoto was there. 10年前の @makimoto さんとその後 - 武蔵野日記
  • 大学院生は夏が研究の天王山 - 武蔵野日記

    朝起きて論文の添削。まだだ、まだ終わらんよ! Adobe Acrobat でいろいろ書き込んで送ったのだが、Mac の Preview.app で見ると書き込んだコメントが見られないというお決まりの罠があり、残念なことに……。全く見られなければ「おかしい」と思うのだろうが、中途半端に見えるので、添削された人はなにかコメントが書かれていることに気がつかないのである。しかしこれは気がつかなくても仕方ない。自分も1回これで失敗しかけたことがあり、Preview.app を信用しないことにした。みなさん、添削が書き込まれた PDFMac で開くときは Adobe (Acrobat) Reader で開きましょう。ちなみに Mac の Acrobat (Reader) だと注釈一覧が印刷できるのに、Linux の Adobe Reader だとできないらしい。それはそれでちょっと…… 結局共著

    大学院生は夏が研究の天王山 - 武蔵野日記
  • 自然言語処理における双対分解に関するチュートリアル - 武蔵野日記

    結局飛行機の中で寝すぎてホテルに着いてから朝まで作業していて、翌日眠い。 朝の便でスーツケースが届くので、午前中にはホテルに届けます、という話だったので、ホテルで待機。10時になって、そろそろ店が開くので最悪買いに行くか、と思って荷物をまとめて出かけようとしたら、フロントからスーツケースが届いたとの電話。助かった。 朝ご飯もべず待っていたので、Pioneer Place というポートランド的なショッピングセンターまで歩いて行って、地下のフードコートでべる。ブティックみたいな店にはほとんど人がいなくて、日曜日だから11時開店らしく、休みだからかな? と思ったら、地下の Apple Store にはうじゃうじゃ人がいて(当に異常なくらい、日の通勤電車並み?)、iPhone 4 やら iPad やらをみなさん見ていて、びっくり。 オレゴンはアメリカの州で唯一消費税がない州で、品物が安く買

    自然言語処理における双対分解に関するチュートリアル - 武蔵野日記
  • はじめてで迷ったときの論文の読み方 - 武蔵野日記

    昨晩勉強会のあと20分くらい takuo-h くんと話したのだが、授業や勉強会が多過ぎてキャパシティを超えているとのこと、たぶん松研の M1 はみんなそうではないかな。自分も M1 の間は平日は毎日3時間睡眠で予習・復習・勉強会そしてバイトと大変だったし、大体みんな忙しいのである。 NAIST の M1 自体がそもそも授業の負荷が高いのに加え、松研は特に勉強会の数が多いので、全部出ていると相当しんどいはず。とはいえ、出ていると耳学問でいろいろと学ぶこともあるので、可能な限り出るとあとあと「限界に近かったけど出ていてよかった」と思うこともあるだろうし、そのあたりは自分の体力との相談かと…… そういえば以前書いた松研究室の手引きという文書を発掘した。修士の2年間しか書いていないので、博士の3年間も書きたいのだが、結婚して夫婦で1年間奈良で暮らしたりしていて、あまり他の人の参考にならないの

    はじめてで迷ったときの論文の読み方 - 武蔵野日記
  • Wolfram|Alpha や Bing のすごくないがゆえにすごいところ - 武蔵野日記

    最近次世代「検索」エンジンが登場しつつあるが、彼らのすごいところは検索結果ではない。たとえば Mathematica を作った会社が Wolfram|Alpha や最近検索に異様に力を入れている Microsoft が Bing を開発中だとアナウンスされたが、彼らが真にすごいのは、現在の自然言語処理(や情報検索などの周辺技術)の精度では恐らく不可能だと思えるようなことをやろうとしている、もしくはやっているところだと思う。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解析器を作っているので仕方な

    Wolfram|Alpha や Bing のすごくないがゆえにすごいところ - 武蔵野日記
  • 論文は実装すると理解が深まる - 武蔵野日記

    出勤後、のコピーなど。@syou6162さんが手伝ってくれると申し出てくれたが、さすがに雑用は自分がやるべきかなと……(30分くらいで終わったし) 午前中は NTT に打ち合わせに行く。Workshop on Advances in Text Input Methods 2011 (テキスト入力メソッドに関するワークショップ) どうしましょうか、という話なのだが、結局6月17日〆切だと厳しいので見送りましょう、という感じに。会議の〆切が2週間延び(て先週は死にそうになっ)たのだが、こちらは延びていない。 松先生も「会議が11月上旬で、会議の論文採否の通知が7月22日なら、ワークショップの〆切はそのあとでもいいくらいではないか。普通会議に付属するワークショップは会議に落ちた人が出せるように、会議の採否の通知のあとに投稿〆切が来ているものだと思う」と(Twitter 的な意味で

    論文は実装すると理解が深まる - 武蔵野日記