タグ

ブックマーク / komachi.hatenablog.com (37)

  • arXiv 投稿すると見てくれる - 武蔵野日記

    今日は出勤日。午前中は  EMNLP 2020 読み会。まだ予稿集は公開されていないのだが、camera ready の締め切りを過ぎ、かなりの数の原稿が arXiv で読めるので、もう既にスタートしている。今回は90分で3紹介してもらうことにしたのだが、最近のうちの研究室での研究に関係するのは以下の論文。 Caglayan et al. Simultaneous Machine Translation with Visual Context. EMNLP 2020. これは画像の情報を用いて同時翻訳をする、という話で、ちょうど @aijant さんが WMT 2020 に採択された以下の研究とも関連していて(もっと言うと、EAMT 2020 でうちの研究室の yuting さんが発表する研究とも主要な貢献が重複していて)、データと手法が同じなら、同時期に似たようなことをする人がいるもの

    arXiv 投稿すると見てくれる - 武蔵野日記
    jir_o
    jir_o 2020/10/28
  • 論文誌書くには息を長くする - 武蔵野日記

    今日も出勤日。研究室の計算機の調子が変という連絡をもらったので、色々更新してみたりする。日野キャンパスのサーバ室の電源の問題でこのところ全然新しい計算機を購入しておらず、GPU を入れ替える(それまで使っていたものを外す)しかしていないのだが、電源の問題が解決したらサーバごと入れ替えていきたい(ので、そうなったらそこそこな予算を取りたい)。今年度中に少し工事できるかも、という話があったがその後音沙汰がないので、まあ増えないだろうな……。 昼から来週締め切り予定の国際会議の原稿のコメントを2件(合計3時間)。この2件は日語の原稿がなく直接英語で書いてもらっていて、これでも普通に B4/M1 の学生が書けるのはすごいなと思うのだが(自分自身含め、昔はそんなの無理だったと思う)、やっぱり英語を書くというところで母語でないために時間がかかる、というのがちょっと悩ましい。英語がネイティブでもいい研

    論文誌書くには息を長くする - 武蔵野日記
    jir_o
    jir_o 2020/10/20
    “まず(ショートでもワークショップでもいいので)国際会議で発表して、それをベースに(日本語で)論文誌にする、というのがベストな気がする”
  • 博士号取る前に読むべからず集 - 武蔵野日記

    火曜日ということで例によって一日中(10時半〜16時半)進捗報告を聞く。 そういえば、先日「博士号のとり方 第6版」というを献していただいた。このの旧版を読んだことがあるのだが、3年経って内容を忘れていたので、先日読み直した。 博士号のとり方[第6版]―学生と指導教員のための実践ハンドブック― 作者: E・M・フィリップス,D・S・ピュー,角谷快彦出版社/メーカー: 名古屋大学出版会発売日: 2018/10/17メディア: 単行この商品を含むブログ (1件) を見るこののポイントは、上記のリンク先でも書いたように、こういう行動を取ると博士号が取得できなくなる、あるいは取得が大幅に遠のく、という事例がたくさん載っていることで、博士号を取得したあとの人が読むと「あー、確かにそうだよねー」と思うことだらけなのだが、博士号を取得する前に読むと「え、何言ってんのこの人たち、これアカハラじゃ

    博士号取る前に読むべからず集 - 武蔵野日記
    jir_o
    jir_o 2020/10/02
  • 投稿が増えれば下がるクオリティ - 武蔵野日記

    今日も今日とて原稿をたくさん見る必要があり、在宅勤務。 午前中は言語処理学会論文誌に投稿予定の原稿2の最後のチェック。9/1の締め切りまでに出せば、採択だった場合に日学生支援機構の奨学金の返還免除の申請のための業績として間に合うのである(これより後の場合、一発採録でないと間に合わない)。修士論文相当の研究は、フルペーパーまたは論文誌として発表してほしいと思ってはいるのだが、現実的にはなかなかタイミング的に難しいものがあり、こうやって修士の在籍中に論文誌を投稿する(査読者との往復も終わる)インセンティブがあるというのはよいことである。 論文誌といえば先週から今週にかけて、1が採録の通知があり、2が不採録の通知があった。採録の方はよいのだが、不採録の方はいずれも1回の照会のあとの不採録通知なので、厳しい。両方、年内にアクセプトされるとよいのだけど。 午後は国際会議の論文の査読 x3。残

    投稿が増えれば下がるクオリティ - 武蔵野日記
    jir_o
    jir_o 2020/09/05
  • ブラインド査読といえどなんとなく - 武蔵野日記

    朝、上の子の熱を測ったら38度1分で、母に見てもらえるかと思って電話したら母も通院日だったようで、フローレンスも受診してからでないとお願いできないし、そもそも家にいて下の子にうつすリスクがあるので、大学に連れていくことに。体調がよくないようで、ときどき「気持ち悪い」と言うのをなんとか休み休み職場に連れてきて心が痛んだが、大学に来てからは大人しくしていた。 まず拡大学部教務委員会。2-3月に定例以外の会議の数が多いのだが(卒業判定や進級判定、編入生の単位認定などがあるから)、定例の会議はそんなに長引かないのでありがたい。 次に研究室で EMNLP 2019 読み会。娘は秘書さんと一緒にいる、ということで自分だけ研究室に。3紹介してもらったが、以下の論文の切り口がおもしろかったかな。スライド Cornelia Caragea, Ana Uban, Liviu P. Dinu. The Myt

    ブラインド査読といえどなんとなく - 武蔵野日記
    jir_o
    jir_o 2020/02/05
  • 新しいものがいいとは限らない - 武蔵野日記

    どこか出かけようかなと思っていたが、午前中から娘(4歳5ヶ月)の様子が少し変で、熱を測ってみると38度あったので、外には行かずに家で過ごす。最近は土日に昼寝をすることもないのだが、昼寝していたので、かなり調子が悪いのだろう。 外に行けなかったので、東大出版会の「ロボットは東大に入れるか」を読んだ(同じ名前の別のもあるので紛らわしいが)。 人工知能プロジェクト「ロボットは東大に入れるか」: 第三次AIブームの到達点と限界 作者: 新井紀子,東中竜一郎出版社/メーカー: 東京大学出版会発売日: 2018/09/27メディア: 単行この商品を含むブログ (2件) を見るこれは極めて重要なで、東ロボプロジェクトの現段階までの総括と、2018年時点でのこれからの展望が盛り込まれていて、内容的にもしっかり書かれているし、東ロボプロジェクトについて何か言いたい人は、とにかくまずこれを読むべきだと思

    新しいものがいいとは限らない - 武蔵野日記
    jir_o
    jir_o 2018/12/19
  • コンピュータ将棋を作る開発者 - 武蔵野日記

    午前中は B3 の情報理論の授業である。今年はスムーズに進み、さ来週の中間試験までの範囲に余裕があったので、授業時間中に情熱大陸の山一成さんの番組を見せる。内容はコンピュータ将棋を作ってトッププロ棋士と戦うという話で、現役の名人に2連勝と、もう今年で人間はコンピュータ将棋に勝つことはできないのでは、と思わされるのだが、人工知能の研究・開発をするというのはどういうことか、というのが端的に分かるよい番組だったので、解説入りで流したのである。 自分自身、教職を取るために教育関係の授業を履修していて、何の授業だったか記憶にないが、ビデオ教材を使った授業方法の紹介で(実際ビデオを見せながら)「授業内容の関するいいビデオを1見つけたら、それだけで教材ができたことになる」ということを教わったのをよく記憶していて、毎日「何か授業の教材になりそうなネタはないかな」と思って過ごしているので、割と授業をする

    コンピュータ将棋を作る開発者 - 武蔵野日記
    jir_o
    jir_o 2017/05/29
    “情熱大陸の山本一成さんの番組を見せる。内容はコンピュータ将棋を作ってトッププロ棋士と戦うという話で、”
  • TA がいないと演習やりにくい - 武蔵野日記

    今日は朝から保育園の大掃除。半年に1回、保育者と親が総出で大掃除をするのである。うちの娘が通う保育園は、年間のイベントといえば12月のお楽しみ会と3月の卒園式、10月くらいのイベント(運動会であることが多い)以外は特にないので、大掃除が一大イベントになっている。 自分はこれまで基的に外回り担当で、今回も台所担当だったが、やることといえば台所の中の換気扇やゴミ箱、冷蔵庫の中の棚を外でひたすら洗う、という仕事。かれこれ3回目の担当なので、特に迷うことなく淡々と処理。ホースが水漏れするので修繕したりする余裕があるくらい。8:45に集合して12時半まで延々やったが、もう慣れたのでそんなに疲れない。 午後はオープンユニバーシティのために飯田橋キャンパスへ。「ウェブと自然言語処理」について話したが、アンケートを書かないといけないのに時間ぴったりまで話してしまったのは、よくなかったかも。自分が独自に用

    TA がいないと演習やりにくい - 武蔵野日記
    jir_o
    jir_o 2016/06/11
  • 委員会こんなに増えていいんかい - 武蔵野日記

    午前中、委員会の事前打ち合わせ。文部科学省関係の書類を準備する、という話なのだが、こんなのをみなさん書いてらっしゃるのか、とびっくりする。職員の方々もかなりのお仕事をしていただいているようで、これは大変。確かにこんなのに付き合っていては、まともな仕事ができないのではなかろうか? お昼はウェブ会議。競争的な研究費(例えば科研費)でも、完全に新しい研究よりは、すでに動き始めて成果が出つつある方が研究費を獲得しやすい、というのがあり、共同研究でも同じだよな、と思う。既にある程度の成果がある研究って、段々飽きてきて「お金をもらってもこれはちょっと」となっていきがちだけど、きっちり色んな分野で検証するのも大事だし。 ちなみに、自分は首都大に来てから競争的研究費は学内のものも含めて10件以上連続で落ちていて、昨年に Microsoft Research CORE プロジェクトに採択してもらうまで、なん

    委員会こんなに増えていいんかい - 武蔵野日記
    jir_o
    jir_o 2016/05/29
  • ポスターを画像検索するといい - 武蔵野日記

    午前中、ポスターのコメントをしたりする(x2)。ポスターは口頭発表と比べると目にする機会が少ないし、公開している人も少ないので作りにくいのだが、Google の画像検索をしたりすると結構サンプルが見つかるので、適当なキーワードを入れて Google 検索してみることをお勧めする。(会議名を入れると出てきやすい)。 お昼に少し時間が取れたので30分だけ論文紹介に出てみる(今年度はほとんど参加できていない)。今学期は古典論文紹介と最先端論文紹介の二立てで、古典論文紹介である。 Franz Joseph Och. Minimum Error Rate Training in Statistical Machine Translation. ACL 2003. 統計的機械翻訳で使われる誤り率最小化学習の話で、ちょっと論文で不明な点はあったが、なんで効率的にできるか、というようなのが分かって納得。

    ポスターを画像検索するといい - 武蔵野日記
    jir_o
    jir_o 2016/05/29
  • 席替えをするともうすぐ新学期 - 武蔵野日記

    朝は研究室で進捗報告を聞く。いろいろ手を動かして、失敗したながらも失敗した結果について報告してもらえるのは素晴らしい。問題は「サーベイしています」と言うのに具体的にサーベイした論文名を挙げないとか、「結果がよくありませんでした」と言うのに実験結果がないとか、「実装できませんでした」と言うのに具体的にどんなコードを書いてダメだったのか説明しないとか、そういうのである。 前者2つは進捗報告を具体的に書いてもらうようにするといいと思うのだが、最後のはどうするのがいいのだろうか。まず擬似コードを書いてもらえばいいのだろうか。擬似コードレベルでは理解できているのに実装ができないのか、それとも擬似コードレベルで理解できていないのか、というのは違うのだが、「実装できませんでした」だとどちらなのか分からないのだ。 新年度は進捗報告をスライドではなく Markdown でもいいのでレジュメ形式で書いてもらう

    席替えをするともうすぐ新学期 - 武蔵野日記
    jir_o
    jir_o 2016/04/01
  • 卒園のときに初めて職を知る - 武蔵野日記

    三連休の最終日は保育園の卒園式である。原則(卒園しない園児・親も)全員参加なのだが、昨年は娘の体調不良で欠席したので、初めての参加。去年は卒園する園児の一人が娘のことをすごくかわいがってくれていたので、行けたらよかったのだが、病気なので仕方ない。 今年度は自分もほぼ毎日保育園の送り迎えをしていることもあり、親の顔と名前は(少なくとも母は)ほぼ一致、園児の顔と名前は女の子は全員一致、男の子は3-4歳の人数が多いところはよくわからないがそれ以外は全員一致、だいぶアウェイ感がなくなった。 卒園する子どもの親が最後にスピーチしたのだが、実は大学教員であるという話を聞いてびっくり。特に文教地区でもなんでもない地域なのだが、当に教育関係者が多い保育園である(卒園するもう一人の子どもの親は大学職員)。言動から、作家か画家か、なにか自由業ではないかと思っていたのだが、同業者だったとは……。契約するまで職

    卒園のときに初めて職を知る - 武蔵野日記
    jir_o
    jir_o 2016/03/28
  • 引用がされる論文を書きたい - 武蔵野日記

    首都大に来てからというもの、仕事に関する価値観を変えようと思っていて、その一つに論文の評価というものがある。自然言語処理分野では、というか、広く情報科学分野では、査読付き国際会議や査読付き論文誌で研究成果を発表するのが一般的で、基的には査読を受けない研究成果は業績にカウントされない。そこで業績にカウントされるよう研究成果を論文にまとめて投稿するわけだが、最近は投稿した論文が(将来にわたって)どれくらいインパクトがあるか? ということを考えるようになってきた。トップカンファレンスで論文を発表するのもよいが、実際にみんなが読んでリファーしてくれる論文を書くべきだという意識になっている。メジャーな国際会議で発表すればするほど、読まれてリファーもされやすくなるので、基的にはより難関の国際会議で発表する、という戦略になる。 論文がリファーされているかどうかを確認する一つが例えば Google S

    引用がされる論文を書きたい - 武蔵野日記
    jir_o
    jir_o 2016/02/24
  • 奨学金返還免除枠がある - 武蔵野日記

    午前中は M1 の研究プロジェクト演習の最終発表会。一応これで成績をつける必要がある科目は全部終了。あとは全員分の成績を回収・入力すればよい。意外と面倒だが……。 B4 の研究室の配属希望が日12時締め切りなので見に行ったりする。どの研究室も定員は3〜5人なのだが、うちの研究室だけ6人が希望していて、最低1人は他の研究室に回されることが確定してしまっている(汗)うちのコースの研究室配属希望は100%成績順で、学生の希望のみで決定され、教員の意向は一切考慮されないため、普段は学生同士で情報交換して、あまり調整がないようになるそうなのだが、今年は波乱含みのようである。 昼からはコース会議。修士論文の合否判定があるので、大学院教務委員として初の大仕事で緊張したが、つつがなく終わる。 審議事項として、日学生支援機構の第1種奨学金の免除の枠に対し、在学中の研究業績に基づいて学生を推薦する、という

    奨学金返還免除枠がある - 武蔵野日記
    jir_o
    jir_o 2016/02/24
    (いままで無関係と思っていたが)第一種奨学生について最近調べている
  • 論文を書くというのも温度差が - 武蔵野日記

    午前中は言語処理学会年次大会で発表しない学生たちの進捗報告を聞く。修士論文に関係する内容を5月の NL 研または7月の NL 研、あるいはそれに相当する外部の研究会・シンポジウム等での発表を義務付けているので、3月に発表しない人はこの時期に進めておかないと修論にたどり着かないのである。(人数的には対象となる学生は5人で、4月以降も残る学生の半分強) 午後は特別研究(卒業論文)発表会。実はうちの学生の特別研究発表会の予稿は今回特にチェックしなかった(NLP 若手の会シンポジウムのときチェックしたし、言語処理学会年次大会または NL 研の原稿でも何往復もチェックしたので)のだが、まあそんなに変な予稿ではなかった。しかし他の研究室はバラバラで、研究室の学生が全員例外なくしっかりした予稿を出している研究室もあれば(学生によると、その研究室では4-5回添削されているらしい。やはりそれくらい往復すると

    論文を書くというのも温度差が - 武蔵野日記
    jir_o
    jir_o 2016/02/24
    コストを捻出する(できる)かどうかは大きい気が。駆逐という表現w > "学生によると、その研究室では4-5回添削されているらしい。やはりそれくらい往復すると、論文の体裁をなしていない予稿は駆逐することができる"
  • 不採択通知を開けるにも勇気 - 武蔵野日記

    午前中は大学院の公開期末評価である。石川研(ソーシャルビッグデータ)の社会人 D の方々が3名いるので報告を聞くのだが、仕事をしながら着実に論文を投稿していてすごいなと思う(投稿先、採否、今後の予定なども半期ごとに報告するスタイル)。すごいなと思うのは、落とされても落とされてもめげずに投稿して採録を勝ち取るスピリットで、これは見習いたい。 そういえば LREC という言語資源に関する国際会議に学生の論文(修論のコアとなった研究)が通った。研究室に入った1期生で今年度修士号を取得するのは3人いるのだが、これで3人中2人の研究が査読付き国際会議に採録されたことになる。2件とも、トップカンファレンスでこそないが、採択率5割程度の国際会議ではある(少なくとも分野内では存在が知られている会議)ので、勉強会も貧弱だった研究室の黎明期からいてくれた彼らがこうやってしっかり通すのを見ると、教員でよかった、

    不採択通知を開けるにも勇気 - 武蔵野日記
    jir_o
    jir_o 2016/02/11
  • 修論の発表会じゃ遅すぎる - 武蔵野日記

    今日は朝から修士論文の発表会。大学院教務委員なので、朝8時半から出勤である。 学生のころ、修士論文の発表会で空気を読まず学生なのに質問したりコメントしたりしていたのだが(そもそも何も発言しないのに話を聞く意味がないと思っていたので)、修士論文の発表会は修士論文の審査を行う場所なので、副査の先生方からコメントをもらわないといけないのである。いま考えると、学生のころは(いまも?)非常識だったものである(でも、教員として、研究室の B4/M1 学生に修士論文の発表会への参加を義務づけないのは、発言できないのに参加を強制されるのはどうかと思うからで、根的な考え方は変わっていない)。 今回いろいろな研究室の学生の副査をしてみて、博士に進学する人でもない限り、修士論文の審査会で根的な話をされても困るだろうし、もっと前に言うべきだということが分かった。 ただ、M2 の修論中間発表(9月)でしたコメン

    修論の発表会じゃ遅すぎる - 武蔵野日記
    jir_o
    jir_o 2016/02/11
    修論発表会が中間、最終の2回なのはどうなんだろうと(卒論は3回発表会をする学部にいることもあり)思っていたけど、他所も似たような感じなのか
  • 兼業をするのは自由・准教授 - 武蔵野日記

    扁桃腺炎のため、1日寝て過ごす。だいぶ治った気がする。 大学の源泉徴収票が来ていたので、例によって公表。 支払金額: 7,523,364円 給与所得控除後の金額: 5,571,027円 所得控除の額の合計額: 1,458,007円 源泉徴収税額: 199,100円 「社会保険料等の金額」が992,631円なので、公立大学准教授3年目で額面は750万、手取りは約630万、というわけである(この金額は大学からもらっている金額のみなので、兼業分は含まれない。週1日程度相当は、兼業をしてもよいことになっている)。 これまでの経緯は[http://d.hatena.ne.jp/mamoruk/20150509/p1:title=去年も書いた]が、昨年が額面720万だったので、30万円の増加である。工学系の学部の准教授としては750万〜800万くらいが妥当な金額だと(自分が大学院生のころから)思ってい

    兼業をするのは自由・准教授 - 武蔵野日記
    jir_o
    jir_o 2016/02/06
  • 修論の目次を見るとよく分かる - 武蔵野日記

    午前中、機械翻訳勉強会の進捗報告。2人の予定が1人だったが、1人で1時間かかったので、ちょうどよかった。 研究室に来てから1年半もすれば、自力で論文をサーベイし、ビックアップした論文を正確に理解していくつか実装できるようになっているのだが、普通に研究すればそれなりの力が付いているということは、やはり内部進学の学生であれば修士論文では相当のことができるのではなかろうか、という気がしている。M1 のうちに国際会議に通せれば学振 DC1 もかなり取りやすいと思われ、研究をする前に就活が始まるので進学するかどうか迷う、というようなことも防げるし。 ただ、外部から進学してきて修士で出てしまうと、せっかく自然言語処理の研究ができるようになったのに、そこで終わってしまうのがちょっともったいない。人のキャリアもあるし、進学を特に勧めているわけではないのだが、外部から修士に来る人は(3人に1人くらいは)博

    修論の目次を見るとよく分かる - 武蔵野日記
    jir_o
    jir_o 2015/12/22
  • 研究の懐事情 How much? - 武蔵野日記

    年度末が近づいてきたので、来年度に向けた準備をしたりする。学生が22人になる予定なので、また少し機材を買い足す必要があるのだが、研究室を運営するのに一体年間いくら必要か? というのはあまり考えたことがない人が多いと思うので、まとめてみる。これを多いと思うか少ないと思うかは人それぞれだろうが、研究の必要経費、というわけである。 まず計算機。情報系なので学生1人あたりノート PC が1台必須で、4年で減価償却として1台15万円で、1年あたり 15 * 20 / 4 = 75万円。 次に国内旅費。東京から大阪まで往復3万円、1泊1万円として、ざっくり出張1回5万円とする(研究会なら1泊、全国大会なら3-4泊で、日全国どこでも開催されるので)。学生1人が年間最低1回全国大会または研究会で発表し、半数は若手の会にも参加するので、1年あたり 5 * 20 * 1.5 = 150万円。また、研究室合宿

    研究の懐事情 How much? - 武蔵野日記
    jir_o
    jir_o 2015/12/22