2018年6月17日のブックマーク (6件)

  • 転職について - 兼雑記

    6月14日がグーグル最終日でした。8月からPFNに混ぜてもらう予定です。退職や入社も重要イベントなんでしょうけど、転職活動それ自体が大変に楽しい体験だったので、入社したからって突然次の会社についての知見にあふれているわけでもなし、このタイミングでなんか書こうと思いました。どうせ暇だし。 前回との差分 http://shinh.hatenablog.com/entry/2016/03/11/142748 が前回までのあらすじ。このちょっと後で、「ニューラルトランスレートすげー」とか思って Google Translate のチームに入れてもらって、自然言語/機械学習研究入門+プロダクショナイズ+TensorFlowまわりのあれこれおもしれーとか、その他いろいろをやってた、というのが現在との差分です。 機械翻訳というのは、他の機械学習応用分野と同じく、ニューラルさんによってすさまじく簡略化され

    転職について - 兼雑記
    yag_ays
    yag_ays 2018/06/17
  • 俺流、機械学習系の論文の書き方 | 餃子

    後輩に機械学習の論文の書き方を伝えるときに使っているメモが出てきたので紹介してみます。 みなさまの参考になるかどうかはわかりませんが…。 俺流、基的な論文の書き方 実験的に検証をするタイプの論文を想定しています。 1 → 2 → 3 と順調にやるというよりは、1,2,3を繰り返して完成度を上げるイメージ。 構成を決める。基形は以下。日語で箇条書きで書く。 アブスト(大体最後に書く) イントロ ポンチ絵: この研究を一枚の絵でまとめた物を1ページ目の目立つところに載せる 社会的・学術的背景: どこに問題意識を感じているか research question この論文では何を解き明かすのか・何を解決したいのか 上の問題意識を受けて、より具体的に 提案手法 どのように解決するのか なぜそれで問題を解決できるのか 実験 何を解き明かす実験なのか どのような設定で行うのか 結果はどんなものか

    yag_ays
    yag_ays 2018/06/17
  • COLING2016 3日目 - ブログではないです

    発表が短いので前2日より更に理解が合ってるか怪しめ。。。 Expanding wordnets to new languages with multilingual sense disambiguation [Mihael Arcan, John Philip McCrae and Paul Buitelaar] 面白かった。英語しかないwordnet を他の言語に翻訳する話。ただし単語は複数の意味(synset) を持つため、wordnet上での対応を取るのが大変。 手法としては、対応する言語との間でパラレルコーパスが存在しているという前提の上で 通常の翻訳システムを用いて対象となる単語を含んだ文を翻訳し、alignmentを取って単語単位での翻訳を行うというもの。この際、翻訳元で対象の単語がどのsynsetで使われているか分からないのでWSDも同時に行っている。 コーパス中で殆ど使われ

    COLING2016 3日目 - ブログではないです
    yag_ays
    yag_ays 2018/06/17
  • 高専から大学へ編入学して4日で留年した話|kashiko sudo|note

    ※2018年6月19日 追記※ こちらに続編を書いております。よろしければ、こちらもお読みください。 初めまして、須藤か志こと申します。 あんまりブログなどで自分の個人的な生活や思想を発信し、見てもらうことに興味がなかったのですが(ゆえに今まで長続きしませんでした)、やってみようと思います。よろ! 自己紹介をします1996年1月31日生まれです。 釧路市の某病院で、須藤家長女として産まれました。 私は釧路工業高等専門学校電気工学科を2017年3月に卒業しました。 男の子がクラスに40名以上、女子は4名のみという男女比が偏ったクラスでしたが、楽しい高専生活でした。 ご存知の方も多いと思いますが、高専は通常5年間が在学年数です。 私の場合、5年次にフィンランドへ交換留学をしたので、それを含めると6年間高専に在学していました。 留学に関してはもう2年前の話になりますが、あまりきちんとまとめたこと

    高専から大学へ編入学して4日で留年した話|kashiko sudo|note
    yag_ays
    yag_ays 2018/06/17
  • 「( ´∀`)」や「(´・ω・`)」系はもう…… 顔文字で分かる年代考察ツイートに共感と「知らなかったよ…」の声

    使っている顔文字で分かる年代考察のツイートが話題になっています。「( ´∀`)」や「(´・ω・`)」ももう古いのか……なんだか切なくなってきた(´・ω・`)。 投稿したのは中埜長治(@borisbadenov85)さん。現在Twitterなどでよく“おじさんの顔文字”だと指摘される「(^_^)」系について、昔は女子高生も使っていたが「おじさんは15年経ってもおじさんなのに女子高生は長くて3年で全滅する薄命存在なので」とその理由を説明。そして、「『( ´∀`)』や『(´・ω・`)』系は自分が若いと思ってる一層痛くさい中壮年の顔文字に成り果てた」と、辛辣な指摘を展開しています。 若者もいつかはおじさんになる、とはこういうことなのかも……。指摘もなんとなく納得できてしまうのがまた切ない。 ショボーンな顔文字 この顔文字に慣れ親しんだ人と、そうでない人の壁は厚いのかもしれない…… この指摘にリプラ

    「( ´∀`)」や「(´・ω・`)」系はもう…… 顔文字で分かる年代考察ツイートに共感と「知らなかったよ…」の声
    yag_ays
    yag_ays 2018/06/17
  • Entity Embeddings of Categorical Variables

    1. どんなもの? カテゴリ変数からEntity Embeddingを自動的に学習するニューラルネットを用いて、カテゴリ変数間の距離を可視化する。 2. 先行研究と比べてどこがすごいの? カテゴリ変数は質的変数や属性変数と呼ばれ、限られた数のカテゴリまたは異なるグループに分類することができる。例えば赤を1、青を2、黄色を3とした場合、「青は赤より大きい」・「赤と黄色の平均が青」といった情報は基的には意味をなさない。またこれらのカテゴリ変数をそのままニューラルネットワークに入力すると、正しく機能しないことが多い。 研究ではニューラルネットワークにEmbedding Layerを導入し、カテゴリ変数から多次元のembeddingを自動的に学習する手法を提案している。またこのembeddingを用いて各カテゴリ変数間の距離を可視化することができる。 3. 技術や手法の”キモ”はどこにある?

    yag_ays
    yag_ays 2018/06/17