ブックマーク / kamujun.hatenablog.com (4)

  • Kaggle創薬コンペにおけるDeep Learningの適用 - Technical Hedgehog

    創薬においてコンピュータの活用はますます盛んになってきており、2012年にはKaggleでコンペも開催されました。このコンペは標的に対する分子の活性を推定するというタスクでした。 用いられた手法としては1位はDeep Learning、2位は非Deepな機械学習手法でありスコアにこそ大差はありませんでしたが、創薬においてDeep Learningの適用可能性を示したことで当時は話題になったそうです。だいぶ前のコンペなの解説記事はすでに多くありますが、コンペを通じて創薬の概要とDeep Learningがどのようなアプローチで適用されたのかを紹介してみます。 !Caution! できる限りの調査をしましたが、私は製薬や医療に詳しい人ではないので誤った解釈をしてしまっている可能性があります。「ここ間違っている」と言う点がありましたら指摘いただけると幸いです。 では、はじめにコンペのタスク背景と

    Kaggle創薬コンペにおけるDeep Learningの適用 - Technical Hedgehog
    yag_ays
    yag_ays 2019/04/24
  • Embeddingを高速に取り出すMagnitude - Technical Hedgehog

    word2vecなど分散表現が活躍するシーンは多いですが、実行速度やメモリなど利用する上で気がかりになる面もあります。この記事では分散表現をすばやく便利に使うためのパッケージであるMagnitudeの説明と実行速度について実験した結果を紹介します。 What's Magnitude? Magnitude は簡単にすばやく単語ベクトルを扱うためのライブラリです。 github.com EMNLP2018で発表された Magnitude: A Fast, Efficient Universal Vector Embedding Utility Package の著者実装となります。論文中で挙げられているように、Gensim の代替を想定しているようです。 Magnitude Object について Magnitudeではベクトル取得を高速化するために、事前に分散表現を変換したものを用います。そ

    Embeddingを高速に取り出すMagnitude - Technical Hedgehog
    yag_ays
    yag_ays 2019/02/28
  • 文脈を考慮した単語表現を獲得するELMo - Technical Hedgehog

    文脈を考慮した単語表現を獲得する深層学習手法のELMoを紹介します。「アメ」は「Rain」と「Candy」どちらの意味か?それを文脈から考慮させるのがこの手法です。 機械学習で取り組まれている複雑なタスクは、部分問題を解決する技術を組み合わせて実現されます。例えば文書分類というタスクに取り組む場合、文書特徴を獲得するために単語分割や単語表現などの手法を用いた上で、SVMやナイーブベイズといった分類器を用いる方法があります。部分問題を解決する技術は特定のタスクだけではなく、様々な問題で利用することができます。単語分割は文書分類にだけではなく質問応答など自然言語処理において幅広く利用されます。 上記のように部分問題は様々なタスクで用いられるため、部分問題の性能向上は様々なタスクの性能向上に寄与できる可能性があります。部分問題がうまく解決できていないと、それらを組み合わせて実現する応用タスクも望

    文脈を考慮した単語表現を獲得するELMo - Technical Hedgehog
    yag_ays
    yag_ays 2018/07/07
  • 数えきれないほどの分類を行うExtreme Classification - Technical Hedgehog

    記事では分類タスクの一種であるExtreme Classificationの代表的な手法と特徴を紹介します。機械学習においてアヤメの分類など10数個までのラベルやクラスへの分類タスクはチュートリアルなどで多く取り上げられています。 一方で商品をカテゴリに分類したい場合など大量のラベルやクラスで分類したい場合、既存手法では計算量が膨大になるなど様々な問題に直面します。そこで大量のラベルやクラスを用いて分類を行うタスクをExtreme Classificationと呼び研究が進められています。 Extreme Classificationとは? Extreme Classificationは10万〜100万にも及ぶ膨大なラベルやクラスを用いて対象を分類するタスクです。このタスクは少なくとも10年以上前から研究が行われており、学会のワークショップなどでも取り組まれています。直近ではNIPS E

    数えきれないほどの分類を行うExtreme Classification - Technical Hedgehog
    yag_ays
    yag_ays 2018/06/22
  • 1