タグ

2018年12月22日のブックマーク (3件)

  • DeepなFactorization Machinesの最新動向 (2018) - Gunosyデータ分析ブログ

    はじめに こんにちは。研究開発チームの関です。 最近毎週日曜日の恋するワンピースの更新を楽しみに生きています。好きなツッコミは「この船の航海士は誰?」です。 あと虹のコンキスタドールのベストアルバム「THE BEST OF RAINBOW」は皆さん買いましたか? 健康にいいので毎日聞きましょう。 この記事はGunosy Advent Calendar 2018の22日目の記事です。 昨日はcou_zさんの「【年末年始に読みたい】Gunosyエンジニアが2018年に購入した書籍まとめ」でした。 皆さんFactorization Machinesは好きですよね。 予測モデル構築においてはXGBoostと並んでとりあえずやっておくべき手法として知られています。 今回のエントリではKDD2018で発表されたxDeepFMを読み解きながら、 DeepなFactorization Machineの現状

    DeepなFactorization Machinesの最新動向 (2018) - Gunosyデータ分析ブログ
  • 機械学習工学 / MLSE Advent Calendar 2018 - Qiita

    機械学習を使ったシステムの開発・運用にまつわるあれやこれやに関するAdvent Calendarです。 「機械学習システム構築のために必要なもの/あるとナイスなもの」にまつわることなら、テーマは何でもいいです。MLOps でも、テストでも、要求分析でも、プロジェクトマネジメントでも。 論文紹介でも、ツール紹介でも、プラクティス紹介でも、ちょっとしたtipsの披露でも何でもいいです。 ちなみに、日ソフトウェア科学会 機械学習工学研究会(MLSE)で扱っているトピックは以下のとおりです。……が、このカレンダーはここからはみ出していてもOKです! 機械学習プロジェクトを運用するマネジメント手法や組織論 機械学習システムのための要求分析、目的設計、工数見積もり手法 効率的な教師データの収集・整備、前処理の方法 機械学習システム開発を効率的に行うためのフレームワークやプログラミング言語、開発環境

    機械学習工学 / MLSE Advent Calendar 2018 - Qiita
  • pandasで1000万件のデータの前処理を高速にするTips集 - Qiita

    はじめに 当社にアルバイトに来ていた人(来春に新卒入社の予定)に「pandasを高速化するための情報は無いですか?」と尋ねられました。 このパッケージの使い方は多数の書籍やWebで体系立った記事で書かれています。 しかし、高速化に関しては体系的な情報源が思いつかなかったので、「実際に書いてみて、1つ1つチューニングするしかないです」としか答えられませんでした。 そこで、この方を始め、来春(2019年4月)にデータアナリストまたはデータサイエンティストになる新卒へ向けて、pandasの高速化に関する私の経験をTips集にしてお伝えしたいと思います。 この記事は今後も内容を充実させるために、Tipsを追加していきます。 この記事を読んだ後にできるようになること pandasでレコード数1000万件のデータでも1分以内で完了する前処理が書けるようになります。 その結果、1日中実行し続けなければな

    pandasで1000万件のデータの前処理を高速にするTips集 - Qiita