タグ

2016年10月24日のブックマーク (1件)

  • メンテナブルな機械学習システムの考察 | 株式会社サイバーエージェント

    執筆者 執筆者:數見拓朗 所属部署:技術部 秋葉原ラボ 業務経歴:トレンド検知システムやスパムフィルタの開発・運用、Amebaと広告配信のデータ分析業務を担当。 概要 機械学習は、データの複雑な関係を明らかにし、未知データの予測や特徴の発見を得るのに有用である。しかし、一般に提供されている機械学習ライブラリは、長期的な運用を目標としてデザインされていない。そのため、高い識別性能を維持するには、通常のソフトウェア開発・運用の知見では不十分である。レポートの目的は、アメーバブログに提供している機械学習フィルタを例として、長期的に運用可能な機械学習システムを考察することである。 目次 1.はじめに アメブロは,アメーバで最も古く,情報発信手段として多くのユーザに利用されているブログサービスである.2015年2月のデータでは,一日当たり約数十万件のエントリーが投稿されている.一方で,一部の悪意

    kimutansk
    kimutansk 2016/10/24
    モジュール分割、モデルのバージョン管理あたりは他のプログラムでもよくある話と。アンチパターンは面白いです。