タグ

MLに関するshunpyのブックマーク (9)

  • 「ABテスト」って・・・ - 業界人間ベム

    ネット専業系の文化に「ABテストして・・・」という最適化概念があるが、これに関しては、ベムは昔から、「それってAからZまで考えてからABテストしてるのかな?AとBのふたつだけ考えてどっちがいいかなんて、もしかするとどっちが一番ひどいクリエイティブかを選別するYZテストかもしれないよね?」という憎まれ口を叩くことにしている。 トラディショナルな広告コミュニケーション開発をやってきた僕には、表現開発には「まず考えられることを全部書き出してみよう」というプロセスから入るのが習慣づいている。「明日までに100コピー書いてこい!」というのは、質を求めてはいない。量を求めている。つまりは表現する考え方をいったん網羅して、それから収斂させるというのが、クリエイティブ開発の王道だと思っているし、実際そういうことをやってきた。ブレストも、KJ法・ラダー法もこうしたプロセスに応用するために学んだ。 一方、ネ

  • ディープラーニングの限界 | POSTD

    (注:2017/04/08、いただいたフィードバックを元に翻訳を修正いたしました。 @liaoyuanw ) この記事は、私の著書 『Deep Learning with PythonPythonを使ったディープラーニング)』 (Manning Publications刊)の第9章2部を編集したものです。現状のディープラーニングの限界とその将来に関する2つのシリーズ記事の一部です。 既にディープラーニングに深く親しんでいる人を対象にしています(例:著書の1章から8章を読んだ人)。読者に相当の予備知識があるものと想定して書かれたものです。 ディープラーニング: 幾何学的観察 ディープラーニングに関して何より驚かされるのは、そのシンプルさです。10年前は、機械認識の問題において、勾配降下法で訓練したシンプルなパラメトリックモデルを使い、これほど見事な結果に到達するなど誰も想像しませんでした。

    ディープラーニングの限界 | POSTD
  • 実タスクで機械学習を導入するまでの壁とその壁の突破方法 - yasuhisa's blog

    社内で機械学習の案件があった際に、機械学習の経験者しか担当できないと後々の引き継ぎで問題が起こりがちです。これを防ぐために、機械学習に興味があり、これまで機械学習を経験したことがないエンジニアにも担当できる体制を整えられることが望ましいです。しかし、機械学習のことに詳しく知らないディレクターやエンジニアにとっては、どのような機械学習の理解段階ならばタスクを任せられるかの判断をするのはなかなか困難です。そこで、このエントリでは機械学習を実タスクでやるまでに乗り越えるべき壁だと私が思っているものについて説明します。 第一の壁: 綺麗なデータで機械学習の問題を解ける 講義で扱われるような綺麗なデータを扱える 行列形式になっていて、欠損値や異常値もない 上記のデータを回帰や分類問題として解くことができる 実際に解く際にはライブラリを使って解いてよい 手法を評価する上で何を行なえばよいか(Preci

    実タスクで機械学習を導入するまでの壁とその壁の突破方法 - yasuhisa's blog
  • 第1回 機械学習 ことはじめ | gihyo.jp

    次のサービスや製品はどれも身近にありますが、これらに共通していることはなんでしょう。 Amazonの「この商品を買った人はこんな商品も買っています」 はてなブックマークの「関連エントリー」 Google 翻訳 Google 日本語入力 メールクライアントのスパムフィルタ デジタルカメラの自動顔認識 ニンテンドーDSの手書き文字認識 買い物履歴、ユーザが書いたコメントやタグ、Webに無数にあるページ、メール、画像や動画と対象はそれぞれ異なっていますが、どれも「データから有益な情報を取り出す」ということを行っています。 これらは「機械学習」という技術を使って実現されているのです。 機械学習の応用範囲 機械学習は冒頭で挙げた以外にも、様々な分野で使われています。 例えば、ノイズ除去や特徴の抽出を目的とした利用パターンがあります。音声認識や画像認識、文字認識(OCR)などはその代表格です。それらも

    第1回 機械学習 ことはじめ | gihyo.jp
    shunpy
    shunpy 2017/01/20
  • 機械学習を1ヵ月で実践レベルにする #1 (とっかかり編) - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 会社から1ヵ月の自由研究期間を頂いたので、かねてより興味のあった機械学習の勉強を始めました。せっかくなので学習の記録をつけていこうと思います。1日目の今日は、機械学習を学ぶ上での文献や、学び方へのまとまりのないリファレンスとなりました。 過去記事一覧 1日目 とっかかり編 2日目 オンライン講座 3日目 Octave チュートリアル 4日目 機械学習の第一歩、線形回帰から 5日目 線形回帰をOctave で実装する 6日目 Octave によるVectorial implementation 7日目 ロジスティック回帰 (分類

    機械学習を1ヵ月で実践レベルにする #1 (とっかかり編) - Qiita
    shunpy
    shunpy 2017/01/13
  • 機械学習をゼロから1ヵ月間勉強し続けた結果 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 追記 2018年の機械学習勉強法などをまとめました! 2018年版もっとも参考になった機械学習系記事ベスト10 はじめに 2016/12/14 から約1ヵ月間、機械学習の勉強をし続けました。これは会社の自由研究という制度を利用させて頂いて、1ヶ月間は業務から離れて、機械学習の勉強だけをやり続けた記録です。 勉強してきたもののうち教師あり学習までは、Qiita にその記録をまとめましたので過去記事一覧からご覧ください。 過去記事一覧 1日目 とっかかり編 2日目 オンライン講座 3日目 Octave チュートリアル 4日目 機械学習の第一

    機械学習をゼロから1ヵ月間勉強し続けた結果 - Qiita
  • ニューラルネットワークの基礎を初心者向けに解説してみる|迫佑樹オフィシャルブログ

    こんにちは,学生エンジニアの迫佑樹(@yuki_99_s)です. 先日の大学の講義でニューラルネットワークを扱ったのですが,それがめちゃめちゃわかりやすかったんです. そこで,ニューラルネットワークの基礎の基礎を,高校生でもわかる簡単な数学だけを使って解説してみようと思います. 理解のしやすさを念頭に置いたので,ニューラルネットワーク・機械学習を専門に学ばれている方からすれば違和感を感じる表現もあるかもしれませんがご了承ください. ニューラルネットワークとは よく聞く,ニューラルネットワークなのですが,一体何なんでしょうか? これは,とてもざっくり説明すると,人間の脳の仕組みをコンピュータに適用したものです. 人間の脳には,ニューロンと呼ばれる神経細胞があります. このニューロンは,他のニューロンから信号を受け取ったり,信号を受け渡したりすることによって,情報を処理しています. つまり,こ

    ニューラルネットワークの基礎を初心者向けに解説してみる|迫佑樹オフィシャルブログ
    shunpy
    shunpy 2016/12/06
  • [自然言語] Wordnet × Pythonで類義語を抽出する - YoheiM .NET

    こんにちは、@yoheiMuneです。 最近はブログがご無沙汰になってしまっていたのでそろそろ書き出そうと思う今日この頃。日は最近激勉強中の機械学習や自然言語処理からブログを書きます。Wordnetと呼ばれる自然言語の分類体系を用いて、指定した単語の類義語を取得する方法を書きたいと思います。 目次 Wordnetとは Wordnet(日語版)はシソーラス(言葉を同義語や意味上の類似関係、包含関係などによって分類した辞書)で単語間の関係を保持しています。この関係性を利用することで、ある単語の類義語を得ることができます。 シソーラスのイメージ 引用:http://astamuse.com/ja/published/JP/No/2010129025 このシソーラスを持つWordnetを、今回はPythonから利用して、類義語を出してみたいと思います。 Wordnetのセットアップ Wordn

    [自然言語] Wordnet × Pythonで類義語を抽出する - YoheiM .NET
  • 【特別連載】 さぁ、自然言語処理を始めよう!(第1回: Fluentd による Tweet データ収集) | ブログ一覧 | DATUM STUDIO株式会社

    はじめにみなさまこんにちは。 データ分析に力を入れている会社でも、大量に蓄積されているテキストデータから有用な情報を抽出する「テキストマイニング」はなかなかハードルの高い分野ではないでしょうか? この連載では実際に Twitter でつぶやかれている話題の分析を行うことで、テキストマイニング行う際に必要になる技術・手法を解説したいと思います。 具体的には以下の内容を予定しています。1回目: fluentd による Tweet データ収集2回目: 単純集計によるテキストマイニング3回目: 機械学習によるTweet分類今回は以前の連載記事 【特別連載】さぁ、社内でデータ分析を始めよう!(第2回:新しくログを作成してみる) で解説した fluentd を利用して、対象となるテキストデータを Twitter から収集してみたいと思います。 具体的には Twitter Streaming API

    【特別連載】 さぁ、自然言語処理を始めよう!(第1回: Fluentd による Tweet データ収集) | ブログ一覧 | DATUM STUDIO株式会社
  • 1