クックパッド・R&Dインターンシップ MLOpsの講義資料 コードの場所は以下 https://github.com/chie8842/cookpad-internship-mlops-2018
![Cookpad_Internship_MLOps_Lecture_2018](https://cdn-ak-scissors.b.st-hatena.com/image/square/51c55351a43fb286e724fe0e6d24183961d6119a/height=288;version=1;width=512/https%3A%2F%2Ffiles.speakerdeck.com%2Fpresentations%2F426ddd0ef65f4040ae7828f22644ed6a%2Fslide_0.jpg%3F10650267)
さて、改めて今回の目的を確認しておくと、機械学習を使って東京都23区のお買い得賃貸物件を発見しよう、というものです。前回までの記事で、お買い得賃貸物件を発見するためのデータを収集し、分析にかけられるよう前処理してきました。 www.analyze-world.com www.analyze-world.com 今回の記事では、いよいよ機械学習を使って分析していきましょう。前回まではPythonを使っていましたが、この分析ではRを用いています。なお、コードはGitHub(https://github.com/ShoKosaka/Suumo)に上げておきますので興味ある方は参照ください。 最初に、データの中身をざっくり見ていきます。具体的には、分析のキーになるポイントをグラフにしながら、賃貸物件の現状や変数同士の関係性を把握していきます。 データ探索 まず、23区の中でどこが物件数が多いのかを
研究開発部の菊田(@yohei_kikuta)です。機械学習を活用した新規サービスの研究開発(主として画像分析系)に取り組んでいます。 最近読んだ論文で面白かったものを3つ挙げろと言われたら以下を挙げます。 Poincaré Embeddings for Learning Hierarchical Representations Training Group Orthogonal Neural Networks with Privileged Information Fluctuation Theorem for Many-Body Pure Quantum States クックパッドのアプリには「料理きろく」という機能があります。 携帯端末から料理画像のみを抽出して表示することで自分が食べたものを振り返れるようになっており、ここからレシピ投稿やつくれぽを送ることもできるようになっています
この4人の美少女キャラのうち、 3つは、 「コンピュータで自動生成」したもの 1つだけ 「人の手で描かれたもの」です。 どれが「人の手で描かれたもの」か、判りますか? (答えは中ごろにあります) ************ 美少女キャラクターをコンピュータが自動生成してくれるサイトがあります。 make.girls.moe 製作者twitter: Aixile@MakeGirlsMoe (@namaniku0) | Twitter (サイトの使い方の詳細などは下記サイトが参考になります) 1クリックで嫁がポンポン生まれるサービスが登場 深層学習で萌えキャラを自動生成 - ねとらぼ また、どうやって作っているかの解説論文も公開されています(英文) (どうも「Getchu.com」のサムネイルを学習させて画像処理しているっぽいですね・・) 何も考えず1クリックで、このレベルの美少女画像が無限に出
研究開発部の菊田(@yohei_kikuta)です。機械学習を活用した新規サービスの研究開発(主として画像分析系)に取り組んでいます。 最近読んだ論文で面白かったものを3つ挙げろと言われたら以下を挙げます。 Why does deep and cheap learning work so well? Universal adversarial perturbations Understanding deep learning requires rethinking generalization 以前本ブログで紹介した Hackarade: MRI Internal Challenge ですが、その第二回として機械学習を題材にしたハッカソンが七月末に開催されました。 Hackarade ではエンジニアにとって長期的に有益となる技術を題材にしようという想いがあります。 今回はクックパッドの研究
機械学習の取り組みを次々と実装! クックパッドの“即戦力”新卒エンジニアが活躍できる背景とは 「若手エンジニア、どんな活躍してますか?」第5回は、日本最大の料理レシピサービスを運営するクックパッド編。発足から間もない研究開発部で、機械学習の開発基盤から実サービスへの組み入れまでを担当した新卒エンジニアが、入社後すぐに第一線で活躍できた背景を詳しく伺いました。 若手エンジニアのための情報メディア「エンジニアHub」。連載「若手エンジニア、どんな活躍してますか?」第5回は、日本最大の料理レシピサービスを運営するクックパッド編です。 2016年7月に発足したクックパッドの研究開発部で、機械学習の開発基盤から実サービスへの組み入れまでを担当したのは、新卒入社1年目の染谷悠一郎(そめや・ゆういちろう)さんでした。メンター役である部長の原島純(はらしま・じゅん)さんは「プログラミングに関しては染谷さん
はじめまして。 本業はアスキーアート (以下AA) 職人のOsciiArtといいます (本業ではない)。 AlphaGo対イ・セドルの対局を見て、「僕もディープラーニングで神AA職人を倒したい!」と思い、pythonをインストールしてちょうど一年の成果を書いていきます。 コードはこちらにアップしてあります。 https://github.com/OsciiArt/DeepAA ここで扱うアスキーアートとは ここで扱うAAとは、 こういうの……↓ ではなく、こういうの……↓ でもなく、こういうの……↓ ともちょっと違って、こういうの……↓ ではもちろんなく、こういうのです。↓ このような、線画を文字を作って再現した「トレースAA」と呼ばれるタイプのAAをここでは扱います。 詳細はwikipediaの「アスキーアート」のページの「プロポーショナルフォント」の項を参照してください。 wikipe
モデルフリー系の深層強化学習の手法を用いてスマブラDXのゲームAIを作ったという論文が出ていたので読んだ。以下はそのメモ。 概要 論文URL : https://arxiv.org/abs/1702.06230 著者のグループは github でコードを公開しており、そのデモ動画が twitch や youtube に上がっている。 www.youtube.com 上の動画はその一例。明記されていないが、動きからして 2P のキャプテン・ファルコンが強化学習 AI で、1P が人間だと思われる。スマブラの素人が見てもあまりピンと来ないのだが、人間側は世界ランキングでトップ50相当のプレイヤー(二人いて、途中で交代している)らしい。 reddit や hacker news でも活発に議論されている模様。 内容 環境の定義について Atari のゲーム環境などとは異なり、画像ではなくエミュレ
ここ最近、Google翻訳がリニューアルされ、性能が向上したという話が流れてきたので、さっそく試してみた。 ぼくが真っ先に試したのは、「母は、父が誕生日を忘れたので、怒っている。」だ。 なぜこの文が気にかかっていたかは後述する。 結果は次の通り。 "My mother is angry because my father forgot her birthday." すばらしい。 では、「母は、父が鞄を忘れたので、怒っている。」はどうだろうか。 "My mother is angry because my father forgot his bag." 完璧だ! 「誕生日を忘れた」の場合は「母の誕生日」と解釈し、「鞄を忘れた」の場合は「父の鞄」と解釈する。 これこそ、利用者が翻訳に求めるものじゃないだろうか。 しかし、ここまでだった。 次にぼくは、「父」と「母」を入れ替え、「父は、母が誕生日
こんにちは。ぼへみあです。 先日はポケモンの個体値判別の記事を書いたらかつてないほどバズって驚きました。 今では、スクリーンショットを撮ったり、常駐してゲーム画面に被せるタイプの個体値チェッカーアプリがたくさん出てきてるので、分度器勢は消え去ったようです。 被せるタイプはとても便利で使っているのですが、基本的に入力は全て自分で行う必要があり、少し面倒です。 コンピュータビジョン研究者見習いとしては、全てローカルの画像認識で行わせたいところです。 そこで手始めに、ポケモンの種類を画像認識で判別するためにポケモンデータセットを作ったのですが、寄り道してポケモンから妖怪ができてしまったので、そのお話です。 ポケモンデータセットの作成 機械学習でクラス分類を行わせるのためには、そのドメインのデータセットが必要です。 以前、おそ松さんを見分けた時も6000枚弱のデータセットをスクリーンショットをたく
Appleは、長年、自社製品に機械学習を使っています。例えば、Siriは、あなたの質問に答え、楽しませてくれます。iPhotoは、写真の中の顔を認識します。メールアプリは、スパムメッセージを検知します。アプリ開発者なら、 顔認証 のようにAppleのAPIで公開されている機能の幾つかを利用できます。iOS 10から始めて、音声認識やSiriKit用のハイレベルAPIを入手しましょう。 時々、プラットフォームに内蔵されているAPIの狭い領域を超えて、独自のものを作りたいと思うこともあるでしょう。多くの場合は機械学習を始動させますが、その際、たくさんの既成のライブラリのうちの1つを使ったり、高速計算能力を持つAccelerateやMetalの上に直接組み上げたりして実現します。 例えば、私の同僚が構築したオフィス入室システムは、iPadを使って顔認証を行い、SlackにGIF画像を投稿して、ユ
ウェブにはSEOの情報が氾濫している。しかし、どれが正しいのかは、いまいちわからない。最近では「良質なコンテンツを提供するのが一番のSEO対策」という論調が主流になっているが、一方でSEOのテクニックがシェアされる様子もまだ見かける。 良質なコンテンツを提供すれば、SEOの対策はしなくてもいいの? 一体、正しいSEOって何? そんな素朴な疑問を、株式会社so.la代表でSEO専門家の辻正浩さんにぶつけてみた。 辻さんは普段からTwitterやブログなどでSEO情報を発信しており、日本でおこなわれる全検索のうち約2.5%は、辻さんが仕事で関わるサイトがクリックされているとのこと。 最近では悪質なSEO業者と熱いバトルを繰り広げたことも記憶に新しい。 そんな“SEOのご意見番”である辻さんの返事は「世の中の99%のサイトは、SEOなんて考えなくてもいいんじゃないでしょうか」というもの。その真意
By Jimmy Baikovicius プログラマーのJi-Sung Kim氏が36時間のハッカソンで作り上げたという自動ジャズジェネレーターが「deepjazz」です。deepjazzはPython製のディープラーニングライブラリである「Keras」と「Theano」を使用して作り上げられた2層構造の「Long short-term memory(LSTM)」で、MIDIファイル(音源データ)を与えると音楽を学習してオリジナルのジャズを作曲してくれます。 deepjazz: deep learning for jazz http://deepjazz.io/ 「deepjazz」は、Googleの「AlphaGo(アルファ碁)」やIBMの「WATSON」などのような、人工知能(AI)の一種です。Googleのアルファ碁は囲碁を打つ能力に特化したAIですが、deepjazzはその名の通り
「いつか勉強しよう」と人工知能/機械学習/ディープラーニング(Deep Learning)といったトピックの記事の見つけてはアーカイブしてきたものの、結局2015年は何一つやらずに終わってしまったので、とにかく一歩でも足を踏み出すべく、本質的な理解等はさておき、とにかく試してみるということをやってみました。 試したのは、TensorFlow、Chainer、Caffe といった機械学習およびディープラーニングの代表的なライブラリ/フレームワーク3種と、2015年に話題になったディープラーニングを利用したアプリケーション2種(DeepDream、chainer-gogh)。 (DeepDreamで試した結果画像) タイトルに半日と書きましたが、たとえばTensorFlowは環境構築だけなら10分もあれば終わるでしょうし、Chainerなんてコマンド一発なので5秒くらいです。Caffeは僕はハ
基本的に競馬なんてやるべきではないと私は思っている。胴元の取り分が多いからだ。宝くじに比べればまだましだが、それでも賭け金の20~30%は胴元に取られることになる。*1 しかし今回は、ちょっと思い立って競馬の予測をやってみることにした。 理由は馬券の安さだ。私は現在、資金量が少ない人間でも不利にならない投資先を探しているのだが、馬券の一枚100円という安さは魅力的に映る。株の場合にはどんな安い株であれ最低購入額は数万円以上*2なので、ある程度まとまった資金が必要になる。 また、競馬には技術介入の余地(努力次第で勝利できる可能性)がある。 例えばこんな例がある。 160億円ボロ儲け!英投資会社が日本の競馬で荒稼ぎした驚きの手法 - NAVER まとめ 彼らは統計解析によって競馬で勝っており、その所得を隠していたらしい。こういうニュースが出るということは、解析者の腕次第では競馬で勝てる可能性が
About reserved postingIf you register a secret article by the day before the same day, it will be automatically published around 7:00 on the same day. About posting periodOnly articles submitted after November 1 of the year can be registered. (Secret articles can be registered anytime articles are posted.)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く