201710に関するkatakamoのブックマーク (26)

  • Deep Learning以外の手法でユニクロコンに参戦してみた (Kaggle Meetup #3)

    Transcript Deep Learning以外の⼿法で ユニクロコンに参戦してみた @mamas16k Kaggle Tokyo Meetup #3 Outline 0.はじめに 1.ユニクロコンペとは? 2.結果 3.⼿法 4.上位の⼈の⼿法まとめ 0.はじめに • Twitter ID: mamas16k • 物理系の学部2年⽣ • 機械学習暦・プログラミング暦共に1年ぐらいの初⼼者 • データ分析系の企業でインターンしてました • ユニクロコンは初の機械学習コンペ 今回のKaggle Meetupの初⼼者枠なので、あまり真に受けずにた くさんマサカリを投げてくれると有り難いです>< 1.ユニクロコンペとは? • Kaggleではなく、オプトDSLで2017年4⽉ ~ 7⽉に開催 • スポンサー:Fast Retailing (ユニクロの親会社) • 服、下、ベルト等の画像を2

    Deep Learning以外の手法でユニクロコンに参戦してみた (Kaggle Meetup #3)
  • パワーアップしたKernelでKaggleに飛び込もう - Qiita

    はじめに Kaggleって、初めての人にはちょっと敷居が高いですよね。 私も「猛者ばかり集まっていて辛い」「初心者だと戦えないだろうからまだ使わなくていいや」という印象でアカウントは作ったもののしばらく使っていませんでした。 しかし、最近Kaggleのコンペに参加してみようという社内の有志の集まりがありチャレンジして見たところ、やはり学びが多くて面白く、これからはもっと使ってみようと考えるようになりました。 そこで、まだKaggleを使ったことがない人向けの取っ掛かりとして、この記事を書いて見ることにしました。 最近KaggleのKernelがパワーアップした KaggleにはKernelという機能があり、自分で環境を用意しなくてもブラウザ上で簡単にコードを実際に動かすことができます。さらにそれを公開できるようになっており、他のコンペ参加者とコードを共有することができます。(もちろん非公開

    パワーアップしたKernelでKaggleに飛び込もう - Qiita
  • Kaggle入門動画をつくった - tkm2261's blog

    皆様こんにちわ 今回はKaggle入門動画作ったので、その事について書いていきます。 Twitterでも告知したし、ブログは良いかなーと思ってたのですが、 ニートで新しいこと挑戦企画としてYoutuberになってみました Kaggleの提出までを環境構築からライブコーディングして実況解説してみました。私流のKaggleワークフローですがよければ見てみて下さいhttps://t.co/0QUDEa1etK— Takami Sato (@tkm2261) 2017年10月20日 英語の翻訳タイトルつけると、Googleが日語でインデックスしてくれない事に気づき、ブログにも投稿することにしました。 良ければ見てみて下さい。 Kaggle入門 Porto Seguroコンペ www.youtube.com 規約的に怪しかったので、Kaggleにも問い合わせてOK貰ってます。 https://ww

    Kaggle入門動画をつくった - tkm2261's blog
  • AlphaGo と AlphaGo Zero の自己対戦による学習部分の違い - うどん記

    流し読みだとちゃんと分からなかったのでメモ。 準備(AlphaGo) policy network : 盤面とその特徴量を入力として受け取り、各マスに打つ確率を返すニューラルネット。 value network: 盤面とその特徴量を入力として受け取り、その盤面での勝率を返すニューラルネット。 AlphaGo ではまず policy network をプロの棋譜データから教師あり学習で事前学習させ、その後自己対戦による強化学習によってさらに改善させていく。 AlphaGo の強化学習パート 教師あり学習後の policy network のパラメータ $\rho_0$ から学習をスタートする。自己対戦の結果から policy network のパラメータは随時更新されていく。それらを $\rho_1, \rho_2, \cdots$ とする。$t$ 回目の自己対戦では、現在のパラメータ $\

    AlphaGo と AlphaGo Zero の自己対戦による学習部分の違い - うどん記
  • 料理きろくと機械学習

    【京都開催 feat.はてな】Cookpad Tech Kitchen #11 https://cookpad.connpass.com/event/64837/ 【福岡開催 feat.ペパボ】Cookpad Tech Kitchen #12 https://cookpad.connpass.com/event/64844/ で発表したものです

    料理きろくと機械学習
  • Personalized Medicine Redefining Cancer Treatment Solution

    Building Better People: How to give real-time feedback that sticks.

    Personalized Medicine Redefining Cancer Treatment Solution
  • これから強化学習を勉強する人のための「強化学習アルゴリズム・マップ」と、実装例まとめ - Qiita

    ※2018年06月23日追記 PyTorchを使用した最新版の内容を次の書籍にまとめました。 つくりながら学ぶ! 深層強化学習 ~PyTorchによる実践プログラミング~ 18年6月28日発売 これから強化学習を勉強したい人に向けて、「どんなアルゴリズムがあるのか」、「どの順番で勉強すれば良いのか」を示した強化学習アルゴリズムの「学習マップ」を作成しました。 さらに、各手法を実際にどう実装すれば良いのかを、簡単な例題を対象に実装しました。 記事では、ひとつずつ解説します。 オレンジ枠の手法は、実装例を紹介します。 ※今回マップを作るにあたっては、以下の文献を参考にしました。 ●速習 強化学習: 基礎理論とアルゴリズム(書籍) ●Deep Learning for Video Game Playing 強化学習とは 強化学習は、画像識別のような教師あり学習や、クラスタリングのような教師なし

    これから強化学習を勉強する人のための「強化学習アルゴリズム・マップ」と、実装例まとめ - Qiita
  • オープンソースの機械学習プラットフォームまとめ - たけぞう瀕死ブログ

    PredictionIOは機械学習を使用したアプリケーションを開発・運用するためのプラットフォームを提供するためのOSSですが、世の中には他にも同じ領域のOSSが存在します。PredictionIO含めて各プロダクトの特徴をまとめてみました(PredictionIO以外はドキュメントやソースをチラ見して書いているので見落としていることなどあるかもしれませんがご容赦いただければと思います)。 PredictionIO github.com Apache Software Foundationで開発されている機械学習プラットフォームです。基的にSpark上で動作する機械学習ライブラリをターゲットにしていますが、最近はPython対応なども行われています。作成したマイクロサービスはSprayベースのAPIサーバとして起動することが可能です。用途に応じたテンプレートが多数用意されており、それをカ

    オープンソースの機械学習プラットフォームまとめ - たけぞう瀕死ブログ
  • 一般向け機械学習本の決定版 - The Master Algorithm by Pedro Domingos - 未翻訳ブックレビュー

    Pedro Domingos - The Master Algorithm このブログで何回も名前を出しているユヴァル・ノア・ハラリ「ホモ・デウス」は、人間の全ての活動はアルゴリズムにいずれ置き換え可能だろうと説くだった。 ハラリはさらにそれを歴史の文脈に位置付ける。神が中心の時代から、神を解体して生まれた人間中心主義の時代があり(←いまココ)、人間を解体する「データ主義」の時代がやがて来るだろうと。簡単に表にすると以下の通り。 神中心 人間は神の創造の産物に過ぎない 人間主義 Humanism 神は人間の想像の産物に過ぎない データ主義 Dataism 人間の想像もアルゴリズムの産物に過ぎない ハラリの見立ては挑発的でめちゃくちゃ面白いのだけど、ひとつ腑に落ちない点もあった。じゃあ人間を置きかえるアルゴリズムって具体的に何?というのが全く不明なのだ。アルゴリズム=「物事を処理する手順、

    一般向け機械学習本の決定版 - The Master Algorithm by Pedro Domingos - 未翻訳ブックレビュー
  • How to unit test machine learning code.

    Credit: https://provalisresearch.com/blog/machine-learning/Edit: The popularity of this post has inspired me to write a machine learning test library. Go check it out! Second Edit: The Github user suriyadeepan made a PyTorch port as well! Over the past year, I’ve spent most of my working time doing deep learning research and internships. And a lot of that year was making very big mistakes that hel

    How to unit test machine learning code.
  • AIは医療の未来をどのように変えるのか?

    (写真:A Health Blog/クリエイティブ・コモンズ表示 2.0 一般) 日でもアメリカでもAIはブームであり、いたるところで見聞きします。AIを使っていると主張するたけで会社を1つや2つ起こすことができると言われるほどブームであると言われる一方で、AIは「誇大広告(Hype)」であるという意見もアメリカではしばしば目にするようになってきました。 例えばこの記事では、登壇者の一人がAIによって医師の代わりに放射線診断ができるようになるのではないかとコメントしたところ、IBMワトソンの医療部門(ワトソンヘルス)の責任者であるDiSanzo氏がそうではないと反論しました。彼女曰く、AIはCTスキャンの画像が64枚あったとして、そのうちの重要な4枚を選び出して、カルテ情報と共に医師に提供することはできるが、そこに映っているものががんなのか良性腫瘍なのかは人が判断しないといけないとコメン

    AIは医療の未来をどのように変えるのか?
  • LIMEで機械学習の予測結果を解釈してみる - Qiita

    初投稿です 追記(20171031) HTMLを出力する際のエンコードがasciiだったため日語が文字化けしていましたが、UTF-8をサポートするようになったようです! 下記に文字化け対策の文章がありますが、読み飛ばしていただければ幸いです。 導入 セクシーなデータサイエンティストの皆様におかれましては、日々の業務で様々な機械学習のモデルを構築しておられるかと思います。それは例えば、あるサービスのユーザ情報を用いてコンバージョンするかしないかを予測していたり、またある時は年収を回帰で予測していたり、またあるときはユーザが投稿した画像情報についての二値分類やテキストデータについてのネガポジ分類をしていたりすることでしょう。 これらにつきものなのが、この予測モデルを実装する際の関係者への説明です。このモデルはどうしてこのような結果を出しているのか、なんでこのユーザは低い年収だと判定されている

    LIMEで機械学習の予測結果を解釈してみる - Qiita
  • AWSとマイクロソフト、深層学習ライブラリ「Gluon」を発表 - ZDNet

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます Amazon Web Services(AWS)とMicrosoftは米国時間10月12日、オープンソースの深層学習ライブラリ「Gluon」を発表した。両社は、Gluonによってより多くの開発者が機械学習を利用できるようになると述べている。 開発者はGluonによって、クラウドアプリ向けやモバイルアプリ向けの機械学習モデルのプロトタイプ作成や構築、訓練、配備を実現するためのインターフェースを手にできる。 両社の説明によると、Gluonは他の製品に比べ、簡潔で理解しやすいプログラミングインターフェースを備えている。このため開発者は、パフォーマンスを犠牲にすることなく、ニューラルネットワークモデルのプロトタイプ作成や実験を迅速に行うことがで

    AWSとマイクロソフト、深層学習ライブラリ「Gluon」を発表 - ZDNet
  • 【新人教育資料】時系列予測をprophet(Python)でやってみる第1章 〜インストールから簡単な予測編〜 - Qiita

    あらすじ 最近は日にいなかったり、インタビューや講演ばっかり受けてて、Qiitaサボリ気味でしたが、少しずつ再開しようと思ってます。 社内の技術イベントでLTしたものをかいつまんで記事をアップしたいと思います。 細かい事は特に気にせず、非エンジニアでもサクッと出来るレベルなので、やってみてください。 ※後々、リクエストに応じて更新することが多いのでストックしておくことをおすすめします。 自分は某社でCTOをしていますが、頭でっかちに理論ばっかり学習するよりは、イメージがなんとなく掴めるように学習し、実践の中で知識を深めていく方が効率的に学習出来ると考えています。 未経験者の教育についてインタビューされた記事もあるので紹介しておきます。ご興味ある方は御覧ください。 エンジニアは「即戦力」より理念に共感した「未経験者」を育てるほうが費用対効果が高い。 教育スタイルとしては正しい事をきっちりか

    【新人教育資料】時系列予測をprophet(Python)でやってみる第1章 〜インストールから簡単な予測編〜 - Qiita
  • 機械学習におけるカーネル法について - めもめも

    何の話かというと 機械学習におけるカーネル法の説明で、よく登場するのがこちらの図です。 左側の (x, y) 平面上の点を分類する場合、このままだと線形分類器(直線で分類するアルゴリズム)ではうまく分類できないのが、右図のように z 軸を追加してデータを変形すると、平面できれいに分割できるようになって、線形分類器による分類がうまくいくというものです。このように、高次元空間にデータを埋め込むことでうまいこと分類するのがカーネル法の仕組みだというわけです。 なのですが・・・・・・・・・・・・・・・・・・・・ これ、当にカーネル法の原理を知っている方には、ちょっと気持ち悪くないですか? ※ 以下はカーネル法を知っている方向けのつぶやきです。 上記の例は、データの配置にあわせて、うまいこと z 軸方向の変形をしているのでうまくいっているのですが、カーネル法には、データの配置にあわせてうまいこと変

    機械学習におけるカーネル法について - めもめも
  • TechCrunch

    In tech, ‘dogfooding’ means using your own stuff in the way you intend for your users to, which is helpful to make sure your stuff lives up to your marketing claims. Apple dogfoods in a nu

    TechCrunch
  • 特異スペクトル変換法による時系列データの異常検知(Python) - Fire Engine

    はじめに 今回は、特異スペクトル変換法というアルゴリズムをPythonで実装します。このアルゴリズムは時系列データの異常検知に対して非常に強い力を発揮します。また、ハイパーパラメータ(人が調整する必要のあるパラメータ)が少なく、比較的チューニングが容易であることも特徴の一つです。数学の理論については深追いはせず、アルゴリズムの概要と実装まで書いていきたいと思います。 【目次】 はじめに 時系列データについて 時系列データの異常と変化点検知 特異スペクトル変換法の概要 履歴行列とテスト行列 特異値分解 変化度の定義 Pythonによる実装 特異スペクトル変換法の課題 おわりに 時系列データについて 時系列データとは、時間の推移ととともに観測されるデータのことです。昨今、様々な企業がデータ活用を推進していますが、世の中の実務の現場に貯まっていく多くのデータは時系列のデータです。 データ分析にお

    特異スペクトル変換法による時系列データの異常検知(Python) - Fire Engine
  • Pythonを書き始める前に見るべきTips - Qiita

    Pythonを使ってこの方さまざまな点につまずいたが、ここではそんなトラップを回避して快適なPython Lifeを送っていただくべく、書き始める前に知っておけばよかったというTipsをまとめておく。 Python2系と3系について Pythonには2系と3系があり、3系では後方互換性に影響のある変更が入れられている。つまり、Python3のコードはPython2では動かないことがある(逆もしかり)。 Python3ではPython2における様々な点が改善されており、今から使うなら最新版のPython3で行うのが基だ(下記でも、Python3で改善されるものは明記するようにした)。何より、Python2は2020年1月1日をもってサポートが終了した。よって今からPython2を使う理由はない。未だにPython2を使う者は、小学生にもディスられる。 しかし、世の中にはまだPython3に

    Pythonを書き始める前に見るべきTips - Qiita
  • 「日本は機械学習パラダイス」 その理由は著作権法にあり

    「日機械学習パラダイスだ」。こう提言したのは、早稲田大学法学部教授の上野達弘さんだ。 なぜなのか。その理由は、日の著作権法にある。 日の著作権法では、「情報解析を行うために著作物を複製すること」が、営利・非営利問わず認められているのだ。世界にもまれな規定だという。 著作権・AIに詳しい弁護士・柿沼太一さんが10月2日に都内で開いた「AIビジネス法務・知財セミナー」の内容から、機械学習と日の著作権法の関係についてまとめる。 キモは「著作権法47条の7」 機械学習とは、大量のデータをプログラムに解析・学習させることで、プログラムが自らデータの特徴を見つけ出し、分類・整理できるようにする手法。例えば、大量のの写真を学習させ、の特徴を学んだモデルに、新たな動物の写真を入力すると、ではないかを判別する――といったイメージだ。 機械学習を行うためには、大量のデータをAIプログラムに

    「日本は機械学習パラダイス」 その理由は著作権法にあり
  • 日本が機械学習パラダイスなのは情報大航海プロジェクトのおかげ - kuenishi's blog

    人工知能じゃ〜これからはシンギュラリティじゃ〜と盛り上がっており、も杓子も深層学習で人工知能で人類皆失業などと楽しいお祭り、ぼくは嫌いじゃない。我々が生きていくためには金が必要なんだ。というわけで、ちょっと気になって調べたことがあったのでここに記録しておく。もしこれが知財や法曹方面の業界で有名な話だったらコンピュータエンジニアたち何やってんのという話ではある。 AIブームというやつが燃料になって日機械学習パラダイスだという記事が話題になっているが、これは平成21年の著作権法改正で追加された著作権法47の7のおかげである(ラッキー!) じゃあ、そもそもどうしてそんな条項ができてるの? 調べてみたら情報大航海プロジェクトが深く関わっているようだよ?ちょっとは感謝したらどう?? もともとこれが気になっていた。ので調べました。という話。 著作権法の47の7が、思いがけず今重要にって解説が散見

    日本が機械学習パラダイスなのは情報大航海プロジェクトのおかげ - kuenishi's blog