2019年4月2日のブックマーク (9件)

  • JupyterHubの構築 - Qiita

    JupyterHubを構築する みなさまはPythonのコーディング環境、なにを使っていますか? Jupyter Notebookという人も意外と多いと思います。 Jupyter NotebookはWebブラウザで使うコーディング環境で、プラグインを使うことでPython以外にもJavaやR等のコーディング環境にもなります。 Jupyter Notebookだけではユーザ管理はできず、グループで開発を行うときに不便です。 JupyterHubを使えばJupyter Notebookにユーザ認証のインターフェイスを付けることができるので、その構築方法を紹介します。 ※ Jupyter NotebookはAnacondaでインストールするのが簡単です。 https://www.continuum.io/downloads ※ JupyterHub http://jupyterhub.readt

    JupyterHubの構築 - Qiita
    soy-curd
    soy-curd 2019/04/02
  • PLSA(確率的潜在意味解析法)|Deloitte Analytics|デロイト トーマツ グループ|Deloitte

    PLSAとLDA 昨今のビッグデータ時代の分析では高次元データを扱うことも多く、このような次元圧縮の技術が注目されているが、実際にはPLSAよりもそれと同様の手法であるLDAの方が世間的に認知されているといえるだろう。この手法はトピックモデルと呼ばれ、元々LSA (Latent Semantic Analysis)という手法があり(Deerwester et al, 1990)、それを確率的な処理をして改良したものがPLSAであり、さらにその拡張版として開発されたのがLDA (Latent Dirichlet Allocation)である(Blei et al, 2003)。 PLSAとLDAの基的な考え方は同じだが、個々の文書における各トピックの現れやすさを表す確率が、PLSAではあくまで学習させた観測データから定義されるが、LDAではディリクレ分布という確率分布を仮定して生成させる。

    PLSA(確率的潜在意味解析法)|Deloitte Analytics|デロイト トーマツ グループ|Deloitte
    soy-curd
    soy-curd 2019/04/02
  • 【ROC曲線とAUC】機械学習の評価指標についての基礎講座 - これで無理なら諦めて!世界一やさしいデータ分析教室

    機械学習ではモデルを作って終わり、ということは無く、モデル作成後にテストデータを使って「当に良いモデルなのか?」という評価を必ず行う必要があります。 では具体的にどのように評価をすれば良いのか?という話になりますが、今回は代表的な評価指標である ROC AUC ついて説明していきます。 この辺りについては、以下書籍でよくまとまっているので、よろしければ是非! Pythonと実データで遊んで学ぶ データ分析講座 作者: 梅津雄一,中野貴広出版社/メーカー: シーアンドアール研究所発売日: 2019/08/10メディア: 単行(ソフトカバー)この商品を含むブログを見る ※追記※ スマホだと数式がうまく表示されない可能性がありますので、こちらのリンク、もしくはPCから購読頂けますと幸いです。 正解率の問題点と、偽陽性率と真陽性率ROC・AUCに入る前に、それらを計算するための性能評価値につい

    【ROC曲線とAUC】機械学習の評価指標についての基礎講座 - これで無理なら諦めて!世界一やさしいデータ分析教室
    soy-curd
    soy-curd 2019/04/02
  • 【物体検出】SSD(Single Shot MultiBox Detector)とは - Qiita

    1.前提知識 ・機械学習の基礎 ・オライリー『ゼロから作る Deep Learning』 ・MLPシリーズ『画像認識』の物体検出の章 2.物体検出とは 多くの物体検出アルゴリズムの内容は、以下の三段階で分けられる。 ①物体領域候補の提案 ②検出物体のクラス分類 ③領域の調整(回帰) 初学者向けの画像認識の実装例では「手書き文字の認識」がよく取り上げられるが、現実の画像においては、「物体が一つのみで全ての物体領域のサイズも同じ」ということは普通はありえない。そこで、1枚の画像の中で様々なサイズで写っている複数の物体を上手く切り出すバウンディングボックスを探し、クラス分類の問題に持ち込む必要がある。 愚直にやるならバウンディングボックスの位置を動かして全パターン探索するSliding Window法が考えられるが、工夫なく行うのでは非常に時間がかかることは容易に想像できる。 R-CNN、Fas

    【物体検出】SSD(Single Shot MultiBox Detector)とは - Qiita
    soy-curd
    soy-curd 2019/04/02
  • EmEditor Free – EmEditor (テキストエディタ)

    EmEditor Free は、無料で使用できるフリーソフトウェアです。最高の無料のテキストエディタが必要なら、EmEditor Free が最適かもしれません。EmEditor Professional と同等とはいかないまでも、EmEditor Free を使用すると、製品を購入しないで、編集タスクのほとんどを行うことができるようになります。見やすい色分け表示、検索と置換、Unicode への対応、印刷、複数選択編集、箱型選択編集など、シンプルなテキストエディタとしてメモ帳の代わりに利用していただことができます。ただ、EmEditor Professional に比べて、プラグイン、スクリプト可能なマクロなど、多くの機能が省かれています。 EmEditor Free (以下、Free版) は、EmEditor Professional (以下、Pro版) と別のプログラムにはならず、同

    soy-curd
    soy-curd 2019/04/02
    おすすめエディタ
  • Google AnalyticsのMeasurement Protocolがすごい! | marketing cloud laboratory

    今回はエモジマさんの投稿に乗っかってGoogleネタです。 読者の方々の中にはGoogle Analyticsで自社サイトの解析をされている方も多いのではないでしょうか。 そんなWebサイトのアクセス解析で有名なGoogle Analyticsには隠れた(?)優秀な機能があります。 Measurement Protocol インターネット接続デバイスで発生したヒットを収集し、Google アナリティクスに送信するための標準ルールセットです。 Measurement Protocol を使用して、インターネット接続デバイスから Google アナリティクスにデータを送信します。売店や POS システムなど、ウェブサイトとモバイルアプリ以外から Google アナリティクスにデータを送信する場合に特に役立ちます。 ウェブサイトとモバイルアプリでのヒットは、Google アナリティクス Java

    soy-curd
    soy-curd 2019/04/02
  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
    soy-curd
    soy-curd 2019/04/02
    なるほど
  • アンサンブル学習について勉強したのでまとめました:Bagging / Boosting / Stacking - St_Hakky’s blog

    こんにちは。 今、KaggleのRestaurant Revenue Predictionをやっていて、その中でアンサンブル学習について再度学習してみたので、まとめました。 結構ながくなっちゃったかもですが、頑張って参考文献に飛ばしたりとかしてまとめました(笑) アンサンブル学習とは 機械学習における目標は、汎化性能が高い学習機をデータから構築することです。汎化性能を向上させる方法はいくつかあるわけなんですが、以下の2つの方針があります。 単一の学習器の性能を向上させる 複数の学習器を用意して、それらの予測結果を統合して汎化性能を高める 後者の方法がいわゆるアンサンブル学習といわれるものです。複数の学習器を利用して高い精度を出すことを実現します。 参考文献や アンサンブル学習(Ensemble learning)とバスケット分析(basket analysis) - Qiita アンサン

    アンサンブル学習について勉強したのでまとめました:Bagging / Boosting / Stacking - St_Hakky’s blog
    soy-curd
    soy-curd 2019/04/02
    知らんかった
  • NYSOL – 超高速な大規模データ解析を実現するソフトウェアツール

    超高速な大規模データ解析を 実現するソフトウェアツール NYSOL makes it easier and faster to analyze big data. NYSOLver2.4.2 SOFTWARE LIST GitHub NYSOL Manual ※NYSOLは日発のオープンソース(無料)です。 *NYSOL is open source software in Japan LICENSE 最新情報NEWS 2019.06.05 SOFTWARE NYSOLのDockerイメージ公開 2019.05.23 SOFTWARE nysol_pympiのインストールメモ 2018.09.20 INFORMATION WebbleバージョンのKIZUNAを公開しました。 Back Number NYSOLとはABOUT NYSOL 大規模データの解析に関する様々な大学やプロジェクト

    soy-curd
    soy-curd 2019/04/02