タグ

2016年4月25日のブックマーク (8件)

  • jupyter (ipython notebook) のipynbファイルをバージョン管理しやすくする - Qiita

    動機:ipynbファイルは差分が絶望的に見にくい コードだけの差分が見たいのに、 以下で無数に差分がでるのが辛い。。。 出力結果 out[1]: hogehoge 実行順番 (In[17]などの 17の部分) セルの区切り具合 方法1(人力:非推奨): 毎回出力結果をクリアしてからコミットする kernel再起動の時にclear output を選択する。 何もしないよりは見やすくなるが以下の欠点がる。 上記の3に対しては無意味 めんどい 忘れてそのままコミットした時に死ぬ 方法2(こっちが題): 自動でpyファイルを生成し、それをバージョン管理する ipynbをセーブした時に自動でpyファイルも更新される! 基的に不要な、出力結果や実行順番を消すこともできる! やり方はここを参考にした。 http://jupyter-notebook.readthedocs.org/en/lates

    jupyter (ipython notebook) のipynbファイルをバージョン管理しやすくする - Qiita
  • ノンパラメトリックベイズ入門2(IndianBuffetProcessと潜在特徴モデル) - Qiita

    IBP(Indian buffet process)を使って潜在特徴モデルの実装を行います。 モチベーション IBPを使って潜在特徴モデルの実装を行うことが目的です。まずここでいう潜在特徴モデル(線形因子モデル?)の説明をするためによくあるレコメンデーションの例を使います。 まず人を縦、映画の種類を横とする行列(X)があるとします。(成分は(i,j)はiによるjの評価だとする)このとき下のようにX=UVとうまく分解することによって潜在特徴を知ることができます。 例えば潜在特徴としてはアドベンチャー成分、ミステリー成分、ロマンス成分とかが考えられます。(あくまでイメージです)この時、Uは人のそれらの成分に対する好感度、Vはそれぞれの映画がどのような成分を持っているかを表します。(実際のレコメンドシステムでは欠損値の予測に使います) 他にも自然言語処理のシチュエーションだったらドキュメントの種

    ノンパラメトリックベイズ入門2(IndianBuffetProcessと潜在特徴モデル) - Qiita
  • The Flask Mega-Tutorial: Now with Python 3 Support

    After more than a year working on various projects on the side of my day job, I have now found some time to rest and return to the blog, which I haven't cared for much during this time. The number one problem I see from my readers is issues when trying to follow my Flask Mega-Tutorial using current versions of Flask, its extensions, or Python 3. In this article I quickly describe the updates I hav

    The Flask Mega-Tutorial: Now with Python 3 Support
  • 最近話題のWeb言語 Elixirのご紹介 | DevelopersIO

    ここ最近、Elixirという言語がWebプログラマー界隈で話題になっています。 ElixirはErlangのVM上で動くRuby風味の関数型言語で、RailsコミッタのJose Valimさんが作ったプログラミング言語です。 この言語はErlangの並行性とRubyの開発生産性を持っています。 今回はこの言語が出てきた背景と文法の特徴について書こうと思います。 Elixirが注目されている理由 ここ数年、Webアプリケーションは以下の問題を抱えています。 C10K問題 10000以上のクライアントがサーバに同時接続すると、HWの性能は足りていてもOS、ソフトウェアの問題で処理が破綻する ムーアの法則の限界 CPUチップメーカーの製造するチップのクロックレートの成長に陰り。代わりにマルチコアアーキテクチャのCPUが開発されている リアルタイムWeb サーバ、クライアントが常時接続するアプリケ

    最近話題のWeb言語 Elixirのご紹介 | DevelopersIO
  • Google Sites: Sign-in

    Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode

    Google Sites: Sign-in
    xiangze
    xiangze 2016/04/25
  • 輸送不等式から集中不等式を出す

    概要Wasserstein距離がKLダイバージェンスで抑えられるという不等式のことを輸送不等式というのでした。例えば距離空間$(X, d)$上の確率測度$\mu$が$T_1(C)$を満たすというのは、任意の確率測度$\nu$に対して $$ W_1(\mu, \nu) \leq \sqrt{C D_{KL} (\mu, \nu)} \tag{1} $$ が成り立つことをいいます。 $f: X \to \mathbb{R}$がLipschitz関数のとき、 $$ \forall t > 0, \quad \Pr [ f - \mathbb{E}f \geq t] \leq \exp \left( - \frac{C t^2}{2 \lVert f \rVert_{Lip}^2} \right) \tag{2} $$ が成り立つという性質を考えます。言葉でいえば「すべてのLipschitz関数の

  • NewsPicks:記事をオススメするLINE Botをつくってみた - UZABASE Tech Blog

    はじめまして。NewsPicks技術チームの井原です。 チャットボット(Bot)という言葉を聞いたことがあるでしょうか。スマホやWebのメッセンジャー上で動く自動会話ロボットで、4/7にLINEがBOT API Trialを公開したことでエンジニア界隈で一躍ホットなトピックとなりました。今週にはFacebookが対応を発表し、NewsPicksでも話題になりました。 newspicks.com 私もBOT API Trialの公開で大喜びしたクチで、さっそく週末と帰宅後の時間でLINE BOTを作ってみました。 うま インフラ環境 メッセージの処理と記事推薦 1. 形態素解析 2. 特徴語抽出 3. 記事の検索 4. 記事の選択 5. 記事の提示 社内公開 時間の指定 形容詞の使用 ソースコード うま こちらが作成したBotです。「うま」(NewsPicks非公式Bot)といいます。 ユー

    NewsPicks:記事をオススメするLINE Botをつくってみた - UZABASE Tech Blog
  • 歩数データから行動パターンを抽出する話 - 盆栽日記

    この1年ほどfitbitで歩数データを取り続けている。 最近、歩数データは1日よりも小さい単位(1分、15分)で取得できることを知ったので、それを利用して日々の行動をパターン化したい。 同時に手持ちの睡眠データと組み合わせて、行動パターンとの関連も見たい。 睡眠データはSonyのSmartband2で取得している。 なお、コードも含めた結果はRPubsにアップしたので細かい話をそちらを確認してほしい。 http://rpubs.com/dichika/stepandsleep 可視化した結果 歩数データは1時間ごとの集計をLDAでもって5グループに分けた。 LDAを用いた理由はこの研究会でLDAを歩数パターンに適用している発表があったのでその追試の意味合いが大きい。 5グループへの分類が終わったら、各グループの特徴を時間別の分布、総歩数、睡眠の質(入眠後3時間以内の深い眠りの割合)で確認す

    歩数データから行動パターンを抽出する話 - 盆栽日記