タグ

ブックマーク / antibayesian.hateblo.jp (7)

  • Python/NetworkXで簡単ネットワーク分析 - あんちべ!

    slaさん主催のNumpy/Scipy勉強会でLTをします。 内容はNetworkXというPythonのネットワーク分析パッケージの紹介です。 Pythonで簡単ネットワーク分析 View more presentations from AntiBayesian ネットワーク分析と言えば、PajekやRのigraphが定評有りますが、 これらはどうしてもサブグラフの扱いに不満がありました。 ネットワークからサブグラフを抽出するところまでは出来ますが、 各サブグラフがどのような性質を持つか分析したい場合、 指定したサブグラフを形成しているノード、エッジ、重みの情報を簡単に取り出す方法がありません。 NetworkXであれば、指定したノードやエッジだけ隣接行列や辺行列の形で入出力することが可能です。 また、ネットワーク分析は非常に計算量が大きく、高速な演算が求められるため、データをNumpyへ

    Python/NetworkXで簡単ネットワーク分析 - あんちべ!
  • 厚みと模様とAlphaGo - あんちべ!

    GoogleAlphaGoというプログラムが、韓国のプロ棋士であるFan Hui氏と囲碁で対局して勝利したというニュースが世界を駆け巡りました。 それについての参考資料のまとめと、思ったことをつらつらと。一点注意ですが、AlphaGoのアルゴリズムを解説するという内容では一切ありません。 紹介記事 ついにコンピューターが囲碁でプロ棋士に勝利、倒したのはGoogle人工知能技術 - GIGAZINE Google Japan Blog: AlphaGo: マシンラーニングで囲碁を AlphaGo | Google DeepMind 論文 Mastering the Game of Go with Deep Neural Networks and Tree Search https://storage.googleapis.com/deepmind-data/assets/papers/d

    厚みと模様とAlphaGo - あんちべ!
    midnightseminar
    midnightseminar 2016/01/29
    “難しい理由のもう一つ、そして私が最大の理由だと考えるのは、「評価関数がわかりにくいから」”
  • Rによるtwitterテキストマイニング 〜テキストに対する学習とは〜 - あんちべ!

    あんちべのすべらない話〜俺のツイートがこんなにウケないはずがない〜 View more presentations from AntiBayesian 自分のtweetがウケるか滑るかをpostする前にrandomForestで判別してみよう! LTは制限時間10分だったため、詳細は意図的に省きました。 記事では皆さんにも実践頂けるよう、学習データの作り方についてスライドより詳しく説明したいと思います。 ●そもそも「学習する」とは? 今回の目的は、自分のツイートがfav(面白い), non(普通)のどちらになるか分類することです。 そのためには「favになるツイートはどのような特徴を持っているか?」を明らかにしなければなりません。 特徴が明らかになっていれば、 ・このツイートはfavの特徴を強く持っている→favに分類 ・このツイートはfavの特徴を殆ど持っていない→nonに分類 という

    Rによるtwitterテキストマイニング 〜テキストに対する学習とは〜 - あんちべ!
  • 職業倫理と邪悪さについて - あんちべ!

    2014-10-15 職業倫理と邪悪さについて この文書は、拙著「エンジニアのためのデータ可視化実践入門」について邪悪な誤りを挿入してしまったことへの懺悔と、私の考える邪悪さとは何かについての説明です。具体的にどのような誤りを含んだかについては下記をご覧下さい。 エンジニアのためのデータ可視化実践入門というを書いた - あんちべ! 注意申し上げますが、この文書に一切の価値はありません、読了はお薦めしません。あくまで私の私による私のための懺悔であり、内容に何ら一般性もなく、あなたに私の思想が正しいと信じ込ませたいという教理でもなく、ただただ完全に異常者の異常なる妄言を書き連ねた気味の悪い文書です。 まず語ることは、邪悪さと愚かさとは異なるものであり、後者は許容すべきであるということです。人は愚かであり、それゆえ間違いを犯してしまうことはあるため、誰しも誤字脱字や不正確だったり誤った記述

  • 統計屋のためのAWK入門 - あんちべ!

    はじめに 稿はAWKという言語を用いて、 ごく簡単にデータ分析用の前処理*1をするための解説記事です。 AWKは短いコマンドを記述するだけで多様なデータ処理を可能にします。 特にデータの抽出に関して恐るべき簡易さを提供します。 具体的には、input.txtというファイルの中から "fail"という文字列を含む行を抽出したければ次のように書くだけです。 awk /fail/ input.txt つまり、スラッシュ記号で文字列を指定するだけで その文字列を含む行を抽出できるのです。 大変簡単ですね! また、awkはLinuxMacには標準で入っており、 Windowsでもawk.exeを一つ用意するだけなので、 面倒なインストール作業や環境構築は不要で誰でも即座に使えるため、 自分で書いた処理を他人に渡したり*2各サーバに仕込むなども簡単に出来ます。 複雑な処理をする場合はPython

    統計屋のためのAWK入門 - あんちべ!
    midnightseminar
    midnightseminar 2014/09/16
    そういえば前、勉強会で紹介してる人がいた記憶がある
  • 統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!

    稿では統計学・データマイニング・機械学習関連書籍について 内容が易しいこと。数学力(特に微積・線形代数)を求められないこと 入手しやすいこと。絶版や学会に入らないと入手不可などではない、値段が安いこと 実務に繋げやすいこと。 持ち運びしやすいこと。忙しい新社会人が通勤中や休み時間ポケットからさっと取り出し、継続して勉強出来ること を主眼に選定したお薦め書籍を紹介します。 (満たせない要望も多いですが) 主な対象者は、文系で数学や統計学をやってこなかった、 プログラミングもわからない(Excelで四則演算やマウス操作くらいは使える) けどいつかマーケティングやデータマイニングやってやるぜ! って考えてる新卒の方です。 筆者自身は経済学科出身の文系で、あまり数学力に自信がないなりに Web企業でデータマイニングをしているという人間です。 ここで紹介している内容で 「統計学・機械学習・データマ

    統計屋による新社会人のための統計系入門書お薦め一覧 - あんちべ!
  • テキストマイニングのための機械学習超入門 一夜目 - あんちべ!

    テキストマイニングに必要なパターン認識と機械学習について学びます。非常に初歩的な話から始めます。対象者は「テキストマイニングに興味があり、用いられる手法の中身を知りたい(けれど高度な数学は厳しい…)」というビジネスマンや学生さんです。数式は出来る限り「使います」。使わないと意味するところは理解できません。ただし、愚直に数式の一行一行を手計算で順を追って解いていきますし、必要な数学知識はその都度説明し、前提知識は求めませんので「数式出てくるの?じゃあついていけないのでは…」という心配は不要です。この記事の特徴は「機械学習の手法をやたら冗長な数式と過剰なまでの例を用いて、くどくどと同じ話を何度も説明する」ことです。 筆者ことあんちべは純文系出身で、数学や統計学、プログラミングは全然学生時代やってこなかった上、業務でも機械学習を使うことなんて皆無、それどころか機械学習なんて言葉は就職してからよう

    テキストマイニングのための機械学習超入門 一夜目 - あんちべ!
  • 1