タグ

Pythonに関するsudo1101のブックマーク (34)

  • pythonで美しいグラフ描画 -seabornを使えばデータ分析と可視化が捗る その1 - Qiita

    Pythonでのグラフ描画 Pythonチャートを描く場合の定番は「matplotlib」ですが、その見た目のやや野暮ったい感じと、表記法のややこしさが指摘されています。 そこで、この記事ではMatplotlibの機能をより美しく、またより簡単に実現するためのラッパー的存在である、「Seaborn」の使い方を取り上げます。 ◆ Overview of Python Visualization Tools http://pbpython.com/visualization-tools-1.html 上記の記事ではMatplotlibとSeabornについて下記のように書かれています。 matplotlibについて Matplotlib is the grandfather of python visualization packages. It is extremely powerful b

    pythonで美しいグラフ描画 -seabornを使えばデータ分析と可視化が捗る その1 - Qiita
  • 「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料

    「第5回 プログラマのための数学勉強会 発表資料 (2015/11/21[sat])」 内容は統計学の素養がある方には基的な事項ですが、ベクトルと内積で見方を変えてみたという点と、あまり統計学に親しみがない方にも理解してもらえるようなまとめになっている、というところにスライドの独自性があると考えていますので、その辺り良ければご覧ください^^Read less

    「内積が見えると統計学も見える」第5回 プログラマのための数学勉強会 発表資料
    sudo1101
    sudo1101 2015/11/22
    「エンジニアや理系の大卒ならばこの程度の内容では感動しない」と本気で思ってしまっているなら認知バイアスかかり過ぎなので気をつけた方が良いです。非常に基本的な統計学的な誤りらしいですよ。
  • Twilog + Pythonで他人の過去の全ツイート(3200件超)を一括取得する方法 - StatsBeginner: 初学者の統計学習ノート

    Twitter APIで「他人の全ツイート」は取得できない さて先日から書いてるように、PythonのTweepyというライブラリを使うと、簡単にTwitterのREST APIを操作することができますので、研究で何か分析するときも、これを使えば手軽に分析用のデータが取得できます。レスポンスのデータの中身を読むのが大変ですが、それなりに理解はできてきました。 statsbeginner.hatenablog.com statsbeginner.hatenablog.com ところで、特定のユーザのツイートの傾向を見たいと思った場合、APIで全ツイートを取得したいところですが、残念ながら最新のものから数えて3200件までしか取得することができません。 「自分のツイート」であれば、Twitterが公式に過去の全件を出力する機能を付けてくれていますが(付属情報がほとんど入って来ませんが)

    Twilog + Pythonで他人の過去の全ツイート(3200件超)を一括取得する方法 - StatsBeginner: 初学者の統計学習ノート
  • 機械学習はじめの一歩に役立つ記事のまとめ - Qiita

    機械学習」というワードになんとなく惹かれつつも、具体的にやりたいことがあるわけでもないので、手を動かすことなくただひたすら**「いつかやる」**ために解説記事やチュートリアル記事を集める日々を過ごしていたのですが、このままじゃイカン!と Machine Learning Advent Calendar に参加登録してみました。 が、やはり何もしないまま当日を迎えてしまったので、お茶濁しではありますが、せめて「機械学習ってどんな手法やライブラリがあって、どんな応用先があるのか?」というあたりをざっくり把握して最初に何をやるのか方向付けをするためにも、たまりにたまった機械学習系の記事をいったん整理してみようと思います。 #機械学習の概要 特定のライブラリや手法の話ではなく、機械学習全般に関する解説。 ##機械学習チュートリアル@Jubatus Casual Talks 冒頭に、 初めて機械学

    機械学習はじめの一歩に役立つ記事のまとめ - Qiita
  • 「王手飛車をかけた方が負ける」は本当か - 盗んだ統計で走り出す

    将棋ニコ生などで頻繁に聞く1「プロの対局では王手飛車をかけたほうが負ける」というジンクス(格言?)が当なのかを自作の将棋解析ライブラリを使って確かめる. 「プロの試合では王手飛車をかけたほうが負ける」とは Wikipediaの「両取り」の項目には,以下のように書いてある. 棋士同士の対局の場合は、「王手飛車をかけた方が負ける」という言葉もある(棋士は王手飛車になる可能性まで踏まえて指しているため)。 また,マイナビの2には次のように書いてある. 「プロは王手飛車をかけたほうが負ける」というセオリー(?)があります。プロが王手飛車を見落とすはずはないので、飛車を取られてもいい読みの組み立てをしているから、という意味です。 また,実際に確かめてみた例として,知恵袋のとある質問の回答中に「『近代将棋』 2002年9月号に,王手飛車をかけたほうが勝率が良かったと書いてあった」という旨の情報が挙

    「王手飛車をかけた方が負ける」は本当か - 盗んだ統計で走り出す
  • 研究者流 コーディングの極意 言語処理学会第19回年次大会(NLP2013) チュートリアル資料(岡崎担当分)

    言語処理学会第19回年次大会 (NLP2013) チュートリアル資料(岡崎担当分) 岡崎 直観 東北大学大学院情報科学研究科 okazaki at ecei.tohoku.ac.jp http://www.chokkan.org/ @chokkanorg 研究者流 コーディングの極意 1 研究におけるコーディングの極意? • 今回のチュートリアルをきっかけにサーベイ – ソフトウェアエンジニア向けの指南書は存在 – でも,研究者向けの資料は数少ない • 自分が修士課程の頃は完全に我流だった – 複数文書自動要約のプログラムをすべてC++で実装 – *NIXを使うスキルはなく,すべてWindows上で実行 – 今から考えると,無駄だらけの実験作法だった • ほとんどの大学では実験の講義があるが… – 研究のためのコーディング作法は教えてくれない 2 繰り返される残念な光景 • 論文の締切前日

  • SQLite3を使用する - Python Tips

    軽量・高速なデータベースSQLitePythonから扱うためのライブラリ。 インストール Python2.5から標準ライブラリに入りました。 インストール作業は不要です。 使用方法 sqlite3をインポートする #!python2.6 # -*- coding: utf-8 -*- import sqlite3 データベースを作成する con = sqlite3.connect("data.db") ファイルがすでに存在するときはファイルを開く。 ファイルがないときは新しいデータベースを作成する。 isolation_levelにNoneを指定すると、自動コミットモードになります。 con = sqlite3.connect('temp.db', isolation_level=None) 特別な名前である ":memory:" を使うとRAM上にデータベースを作ることもできます。 c

  • 全てのwebエンジニアがPythonを勉強するべき2013年到来

    あけおめ!今年は巳年。へび。へびと言えばPython。そう今年は全てのwebエンジニアPythonを勉強する最高の環境が整った年なのです。 既にPerlRubyを習得してるけど、それに加えてPython必要?必要です!必要だと思います。もはやPythonはwebエンジニアにとって必修言語となりつつあると思います。Linuxの多くの箇所でシステム言語として用いられ、可読性の高さから多くの技術系書籍のサンプルコードとして用いられ、科学技術系分野におけるエコシステムの充実っぷりはますます磨きがかかっており、様々なライブラリがどんどん出てくる現状を「Pythonわからないから自分には関係無い」と遠巻きに眺めるのはもったいないです。 習得するのにどのくらい時間かかるの?あなたが既に他の言語に慣れ親しんでいるなら、特にRubyなどに精通していれば「1週間」で基的な読み書きは出来るようになるでしょ

    全てのwebエンジニアがPythonを勉強するべき2013年到来
    sudo1101
    sudo1101 2015/06/25
    “Numpy。数値行列計算を内部でCを使って計算するために非常に高速”
  • OLの事務vim日記 - 藻ログ

    4月から都会でOLとして働き始めたので, OL的windowsの事務処理環境を手探りで作ってみました. OLとWindows 事務処理といえばOffice, 当然Windowsで行うことになります. 今時のOLは家ではLinuxを使っているはずなので, 自然とシェル環境で困ることになります. Windows当にわからない linuxコマンド使いたい(DOS音痴) Cygwinは嫌い MinGW+MSYS にしてみたい(けど未だによくわかってない) 事務PCなので, 大掛かりな環境は入れたくない(入れられない) WSL ? そもそも Windows7 なので(ry) などのモチベーションから 色々見ていてcmderが良さそうだなと思ったのですが cmder.net 所属機関でフィルタされて落とせなかった(つらい)ので, ConEmu + msys bash の組み合わせで端末環境を整える

    sudo1101
    sudo1101 2015/06/22
    "今時のOLは家ではLinuxを使っているはずなので, 自然とシェル環境で困ることになります." / 違う世界線に来てしまったようだ…。
  • moco(beta)'s backup: 辞書内包/Pure Python実装の形態素解析器 Janome を公開しました

    一応の基機能がととのったので、できたてほやほやではありますが、Python製の形態素解析器 Janome を公開しました。 http://mocobeta.github.io/janome/ インストール方法や使い方は上記ページを見てください。 ソースコードはGithubにおいています: https://github.com/mocobeta/janome 【公開にいたった背景など】 日語テキストを分析したりテキストマイニングする場合、まずは形態素解析から始めると思います。 Python の場合、そのためには MeCab をインストールして、mecab-ipadic をインストールして、mecab-python をインストールする、という手順を踏むことが多いと思うのですが、環境依存のところでハマって面倒な思いをしたり、サーバ構築の手間がかかったり、しますよね。なので、Pythonモジュ

    sudo1101
    sudo1101 2015/06/20
    なんて素敵な!! ありがたやありがたや…。
  • PythonでBag of WordsとSVMを使ったタイトルのカテゴリ分類 - stMind

    cc licensed ( BY ) flickr photo shared by Loco Steve 週末に試そうのコーナー。 ちょうど良いチュートリアルがあったので、データセットを用意してやってみました。 問題 How can I get a computer to tell me what an article is about (provided methods such as bribery and asking politely do not work)? ある記事が何について書かれているのか、コンピュータに理解させるにはどうすれば良いか? チュートリアルでは手動で作ったデータを使って犬もしくはサンドイッチの2クラス分類をしています。 ここでは、Google NewsでiPadのニュース、ソチ五輪のニュースとカテゴリ分けされている記事のタイトルを使って、 あるタイトルがiPa

    PythonでBag of WordsとSVMを使ったタイトルのカテゴリ分類 - stMind
  • PythonでWeb開発入門 みんなのPython Webアプリ編 HTML版(無料) | TRIVIAL TECHNOLOGIES 4 @ats のイクメン日記

    みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー 一部読者から高い評価をいただき,絶版となりながら中古市場でプレミア価格がついていた拙著「みんなのPython Webアプリ編」のHTML版をお送りします。Pythonを使って,Webアプリを開発するための方法を,基的な事柄から積み重ね式に解説した書籍をHTMLにしたのがコンテンツです。 編集部のご厚意で作ってもらった配布用PDFをベースに作っています(PDF作成だけでなく,出版契約の解除など必要な手続きを快く受けて頂いた担当様にはとても感謝しております)。構成などは著書をベースにしていますが,HTML化する過程で少し手直ししてあります。特にPython 2.7で動かないサンプルコー

  • HOME > 電算 > Python と文字コード

    HOME > 電算 > Python と文字コード Python と文字コード Python で行き当たりばったりに日語処理をしてきたが、これではいかんと思っていくらかまとめてみた。(当然、このメモには間違いや誤解があろうと思う) 「python は『abc』を使うのが基で『あいう』を使うのが例外だ」と考えると、「あいう」に対してできないことが多すぎて難しく見える。しかし、「『あいう』に対して使えるようなやり方なら『abc』にも問題なく使えて、ただ、『abc』には特権的に無作法な書き方が許されているのだ」と考えれば、ずっと簡単に理解できるように思う。 まとめ ユニコードは「文字コード」(バイト表現と文字の対応関係)ではない utf-8 は「文字コード」である Python の unicode 型は「文字コード」にとらわれない型で、CPU やメモリ上で用いられる Python の str

  • Google APIを使ってPythonから検索データを取得する方法

    2013年12月3日 備忘録 pythonを使ってGoogle検索の結果を取得する方法をメモ。 まずAPI keyが必要になるので取得する。以下のサイトを見ながらやった。 Google Custom Search API を試す インターフェースが変わったようで、大分手間取った。API keyはここからプロジェクトを1つ選択してAPIs & auth > Registered apps > Browser Keyから取得できる。(Googleアカウントでサインインしてるのは前提条件) 次にここから検索エンジンIDを取得する。これは上のリンクの通りにやればOK。 これで準備おkなので、リクエストURL:https://www.googleapis.com/customsearch/v1にパラメータを渡してアクセスするとデータが取れる。プログラムはこんな感じ。ちなみに環境は、Mac10.8,

  • Pythonスクリプト実行後に対話的に操作したい - 唯物是真 @Scaled_Wurm

    以下のように'-i'を指定するだけでできるみたいです。 こんな簡単なのを知らなかったとは……やはりドキュメントはちゃんと読まないといけませんね。 python -i ファイル名あるいは対話モードの時にexecfile関数を実行すれば同様のことができるみたいです。 最後ではなく、スクリプトの途中で対話的に実行したい場合にはcodeモジュールを使えば以下のように書けるみたいです。 インタプリタはCtrl+ZとかCtrl+Dとか(OSによる?)の対話的なインタプリタを通常止めるときのキーを打てば止まります。 exit()をするとあとの処理をせずに終了してしまいますので注意。 import code 何か前処理() code.InteractiveConsole(globals()).interact()#対話的コンソール 何か後処理() 参考 266:ファイルをPythonスクリプトとしてロード

    Pythonスクリプト実行後に対話的に操作したい - 唯物是真 @Scaled_Wurm
    sudo1101
    sudo1101 2015/06/04
    “python -i ファイル名”
  • Pythonらしいコードの書き方 - Kesinの知見置き場

    はてなブログに移行して最初の記事はやはりPythonネタにしました。 はてなブログいいですね。デザインの編集がやりやすくなったのと、Markdownで書けるのが素晴らしいです。 PyCon 2013の動画を見ていたら、素晴らしい"Transforming Code into Beautiful, Idiomatic Python"という発表を見つけたのでそのまとめです。 今どきのPythonコードのベターな書き方を紹介しています。 Transforming Code into Beautiful, Idiomatic Python ... スライドはこちらにありました 結構長くなってしまったので、知ってる項目は読み飛ばしてもらえばと思います。 ループの基 整数のループ まずは基のループ。 Cのfor int i=0; i<6; i++をPythonで単純に書くとこうなります。 for

    Pythonらしいコードの書き方 - Kesinの知見置き場
  • 【数学】固有値・固有ベクトルとは何かを可視化してみる - Qiita

    線形代数に固有値という概念が出てきます。最初はイメージしにくいのでは、と思うのですが重要な概念かつ、統計学でも頻繁に利用されるので、これもこの可視化シリーズとしてアニメーショングラフを書いて説明することを試みたいと思います。 このようなグラフの意味を読み解いていきます。 1.固有値・固有ベクトルとは? まず、固有値・固有ベクトルとはなんぞや。数式で表すと下記のことです。 ${\bf x}\neq {\bf 0}$の${\bf x}$で、行列Aをかけると、長さが$\lambda$倍になるような${\bf x}$の事を固有ベクトル, $\lambda$を固有値と言います。 知らない人は???で、これだけではよくわからないですね。 早速、グラフィカルな説明も交えて説明していきたいと思います。 2.行列Aによる線形変換 固有値・固有ベクトルの説明の前に、行列による線形変換について取り上げます。 例

    【数学】固有値・固有ベクトルとは何かを可視化してみる - Qiita
  • Data Science by R and Python

    はじめに ほんと、久々の更新になってしまいました。。。 いまだに月間で1000PVほど見られているようでとてもありがたく思いますm(_ _)m 最近も変わらず因果推論の研究を中心に行っておりますが、それ関連の内容はまた機会をみてblogで書いていければと思っています。 また先日、twitterで公開したこちらのスライドもたくさんの方に見ていただけまして、コメントも頂けたりして、とても嬉しく、励みになっています。 speakerdeck.com また、少しずつではありますが更新いたしますので、たまに覗いていただければ嬉しいです。 では、題にまいります。 今回の更新 とはいっても、今日の更新は、大した内容ではなく、pythonでstepwise regressionの関数で自分がほしいものがないので、つくりましたという内容です。 Stepwise Regressionについて 特に、回帰モデ

    Data Science by R and Python
  • tfidf, lsi, ldaを使ったツイッターユーザーの類似度計算

    tfidf, lsi, ldaを使ったツイッターユーザーの類似度計算メモ。 tfidf, lsi, ldaを使ったツイッターユーザーの類似度計算 ツイッターの@ts_3156のフォロー情報を使って、ツイッターユーザーの類似度計算を行いました。 結論だけ先に書いておくと、プロフィール情報だけを使って類似度計算を行なっても、全然いい結果にはならないです(^^) その理由あれこれは下の方に書いてあります。 「じゃあ、正確なツイッターユーザーの類似度計算はどうやればいいの?」についても下の方に書いておきました(^^) 今回書いたプログラムは、ツイッタープロフィールだけでなく文章集合の類似度計算全般に使えるので、よかったら各自で何かしら使ってみてください(^^) サンプルコードの動作環境 python2.7(2系なら何でもOKかも) もしない場合は、「yum install python27」でイン

  • 言語処理100本ノック 2015

    言語処理100ノックは,実践的な課題に取り組みながら,プログラミング,データ分析,研究のスキルを楽しく習得することを目指した問題集です 実用的でワクワクするような題材を厳選しました 言語処理に加えて,統計や機械学習などの周辺分野にも親しめます 研究やデータ分析の進め方,作法,スキルを修得できます 問題を解くのに必要なデータ・コーパスを配布しています 言語はPythonを想定していますが,他の言語にも対応しています