プログラミング言語PythonをCGIに使った統計計算プログラムです。 とくに難しい設定は必要なく、ただデータを貼り付けるだけです。 心理検定などで統計計算が必要な方は、お試しになってみてください。 どんなときに、どんな統計分析を使うのか?
みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー 「入門 自然言語処理」はヤバい書籍なので禁書にすべきだ。 タイトルは釣りじゃない。その理由を10個挙げる。 自然言語処理のかなり基本的なことからそこそこ高度なことについて解説されてあり,自然言語処理について理解が深まり過ぎる ボリュームがあるのに書き方が平易でついつい読みふけってしまう 演習問題があり,自分の理解度を確かめられたりするのもケシカラン 原著は欧米語のための言語処理について書かれた書籍なのに,日本語の形態素解析などについても解説してあって我慢できない 必要ライブラリのインストールなど環境構築に時間が取られそうでヤバい 書籍の応用でBotとか人工無能とか作ったらどうかな−,と
はじめに この文書は、 Steven Bird, Ewan Klein, Edward Loper 著 萩原 正人、中山 敬広、水野 貴明 訳 『入門 自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。 原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも
「mixiのOpenIDを使うとニックネームが取れるのにYahoo!だと何で取れないの?ムキー」って言う人もこれで安心ですね! サンプル 前回はサンプルコードをPHPで作成しましたが、今回はPythonのWebフレームワークであるDjangoを用いて作成します。 Djangoを使ってOpenIDを扱うにはdjango-openidやDjango-Socialauthといったライブラリがありますが、今回はYahoo!Incが提供するライブラリ 2 を元に実際に動かせるサンプルを作成しました。以下からダウンロードできます。 ZIPファイルダウンロード(26KB)(提供終了) 動かしてみる 以下のサンプルは以下のような環境で動作確認を行いました。 Python2.6.5 Django1.1 SQLite3 これらのインストールは完了しているものとして今回は話を進めさせていただきます。 サンプルの
1章: 始めよう¶ Pythonのインストール Pythonの実装系 Jython IronPython PyPy その他の実装 Linux へのインストール パッケージインストール ソースコンパイル Windows へのインストール Python のインストール MinGW のインストール MSYS のインストール Mac OS X へのインストール パッケージインストール ソースコンパイル Python プロンプト インタラクティブプロンプトのカスタマイズ iPython: より良いプロンプト setuptools のインストール 動作原理を理解する EasyInstallを使ったsetuptoolsのインストール distutilsにMinGWのフックを入れる 作業環境 エディターと補助ツールを使う コードエディター Vimのインストールと設定 その他のエディタを使う その他のバイナ
C++版のOpenCVを使ってカラーヒストグラムを用いた類似画像検索を実験してみました。バッチ処理などのスクリプトはPythonを使ってますが、PerlでもRubyでも似たような感じでできます。 指定した画像と類似した画像を検索するシステムは類似画像検索システムと言います。GoogleやYahoo!のイメージ検索は、クエリにキーワードを入れてキーワードに関連した画像を検索しますが、類似画像検索ではクエリに画像を与えるのが特徴的です。この分野は、Content-Based Image Retrieval (CBIR)と呼ばれており、最新のサーベイ論文(Datta,2008)を読むと1990年代前半とけっこう昔から研究されてます。 最新の手法では、色、形状、テクスチャ、特徴点などさまざまな特徴量を用いて類似度を判定するそうですが、今回は、もっとも簡単な「色」を用いた類似画像検索を実験してみます
以前のエントリーで本文抽出ライブラリWebstemmerを使ってみました。 Webstemmerによるブログの本文抽出 - FutureInsight.info Webstemmerは非常に興味深い本文抽出ライブラリなのですが、ニュースサイトなどの複雑な階層構造を持っているサイトの本文抽出に特化しているため、逆にblogのようなシンプルなケースでの本文抽出に用いるには、ちょっとオーバースペックです。 Webstemmer Webstemmer はニュースサイトから記事本文と記事のタイトルをプレインテキスト形式で自動的に抽出するソフトウェアです。サイトのトップページの URL さえ与えれば全自動で解析するため、人手の介入はほとんど必要ありません。 そのあたりのことを考慮して、本文抽出ライブラリWebstemmerのblog本文抽出用特化スクリプト「blogstemmer」を作成してみました。
ãããããã¼ ã¬ã¤ã Google App Engine ã¸ãããããã®ãããããã¼ ã¬ã¤ãã¯ãGoogle æè¡ã使ç¨ãã¦æ¡å¼µå¯è½ãª Web ã¢ããªã±ã¼ã·ã§ã³ãä½æããããã«å¿ è¦ãªãã¹ã¦ã®ç¥èãç¶²ç¾ ãã¦ãã¾ãã ãã®ã¬ã¤ãã¯ã次ã®ã»ã¯ã·ã§ã³ã§æ§æããã¦ãã¾ãã æ¦è¦ Google App Engine ã«ã¤ãã¦ãApp Engine ã®æ©è½ã¨ãµã¼ãã
Google App Engine | 04:50 | はじめに このエントリーは、先に公開した記事「道に迷ったアナタに捧ぐ(関連記事のまとめ)」が原因不明の事象により直リンクでは見えない!という問題に対処する目的で作成されました。中身は基本的に変わりません。なんだかブックマークを見ていて「まとめ記事」の存在をご存知頂けていないッポイな、、という気がしたもので、本日の「超訳完了記念」に合わせて再度作成してみた次第です。どの記事が何に言及したものかよく分からん!とお怒りの方々の為に少しでも助けになれば幸いです。Google App Engine の公開から約2週間。毎日結構な方のアクセスがあった事が励みになり、スピードを落とさずに超訳作業が完了出来ました。スターやブクマ、コメントを下さった皆さんだけでなく、アクセス頂いた全ての方々に感謝したいと思います。また、多くの皆さんに本ブログをご覧頂く
講義資料 † 注: 直したつもりではありますが去年からの更新のし忘れで,python.logos.ic.i.u-tokyo.ac.jp というサーバ名が,ときどき marten.logos.ic.i.u-tokyo.ac.jp となっていることが有るかもしれません(もうないつもり).marten はすべからく pythonと読み替えてください ここには、講義のスライドや配布資料がアップされます。 ↑ テストデータ, reference情報など † 10/30 mini-Python文法 grammar.txt 10/30 字句解析器テストデータ tokenizer_test.tar.gz 11/14 構文木ヘッダsyntree.h.txt 11/14 構文木Cソースの一部syntree.c.txt 11/14 構文解析木ヘッダparser.h.txt 11/14 構文解析木Cソース一部al
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く