我が家のダグウッド ダグウッドとはハナミズキのことである。昔、日本からポトマックリバーの桜の苗木を送った返礼として、アメリカから送られて来たのが日本での始まりで、アメリカ原産でアメリカヤマボウシともいうらしい。 最近では日本でも、あちこちで、街路樹であったり、庭木であっ…
The JavaScript InfoVis Toolkit allows users to create interactive data visualizations for the web. It features multiple graph and tree layouts that can be used modularly and are extensible. The toolkit uses web standards and allows visualizations to be built in a composable way. It includes visualizations like stacked charts, node-link diagrams, sunbursts, treemaps and icicles that were inspired b
CIServer http://jenkins-ci.org/ 環境 Gerrit サーバー:Ubuntu Server 11.10 x64 ※Windows にインストールしたかったけど、色々ハードルが高そうなので今回は Ubuntu Gerrit:gerrit-2.2.2.1.war Jenkins サーバー:Gerrit サーバーに同居 Jenkins:1.454 Gerrit Trigger プラグイン:2.5.0 クライアント:Windows 7 x64 ゴールイントラネット内の Windows クライアントから、Gerrit サーバー上の Git に push すると、自動で Jenkins がビルドを行うところまで Gerrit の構成は、 ・DB 以外は、デフォルト(MySQL)の設定 ・メール通知は無し(SMTP サーバーは立てない)
第7回自然言語処理勉強会で文書要約に関するお話をさせていただきました。その際に用いましたスライドを公開します。今回は入門編(初級編)なので、そのうち中級編をやるかもしれません。 Introduction to Automatic Summarization View more presentations from Hitoshi NISHIKAWA 毎回、スライドのレイアウトがおかしくなっていましたが、今回はpdfに変換してアップロードしました。こうすれば良かったのですね。今回はレイアウトが乱れていないはずです。過去のスライドもpdf化してアップロードしなおすつもりです。 次はグーグルによるザガットサーベイ買収の話か、NLP若手の会第6回シンポジウムの話を書きます。
Thoughtworks Technology Radar is a twice-yearly snapshot of tools, techniques, platforms, languages and frameworks. This knowledge-sharing tool is based on our global teams’ experience and highlights things you may want to explore on your projects. Adopt Trial Assess Hold Adopt Trial Assess Hold Adopt Trial Assess Hold Adopt Trial Assess Hold Adopt Trial Assess Hold Adopt Trial Assess Hold Adopt T
2012/3/10に、第21回Tokyo.Rを開催しました! http://atnd.org/events/24811 @aad34210: 続・はじめてのR (30分) Tokyo r21 2 View more PowerPoint from aad34210 R言語の初心者向けの発表。 プログラミングの基本である条件分岐とループから、 R言語の基本機能であるグラフ作成、そして統計解析という盛り沢山な内容でした! @holidayworking: Rによるデータサイエンス第16章 集団学習 (30分) アンサンブル学習 View more presentations from Hidekazu Tanaka アンサンブル学習のアルゴリズムをcaretパッケージを使って比較 バギング ブースティング ランダムフォレスト ⇒ ランダムフォレストが1番精度が高かった! @Hiro_macch
PyPIデビュー¶ PyPIの目的¶ PyPI (http://pypi.python.org/pypi) はだれでもPythonパッケージを 登録したりダウンロードしたりできるPython版CPANと言えるものです。 easy_install が登場してから一気に使い勝手がよくなり知名度が あがりました。 PyPIへの登録¶ 先ほど作成したfooのseutp.pyを使って登録してみましょう: ここで初めて行う人はユーザーアカウントを聞かれると思います。 ちなみに、 foo というアプリケーションは既に登録されているため、 (http://pypi.python.org/pypi/foo) このまま進めても登録は失敗するので、 そのまま進めちゃってください。 アカウント登録は以下のように進みます: $ python setup.py register running register ..
Flask is awesome. Why do I think so? Well, read on. Firstly, what is it? If you didn't click the Flask link at the top of the page despite the pain I took in putting it there, here's what the website says Flask is a microframework for Python based on Werkzeug, Jinja 2 and good intentions. And before you ask: It's BSD Licensed!Whenever you buy anything, you usually consider the brand behind it. Fo
What is Currying? Currying is like a kind of incremental binding of function arguments. Let’s define a simple function which takes 5 arguments: def f(a, b, c, d, e): print(a, b, c, d, e) In a language where currying is supported, f is a function which takes one argument (a) and returns a function which takes 4 arguments. This means that f(5) is the following function: def g(b, c, d, e): f(5, b, c,
自然言語処理学会第18回年次大会(NLP2012)が日程上終了しました。 記録のため、見つかる範囲でNLP2012関連ブログ記事を整理すると以下のようになります。 @naltoma: 年次大会レポート: [ チュートリアル | 1日目 | 2日目 | 3日目 | この記事 ] @mamoruk: [ チュートリアル: 自然言語処理は10年経ったら浦島太郎 | 本会議初日 (1): 日本語作文・校正支援の研究が盛りだくさん | 本会議初日 (2): 英作文支援の研究も盛り上がりつつある | 本会議2日目: 研究の流行り廃りはあるが、いつの時代でも大事なことを研究したい | 本会議最終日: 先送り症候群になりそうな人は気をつけましょう ] @langstat: [ 回帰で解くか分類で解くか | NLP2012で印象に残った発表 | 言語処理関連会議 参加報告リンク集 ] @nokuno: 極大
また、データの全件処理、特にI/Oの性能が求められる多重のバッチ処理にはMapReduceが新たな選択肢として加わります。MapReduceはデータインデックシングや非構造化データの前処理(ETL、クレンジング)への適用が有名ですが、より汎用的なバッチ処理のインフラ技術[3]として適用範囲が広がっています。 こうした技術の選択肢の中で、特にスケールさせるためにはデータを分割し、分散配置させることと、データの配置場所に処理を持っていくこと、つまり、シェアードナッシングのデータベース技術がアプリケーションアーキテクチャーに大きな影響を及ぼしています。 非構造化データを含めた大規模データ分析はMapReduceで実行し、その結果の集計やレポート機能にRDBを利用して分析結果の可視化をするのが現在は主流となっています。しかし、この方法は十分に全体最適化がされてなく、データ転送コストの無駄が発生して
Webにある「学び舎」使っていますか? 無料で学べるオンラインコンテンツが数多く観られるようになってきました。従来は語学や、ビジネス系のものが目立っていましたが、最近では、質の高いIT系のオンライン学習のための教材がそろってきました。オンラインでの学習の利点はいくつか考えられます。 安価もしくは無料で質の高い教材に出会える 自分の時間をうまく使って教材や講座を観られる →モバイルデバイスに入れて持ち歩くこともできる 気に入った講座はサブスクライブ(登録)することで継続的に受講できる 海外の講座であれば、英語の勉強(ヒアリング)にもなる →海外出張や英語イベント参加の前に、英語脳に切り替えるのに便利 物理や数学、ITやプログラミングに直接関係無い事柄でも学べる 一方で、一緒に学ぶ同級生の存在が感じられにくい、サボる理由がいくらでもあり、モチベーションが続きにくいといった難点もあります。 また
Scaling to Very Very Large Corpora for Natural Language Disambiguation Michele Banko and Eric Brill Microsoft Research 1 Microsoft Way Redmond, WA 98052 USA {mbanko,brill}@microsoft.com Abstract The amount of readily available on-line text has reached hundreds of billions of words and continues to grow. Yet for most core natural language tasks, algorithms continue to be optimized, tested and compa
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く