rin1024のブックマーク / 2009年6月24日

BasisTech

アイデアの可能性を実行可能なソリューションに育てる BasisTechは、ベンチャー企業の製品開発、有能なスタッフの獲得、資金調達や成長への準備を支援します。有望なアイデアを持つ卓越した人材を求めていますより良い世界づくりに貢献する可能性を秘めたアーリーステージスタートアップ企業を支援します。現在参加の企業はエンタープライズデータ、マシンビジョン、公的機関にフォーカスしています。

rin1024 2009/06/24

Googleでも使われてるらしい形態素解析エンジン

リンク

ChaSen 日本語形態素解析システム CaboCha Support Vector Machines に基づく日本語係り受け解析器 JSplitter 日本語の単語抽出ツール MeCab ChaSenを基に開発された高速な形態素解析器 Sen Java 形態素解析エンジンすもも NTT 物性科学基礎研究所で開発された日本語形態素解析システム大量の日本語データを高速に形態素解析することを目的 JUMAN 日本語の解析の研究を目指す多くの研究者に共通に使える形態素解析ツール Breakfast 富士通研究所が開発した日本語形態素解析システム KNP 日本語文の構文解析を行なうシステム SUFARY suffix arrayというデータ構造を用いて高速な文字列検索を行なう MACD Java RM用いた形態素解析システム Rosette Google、Amazon、Lycos 等名だたるサ

rin1024 2009/06/24

昨今の形態素解析エンジン一覧

リンク

Perlメモ/MeCabモジュール - Walrus, Digit.

以下で、現時点での最新0.96版のPPDファイルと、PPMコマンドでのインストール方法が公開されています。 http://namazu.asablo.jp/blog/2007/06/28/1611341 私が使用しているWindows＋ActivePerl 5.8の環境では、ここに書かれているとおり以下を実行することでMeCab?モジュールをインストールできました。 ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd サンプルスクリプトを参考に、次のようなスクリプトを作成しました。 use MeCab; print $MeCab::VERSION, "\n\n"; my $sentence = "太郎はこの本を二郎を見た女性に渡した。"; my $tagger = new MeCab::Tagger(join " ",

rin1024 2009/06/24

Active Perl使ってMeCab触る方法

リンク

カイ二乗分布表の求め方

自由度Φのカイ二乗分布の密度関数は、 http://d.hatena.ne.jp/cgi-bin/mimetex.cgi?5$f_\P …^2\right)=\frac{1}{2^{\frac{\Phi}{2}}\Gamma\left(\frac{\Phi}{2}\right)}e^{-\frac{\chi^2}{2}}\left(\chi^2\right)^{\frac{\Phi}{2}-1} で与えられるので、（上のURLを１行にしてコピペしてください）この上側、100p パーセント点αは、 http://d.hatena.ne.jp/cgi-bin/mimetex.cgi?5$p=\i …^\infty%20f_\Phi(\chi^2)d\chi^2 で決まる点αです。（これも、URLを1行にしてコピペしてください）この積分を折れ線近似でもしてやれば、小さなΦの値でも計算できるか

rin1024 2009/06/24

カイ二乗の計算方法

リンク

http://homepage2.nifty.com/nandemoarchive/suite_and_kente/kai.htm

rin1024 2009/06/24

カイ二乗分布表。カイ二乗検定で利用。

リンク

転置行列 - Wikipedia

転置行列（てんちぎょうれつ、英: transpose [of a matrix], transposed matrix）とは、m 行 n 列の行列 A に対して A の (i, j) 要素と (j, i) 要素を入れ替えてできる n 行 m 列の行列のことである[1]。転置行列は tA, AT, A⊤, Atr, A′ などと示される。行列の転置行列を与える操作のことを転置（てんち、英: transpose）といい、「A を転置する」などと表現する。特に正方行列に対しては、転置行列は各成分を対角成分で折り返した行列になる。 A, B は行列、k, l はスカラーとして各演算が定義できる限りにおいて以下のことが成り立つ。転置の転置は元の行列を与える[1]（対合性）：t tA = A 和の転置は転置の和を与える[1]（加法性）：t(A + B) = tA + tB 行列のスカラー倍の転置は

rin1024 2009/06/24

Atの計算方法(備忘). 転置行列と逆行列は同一だと思ってました.

matrix

リンク

行列の階数の求め方

基本的にどこかの行・列の成分を０にすることを考えます。３列目に１が並んでいるのに着目して、１行目を２行目に足す、１行目を３行目に足すという操作を行うと、３　４　－１５　５　０１　１　０となります。すると、２行目と３行目が比例関係にあることが見えるので、２行目の－１／５倍を３行目に足すと、３　４　－１５　５　００　０　０となって、３行目がすべて０となります。従って、この行列式は０であり、階数は３にはなり得ず、３　４５　５の行列式は０ではないので、階数は２となります。もっと変形を進めて、１　０　００　１　００　０　０まで変形することができますが、ここまでやらなくても階数はわかるでしょう。また、当然、変形の仕方は一意的ではありません。なので、本の解答が絶対唯一のものではありません。最初に、この行列の行列式を計算すると０になるので、最初から階数

rin1024 2009/06/24

階数の求め方

matrix

リンク

行列の階数

rin1024 2009/06/24

rank(A)の計算方法

matrix

リンク

行列の階数 - Wikipedia

この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。（このテンプレートの使い方）出典検索?: "行列の階数" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2017年7月) 線型代数学における行列の階数（かいすう、rank; ランク）は、行列の最も基本的な特性数 (characteristic) の一つで、その行列が表す線型方程式系および線型変換がどのくらい「非退化」であるかを示すものである。行列の階数を定義する方法は同値なものがいくつもある。例えば、行列 A の階数 rank(A)（あるいは rk(A) または丸括弧を落として rank A）は、A の列空間（列ベクトルの張るベクトル空間）の次元[1]に等しく、また A の行

rin1024 2009/06/24

rank(A)のrankの意味。知らんかった。

matrix

リンク

射影行列の性質

rin1024 2009/06/24

射影

matrix

リンク

Google Scholar

rin1024 2009/06/24

生物学とかの方がLSAとかの研究進んでるらしい

リンク

スケジュール: YAPC::Asia 2009 - Sep 10-11 in Tokyo, JAPAN

スケジュールボールドのトークはスピーカーの確認済みです。 9/9が前夜祭、 9/10-9/11がYAPC::Asia本編となります。9/14, 9/15, 9/16は特別研修の日程です水曜日 | 木曜日 | 金曜日 | 月曜日 | 火曜日 | 水曜日 2009/09/09 時間フェライト会議室

rin1024 2009/06/24

Yapc::Asia 2009のスケジュール(まだ埋まってない)

リンク

YAPC::Asia 2009 - Sep 10-11 in Tokyo, JAPAN

ようこそ YAPC::Asia 2009 は 2009/09/10-11に東京工業大学大岡山キャンパス (東京都目黒区) で Japan Perl Association主催で開催されます。特別研修が受けられます！Moose入門、DBIx::ClassとMySQLによるスケーリング術、そしてPerl/Unicode/Ajaxについて、あの小飼弾氏を含む最強の講師達から学べる! 今回が初めてのYAPCへの参加の場合はこちらから参加者登録することができます。もしYAPC::Asia Tokyo 2008を含む他のYAPCにAct経由でログインした事がある場合は、前回と同じID/パスワードを使用してログインしてください。 YAPC::Asia Tokyo 2009の写真をficia.comにアップしました。ficia.comを運営するetolabo.comは今回YAPCスピーカーのうち3人

rin1024 2009/06/24

意地でもいく

yapc
perl

リンク

Latent Semantic Indexing - naoyaのはてなダイアリー

情報検索におけるベクトル空間モデルでは、文書をベクトルとみなして線形空間でそれを扱います。この文書ベクトルは、文書に含まれる単語の出現頻度などを成分に取ります。結果、以下のような単語文書行列 (term document matrix) が得られます。 d1 d2 d3 d4 Apple 3 0 0 0 Linux 0 1 0 1 MacOSX 2 0 0 0 Perl 0 1 0 0 Ruby 0 1 0 3 この単語文書行列に対して内積による類似度などの計算を行って、情報要求に適合する文書を探すのがベクトル空間モデルによる検索モデルです。見ての通り、単語文書行列の次元数は索引語の総数です。文書が増えれば増えるほど次元は増加する傾向にあります。例えば索引語が100万語あって検索対象の文書が 1,000万件あると、100万次元 * 1,000万という大きさの行列を扱うことになりますが、単

rin1024 2009/06/24

http://www-tsujii.is.s.u-tokyo.ac.jp/enshu3/lsa.htm ここの説明をもう少し詳しくした感じだった

iir
lsi

リンク

Introduction to Information Retrieval

This is the companion website for the following book. Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. You can order this book at CUP, at your local bookstore or on the internet. The best search term to use is the ISBN: 0521865719. The book aims to provide a modern approach to information retrieval from a co

rin1024 2009/06/24

こいつは本物だ・・・。

iir

リンク

スパースって何？ - OKWAVE

『BEMで取り扱うシステムマトリックスは，FEMにおけるように対称ではなく，またスパースでもない』という文章がありました．でもスパースってどういう状態をいうのか分かりません．スパース構造ってのもあるらしいんですけど，これっていったいなんですか？

rin1024 2009/06/24

"成分のうち０でないもの（非零の成分）がまばら⇒ほとんど（ないしは多くの成分が）0" スパースの意味

リンク

Automatic Cross-Language Retrieval Using Latent Semantic Indexing

rin1024 2009/06/24

LSAを用いた機械翻訳を一切必要としない多言語間検索

lsi

リンク

Latent semantic analysis - Wikipedia

Latent semantic analysis (LSA) is a technique in natural language processing, in particular distributional semantics, of analyzing relationships between a set of documents and the terms they contain by producing a set of concepts related to the documents and terms. LSA assumes that words that are close in meaning will occur in similar pieces of text (the distributional hypothesis). A matrix contai

rin1024 2009/06/24

lsa

リンク

18 Matrix decomposition and latent semantic indexing (pp.369-384) - シリコンの谷のゾンビ

ちょっと飛ばして，先にIIR18章を読んでみた．単語文書行列を特異値分解して新しい空間でベクトル空間モデルを使うというLSIの話．ページ数が少なかったので，魔が差して翻訳もしてみた．さらに数式が多いのでTeXで書いてみた．ここまで来たらこだわろうとAB型の悪い癖が出て，数式や演習も全部訳してみた．ついカッとなってやってしまった．今は公開している．でも反省はしていない．まだやっつけの部分があるのでこつこつとバージョンアップしてきます． Introduction to information retrieval: 18 Matrix decomposition and latent semantic indexing（和訳）大体1ページ1時間．こつこつ夜なべをして3日間くらいかかりました．否が応でも精読するので，とても理解が深まりました．じっくり読むのも翻訳作業もとても楽しかったので，なん

rin1024 2009/06/24

IIR18章のLSI及びSVDとかについての話

リンク

潜在意味解析 - Wikipedia

潜在意味解析（せんざいいみかいせき、英: Latent Semantic Analysis、略称: LSA）は、ベクトル空間モデルを利用した自然言語処理の技法の1つで、文書群とそこに含まれる用語群について、それらに関連した概念の集合を生成することで、その関係を分析する技術である。潜在的意味解析とも。 1988年、アメリカ合衆国でLSAの特許が取得されている[1]。情報検索の分野では、潜在的意味索引または潜在意味インデックス（英: Latent Semantic Indexing, LSI）とも呼ばれている。 LSA では、各文書における用語の出現を表した文書-単語マトリクスが使われる。これは各行が各単語に対応し、各列が各文書に対応した疎行列である。この行列の各成分の重み付けには tf-idf (term frequency–inverse document frequency) が用いられ

rin1024 2009/06/24

単語文書行列に対しSVDを利用して行列の次元縮退を行ったりする

lsa

リンク

Perceptron - [物理のかぎしっぽ]

基本の学習モデル † 最近傍決定則やk-最近傍決定則によりパターンを識別する事ができるようになりました．これらの方法は大変シンプルな考え方でありながら，サンプルが充実していればかなりの精度で識別が可能だと考えられます．しかし問題点として，サンプル全てを保持しておかなければならない事，次元数が増え，サンプル数が増えると計算量が膨大になる事が挙げられます．ここで最近傍決定則のように，パターンに最も距離の近いクラスタを選ぶという作業は見方を変えると，異なるクラスタのサンプル間において，垂直二等分線を考え，領域を分けるという事になります．ということは，この境界線を知ることができれば，サンプルのデータは不要と考えることができ，Perceptronはこの境界線を学習によって得ることができます．ただし，Perceptronは上の図のような垂直二等分線を得る訳ではなく，学習であたえ

rin1024 2009/06/24

perceptron

リンク

大規模データを基にした自然言語

大規模データを基にした自然言語叀 2009/3/13 SIGFPAI @学習院大自然言語叀岡野原大輔東京大学情報工学研科コンピュータ科学専攻辻井研 hillbig@is.s.u-tokyo.ac.jp 背景 • 匏用可能な言語資源の急な拡大 – ブログ, 掲示板, 商品情報, レビュー – Wikipedia, Google N-gram Corpus ( 1010 語) – 従来の言語資源 Penn treebank ( 106語)– 従来の言語資源 Penn treebank ( 10 語) • より多くのデータ⇒ も向上 – 統計的機械翻訳 [Brants+, EM NLP 07] • 言語資源のの対数で翻訳は線形に上昇 – 博卝有学習によるラベリング [Suzuki+, ACL 09] – 単語の類似計算 [柴田+, NLP 09] 発表の概要 • 大

rin1024 2009/06/24

最適化問題について。FOLOSやPerceptronの解説。

perceptron

リンク

golex.dvi

意味の包含関係に基づく動詞項構造の細分類竹内孔一 †，乾健太郎¶，竹内奈央 ‡，藤田篤 § 岡山大学大学院 † 奈良先端科学技術大学院大学¶ 言語アナリスト ‡ 名古屋大学大学院 § koichi@cl.cs.okayama-u.ac.jp, inui@is.naist.jp, fujita@nuee.nagoya-u.ac.jp 1 はじめに近年，係り受け解析の精度が向上し文を構成する動詞と名詞との関係，つまり項構造が同定できるようになってきた．項構造レベルでは表現の間で事態の推論を行う基礎となる命題的な意味関係が存在する．例え 2 語の構成的意味分解のコード化ば「X が Y を曲げる」は「Y が曲がる」ことを包含し，「X が Y に就職する」ならば「X が Y に所属する」こ 2.1 LCS の利点と問題点とを包含するであろう．こうした項構造レベルでの意 LC

rin1024 2009/06/24

リンク

2005年度人工知能学会全国大会・原稿テンプレート

rin1024 2009/06/24

pLSI

リンク

極性反転に対応した評価表現モデル高村大也† 乾孝司†† 奥村学† † 東京工業大学精密工学研究所〒 226-8503 横浜市緑区長津田町 4259 ††日本学術振興会 {takamura,oku}@pi.titech.ac.jp, tinui@

極性反転に対応した評価表現モデル高村大也† 乾孝司†† 奥村学† † 東京工業大学精密工学研究所〒 226-8503 横浜市緑区長津田町 4259 ††日本学術振興会 {takamura,oku}@pi.titech.ac.jp, tinui@lr.pi.titech.ac.jp 複数語から成る評価表現のモデル及びそれに基づいた分類手法を提案する. 複数語から成る評価表現の感情極性は, その構成語の感情極性を単純に足し合わせるだけでは算出できないことが多い. そのような表現に対応するために, 我々はモデルに隠れ変数を導入する. 実験により, 提案した隠れ変数モデルは複数語から成る評価表現分類において, 82%という高い分類正解率を得ることに成功した. キーワード : 感情極性, 複数語表現の分類, 隠れ変数モデル Latent Variable Models for S

rin1024 2009/06/24

Hofmannの生成モデルを利用

SVM

リンク

Probabilistic Latent Semantic Analysis

rin1024 2009/06/24

LSAの理論の解説

LSA

リンク

http://www.j-tokkyo.com/2008/G06F/JP2008-257511.shtml

rin1024 2009/06/24

専門用語抽出

flr

リンク

CakePHP 目で見るフックメソッド

第2回CakePHP関西勉強会でやったデモをこちらでも。 CakePHPには色々なフックメソッドがあるのですが、それらがどのタイミングで呼ばれるかを一覧できるようにデモを行いました。懇親会やアンケートでも良かったよ、と意見を頂いたので、簡単に画面のキャプチャを並べます。 1. Controllerのフックメソッド Controllerのフックメソッドを並べています。index()はアクションメソッドなので、ここで表示されているフックメソッドは3つです。ソース <?php class DemoController extends AppController { public $uses = array(); public function index() { } } ?> フックメソッドの並び 2. Componentのフックメソッド Controllerの$componentsを設定して

rin1024 2009/06/24

Controllerのhookの流れ

CakePHP

リンク

はてなブックマーク

タグ

2009年6月24日のブックマーク (28件)

BasisTech

形態素解析エンジン一覧

Perlメモ/MeCabモジュール - Walrus, Digit.

カイ二乗分布表の求め方

http://homepage2.nifty.com/nandemoarchive/suite_and_kente/kai.htm

転置行列 - Wikipedia

行列の階数の求め方

行列の階数

行列の階数 - Wikipedia

射影行列の性質

Google Scholar

スケジュール: YAPC::Asia 2009 - Sep 10-11 in Tokyo, JAPAN

YAPC::Asia 2009 - Sep 10-11 in Tokyo, JAPAN

Latent Semantic Indexing - naoyaのはてなダイアリー

Introduction to Information Retrieval

スパースって何？ - OKWAVE

Automatic Cross-Language Retrieval Using Latent Semantic Indexing

Latent semantic analysis - Wikipedia

18 Matrix decomposition and latent semantic indexing (pp.369-384) - シリコンの谷のゾンビ

潜在意味解析 - Wikipedia

Perceptron - [物理のかぎしっぽ]

大規模データを基にした自然言語

golex.dvi

2005年度人工知能学会全国大会・原稿テンプレート

極性反転に対応した評価表現モデル高村大也† 乾孝司†† 奥村学† † 東京工業大学精密工学研究所〒 226-8503 横浜市緑区長津田町 4259 ††日本学術振興会 {takamura,oku}@pi.titech.ac.jp, tinui@

Probabilistic Latent Semantic Analysis

http://www.j-tokkyo.com/2008/G06F/JP2008-257511.shtml

CakePHP 目で見るフックメソッド

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス