タグ

2009年6月24日のブックマーク (28件)

  • BasisTech

    アイデアの可能性を実行可能なソリューションに育てる BasisTechは、ベンチャー企業の製品開発、有能なスタッフの獲得、資金調達や成長への準備を支援します。 有望なアイデアを持つ卓越した人材を求めています より良い世界づくりに貢献する可能性を秘めたアーリーステージスタートアップ企業を支援します。現在参加の企業はエンタープライズデータ、マシンビジョン、公的機関にフォーカスしています。

    BasisTech
    rin1024
    rin1024 2009/06/24
    Googleでも使われてるらしい形態素解析エンジン
  • 形態素解析 エンジン 一覧

    ChaSen 日形態素解析システム CaboCha Support Vector Machines に基づく日語係り受け解析器 JSplitter 日語の単語抽出ツール MeCab ChaSenを基に開発された高速な形態素解析器 Sen Java 形態素解析エンジン すもも NTT 物性科学基礎研究所で開発された日形態素解析システム 大量の日語データを高速に形態素解析することを目的 JUMAN 日語の解析の研究を目指す多くの研究者に共通に使える形態素解析ツール Breakfast 富士通研究所が開発した日形態素解析システム KNP 日語文の構文解析を行なうシステム SUFARY suffix arrayというデータ構造を用いて高速な文字列検索を行なう MACD Java RM用いた形態素解析システム Rosette GoogleAmazon、Lycos 等名だたるサ

    rin1024
    rin1024 2009/06/24
    昨今の形態素解析エンジン一覧
  • Perlメモ/MeCabモジュール - Walrus, Digit.

    以下で、現時点での最新0.96版のPPDファイルと、PPMコマンドでのインストール方法が公開されています。 http://namazu.asablo.jp/blog/2007/06/28/1611341 私が使用しているWindows+ActivePerl 5.8の環境では、ここに書かれているとおり以下を実行することでMeCab?モジュールをインストールできました。 ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd サンプルスクリプトを参考に、次のようなスクリプトを作成しました。 use MeCab; print $MeCab::VERSION, "\n\n"; my $sentence = "太郎 はこのを二郎を見た女性に渡した。"; my $tagger = new MeCab::Tagger(join " ",

    rin1024
    rin1024 2009/06/24
    Active Perl使ってMeCab触る方法
  • カイ二乗分布表の求め方

    自由度Φのカイ二乗分布の密度関数は、 http://d.hatena.ne.jp/cgi-bin/mimetex.cgi?5$f_\P …^2\right)=\frac{1}{2^{\frac{\Phi}{2}}\Gamma\left(\frac{\Phi}{2}\right)}e^{-\frac{\chi^2}{2}}\left(\chi^2\right)^{\frac{\Phi}{2}-1} で与えられるので、(上のURLを1行にしてコピペしてください) この上側、100p パーセント点αは、 http://d.hatena.ne.jp/cgi-bin/mimetex.cgi?5$p=\i …^\infty%20f_\Phi(\chi^2)d\chi^2 で決まる点αです。(これも、URLを1行にしてコピペしてください) この積分を折れ線近似でもしてやれば、小さなΦの値でも計算できるか

    カイ二乗分布表の求め方
    rin1024
    rin1024 2009/06/24
    カイ二乗の計算方法
  • http://homepage2.nifty.com/nandemoarchive/suite_and_kente/kai.htm

    rin1024
    rin1024 2009/06/24
    カイ二乗分布表。カイ二乗検定で利用。
  • 転置行列 - Wikipedia

    転置行列(てんちぎょうれつ、英: transpose [of a matrix], transposed matrix)とは、m 行 n 列の行列 A に対して A の (i, j) 要素と (j, i) 要素を入れ替えてできる n 行 m 列の行列のことである[1]。転置行列は tA, AT, A⊤, Atr, A′ などと示される。行列の転置行列を与える操作のことを転置(てんち、英: transpose)といい、「A を転置する」などと表現する。 特に正方行列に対しては、転置行列は各成分を対角成分で折り返した行列になる。 A, B は行列、k, l はスカラーとして各演算が定義できる限りにおいて以下のことが成り立つ。 転置の転置は元の行列を与える[1](対合性):t tA = A 和の転置は転置の和を与える[1](加法性):t(A + B) = tA + tB 行列のスカラー倍の転置は

    転置行列 - Wikipedia
    rin1024
    rin1024 2009/06/24
    Atの計算方法(備忘). 転置行列と逆行列は同一だと思ってました.
  • 行列の階数の求め方

    的にどこかの行・列の成分を0にすることを考えます。 3列目に1が並んでいるのに着目して、 1行目を2行目に足す、1行目を3行目に足す という操作を行うと、 3 4 -1 5 5 0 1 1 0 となります。 すると、2行目と3行目が比例関係にあることが見えるので、 2行目の-1/5倍を3行目に足すと、 3 4 -1 5 5 0 0 0 0 となって、3行目がすべて0となります。 従って、この行列式は0であり、階数は3にはなり得ず、 3 4 5 5 の行列式は0ではないので、階数は2となります。 もっと変形を進めて、 1 0 0 0 1 0 0 0 0 まで変形することができますが、ここまでやらなくても階数はわかる でしょう。 また、当然、変形の仕方は一意的ではありません。なので、の解答 が絶対唯一のものではありません。 最初に、この行列の行列式を計算すると0になるので、最初から 階数

    行列の階数の求め方
    rin1024
    rin1024 2009/06/24
    階数の求め方
  • 行列の階数

    rin1024
    rin1024 2009/06/24
    rank(A)の計算方法
  • 行列の階数 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "行列の階数" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL (2017年7月) 線型代数学における行列の階数(かいすう、rank; ランク)は、行列の最も基的な特性数 (characteristic) の一つで、その行列が表す線型方程式系および線型変換がどのくらい「非退化」であるかを示すものである。行列の階数を定義する方法は同値なものがいくつもある。 例えば、行列 A の階数 rank(A)(あるいは rk(A) または丸括弧を落として rank A)は、A の列空間(列ベクトルの張るベクトル空間)の次元[1]に等しく、また A の行

    rin1024
    rin1024 2009/06/24
    rank(A)のrankの意味。知らんかった。
  • 射影行列の性質

    rin1024
    rin1024 2009/06/24
    射影
  • Google Scholar

    rin1024
    rin1024 2009/06/24
    生物学とかの方がLSAとかの研究進んでるらしい
  • スケジュール: YAPC::Asia 2009 - Sep 10-11 in Tokyo, JAPAN

    スケジュール ボールドのトークはスピーカーの確認済みです。 9/9が前夜祭、 9/10-9/11がYAPC::Asia編となります。9/14, 9/15, 9/16は特別研修の日程です 水曜日 | 木曜日 | 金曜日 | 月曜日 | 火曜日 | 水曜日 2009/09/09 時間 フェライト会議室

    rin1024
    rin1024 2009/06/24
    Yapc::Asia 2009のスケジュール(まだ埋まってない)
  • YAPC::Asia 2009 - Sep 10-11 in Tokyo, JAPAN

    ようこそ YAPC::Asia 2009 は 2009/09/10-11に 東京工業大学大岡山キャンパス (東京都目黒区) で Japan Perl Association主催で 開催されます。 特別研修が受けられます!Moose入門、DBIx::ClassとMySQLによるスケーリング術、そしてPerl/Unicode/Ajaxについて、あの小飼弾氏を含む最強の講師達から学べる! 今回が初めてのYAPCへの参加の場合はこちらから参加者登録することができます。もしYAPC::Asia Tokyo 2008を含む他のYAPCにAct経由でログインした事がある場合は、前回と同じID/パスワードを使用してログインしてください。 YAPC::Asia Tokyo 2009の写真をficia.comにアップしました。ficia.comを運営するetolabo.comは今回YAPCスピーカーのうち3人

    rin1024
    rin1024 2009/06/24
    意地でもいく
  • Latent Semantic Indexing - naoyaのはてなダイアリー

    情報検索におけるベクトル空間モデルでは、文書をベクトルとみなして線形空間でそれを扱います。この文書ベクトルは、文書に含まれる単語の出現頻度などを成分に取ります。結果、以下のような単語文書行列 (term document matrix) が得られます。 d1 d2 d3 d4 Apple 3 0 0 0 Linux 0 1 0 1 MacOSX 2 0 0 0 Perl 0 1 0 0 Ruby 0 1 0 3 この単語文書行列に対して内積による類似度などの計算を行って、情報要求に適合する文書を探すのがベクトル空間モデルによる検索モデルです。 見ての通り、単語文書行列の次元数は索引語の総数です。文書が増えれば増えるほど次元は増加する傾向にあります。例えば索引語が100万語あって検索対象の文書が 1,000万件あると、100万次元 * 1,000万という大きさの行列を扱うことになりますが、単

    Latent Semantic Indexing - naoyaのはてなダイアリー
    rin1024
    rin1024 2009/06/24
    http://www-tsujii.is.s.u-tokyo.ac.jp/enshu3/lsa.htm ここの説明をもう少し詳しくした感じだった
  • Introduction to Information Retrieval

    This is the companion website for the following book. Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008. You can order this book at CUP, at your local bookstore or on the internet. The best search term to use is the ISBN: 0521865719. The book aims to provide a modern approach to information retrieval from a co

    rin1024
    rin1024 2009/06/24
    こいつは本物だ・・・。
  • スパースって何? - OKWAVE

    『BEMで取り扱うシステムマトリックスは,FEMにおけるように対称ではなく,またスパースでもない』という文章がありました.でもスパースってどういう状態をいうのか分かりません.スパース構造ってのもあるらしいんですけど,これっていったいなんですか?

    スパースって何? - OKWAVE
    rin1024
    rin1024 2009/06/24
    "成分のうち0でないもの(非零の成分)がまばら⇒ほとんど(ないしは多くの成分が)0" スパースの意味
  • Automatic Cross-Language Retrieval Using Latent Semantic Indexing

    rin1024
    rin1024 2009/06/24
    LSAを用いた機械翻訳を一切必要としない多言語間検索
  • Latent semantic analysis - Wikipedia

    Latent semantic analysis (LSA) is a technique in natural language processing, in particular distributional semantics, of analyzing relationships between a set of documents and the terms they contain by producing a set of concepts related to the documents and terms. LSA assumes that words that are close in meaning will occur in similar pieces of text (the distributional hypothesis). A matrix contai

    rin1024
    rin1024 2009/06/24
  • 18 Matrix decomposition and latent semantic indexing (pp.369-384) - シリコンの谷のゾンビ

    ちょっと飛ばして,先にIIR18章を読んでみた.単語文書行列を特異値分解して新しい空間でベクトル空間モデルを使うというLSIの話. ページ数が少なかったので,魔が差して翻訳もしてみた.さらに数式が多いのでTeXで書いてみた.ここまで来たらこだわろうとAB型の悪い癖が出て,数式や演習も全部訳してみた.ついカッとなってやってしまった.今は公開している.でも反省はしていない.まだやっつけの部分があるのでこつこつとバージョンアップしてきます. Introduction to information retrieval: 18 Matrix decomposition and latent semantic indexing(和訳) 大体1ページ1時間.こつこつ夜なべをして3日間くらいかかりました.否が応でも精読するので,とても理解が深まりました.じっくり読むのも翻訳作業もとても楽しかったので,なん

    18 Matrix decomposition and latent semantic indexing (pp.369-384) - シリコンの谷のゾンビ
    rin1024
    rin1024 2009/06/24
    IIR18章のLSI及びSVDとかについての話
  • 潜在意味解析 - Wikipedia

    潜在意味解析(せんざいいみかいせき、英: Latent Semantic Analysis、略称: LSA)は、ベクトル空間モデルを利用した自然言語処理の技法の1つで、文書群とそこに含まれる用語群について、それらに関連した概念の集合を生成することで、その関係を分析する技術である。潜在的意味解析とも。 1988年、アメリカ合衆国でLSAの特許が取得されている[1]。情報検索の分野では、潜在的意味索引または潜在意味インデックス(英: Latent Semantic Indexing, LSI)とも呼ばれている。 LSA では、各文書における用語の出現を表した文書-単語マトリクスが使われる。これは各行が各単語に対応し、各列が各文書に対応した疎行列である。この行列の各成分の重み付けには tf-idf (term frequency–inverse document frequency) が用いられ

    rin1024
    rin1024 2009/06/24
    単語文書行列に対しSVDを利用して行列の次元縮退を行ったりする
  • Perceptron - [物理のかぎしっぽ]

    の学習モデル † 最近傍決定則やk-最近傍決定則 によりパターンを識別する事ができるようになりました. これらの方法は大変シンプルな考え方でありながら,サンプルが充実していれば かなりの精度で識別が可能だと考えられます.しかし問題点として, サンプル全てを保持しておかなければならない事,次元数が増え,サンプル数が増えると 計算量が膨大になる事が挙げられます. ここで最近傍決定則のように,パターンに最も距離の近いクラスタを選ぶという作業は 見方を変えると,異なるクラスタのサンプル間において, 垂直二等分線を考え,領域を分けるという事になります. ということは,この境界線を知ることができれば, サンプルのデータは不要と考えることができ,Perceptronはこの境界線を 学習によって得ることができます.ただし,Perceptronは上の図のような垂直二等分線を得る訳ではなく, 学習であたえ

  • 大規模データを基にした 自然言語

    大規模データを基にした 自然言語叀 2009/3/13 SIGFPAI @学習院大 自然言語叀 岡野原大輔 東京大学情報 工学 研 科 コンピュータ科学専攻 辻井研 hillbig@is.s.u-tokyo.ac.jp 背景 • 匏用可能な言語資源の急 な拡大 – ブログ, 掲示板, 商品情報, レビュー – Wikipedia, Google N-gram Corpus ( 1010 語) – 従来の言語資源 Penn treebank ( 106語)– 従来の言語資源 Penn treebank ( 10 語) • より多くのデータ⇒ も向上 – 統計的機械翻訳 [Brants+, EMNLP 07] • 言語資源の の対数で翻訳 は線形に上昇 – 博卝 有学習による ラベリング [Suzuki+, ACL 09] – 単語の類似 計算 [柴田+, NLP 09] 発表の概要 • 大

    rin1024
    rin1024 2009/06/24
    最適化問題について。FOLOSやPerceptronの解説。
  • golex.dvi

    意味の包含関係に基づく動詞項構造の細分類 竹内 孔一 †,乾健太郎¶,竹内奈央 ‡,藤田篤 § 岡山大学大学院 † 奈良先端科学技術大学院大学¶ 言語アナリスト ‡ 名古屋大学大学院 § koichi@cl.cs.okayama-u.ac.jp, inui@is.naist.jp, fujita@nuee.nagoya-u.ac.jp 1 はじめに 近年,係り受け解析の精度が向上し文を構成する動 詞と名詞との関係,つまり項構造が同定できるように なってきた.項構造レベルでは表現の間で事態の推論 を行う基礎となる命題的な意味関係が存在する.例え 2 語の構成的意味分解のコード化 ば「X が Y を曲げる」は「Y が曲がる」ことを包含し, 「X が Y に就職する」ならば「X が Y に所属する」こ 2.1 LCS の利点と問題点 とを包含するであろう.こうした項構造レベルでの意 LC

    rin1024
    rin1024 2009/06/24
  • 2005年度人工知能学会全国大会・原稿テンプレート

    rin1024
    rin1024 2009/06/24
  • 極性反転に対応した評価表現モデル 高村 大也† 乾 孝司†† 奥村 学† † 東京工業大学 精密工学研究所 〒 226-8503 横浜市緑区長津田町 4259 ††日本学術振興会 {takamura,oku}@pi.titech.ac.jp, tinui@

    極性反転に対応した評価表現モデル 高村 大也† 乾 孝司†† 奥村 学† † 東京工業大学 精密工学研究所 〒 226-8503 横浜市緑区長津田町 4259 ††日学術振興会 {takamura,oku}@pi.titech.ac.jp, tinui@lr.pi.titech.ac.jp 複数語から成る評価表現のモデル及びそれに基づいた分類手法を提案する. 複数語から成る評価表現 の感情極性は, その構成語の感情極性を単純に足し合わせるだけでは算出できないことが多い. その ような表現に対応するために, 我々はモデルに隠れ変数を導入する. 実験により, 提案した隠れ変数モ デルは複数語から成る評価表現分類において, 82%という高い分類正解率を得ることに成功した. キーワード : 感情極性, 複数語表現の分類, 隠れ変数モデル Latent Variable Models for S

    rin1024
    rin1024 2009/06/24
    Hofmannの生成モデルを利用
  • Probabilistic Latent Semantic Analysis

    rin1024
    rin1024 2009/06/24
    LSAの理論の解説
  • http://www.j-tokkyo.com/2008/G06F/JP2008-257511.shtml

    rin1024
    rin1024 2009/06/24
    専門用語抽出
  • CakePHP 目で見るフックメソッド

    第2回CakePHP関西勉強会でやったデモをこちらでも。 CakePHPには色々なフックメソッドがあるのですが、それらがどのタイミングで呼ばれるかを一覧できるようにデモを行いました。懇親会やアンケートでも良かったよ、と意見を頂いたので、簡単に画面のキャプチャを並べます。 1. Controllerのフックメソッド Controllerのフックメソッドを並べています。index()はアクションメソッドなので、ここで表示されているフックメソッドは3つです。 ソース <?php class DemoController extends AppController { public $uses = array(); public function index() { } } ?> フックメソッドの並び 2. Componentのフックメソッド Controllerの$componentsを設定して

    rin1024
    rin1024 2009/06/24
    Controllerのhookの流れ