meganehouserのブックマーク / 2011年9月22日

meganehouser id:meganehouser

2011年9月22日のブックマーク (9件)

https://objectclub.jp/download/files/event/2006Christmas/xfd_ashizawa.pdf
meganehouser 2011/09/22
IT
リンク
サービス終了のお知らせ
サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
meganehouser 2011/09/22
機械学習
リンク
統計的機械学習(Hiroshi Nakagawa)
統計的機械学習 (under construction) 導入ppt pdf 情報の変換過程のモデル化ベイズ統計の意義識別モデルと生成モデル次元の呪い損失関数, bias, variance, noise 数学のおさらいppt pdf 線形代数学で役立つ公式情報理論の諸概念 (KL-divergenceなど) 指数型分布族、自然共役正規分布(条件付き、および事前分布) 評価方法ppt pdf 順位なし結果の評価(再現率、精度、適合率、F値) 順位付き結果の評価線形回帰と識別ppt pdf 線形回帰正規方程式正規化項の導入線形識別カーネル法ppt pdf 線形識別の一般化カーネルの構築法最大マージン分類器ソフトマージンの分類器 SVMによる回帰モデル SVM実装上の工夫モデル推定ppt pdf 潜在変数のあるモデル EMアルゴリズム変分ベイズ法 Expecta
meganehouser 2011/09/22
機械学習
リンク
機械学習 - 機械学習の「朱鷺の杜Wiki」
機械学習とは，Arther Samuel によれば「明示的にプログラミングすることなく，コンピュータに行動させるようにする科学」のことです．歴史的には，人工知能の研究分野の中で，人間が日々の実体験から得られる情報の中から，後に再利用できそうな知識を獲得していく過程を，コンピュータにおいて実現したいという動機から生じました．現在では，数値・文字・画像・音声など多種多様なデータの中から，規則性・パターン・知識を発見し，現状を把握や将来の予測をしたりするのにその知識を役立てることが目的となっています．しましまの私見に基づいて，機械学習の各種の問題を整理しました． ↑ 他分野との関連† 確率論：機械学習で扱うデータは，いろいろな不確定要素の影響を受けており，こうして生じた曖昧さを扱うために利用されます．統計：観測されたデータを処理する手法として長く研究されてきたため深い関連があります．特
meganehouser 2011/09/22
機械学習
リンク
PythonでNaiveBayesを実装してみた - nokunoの日記
解説は後日…しないかも． #!/usr/bin/env python #encoding: utf-8 from sys import stdin from optparse import OptionParser from collections import defaultdict def sign(x): if abs(x) return 0 elif x > 0: return 1 return -1 def clip(x, c): return sign(x) * max(0., abs(x) - c) def parse(line, bias, discount): label, document = line.strip().split(" ", 1) features = {} for feature in document.split(" "): key, value =
meganehouser 2011/09/22
python

自然言語処理
リンク
NLTKで日本語コーパスを扱う方法 - nokunoの日記
オライリーの「入門自然言語処理」の12章はHTML版がWebで公開されています．Python による日本語自然言語処理というわけで，NLTKで日本語でコーパスを扱う環境を整えました． NLTKのインストール公式サイトを見ながらインストールする．最新版はNLTK2.0で，オライリーの書籍のときと比べてChasen形式のパーザなどが追加されています．Download - Natural Language Toolkit Mac OSXの場合はPortでもインストールできるらしいのですが，うまくいかなかったのでパッケージをダウンロードしました．コーパスのダウンロードnltk.download()を実行して必要なコーパスをダウンロードします．$ python>>> import nltk>>> nltk.download()jeitaとknbcをダウンロード NLTKを日本語コーパスで使う場合の注
meganehouser 2011/09/22
自然言語処理
リンク
非公開サイト
サイトの構築。作品の販売。ブログの投稿。この他にもさまざまな機能があります。ログインサイトをはじめよう非公開サイトこのサイトは現在プライベート設定になっています。
meganehouser 2011/09/22
自然言語処理

python
リンク
KyTea (京都テキスト解析ツールキット)
English 京都テキスト解析ツールキット(KyTea、「キューティー」)は、日本語など、単語(または形態素)分割を必要とする言語のための一般的なテキスト解析器です。特徴ダウンロード・インストールプログラム仕様解析：手法の詳細, 入出力の形式, API 学習：モデル学習, 入手可能なモデル KyTeaを使った分野適応開発情報特徴 KyTeaには以下の機能が揃っています：単語分割：分かち書きされていないテキストを適当な単語または形態素に分割する。読み推定・品詞推定：かな漢字変換や音声認識、音声生成のために単語の発音を推定することができ、品詞を推定することもできます。線形SVMやロジスティック回帰などを用いてそれぞれの分割点や読みを個別に推定するため、部分的にアノテーションされたデータを利用してモデルを学習することも可能です。分類器の学習にはLIBLINEARを使用してい
meganehouser 2011/09/22
自然言語処理

programming
リンク
Zzz Eee Lll Ccc Hhh
形態素解析 (品詞推定) 日本語の形態素解析は、入力文字列を単語に分割して品詞を付与する処理で、これらを同時に行うのが一般的です。 ChaSenやMeCabやJUMANがその例です。これにら対して、我々は、単語分割と品詞付与を別々に行う枠組みを提案しています。この枠組みでは、様々な言語資源を用いることができるので、実用において問題となる分野適応に非常に強いという特徴があります。つまり、新聞などの一般的な分野以外のテキストに自然言語処理を適用する場合に、既存手法よりも基本的性能が高く、さらに迅速かつ安価に精度向上が図れます。この枠組みを実現した形態素解析器を KyPt として公開しています。枠組みまず、形態素解析を単語分割と品詞推定に分けて処理します。これにより、分野適応に非常に強い設計が可能になります。仮名漢字変換や音声認識の言語モデルなど、品詞が不要なアプリケーシ
meganehouser 2011/09/22
自然言語処理
リンク
- 2011年9月23日
- 2011年9月22日
- 2011年9月21日