kitanowのブックマーク / 2007年12月5日

kitanow id:kitanow

2007年12月5日のブックマーク (5件)

Browsing Photoshop Custom Shapes
Upload your creations for people to see, favourite, and share.
kitanow 2007/12/05
icon
リンク
Websiteicons
DashboardExpiring SoonDomain ListHosting ListPrivate Em ailSSL CertificatesSubscriptionsMy OffersNEWProfile Oops! This page cannot be found.Unfortunately, this page is unavailable. But don’t worry, we can get you right back on track! Go to homepage
kitanow 2007/12/05
icon
リンク
liquidicity » 77 Vector Buttons hot off the press.
Can’t be bothered with making buttons? Want some new ones to add to your collection? Need a little inspiration? We’ve put together a little set of 77 buttons that we hope will lend you a hand in your times of button making breakdown. Other resources in IconsBrowserconsA slick, full-featured set of sweet browser icons from 16px to 64px. View ResourceGoSocialA beautiful set of social media icons, pr
kitanow 2007/12/05
button

web
リンク
DO++ : マルコフ情報源上で次の文字を予測する
文字列（単語列）を解析する際、i番目の文字はその直前(N-1)文字のみ依存するというマルコフ情報源を仮定することはいろいろな場面で現れます。例えば音声認識とか機械翻訳では、次の単語を直前(N-1)単語を使って予測するというN-gramモデルが古くから今でも使われてますし、データ圧縮でもこれと全く同じように履歴を使って次の文字を予測し、その予測確率を用いて符号化するPPMモデルがあります。ここで問題になるのは、何文字前まで見れば次の文字を予測できるかということが一般のデータだと分からないということです。例えば4文字前まで見た場合より5文字前まで見たほうが次の文字が確実に予想できそうですが、4文字前までは過去のデータで何回もでているのに5文字になると途端に出現回数が少なくなってサンプル数が少なくなってしまい予測精度が低下してしまう問題があります。そのため大抵は1,2,3..,N文字前の文
kitanow 2007/12/05
自然言語処理
リンク
DO++: AND検索の最尤推定
検索技術においてAND検索、つまり二つの単語を指定して、それが両方出現している文書数の推定を高速に行うのは難しい問題です。問題を正しく書くと単語w_xが出ている文書番号(x1,x2,x3,..,xn)とw_yが出ている文書番号(y1,y2,y3,...,ym)が与えられたら | {(i,j)|x_i = y_j} | の数を求める問題です。これは前もって全通り求めて保存しておくにも単語種類数の二乗のオーダー分必要なのでできません。これは機械学習でも特徴関数が0/1の値しかとらないとき、二つの要素の特徴ベクトルの内積を求める問題と同じで、またデータベースでもJOINの順番を決めるときにでてくる問題です。普通は全体の文書からサンプルをとって、その中で数えてみて、それを元のサイズにスケールさせることをします。例えば全体文書1億件の中から文書1000件だけとってきて、その中でw_xとw_y
kitanow 2007/12/05
自然言語処理
リンク
- 2007年12月6日
- 2007年12月5日
- 2007年12月3日