運営元のロゴ Copyright © 2007-2025 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します。個別にライセンスが設定されている記事等はそのライセンスに従います。

毎週決まった平日の夜に 「機械学習とパターン認識」(PRML) を読み進めようという PRML Wednesday のキックオフにのこのこ顔を出してきた。主催の naoya_t さん&参加者のみなさん、お疲れ様でした&ありがとうございました。 ほとんど初顔の方ばかりの中で好き放題しゃべってしまい。まあ例によって反省はしていないのだけれど(苦笑)。 会であれこれ言ったこと(めんどくさいので、ここでもう一度繰り返すことはしないw)はあくまで「素人から出発して PRML をひと通り読み終わった個人が、その経験から感じたこと」であり、絶対の正解なんかではない。 気に入らなかったら「なるほど、お前の中では(ry」で片付けて欲しい。勉強なんて続かなかったら意味が無いので、自分が続けられる方法やスタンスを模索して選びとっていかないとしょうがないのだから。 PRML Wednesday にはたぶん毎回は参
最近は、簡潔データ構造を中心に調べたりしていたけど、文字列マッチングを考えた場合、別のアプローチもあります。そう、grepのような逐次文字列検索ですね。以下の解説がおもしろいです。 http://www.i.kyushu-u.ac.jp/~takeda/papers/IPSJMagazineCPM.pdf CSAとかFM-Indexに隠れてしまっていますが、実はかなり強力です。特に、クエリが固定で、テキストが頻繁に変更されるようなケースでは有効です。中でも使いやすのは、Aho-Corasick法(AC法)ですね。複数のパターンを同時に検索することができます。KMPを拡張した方法です。 AC法については、日本語だと 情報検索アルゴリズム 作者: 北研二,津田和彦,獅々堀正幹出版社/メーカー: 共立出版発売日: 2002/01メディア: 単行本購入: 6人 クリック: 552回この商品を含むブ
コンピュータビジョン&機械学習の入門的な内容について ※事例のランダムサンプリングを追加:修正 ※再現率、適合率の名称逆だったので入れ替え:修正
違法素数(いほうそすう/英: illegal prime)とは、素数のうち、違法となるような情報やコンピュータプログラムを含む数字。違法数(英語版)の一種である。 2001年、違法素数の1つが発見された。この数はある規則に従って変換すると、DVDのデジタル著作権管理を回避するコンピュータプログラムとして実行可能であり、そのプログラムはアメリカ合衆国のデジタルミレニアム著作権法で違法とされている[1]。 DVDのコピーガードを破るコンピュータプログラムDeCSSのソースコード 1999年、ヨン・レック・ヨハンセンはDVDのコピーガード (Content Scramble System; CSS)を破るコンピュータプログラム「DeCSS」を発表した。ところが2001年5月30日、アメリカ合衆国の裁判所は、このプログラムの使用を違法としただけではなく、ソースコードの公表も違法であると判断した[2
参考:人材獲得作戦・4 試験問題ほか: 人生を書き換える者すらいた。 Lv4に評価されるためには、最短性の完全なチェックが必要だったのでCoqで証明してみた。 まず、accessiblesという関数を定義し、以下の性質を証明した。 ここでplengthはパスの長さを計る関数で、Path x pはpがxを起点としたパスであるという述語。endofはパスの終点を求める関数。 Fixpoint accessibles (start : node) (len : nat) : list path := match len with | O => (PUnit start) :: nil | S n' => div_equiv path_equiv_dec @@ (flat_map expand @@ accessibles start n') end. この関数はstartから始まってlenの長さ
Exact Cover Problem 今回解説するKnuth's Algorithm Xは、Exact Cover Problemという問題を解くためのアルゴリズムです。Exact Cover Problemについてはうまい日本語訳が分からない(「敷き詰め問題」とか?)ので英語のまま書いています。 数学で言うと、ある集合Xの部分集合の集合Sが与えられて、そのSの部分集合であるようなS*において、Xに含まれる要素全てがS*の中にひとつだけ含まれるとき、S*はExact Coverであると言います。 ちょっと分かりづらいと思うので具体例を挙げると、まず集合 X = {1, 2, 3, 4, 5} だとします。そして集合 S = {A, B, C, D, E, F} として、A,B,C,D,E,Fは以下のようであるとします。 A = {1, 3} B = {1, 4, 5} C = {2, 4
グラフ理論において、グラフGの頂点からなるある集合VがGの頂点被覆(ちょうてんひふく、英: vertex cover)であるとは、Gのどの辺をとってもその端点のどちらかがVに含まれるという意味である。最小頂点被覆を求める問題は計算機科学における古典的な最適化問題であり、近似アルゴリズムのある典型的なNP困難な問題でもある。その決定問題版である頂点被覆問題は計算複雑性理論における古典的なNP完全問題である。さらに頂点被覆問題には固定パラメータ容易性 (fixed-parameter tractability) があり、パラメータ化計算量理論の中心問題の1つである。 最小頂点被覆問題は、整数計画問題に定式化でき、その双対問題は最大マッチング問題である。 グラフ G の頂点被覆とは頂点の集合 C であり、G の各辺は C 内の少なくとも1つの頂点と接合する。このとき集合 C は G の辺を「被覆
10:01 10/07/20 それでも2倍だ 先日のvectorの伸長度合いの記事に関して 本当に1.5倍のほうがメモリ効率がよいのか という反応をいただきました。とても興味深い。みんな読みましょう。 自分の理解メモ: 「再利用ができるから嬉しい」等の議論をするなら、 今までに確保したメモリ (1 + r^1 + ... + r^k) のうち、 有効に使えてるメモリ r^{k-1} (バッファ拡大直後) や r^k (次のバッファ拡大直前) の割合で評価してみようじゃないかという。 まず簡単のために再利用をしない場合を考えると、この割合はそれぞれ (r-1)/r^2、 (r-1)/r になります(途中計算略)。 この利用率が最悪になる瞬間 (r-1)/r^2 を最善にしよう、 という一つの指標で考えてみると、式を微分なりなんなりしてみると r = 2 で最大(25%)となることがわかります
AROBAS Team, IBISC Lab, Department of Computer Science, University of Evry, IBGBI Building, 23 Boulevard de France, 91037 Evry, FRANCE Welcome! I'm about 45 years old, and the father of 2 nice kids. I'm a full professor at the University of Evry, 25km in the South of Paris. I do my research in the AROBAS Research Team of the IBISC Lab. I've been maître de conférences (professor assistant) at the U
Anarchy Golf This is a golf server. You can enjoy short coding here in several languages (116 languages). The purpose of this server is not serious competition. Joke problems are welcomed and you can speak freely about problems and can release spoilers. For serious competition with ranking, enter Code Golf. IRC channel for this golf server: #anagol in freenode. Please feel free to join the channel
CCRMAにブラスの物理モデルが書いてあった。 https://ccrma.stanford.edu/~jos/pasp/Brasses.html 実装はSTKに書いてあるので、jsで真似して書いてみた。 http://cygx.mydns.jp/tracker/?id=Brass それっぽいけどまだ何か変。 とりあえず分かったことをメモ。 簡単に言うと、管楽器というのは管とリードから成る。ブラスの場合はリードは奏者の唇となる。 唇は息と管の圧力を双2次フィルタで目的の周波数で共振させることで実装している。 息の圧力は単純にADSRで決める。ただそれだけだと単純すぎるのでサイン波でビブラートを入れる。ついでに雑音も入れてみた。 管はdigital waveguideで実装していると書いてあるけど、難しいことは無く、左へ進む波と右へ進む波をそれぞれ管理するバッファのこと。管の性質は端に到達し
物理モデル音源といえば、VL1だと思ってたけど、もうとっくにソフトシンセでも物理ベースが当たり前になりつつあるらしい。 【DEMO】YAMAHA VL1 http://www.youtube.com/watch?v=OYWxCrz3vmQ VL1は今見ても面白い。 YAMAHA VL1 Perfect Guide http://download.yamaha.com/api/asset/file/?language=ja&site=jp.yamaha.com&asset_id=17050 その仕組みは僕にとって謎だったのだけど、シンセサイザの総本山的なスタンフォードのCCRMAのページにかなり詳細な情報が載っていた。 PHYSICAL AUDIO SIGNAL PROCESSING https://ccrma.stanford.edu/~jos/pasp/pasp.html これは本当に宝
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? オバマ大統領の再選に大きく寄与したことで大きな注目を集めているA/Bテスト。A/Bテストを導入した、することを検討している、という開発現場も多いのではないだろうか。 そんな中、Web上で次のような議論を見つけた。 20 lines of code that will beat A/B testing every time Why multi-armed bandit algorithm is not “better” than A/B testing 一言でまとめると「A/Bテストよりバンディットアルゴリズムの方がすごいよ」「いやいやA
次数4、長さ6のゴロム定規。最短で完全である。 ゴロム定規(ゴロムじょうぎ、英: Golomb ruler)とは、想像上の定規の上で一連の整数位置にマークを配置し、任意のマークの対の距離がどれをとっても等しくならないものをいう。ゴロム尺とも。マーク数を「次数 (order)」、2つのマーク間の距離のうち最大の距離を「長さ (length)」という。ゴロム定規の平行移動と鏡映は自明と考えられる。そのため慣例として、最小のマークを0とし、その次のマークは2つの可能な値のうち小さいほうを取る。 ソロモン・ゴロムが名前の由来だが、Sidon(英語版)[1]とBabcock[2]も独自に発見している。 ゴロム定規は、その長さまでの全ての距離を測定できる必要はないが、全ての距離を測定できるゴロム定規を「完全 (perfect)」ゴロム定規 (PGR) という。5個以上のマークのあるゴロム定規では、完全
注意:github に移動しました。 再帰を学ぶためのドリル。使用するプログラミング言語は Haskell。このシリーズは続くかもしれないし、途中で挫折するかもしれない。乞うご期待! 等差数列の和 差が1の等差数列の和を計算する関数 soap(sum of arithmetic progression) を考える。 soap 0 = 0 soap 1 = 0 + 1 soap 2 = 0 + 1 + 2 soap 3 = 0 + 1 + 2 + 3 soap 4 = 0 + 1 + 2 + 3 + 4 一歩手前を使うとどうなる? soap 0 = 0 soap 1 = soap 0 + 1 soap 2 = soap 1 + 2 soap 3 = soap 2 + 3 soap 4 = soap 3 + 4 再帰部を一般化するとどうなる? soap 0 = 0 -- 基底部 soap n
お気に入り経由で以下の記事を読んでとてもおもしろかったのですが、 http://ama.an-pan-man.com/archives/814 原文も読んで確認もしたんですけど、エリック・ランダーが自己紹介するにあたって「ランダー・グリーンアルゴリズム*1」について一言も触れてない。 これはとても美しいアルゴリズムで、隠れマルコフモデルの遺伝家系データへの適用で、最初にこれを思いついたのは天才だと私は思う。今でもこのアルゴリズムは応用されており、たとえば次世代シーケンサーのデータにおいても行われるハプロタイプの相決定や、imputationアルゴリズムと言ってヒトゲノム上数十万のマーカーデータから、相関構造を利用して一千万以上のマーカーデータを推定するというのに使われます。 わたしは数学出身ではありません。EMアルゴリズムのDempster論文も、なんとか読み終えることは出来ましたというレ
The Lempel–Ziv–Markov chain algorithm[1] (LZMA) is an algorithm used to perform lossless data compression. It has been used in the 7z format of the 7-Zip archiver since 2001.[2] This algorithm uses a dictionary compression scheme somewhat similar to the LZ77 algorithm published by Abraham Lempel and Jacob Ziv in 1977 and features a high compression ratio (generally higher than bzip2)[3][4] and a v
Lempel-Ziv-Markov chain-Algorithm(略してLZMA)は、2001年から開発されているデータ圧縮アルゴリズムで、7-Zipアーカイバの7zフォーマットやXZ Utilsのxzフォーマットで使用されている。LZMAは、LZ77に少々類似した辞書式圧縮法(英語版)を使用し、通常bzip2以上の高い圧縮率と伸張速度、および最大4GBのサイズ可変な圧縮辞書を特徴とする。 LZMA2は、圧縮されていないデータとLZMAデータの両方を含むことができ、複数の異なるLZMAエンコーディングパラメータを含むことができる単純なコンテナ形式である。 LZMA2は、任意にスケーラブルなマルチスレッドの圧縮と展開と、部分的に非圧縮データの効率的な圧縮をサポートする。 LZMAは、改良LZ77圧縮アルゴリズムと、バックエンドにレンジコーダー(Range Coder)を使用している。 辞書
Computer Science の人間に「辞書順」が通じないと軽くショックですね。 補足 ref:clmemo@aka: コンピューター業界の「辞書順」に疑問 うえ、こんなエントリにトラックバックが付いたので少し補足。 ええと、ここでいう辞書順ってのはいわゆる lexicographic order です。多分、これの訳語は「辞書順」で定着しているので、その分野の人間(というか相手は自然言語処理の人間だったんですが)ならそれで通じて欲しいなぁと。 あと、日本の辞書はふりがなをキーに lexicographic order に並べているわけで、単に整列のキーが見出し語じゃないというオチもあったり。 しかし、他にいい訳語がなさげ。たとえば Java の java.lang.String#compareTo のドキュメントの一部は英・日でこんな感じ。 Compares two strings
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く