タグ

関連タグで絞り込む (182)

タグの絞り込みを解除

説明に関するtorutoのブックマーク (336)

  • 議論のしかた

    議論のしかた2003-07-16ネットで議論をするにはルールがあります。いえ、ネット以外で議論する場合も同じですが。

  • ベイズの事後分布と事後予測分布を出してみた - yasuhisa's blog

    MCMCで、って言ったそばからあれなんですが、研究室の先輩と話してたらできそうだ、ということでやりました。できました。 事後分布についてコインを二回投げて、表なら1、裏なら0でその和について考える。この和の事前分布をとりあえず一様分布*1としておく。この場合のパラメータの事後分布は一般に次のように書けるはず*2。 で、これがデータが与えられるにつれて、どのように変化していくか、というのを見ようということをやりたかったのである。 ひとまずindicator functionとposterior distributionをRで以下のように定義する。関数を返す関数になっているが、尤度関数でパラメータを求めさせたことがある人とかなら普通にやったことがあるようなやつである。 indicator_function<- function(x){ if(0 <= all(x) & all(x) <= 1)

    ベイズの事後分布と事後予測分布を出してみた - yasuhisa's blog
  • Introduction to Information Retrieval 輪講第7回 : no hacking, no life

    たつをさんが主催するIIR輪講の第7回に参加してきました。 (今回が初参加。誘って頂きありがとうございます!) 最初に、恒例(らしい)のnaoyaさんからの前回の復習がありました。 「転置インデックスの圧縮は、Termを保存する辞書と、Termの出現位置を保存するPostingの両方が圧縮対象で、それぞれ・・・(省略)などの方法があります」という話で、すごいわかりやすい説明だったので、これだけでもとてもためになりました。拙作のLuxではインデックスの圧縮はまだ実装していないので、5章を見ていろいろやってみようと思います。postingsに関しては、variable byte encodedが圧縮率や実装のしやすさの面でよさそうな感じがしました。 その後、題の6章の「Scoring, term weighting and the vector space model」について担当の能登

  • MapReduce - naoyaのはてなダイアリー

    "MapReduce" は Google のバックエンドで利用されている並列計算システムです。検索エンジンのインデックス作成をはじめとする、大規模な入力データに対するバッチ処理を想定して作られたシステムです。 MapReduce の面白いところは、map() と reduce() という二つの関数の組み合わせを定義するだけで、大規模データに対する様々な計算問題を解決することができる点です。 MapReduce の計算モデル map() にはその計算問題のデータとしての key-value ペアが次々に渡ってきます。map() では key-value 値のペアを異なる複数の key-value ペアに変換します。reduce() には、map() で作った key-value ペアを同一の key で束ねたものが順番に渡ってきます。その key-values ペアを任意の形式に変換すること

    MapReduce - naoyaのはてなダイアリー
  • ロベールのC++教室

  • 貧乏人のためのCG講座

    ■ 貧乏人のためのCG講座 CG知識編 ■ JPEG形式について JPEG形式はCCITT(国際電信電話諮問機関。現ITU-T)とISO(国際標準化機構)の画像符合標準化のための合同グループである「Joint Photographic Experts Group」という団体が提唱した、カラー静止画像の国際標準符号化方式です。細かい事を言えば、JPEGで標準化されているのは圧縮方式であって、実際にファイルに記録する方式は標準化されていません。そのためいくつかの規格が存在するのですが、現在ではC-Cube Microsystems社による「JPEG File Interchange Format」(JFIF)がデファクトスタンダードとなっており、普通、JPEGと言った場合はこのJFIFを指します。JPEG/JFIFでは最大65535×65535ドット、1677万色(24ビットカラー)の画像を

  • 標本化定理(サンプリング定理、ナイキストノ定理)について

    化定理(サンプリング定理、ナイキストノ定理)について教えてください。 ”あるアナログ的な信号をデジタルデータにサンプリングする場合、原信号の各周波数成分をすべて正確にサンプリングするためには、原周波数の2倍以上のサンプリング周波数が必要となる。これを標化定理という。”というのが基的な説明だと思います。 この中で『2倍以上の』という表現がありますが、この点が疑問になっています。 例えば、20kHzのSin波を40kHzでサンプリングしたとして、サンプリングする点が丁度サイン波の振幅0の点だった場合、元のSin波の周波数は分かりますが、振幅は一意に決められないと思います。原信号を振幅も含めて復元するには、『2倍より大きい』周波数でサンプリングする必要があると考えるべきでしょうか?『2倍以上』という表現は厳密には正しくないと考えて良いのでしょうか? また、そもそもサンプリング定理は振幅情

    標本化定理(サンプリング定理、ナイキストノ定理)について
  • OpenBayesの使い方(1) - 人工知能に関する断創録

    ベイズネットワークのゲームへの応用(2008/5/2)の続き。というわけでPythonのベイズネットのライブラリであるOpenBayesの使い方をちょっとまとめておきます。 ここでは、OpenBayesのチュートリアルにあるSprinklerというベイズネットを作成してみます。この例はいろんなとこでよく見るなぁ。 このベイズネットのノードは、 Cloud (C) : 曇っているか? Sprinkler (S) : スプリンクラーで水をまいたか? Rain (R) : 雨が降ったか? WetGrass (W) : 芝生が濡れているか? を表している。各ノードはTrue(1)かFalse(0)の2値を取る。矢印は因果関係を表している。 C→S : 曇っているかによってスプリンクラーを使うか決まる C→R : 曇っているかによって雨が降るか決まる S→W : スプリンクラーを使ったかによって芝生

    OpenBayesの使い方(1) - 人工知能に関する断創録
  • iモードの“ガラパゴス現象”の二の舞を演ずるな:ITpro

    早稲田大学大学院 GITS客員准教授 境 真良 NGNとは何か。この問いに,NTTは一貫して,QoSや回線認証を備えた高度なネットワークで,ハイビジョン級の映像配信などを可能にする安全安心なネットワークだと答えてきた。NGNは,この言葉通り,コンテンツ産業や関連するサービス産業に新たな発展をもたらす,大波を起こせるだろうか。 NGNは「成功する」か? まず,NGNが「成功する」とはどういうことだろうか?まずそれが「普及する」ことを意味するのは間違いないが,そうした視点から見れば,「フレッツ光ネクスト」を「フレッツ光」と同価か,あるいは安売りする戦略は的を射ているように思える。それだけでも,英BTほどではないにせよ,ネットワーク維持コストを低減できれば,NTTとしては一定の成果を上げたと言える。 しかし,「成功する」ということが,「NTTのいうように映像配信サービスやその他の高度なサービスが

    iモードの“ガラパゴス現象”の二の舞を演ずるな:ITpro
  • 連載:検索エンジンを作る|gihyo.jp … 技術評論社

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    連載:検索エンジンを作る|gihyo.jp … 技術評論社
  • ネット上の違法な音楽や映像を自動で1日あたり数千件から数万件を見つけ出す「ロバストメディア探索技術」

    NTTの発表によると、音や映像の特徴どうしを照合することにより、インターネット上の投稿コンテンツなどの音や映像の中に、予め登録された特定の音楽や映像が含まれるかどうかを高速に検出できる「ロバストメディア探索(RMS: Robust Media Search)技術」を開発したとのこと。 この技術を使ってネット上の投稿サイトやブログサイトなどで使用された音楽や映像コンテンツのタイトルを特定する実証実験を、2008年4月22日(米国時間)から9月30日までの予定で開始するそうです。 一体どういう仕組みでこんな事が可能なのかという詳細は以下から。 インターネット上での音楽・映像コンテンツの 使用を特定する実証実験を開始 ~大量の投稿コンテンツを処理できる「ロバストメディア探索技術」を開発~ このRMS技術はメディア探索技術の一つで、これまでの一般的なメディア探索技術に比べて高いロバスト性を持ってい

    ネット上の違法な音楽や映像を自動で1日あたり数千件から数万件を見つけ出す「ロバストメディア探索技術」
  • 線形代数(行列)の応用、および世界観について

    補足を拝見しました。 ご質問は「鶴亀算と連立方程式と行列は質的に何も変わらない。」そういうご主旨でしょうか。出てくる答は同じでも、抽象度が違います。 ベクトルの張る空間に対する演算子として行列を扱うことで、何次元の空間でも幾何学が展開できます。また行列そのものを対象として扱うことによって、連立方程式系同士の関係が論じられます。これらの事はお気づきでしょう? 線形代数は一般に無限自由度の線形空間を対象にします。ちょっと不正確だけど無限次元の行列を扱うようなもの。要素に分解していたんじゃ扱えません。行列のを何冊見たって、行列のことしか書いてないですよ。取りあえず、抽象代数、あるいは関数解析のでも読んでみてください。 大学は教えて貰うのを待っている所ではありませんよね?むしろ、教授や先輩や図書館といった「設備」を自由に活用する権利を持っていらっしゃるんです。(持ち腐れのまま卒業するひとも多

    線形代数(行列)の応用、および世界観について
    toruto
    toruto 2008/04/24
    【線形代数とその応用】はとてもいい本だと思う.
  • 【IDF上海2008】「小さいけれども大きく」、米インテルのモバイル・コンピューティング研究

    写真2●インテルが開発中の技術の例。ユーザーがいる場所を自動認識し、その場所にちなんだ解説文をネット上から探し表示する サーバー市場、パソコン市場それぞれで高いシェアを持つ米インテル。現在「次なるフロンティア」として有望視しているのがモバイル市場だ。研究開発部門もモバイル・コンピューティング分野に注力している。インテルのコミュニケーション・テクノロジ・ラボのディレクタを務めるケビン・カーン氏(写真1)は「Carry Small, Live Large」という考え方を提示し、次世代のモバイル・コンピューティングの姿と、それを現実化する研究開発の動向を紹介した。 インテルは超小型ノートPCや、MID(Mobile Internet Device)といったモバイル機器向けのIAプロセサ「Silverthrone」を開発中だ。インテルは小型モバイル機器を中心に、家電やパソコン、サーバー、自動車など

    【IDF上海2008】「小さいけれども大きく」、米インテルのモバイル・コンピューティング研究
  • Mixed Reality Lab – The Mixed Reality Lab (MXR) aims to push the boundaries of research into interactive new media technologies through the combination of technology, art, and creativity.

    toruto
    toruto 2008/03/05
    ニワトリ,なでなで.
  • データマイニング分野のクラスタリング手法(1) (application/pdf オブジェクト)

  • 学生プログラマの「実力差」は、「麻雀」と「囲碁」の差 - 本当は怖いHPC

    僕も学生なのだけど(一応)、仕事をしているチームにプログラマをスカウトするために何人もの学生プログラマと会ってきた。能力はいろいろ。Linuxのソースをガンガン読んでいる人もいれば、授業のプログラミング課題がちょっと得意、くらいの人もいた。言い方は悪いけどピンキリ。 で、その差が何から来るのか疑問に思っていた。「プログラミングに対する情熱や興味の差」とか、「アルバイトでの開発の経験」などの差はもちろんあるのだが、どうもそれだけでは説明し得ない壁があるように感じたので、ここ数日それを考えていた。 で、理由を思い立った。 学生に限らず、プログラミング能力は個人差が激しい。これは最終的には「純粋な頭脳労働だから」という点に帰着すると思う。他の多くの世界と違って、プログラミングは「時間と頭脳があれば原理的に何でもできる」わけだ。他の分野においても「頭脳戦の割合が高ければ高いほど偏差も大きくなる」と

    学生プログラマの「実力差」は、「麻雀」と「囲碁」の差 - 本当は怖いHPC
  • アドホック検索とは?

    アドホック検索とは? 2008-01-16-1 [IIR] 先日[2008-01-12-1]の 「Introduction to Information Retrieval」[1]の輪講で、 第一章に出てきた "ad-hoc retrieval"(アドホック検索)を説明する際に、 ぐだぐだな感じになってしまったことを深く反省し、 改めてまとめてみました。 § 「情報検索アルゴリズム」(共立出版)[2]によれば、 アドホック検索 (ad-hoc retrieval) とは、 「検索質問を短期的 (short-term) あるいは動的 (dynamic)、 文書集合を長期的 (long-term) あるいは静的 (static) なもの としてとらえる情報検索」とのこと。また、これとは逆に、 短期的に更新(追加)されていく文書集合に対して、 長期的な検索質問で検索要求を満たすものだけを取り出す

    アドホック検索とは?
  • TiddlyWikiのススメ - (HSJ.jp) ver.20050714 based on 1.2.28

    ■ローカルで使うファイル一つのTiddlyWiki\n http://kengo.preston-net.com/archives/001951.shtml\n■Teddlywikiのバージョンアップ方法\n http://kengo.preston-net.com/archives/001955.shtml\n■TiddlyWikiの文字のサイズなどを大きくする\n http://kengo.preston-net.com/archives/001962.shtml\n SPAN#siteTitle{\nfont-family: sans-serif;\n}\n\nDIV#mainMenu{\npadding: 2px;\ntext-align: left;\n}\n\nDIV.title{\nfont-size:large;\nborder: 2px solid #996633;\nc

  • MMR年表

    おおむかし 退化した体を持つ異星人が地球にきて、自分たちに適合する遺伝子を持つ体を手に入れるために、サルたちの遺伝子を操作して人間を作り出した。地球は「人間農場」である。1-1 なにかのウイルスに感染したヒトから、ネオテニー化した新たな種が誕生して枝分かれし、ヒトよりも高度な知的生命体(グレイ)となり、宇宙のどこかに移住し高度文明を築く。8-1 (どっちが先なんだろう('o?) そもそもこの2つを両立させることができるのか('o?)----「時間軸が未来へ遠ざかっていくということは逆に過去に近づいていくということらしい」4-A, 4巻 p.214) 自転周期が24.7時間である火星で、24.7時間の生体リズムをもつ人類が誕生した。12-2 むかし (順不同、というよりわかりません) 古代人はUFOに乗った異星人にいけにえを捧げる儀式のためにストーンサークルを建造した。1-1 権力者のDNA

  • http://www.yomiuri.co.jp/science/news/20071218i503.htm

    toruto
    toruto 2007/12/18
    日本国政府を揺るがした質問書.多分この記事ブクマした人達は皆突然の失踪をす...