1月に「高速文字列解析の世界」を購入してから半年が経ちました。以下、文字列本と呼びます。 高速文字列解析の世界――データ圧縮・全文検索・テキストマイニング (確率と情報の科学) 作者: 岡野原大輔出版社/メーカー: 岩波書店発売日: 2012/12/27メディア: 単行本購入: 15人 クリック: 324回この商品を含むブログ (4件) を見る 全文検索として、「CSA」や「FM-Index」が紹介されていますが、「全文検索システム」を作るには、これらだけでは不十分です。なぜなら、以下のような特徴があるからです。 文書IDの識別が遅い。 各文書IDに出現する頻度を求めるのが遅い。 ちなみに、転置インデックス(or N-gramインデックス)を使った場合、これらの処理は高速ですね。 インデックスを圧縮しているのだからしょうがないとも考えられますが、作りたいですよねぇ、「全文検索システム」。こ
グーグル、NASA、TIMEが共同で過去数十年間の地球の変化を撮影した画像を公開した。各地に劇的な変化が見られる
Case: THE LIGHTEST AD EVER カンヌ2013のメディア部門において、ブロンズに輝いた作品をご紹介。 スポーツブランド・ミズノがブラジルで展開したプリント広告です。 ミズノはブランド史上最軽量のシューズ、“THE MIZUNO MORELIA NEO”を開発。 その商品特性を分かりやすく伝えるために制作したのが『世界一軽い広告』です。 中央にあるシューズ以外の部分に7,000個もの穴をあけ、紙面自体を軽量化。誰も見たことがないようなインパクトのある新聞広告を生み出しました。 プリント広告にはまだまだ可能性があることを感じさせてくれる好事例でした。 動画はコチラ 参考サイト Canneslions http://www.canneslions.com/work/2013/media/entry.cfm?entryid=32300&award=4
この記事を読む前に、絶対に理解出来ないモナドチュートリアルに一度目を通してみてほしい。モナドを理解していく上で、とても重要なことが書かれている。 改めて言おう、モナドはモナドだ。コンテナだとかプログラマブルセミコロンだという説明では、モナドのすべてを正確に表せるとは言い難い。では、モナドを過不足なく説明できる、モナド以外の言葉はあるのか? 実は、モナドを表現し、かつモナドで表現される言葉は存在する。その一つは手続きである。手続き型言語の「手続き」だ。 手続きとは何か 手続きは結果を持つ おおよそすべての手続きは何らかの結果を持つ。Haskellの()、C言語のvoid、PythonのNone、Rubyのnilなども結果の一種だ。結果が出ないとしたら、そのプログラムは停止しないか、途中で異常終了するだろう。 手続きには最小単位が存在する 処理系が扱っている以上、手続きが際限なく分解できるとい
昨日の記事「メイヤー代数やメイヤー加群はまだ整理不足」において、 双代数の条件を入れておいたのはトランザクションのためでした。トランザクションは、「更新オペレータをローカルでキューイングする」方式を前提とします。 と書きました。 ここで、トランザクションについてザッと説明しておきます。下の絵のような3つの方式について紹介して、僕の立場からのコメントを付けます。それぞれの方式を切り離した絵も後に再掲します。 詳細はともかく、絵の見方は: 時間は上から下の方向に経過します。 Sは状態空間です。データベースの可能なすべての状態の集合と考えればいいでしょう。 Vは状態の観測値の集合です。観測値は状態に関する部分的な情報を提供します。 fは状態を変更する処理を行うプログラムです。 Mは状態を更新するオペレータの集まり、モノイドとなります。 黒三角はデータのコピー(クローン)です。 S→S×V という
Unlambda記法 適用 `FG F、Gは任意の式。 コンビネータ計算記法 適用 (FG) F、Gは任意の式。 Iota記法 適用 *FG F、Gは任意の式。 Jot記法 空白のコード → 恒等関数 X0 → X S K X1 → S (K X) Xは任意の式で、S、Kはコンビネータ。
zipと言っても、圧縮&アーカイブのツールではありません。リスト処理の話です。ファスナーをしめる操作を連想させるのでzipと呼ぶのでしょう。今ここでは、「あのzipです」という以上の説明はしません。あのzipを型付けすると、自然変換だと解釈できます。二項関手のあいだの自然変換なので、モナド(の台関手)などとは違った雰囲気のものです。 集合圏の小さい部分圏Cを固定して、ここを舞台に考えます。C内で直積や直和は自由に作れるとします。もうひとつの圏Dがあるとして、F:D→C が関手のとき、Fの対象部分(object part)をF0、射部分(morphism part)をF1とします。さらに、射部分は対象の対ごとに分割して F1A,B:D(A, B)→C(F0(A), F0(B)) のようにも書きます。関手Fは、写像F0:|D|→|C| と (A, B)∈(|D|×|D|) で添字付けられた写像
2013年07月13日18:30 カテゴリ書評/画評/品評Value 2.0 「ありのまま」の資本主義を - 書評 - 里山資本主義 里山資本主義 NHK広島取材班 / 藻谷浩介 編集部より献本御礼。 ああ、これでいいのかも。 404 Blog Not Found:少子化対策にあたって0番目に直視すべき現実 今から何とか出来るのは、「減ってもなんとかなる」ように持っていくだけ。 そう持って行くための、一つの解が、本書にある。 唯一の解ではないかも知れないが、すでに見つかった解は私が知るかぎりこれだけ。 本書「里山資本主義」は、「ありのまま」の資本主義のすすめ。 その前に、現在我々が「資本主義」だと思い込んでいるものを振り返ってみよう。 〈「お金」崩壊〉より この上下の円のうち、元来の資本は下の円である。拙著「弾言」で「カネ=ヒト+モノ」となっているうちのモノに相当する。 それを我々はどうし
How secure is Linux's random number generator? | Hacker News Hacker Newsで話題になっていたので。 主に暗号用途には、予測不可能な乱数が必要となる。予測不可能というのは、実装と内部状態が知られていても、なお将来の乱数が予測できないということだ。 たとえば、擬似乱数としてよく使われる線形合同法(Linear congruential generator)は、以下のように書ける。 namespace lcg { thread_local unsigned int seed ; void srand( unsigned int seed ) { lcg::seed = seed ; } int rand( void ) { // glibcの使っている値を拝借 seed = (1103515245 * seed + 12345
社会 1万2千年前の人骨発見/南城市・サキタリ遺跡/石器と同時、国内初2012年10月19日 Tweet クリックで拡大(PDFファイル 583KB) 県立博物館・美術館(白保台一館長)は、南城市のサキタリ洞遺跡から、約1万2千年前の旧石器時代の地層から、人骨化石や石英製石器、貝、食べかすとみられるイノシシの骨を発見した。同館によると、旧石器時代の人骨と石器が同じ遺跡で出土したのは初めてで、国内最古の事例となる。白保館長らが19日午前、発表した。 1万8千年前(旧石器時代)の「港川人」の人骨化石以降、7千〜6千年前(縄文時代)の土器文化が出現するまでの間、人骨や石器が発見されていなかったことから、同発見は県内での両時代の空白を埋めるものとされる。 見つかったのは、子どもの犬歯1点と石英製石器3点、周辺では採れない海産の貝2点、食べかすとみられるイノシシなどの骨。今回の発見で、沖縄で石
気に成ってHaskellでもMobius函數 (メビウス関数) を実装した。Elixir版も再掲する。 cf. Elixir (とJavaScriptとRuby) でMöbius関数を実装した http://c4se.hatenablog.com/entry/2013/07/12/210747 前回 Haskellをまともに書いたのは人生で初めてである。今まで書こうにも感覚的に、書けなかった。RubyのEnumerableを使いまわしてゐれば、あまり怖くはなかった。 HaskellでMöbius函數 compileが通った次の瞬間にtestも通って驚いた。好い事だ。ghciは便利だが、Elixirのiexも便利なので洞うと云ふ事は無い。 好い事も悪い事も有る。Elixir (Erlang) はcurry化されてゐないので、arity (引数の個數) の異なる函數は全く区別される。其れをpa
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く