タグ

2013年7月28日のブックマーク (6件)

  • 高速な文字列マッチング - 気ままなブログ

    最近は、簡潔データ構造を中心に調べたりしていたけど、文字列マッチングを考えた場合、別のアプローチもあります。そう、grepのような逐次文字列検索ですね。以下の解説がおもしろいです。 http://www.i.kyushu-u.ac.jp/~takeda/papers/IPSJMagazineCPM.pdf CSAとかFM-Indexに隠れてしまっていますが、実はかなり強力です。特に、クエリが固定で、テキストが頻繁に変更されるようなケースでは有効です。中でも使いやすのは、Aho-Corasick法(AC法)ですね。複数のパターンを同時に検索することができます。KMPを拡張した方法です。 AC法については、日語だと 情報検索アルゴリズム 作者: 北研二,津田和彦,獅々堀正幹出版社/メーカー: 共立出版発売日: 2002/01メディア: 単行購入: 6人 クリック: 552回この商品を含むブ

    高速な文字列マッチング - 気ままなブログ
  • 「日時」を「日 時」のように表現するのは、もう、やめませんか?|DTP Transit

    「日時」を「日 時」のように記述(表現)することがあります。 そもそも、どうして均等揃えにしたいんだっけ?を考えると、次のような理由が考えられます。 項目名の一番右の文字のツラを揃えたい 項目名と対応する情報(「日時」と「2013年9月21日」)が離れると関連性がわかりにくくなる(※左寄せの場合。右寄せにすれば解決) しかし、項目名を均等割付するのは、単純に、ワープロ時代からの悪しき慣習によるものが多いのではないでしょうか? 私たちは、1文字ずつでなく、チャンク(複数の文字のカタマリ)で単語を認識しています。不必要に文字が離れているのは、読みにくいと思うのです。 追記(2013年7月29日): エントリー全体を整理、リライトしました。 実装方法とそのpros/cons(よいところ/悪いところ) 均等割付する場合には、次ような実装方法があります。 全角スペース(半角スペース)を入れて調整(プ

    「日時」を「日 時」のように表現するのは、もう、やめませんか?|DTP Transit
  • コンピュータビジョンと機械学習 徹底入門 -現実的な画像検索のためにやってきたこと- #TokyoWebmining

    コンピュータビジョン&機械学習の入門的な内容について ※事例のランダムサンプリングを追加:修正 ※再現率、適合率の名称逆だったので入れ替え:修正 Read less

    コンピュータビジョンと機械学習 徹底入門 -現実的な画像検索のためにやってきたこと- #TokyoWebmining
  • Nullのはなし(up用)

    How Race, Age and Gender Shape Attitudes Towards Mental Health

    Nullのはなし(up用)
    rydot
    rydot 2013/07/28
  • 「バルス中止のお知らせ」ツイート拡散中

    もはやツイートの代名詞とさえ言える「バルス」。 これまで、テレビ映画「天空の城ラピュタ」が放映される度に、「バルス」というツイートが大量に投稿され、Twitterサーバに大きく影響を与えてきたことは周知の事実だろう。 そのような中、7月27日深夜に投稿された「バルス中止のお知らせ」と題するネタツイートが、画像の出来の良さも相まって大量にリツイートされる事態が発生している。7月27日14時現在、既に3万RTに迫る勢いだ。 しっかり画像を確認すれば、ところどころ不審な箇所があり、右下にある「※ねたツイートです」との表記にも気がつくところだが、うっかり釣られてしまったユーザも多いようだ。最終的にRT数はどこまで伸びてしまうのだろうか。

    「バルス中止のお知らせ」ツイート拡散中
    rydot
    rydot 2013/07/28
  • Koin変体仮名

    ■変体仮名(へんたいがな)とは 変体仮名とは、変体がな、変体かな、仮名変体、かな異体字等とも呼ばれ、明治33年の小学校令施行規則で採用された平仮名・片仮名と異なる仮名です。 それ以前には、現在のように一音一字ではなく、一音についていくつもの字体がありました。字体が異なる理由は、字母(字源)の違いやくずし方の違いです。例えば、「あ」については、現在の「安」を字母とする平仮名と共に「阿」を字母とする平仮名もよく使われていました。 ただし、江戸時代・明治時代にはほとんど一定の字体に統一され、よく使用されるものは一音に対して数種類にほぼ限定されていました。 現在身近に見られるものとしては、そば屋など店舗の看板や年配の女性名があります。 よく誤解される方がいますが、「旧仮名」とは言いません。「旧仮名」は普通「旧仮名遣い」の意味で使われることが多いようです。 旧仮名遣いとは歴史的仮名遣いのことで、たと

    rydot
    rydot 2013/07/28