タグ

2013年7月8日のブックマーク (3件)

  • Rで計量時系列分析:はじめに覚えておきたいこと - 渋谷駅前で働くデータサイエンティストのブログ

    機械学習は全然専門ではない僕が知ったかぶりをするのも何なので*1、もっともっと以前からそこそこやっている*2計量時系列分析の話でもしてお茶を濁してみることにします(笑)。 もうしつこ過ぎて自分でも嫌になってきたんですが(笑)、このシリーズでベースにするテキストは以下の2冊。沖テキストとHamiltonテキストです*3。他にも良いテキストはあるんじゃないかと思いますが、ここではこの2冊をベースにしていきます。なお、ほとんど沖テキストからの抜粋なのでお持ちの方はそちらを読んでもらった方が圧倒的に早いです、悪しからず。 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー) 作者: 沖竜義出版社/メーカー: 朝倉書店発売日: 2010/02/01メディア: 単行購入: 4人 クリック: 101回この商品を含むブログ (6件) を見る Time Series Analysis 作者

    Rで計量時系列分析:はじめに覚えておきたいこと - 渋谷駅前で働くデータサイエンティストのブログ
    nanolia
    nanolia 2013/07/08
  • ■コンピュータは人間を進化させるか■アラン・ケイ氏インタビュー - 後藤貴子の米国ハイテク事情

    ●ビジョナリーが夢見るのは数百年後の世界 数年先のPCや家電の規格とか、Webやケータイの新しいサービスとか。IT業界の大きなテーマが、当はいかに小さいか、この人に会うとよくわかる。 “この人”とは、アラン・ケイ(Alan Kay)氏。メインフレーム主流の時代に、パーソナルでダイナミックなメディア「Dynabook(ダイナブック)」を構想し、先進的アイデアを詰め込んだワークステーション「Alto(アルト)」の開発でも中心的役割を担った伝説的人物。未来を予測する最良の方法は未来を発明することだとの名言を自ら実践してきた、最高のビジョナリーの一人だ。 だが、著名な学者やビジョナリーの中でも、ケイ氏はちょっと毛色が違うように思う。米国のビジョナリーには、起業したり企業の顧問になったり、あるいは自分の大学への企業の寄付集めに熱心だったりと、ビジネスと深い関わりを持つことで自分のアイデアの実現を図

    nanolia
    nanolia 2013/07/08
  • 高速文字列解析の"別"世界 - 気ままなブログ

    1月に「高速文字列解析の世界」を購入してから半年が経ちました。以下、文字列と呼びます。 高速文字列解析の世界――データ圧縮・全文検索・テキストマイニング (確率と情報の科学) 作者: 岡野原大輔出版社/メーカー: 岩波書店発売日: 2012/12/27メディア: 単行購入: 15人 クリック: 324回この商品を含むブログ (4件) を見る 全文検索として、「CSA」や「FM-Index」が紹介されていますが、「全文検索システム」を作るには、これらだけでは不十分です。なぜなら、以下のような特徴があるからです。 文書IDの識別が遅い。 各文書IDに出現する頻度を求めるのが遅い。 ちなみに、転置インデックス(or N-gramインデックス)を使った場合、これらの処理は高速ですね。 インデックスを圧縮しているのだからしょうがないとも考えられますが、作りたいですよねぇ、「全文検索システム」。こ

    高速文字列解析の"別"世界 - 気ままなブログ
    nanolia
    nanolia 2013/07/08