タグ

2011年1月30日のブックマーク (9件)

  • AIが本当におもしろいアニメをオススメ

    AIがあなたにぴったりのアニメをオススメしてくれるサービスです。 どのアニメを何話まで見たか視聴記録を残すこともできます。 よくある「このアニメを見た人はこれらも見ています」表示もあります。 自分に合った当におもしろいアニメを知りたい人、よくある人気ランキングだとしっくり来ない人にとくに最適です。

    AIが本当におもしろいアニメをオススメ
    showyou
    showyou 2011/01/30
  • 自然言語処理・データマイニング系のQuoraまとめ - nokunoの日記

    最近、Q&AコミュニティのQuoraが流行っていますね。Quoraそこで、個人的に興味のある分野のQAについてまとめておきます。 自然言語処理・機械学習系 What is the best way to analyze a corpus of text to determine the most popular phrases? - QuoraWhat is the best open source C++ implementation of a trie? - QuoraMachine Learning: What papers have shown that for machine learning, data set size is more important than the model being trained? - QuoraNatural Language Process

    showyou
    showyou 2011/01/30
    自然言語処理・データマイニング系のQuoraまとめ
  • きまぐれ日記: キーワード抽出: tf-idf の意味づけ

    単語の重み付けの古典的な方法に tf-idf があります。文書中の各単語の tf-idf 値計算し、値でソートすると、その文書に特徴的な単語リストを得ることができます。 http://nais.to/~yto/clog/2005-10-12-1.html tf-idf は、単なるヒューリスティックスだと考えられていましたが、最近言語モデルに基づく情報検索手法がさかんに研究されるようになり、tf*idf の解釈が明らかになってきました。言語モデルに基づく手法は、ヒューリスティックスばりばりの手法と同性能にもかかわらず、文書のランキングに理論的で合理的な説明を与えることができます。 情報検索は、クエリ q に対し、もっとも適合する文書 d_opt を求めるタスクです。つまり、q が与えられたとき、文書 d が出現する確率 p(d|q) の最大化問題と解釈できます。 d_opt = argmax

  • nmh - Stories of Your Life and Others

    NMH (Nihongo Moji-code Hanbetsu) Library 紹介 日語の文字コードを判別するためのライブラリです。 現在、UTF-8, EUC-JP, ISO-2022-JP, Shift_JISに対応しています。 文字コードを変換するだけであれば準標準ライブラリと言えるiconvが利用できるのですが、文字コードの判別は nkf , ICU , BABEL といった追加ライブラリの導入が必要でした。 そういうライブラリを入れるまでもない、お手軽に文字コードの判別ができるように、という思いから作ってみました。 変更履歴 version 0.0.1 first release インストール 1. ソースコードをダウンロード githubもしくはこちらからダウンロードが可能です。 $ git clone https://github.com/shnya/nmh.gi

    showyou
    showyou 2011/01/30
    nkfみたいなの
  • 【作業用BGM】ファルコム名曲集 【イース・英雄伝説・他人気作】‐ニコニコ動画(9)

    再up高画質verです。日ファルコムのゲームBGMを各作品ごとにまとめました。全部で 23作 60曲選曲方法 ①1作品3曲以内 ②3曲入れる際は、2ch第1回ファルコム名曲ベスト100に入らなかった曲を入れる③各作品の最初はBGM聞いて、その作品がわかる曲とする。★順番 イースⅠ,Ⅱ,Ⅲ→ザナドゥ→イースⅣ,Ⅴ→ブランディシュ→ イースⅥ,オリジン,7→ソーサリアン→ドラゴンスレイヤー英雄伝説Ⅰ,Ⅱ→ヴァンテージマスター→白の魔女,朱紅い雫,海の檻歌→ZweiⅠ,Ⅱ → 空の軌跡(FC,SC,the 3rd)→ぐるみん 【注】SoundEngine加工 低音カット、丸み上げ、サラウンド上げ>part2/sm9761686デモムービー集sm9350684 米光亮ver/sm10413905mylist/8644170

  • 『サーバの構築作業やシステム管理を自動化する「Chef」』

    皆様、はじめまして。2010年9月に入社した並河です。 インフラ周りの話題を・・・ということで、今回はサーバの構築やシステム管理作業を楽にしてくれるツールである「Chef」について紹介します。 ■ Chefとは「Chef」は、サーバOSでのインストール・設定・各サービスの状態管理等、諸々のシステム構築や運用作業を自動化してくれるRuby製のシステム管理ツールで、オープンソースとして公開されており、既に、37signalsやEngine Yard、RightScaleなどでも使われており、利用実績も出始めています。 Ruby製のシステム管理ツールといえば「Puppet」を思い浮かべる方も多いのではないでしょうか。ChefはPuppetの競合ソフトウェアとなる位置付けで、出来ることだけでいうと、特別大きな差はないと感じていますが、Puppetは外部DSLとして設定を記載するのに対し、Chefは

    『サーバの構築作業やシステム管理を自動化する「Chef」』
  • http://research.google.com/pubs/archive/36962.pdf

    showyou
    showyou 2011/01/30
    Googleの最新論文:Hidden CRFで評判抽出
  • NumPy MedKit

    Introduce yourself University of Stellenbosch, Department of Applied Mathematics Background is in engineering Developing NumPy is my PhD procrastination project Priviledged to be here with such talented people, many of whom could have been up here instead of me!, looking very much forward to the rest of this conference Level of tutorial: "advanced track", but rather intermediate track Advanced top

    showyou
    showyou 2011/01/30
    shima_shima>NumPy MedKit http://mentat.za.net/numpy/numpy_advanced_slides/ 恐ろしい深淵だ… 正規表現のグループを numpy.array に取り込んでくれるとか知らなかった.
  • 日本語ウェブコーパス 2010

    概要 コーパスの HTML アーカイブは,ipadic-2.7.0 の見出し語をシードとして,かつての Yahoo! Web API による検索結果に含まれるウェブページを収集したものです.テキストの抽出においては,文字コードを UTF-8 に統一した後,いくつかの記号をデリミタとして文への分割をおこない,さらに文を構成する文字の種類や数によるフィルタリングを施しています.N-gram コーパスについては,テキストアーカイブに出現する頻度 10 以上の N-gram を収録しています. コーパスの英語名称は Nihongo Web Corpusn 2010 (NWC 2010) です. 謝辞 コーパスの作成においては,様々なウェブサービス,ツール,コーパスを利用させていただきました.開発者・研究者の皆様に感謝いたします. コーパスの作成・保存・配布には Amazon Web Serv