タグ

2009年2月20日のブックマーク (6件)

  • Apache Mahout - Overview

    For Creating Scalable Performant Machine Learning Applications Download Mahout Apache Mahout(TM) is a distributed linear algebra framework and mathematically expressive Scala DSL designed to let mathematicians, statisticians, and data scientists quickly implement their own algorithms. Apache Spark is the recommended out-of-the-box distributed back-end, or can be extended to other distributed backe

  • 5 Problems of Recommender Systems

    When you buy through affiliate links in our content, we may earn a commission at no extra cost to you. Learn how our funding model works. By using this website you agree to our terms and conditions and privacy policy. We uphold a strict editorial policy that focuses on factual accuracy, relevance, and impartiality. Our content, created by leading industry experts, is meticulously reviewed by a tea

  • Tx: Succinct Trie Data Structure

    English 概要 TxはコンパクトなTrieを構築するためのライブラリです.従来のTrieの実装(darts等)に比べ1/4〜1/10の作業領域量で辞書を保持することができ、数億〜十億キーワードなど大規模な辞書を扱うことが可能です.Trieは文字列からなるキー集合を処理するデータ構造で、キーが辞書に含まれているかのみではなく、キーのPrefixが含まれているかを高速に求めることができます.内部データ構造にはSuccinct Data StructureであるLevel-Order Unary Degree Sequence (LOUDS)を利用しています. ダウンロード Txはフリーソフトウェアです.BSD ライセンスに従ってソフトウェアを使用,再配布することができます. tx-0.12.tar.gz: HTTP Archives tx-0.11.tar.gz: HTTP tx

    pcod
    pcod 2009/02/20
  • 最大マージン kNN と SVM の関係: kNN も最近はがんばっています - 武蔵野日記

    先日書いた機械学習における距離学習の続き。 kNN (k-nearest neighbour: k 近傍法)は Wikipedia のエントリにも書いてある通り、教師あり学習の一つで、あるインスタンスのラベルを周辺 k 個のラベルから推定する手法。memory-based learning と呼ばれることもある。単純に多数決を取る場合もあれば(同点を解決する必要があるが)、近いインスタンスの重みを大きくする場合もあるのだが、いずれにせよかなり実装は単純なので、他の機械学習との比較(ベースライン)として使われることも多い。 簡単なアルゴリズムではあるが、1-NN の場合このアルゴリズムの誤り率はベイズ誤り率(達成可能な最小誤り率)の2倍以下となることが示されたり、理論的にもそれなりにクリアになってきているのではないかと思う。また、多クラス分類がちょっと一手間な SVM (pairwise に

  • An open-source fulltext search engine and column store

    About Groonga Groonga is an open-source fulltext search engine and column store. It lets you write high-performance applications that requires fulltext search. Characteristic The latest release 14.0.6 is the latest release. It had been released at 2024-07-29. Install Source The latest posts Groonga 14.0.6 has been released (2024-07-29) PGroonga (fast full text search module for PostgreSQL) 3.2.1 h

    An open-source fulltext search engine and column store
    pcod
    pcod 2009/02/20
  • lucille development blog » Blog Archive » Playing with pyparsing

    そろそろ yacc/lex でパーザを書くことに限界(コンフリクトやメンテナンス性)を感じているので、パーザコンビネータなどでコンフリクトがなく、またメンテナンスしやすいパーザプログラミング手法に注目しています. Haskell の Parsec や、 Packrat パーザがそのようなコンフリクトがなくて、かつメンテナンスしやすいパーザ記述手法になるようです. 最近はかなり Python っ子なので、同様なものが Python でないか探したところ、pyparsing という同様なことができるライブラリを見つけました. http://pyparsing.wikispaces.com/ Packrat なパーザも制限がありますがサポートされています. pyparsing を使って簡単な四則演算パーザを作ってみました. それぞれの項 or 式で AST(Abstract Syntax Tr

    pcod
    pcod 2009/02/20