タグ

2012年10月14日のブックマーク (2件)

  • 日本語の用言リストを作りました - アスペ日記

    語の用言リストを作りました。 https://github.com/hiroshi-manabe/japanese_verb_adj_list 書くべきことはだいたいこちらの README に書いてありますが、少しだけ補足を。 このリストは既存の辞書やコーパス等をベースにしていますが、特に新語・俗語については、これまでの職場で働く中で自然と知識として蓄積されたものもあります。しかし、それらは語彙として自分の中で確固たる位置を占めており、その知識を使うことに倫理的な問題はないと判断しました。 用言リストを作るのに人間なんていらないよ、時代は機械だよ、という意見もあるかもしれませんが、現状で多くの IME は固定した辞書を持っており、また私自身もそのような IME を使いやすいと感じているため、作る過程では補助的にスクリプト等を用いても、最終的な判断は人間が行うのがよいと考えています。です

    日本語の用言リストを作りました - アスペ日記
    skozawa
    skozawa 2012/10/14
  • パフォーマンス比較 Cassandra、Mongodb、SQLite、H2、MySQL、Postgres - cypher256's blog

    下記のようなシステムでパフォーマンスが良さげな SQLite を使用予定ですが、もっと速いものが無いか確認のため他のデータベースのパフォーマンスを計測してみました。SQL 利用前提ですが、NoSQL が圧倒的な性能を出す場合は検討する必要があるので KVS も確認しました。 データ件数は 1 億件程度、JDBC SQL 利用可能 INSERT、UPDATE はバッチ SELECT は主キーアクセス性能を重視 将来スケールアウトのための分散はありえるが、スタンドアロンで遅いのはだめ データベースのパフォーマンス比較 計測したデータベース データベース名 タイプ 形態 評判 計測についての備考 SQLite RDB 組み込み ※2 おもちゃ、Android標準 JDBC操作 ※1 H2 RDB 組み込み ※2 組み込み最速 JDBC操作 ※1 Derby RDB 組み込み ※2 Java標準で

    パフォーマンス比較 Cassandra、Mongodb、SQLite、H2、MySQL、Postgres - cypher256's blog