タグ

ブックマーク / search.hatenadiary.jp (2)

  • 言語処理100本ノック 2015 7日目 - 日記

    [言語処理100ノック](http://www.cl.ecei.tohoku.ac.jp/nlp100/)を見つけたのでやる。環境はPython2.7 + Ubuntu15.10です。 いたらぬ点もありますがよろしくお願いします もう解けてるやつ 00,01,02,03,04,05,06,07,08,09,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24 まだ解けてないやつ たくさん #第3章:正規表現 Wikipediaの記事を以下のフォーマットで書き出したファイルjawiki-country.json.gzがある. 1行に1記事の情報がJSON形式で格納される 各行には記事名が"title"キーに,記事文が"text"キーの辞書オブジェクトに格納され,そのオブジェクトがJSON形式で書き出される ファイル全体はgzipで圧縮される 以下の処理

    言語処理100本ノック 2015 7日目 - 日記
  • 20160329 Groonga新リリース自慢会6.0.1に参加した - 日記

    概要 20160329に行われたGroonga新リリース自慢会6.0.1の内容と感想 この勉強会に行ったきっかけ 20160324くらいに検索を作る側にまわってみたいと思ったから 20160327-20160330の間に行われるSolr,Groonga,Elasticsearch,AmazonCloudSearchの勉強会をconnpass,atnd,doorkeeperで検索したところこの勉強会がヒットしたから 勉強会の内容 Groonga6.0.1の変更内容(http://groonga.org/ja/blog/2016/03/29/groonga-6.0.1.html) 静的検索によるフレーズ検索の高速化 mroonga6.01の変更内容 PGroonga1.0.3の変更内容 知らなかったけど知ったこと Groongaは[bitを大事にする文化がある|新しい情報に重きをおく|スループ

    20160329 Groonga新リリース自慢会6.0.1に参加した - 日記
  • 1