タグ

ブックマーク / blog.livedoor.jp/techblog (4)

  • livedoor Techブログ : wikipediaのデータや顔文字辞書からmecabのユーザ辞書を作成するフレームワーク

    突然ですが,mecabの辞書 (mecab-ipadic) をデフォルトのまま使って,mecab意外と使えねぇとか文句言ってる悪い子はおらんかね? mecab-ipadic は比較的お行儀のよい日語をベースに作られているので,そのままでは web上の口語文体のテキストはうまく扱えないことがあります。来は教師データを用意し,学習させるといった手法を使うのが正攻法だと思いますが,とりあえず名詞を充実させるだけでも実用度はだいぶ上がるでしょう。 人間の話す言語には,動詞の語幹や名詞には日々新しく語彙が増えるけど,助詞や活用のルールは簡単には変化しない,という特性があります。特に「いま最もつぶやかれている単語ランキング」といった集計をするような場合は,名詞の範囲の切り出しさえ間違えなければそれなりの結果を出せることも多いのです。 ただ,辞書への単語追加はここにある通り簡単にできるのですが,単語

  • livedoor Techブログ : mod_rewrite マニアックス

    こんにちは。開発部の池邉です。 既に色んなところで発表していますが、ライブドアではWebサーバとして殆んどのサービスでApacheを使用しています。 Apache の特徴として、モジュールによる機能の追加、挙動の制御があります。その中でもよく利用されていながら、深く使っていくとハマりどころや謎の機能の多いモジュールとして mod_rewrite があります。Apacheの公式サイトでも以下のように書かれている事からも、家でもその点については認めているという事でしょう。 今回はそんな mod_rewrite のちょっとマニアックな拡張方法について紹介したいと思います。 Despite the tons of examples and docs, mod_rewrite is voodoo. Damned cool voodoo, but still voodoo. 変数を利用したプログラム

  • livedoor Developers Blog:Subversionで攻めの開発を (いまさらだけど) - livedoor Blog(ブログ)

    こんにちは。ブログ担当のnabokov7です。 さてみなさん、ここのところ、livedoor Blog の新機能リリースのペースが上がっていることにお気づきでしょうか。 12月だけでこれだけの新規リリースのお知らせを出しました。 2007年12月27日 プライベートモードで記事を投稿できるようになりました 2007年12月25日 タグクラウド とタグ別ページを表示できるようになりました 2007年12月20日 カテゴリ別モブログ機能リリースのお知らせ 2007年12月18日 「話題のブログ」が新しくなりました 2007年12月18日 プレビュー機能強化と新リスログプラグインのお知らせ 2007年12月13日 投稿・編集を便利にするブックマークレットのご紹介 2007年12月11日 バリューコマースの商品をカンタンに紹介できるようになりました。 2007年12月11日 アップロードしたファイ

    youhey
    youhey 2009/06/04
    livedoorのSubversion、branchきる、バージョン管理とリリースまでのながれ
  • livedoor Techブログ : 第一回 ライブドア テクニカルセミナー・ログ

    2009年2月27日(金)に開催されました 第1回 ライブドア テクニカルセミナー「Open & Share」の発表資料と動画を公開致します。 プラクティカル Cicindela 中の人による中の人のための、ライブドアブログ公式攻撃マニュアル(抜粋) インサイド livedoor Blog ライブドアのネットワークとトラフィックパターン P2Pコンテンツ配信技術の現状 デジタルコンテンツ配信の法的問題 プラクティカル Cicindela 株式会社ライブドア   井原 郁夫(15分) オープンソースのレコメンデーションエンジン「Cicindela(シシンデラ)」。実際の各種サービスで利用するための工夫と実践向けのプログラム設計手法を公開。 中の人による中の人のための、ライブドアブログ公式攻撃マニュアル(抜粋) 株式会社ライブドア   井原 郁央(5分) 2008年のある事件をケースとした、社

  • 1