タグ

ブックマーク / blog.livedoor.jp/techblog (3)

  • livedoor Techブログ : wikipediaのデータや顔文字辞書からmecabのユーザ辞書を作成するフレームワーク

    突然ですが,mecabの辞書 (mecab-ipadic) をデフォルトのまま使って,mecab意外と使えねぇとか文句言ってる悪い子はおらんかね? mecab-ipadic は比較的お行儀のよい日語をベースに作られているので,そのままでは web上の口語文体のテキストはうまく扱えないことがあります。来は教師データを用意し,学習させるといった手法を使うのが正攻法だと思いますが,とりあえず名詞を充実させるだけでも実用度はだいぶ上がるでしょう。 人間の話す言語には,動詞の語幹や名詞には日々新しく語彙が増えるけど,助詞や活用のルールは簡単には変化しない,という特性があります。特に「いま最もつぶやかれている単語ランキング」といった集計をするような場合は,名詞の範囲の切り出しさえ間違えなければそれなりの結果を出せることも多いのです。 ただ,辞書への単語追加はここにある通り簡単にできるのですが,単語

  • livedoor Techブログ : 第五回ライブドア・テクニカルセミナー ログ

    2011年2月26日(土)に開催されました 第五回 ライブドア・テクニカルセミナー の発表資料と動画を公開致します。ご参加頂きました皆様、どうもありがとうございました。 「開発者から見たAndroidとiOSアプリの違い」(佐孝 太郎 株式会社ライブドア) 「HTML5で動くFlash Playerを作ってみた」(紀平 拓男 氏 株式会社 ブロードテイル) 「対談: 新進気鋭のSAPに聞いた現場事情」(石井 武 氏 株式会社オルトプラス/ 聞き手 伊勢 幸一 ) 「スマートフォン向けソーシャルアプリケーション開発の現在」伊藤 直也 氏 グリー株式会社) 講演1「開発者から見たAndroidとiOSアプリの違い」 株式会社ライブドア 開発部開発2G(スマートフォンチーム)   佐孝 太郎(約21分) 1/2 2/2 概要: 「スマートフォン」でひとつに括られるAndroidとiOSですが、

    jagel
    jagel 2011/03/04
  • livedoor Techブログ : ライブドア サマーインターンの様子 4日目

    こんにちは、櫛井です。 職員室の冷房が効きすぎて凍えそうです。 4日目は、座学→実習→データホテル見学→直帰、という大人っぽい スケジュールを組んでみました。直帰とか憧れますよね。NRですよ。 海苔じゃないですよ。No Return ですよ。片道切符ですよ。 まずは座学。みんな熱心にメモっていて大変よいですね。 池邉校長自ら熱弁をふるっておられちゃられました。 「MySQL & O/Rマッパー」というテーマ。 実習席に戻ってからも熱弁は続く。熱血教師ですね。 執行役員の小久保が見学に来ていました。 「大きくなりやがって…」的な視線でしたが、初対面のはずです。 私の母校である専門学校から後輩が一人参戦しています。 YAPC::AsiaのTシャツを進呈してみました。 効能:タイピングが早くなる 嘘 夕方からはデータホテルの見学会へ。 写真撮影は禁止なので皆が旅立つところの写真。 ちなみに内部の

  • 1