タグ

ブックマーク / labs.cybozu.co.jp (2)

  • Gmailの容量が心配な人に、大きなメールや添付ファイルだけを探す隠し検索機能size:

    みなさんGmail使ってますか? 無料で使えて大容量(今は10GBぐらい?)を誇るGmailの登場で、Gmail以前なら古いメールや重要じゃないメールは削除したり圧縮したりしていたものが、なんでも受け取ってアーカイブする […] みなさんGmail使ってますか? 無料で使えて大容量(今は10GBぐらい?)を誇るGmailの登場で、Gmail以前なら古いメールや重要じゃないメールは削除したり圧縮したりしていたものが、なんでも受け取ってアーカイブするようになってしまいました。 それでも、長く使っていると、過去の蓄積でかなり容量が圧迫されてきます。今僕のGmailアカウントは8割が使用済の状況です。 重要じゃないニュースレター等を検索・削除して容量を空けてもいいですが、もっと直接的に、大きな添付ファイルや大きなメールを探して消せればいいですよね。これまでは、APIを使った外部サービス等を使って、

    Gmailの容量が心配な人に、大きなメールや添付ファイルだけを探す隠し検索機能size:
  • キーワード抽出モジュール Lingua::JA::Summarize を使うコツ (nakatani @ cybozu labs)

    いわゆる「Web2.0」っぽい要素である「タグ」。 一般にはタグ付けは手動で行うわけですが、自然言語テキストへのタグ付け(キーワード抽出)を自動で行うことができれば、あれこれと可能性が広がって楽しそう……しかし、それは実現が難しかったり高コストだったりして、簡単に手を出せる解はあまりありません。 ラボの奥さんの作成したキーワード抽出モジュール Lingua::JA::Summarize は次の特徴を持っています。 動作要件の敷居が低い 辞書のメンテナンスをしなくても、未知語や熟語もある程度抽出してくれる 希望の結果に近づけるためのチューニングが可能 モジュールを使って、サイボウズ・ラボ内での情報交換を行っている社内掲示板をスレッド単位で解析しているのですが、辞書を一切チューニングしていない状態でも「しょこたん☆ぶろぐ」や「かぶり隊隊員ニャンコ達」などの特徴的なキーワードが抽出されます(

  • 1