初出: 2007/6/27 更新: 2007/7/1 文章からキーワードを抽出するスクリプトをPythonモジュールとして実装しました。 分かち書きした上に、適切に複合語をつくり、さらに重要そうなものかどうかのスコアをつけます。 アルゴリズムは、以下のサイトを参考にしました。 http://gensen.dl.itc.u-tokyo.ac.jp/ ここで紹介されている論文 * 中川裕志、森辰則、湯本紘彰: "出現頻度と連接頻度に基づく専門用語抽出",自然言語処理、Vol.10 No.1, pp. 27 - 45, 2003年1月 http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/academic-res/jnlp10-1.pdf に掲載されているFLR法のみを実装しています。 実行結果サンプル たとえば、こんなページの本文をテキストフ
ref:http://www.nishiohirokazu.org/pwe2007/2007/06/post_5.html 適当にオプションで切り替えられるように。そしてファイルの入出力は UNIX 流儀で。 import sys, fileinput class Person(object): __slots__ = 'firstname lastname'.split() def __init__(self, lastname, firstname): self.firstname = firstname self.lastname = lastname def __cmp__(self, other): return cmp((self.lastname, self.firstname), (other.lastname, other.firstname)) def initial_
基調講演の後には、報道向けのラウンドテーブルが開催。トロット氏に加え、Voxの事業責任者であるアンドリュー・アンカー氏、シックス・アパート代表取締役の関信浩氏らが出席し、Voxの事業展開や開発の背景について説明した。 Voxの大きな特徴であるプライバシーコントロール機能は、トロット氏自らのブログ経験も影響しているという。トロット氏は「以前にブログで自分のことをジョークにしているつもりが、夫のことを悪く言っていると勘違いされてしまい、『そんな夫とは離婚しろ』といったコメントがついてしまったことがある」との思い出を紹介。「2001年からブログを続けているが、最近はブログが増えてきて最初の頃ほど親密感がなくなり、楽しくなくなってきている面もある」とし、こうした体験がVox開発のアイディアにつながっているとした。 Voxのユーザーターゲットは、すでにブログを利用しているユーザーだけでなく、ブログに
米SixApartはこのほど、エントリーごとに公開範囲を限定できる無料ブログサービス「Vox」を正式公開した。初心者向けにインタフェースを簡便にしたほか、写真や動画を気軽にアップしてもらえるよう、1カ月あたり2Gバイトのストレージエリアを提供。「ブログは誰に見られるか分からない」と不安に感じて手を出せなかった人をターゲットに据える。 Voxは「Movable Type」「TypePad」「LiveJournal」に続く同社4番目のサービスで、英語版、日本語版、フランス語版を公開した。毎日の生活を記録し、限られた人に公開する」ことを目指したサービスで、携帯電話からも利用できる。 ブログはYouTubeやAmazon.co.jpなど他サービスとシームレスに連携。入力画面からYouTubeの映像やAmazonの商品を直接検索してリンクを挿入することも可能だ。プロフィール公開機能や、写真・動画・音
今日(昨日)はSNS系のエントリーがとても多く感じた。 Microsoftのスピンオフ、Wallopがスタート SNSのFacebook、学生向けから一般公開へ MixiはSNSの黒船にどう迎え撃つのか ライブドア有賀氏、新ブログサービス「PRAC」で新たなユーザー層開拓を コミュニケーションサービスの成功要素 ミクシィ襲う1億人の黒船 これらの記事を読み比べてみると、今後のSNSに関して2つの見解が存在するように思える。 1つは、今後はSNSに対するユーザーの要求が高まっていき、高機能になっていくだろうという考え。 MixiはSNSの黒船にどう迎え撃つのか どう考えても、現在のSNSというカタチで利用者がこれまでのように広がっていくとはとうてい思えません。ビジネスモデルも弱いですね。新しいカタチや姿、新しい価値、新しい発想が必要だと感じるのです。コミュニティをつくって日記を見せ合い、掲示
[{"displayPrice":"¥2,990","priceAmount":2990.00,"currencySymbol":"¥","integerValue":"2,990","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"Hn087XdNZXFYu0nrcybdnm8h5nsGfLp03mJfIsUh13Jd2EwEV0sqs2jJAmZzahYao0xigkms0L4p0lg1IuSP%2FdXzs1GuPDcNq0GR%2Bv1wP%2FvKjA5z2yjIZ9cRYQm9rYvG%2FdpG8Y4XYoLRU68D%2FsRj07HsZ5ybVBz
2022年振り返りというものを書いていたようで*1、はてなブログからリマインドが来たこともあり、2023年振り返りを書いてみる。 仕事 2023年の仕事は引き続きエンジニアチームのマネジメントが中心で、ハイライトとしてはコロナ渦以来できていなかったオフサイトをボストンで開催できたこと。いつも画面越しにしか見たことがなかった同僚たちとリアルで会うことができてよかった。一度会っておくと、その後の仕事もやりやすい気がする。あと海外でオフサイト企画に携わったのは初めてだったけれど、参加してもらった人達の満足度は高くできたようでよかった。また、普段は英語で仕事をしているわけだけど、その英語はギリギリなんとかなっているレベルという自己評価をしていて、「ギリギリ」という状態から抜け出すためにも、主に発音をもうすこし良くしたい。 プライベート プライベートでは旅行に良く行った年となった。アメリカにいる間に
モバゲータウン(モバゲー)が携帯で圧倒的なユーザーを集めている。 モバゲーは12月の段階で、会員数が225万人を超え、 月間約40億万ページビューある巨大サイトになっている。 モバゲーは一言で言うと「ケータイゲーム&SNS」のサイトである。 無料でゲームを遊ぶことが出来ると同時に、アバターを使ったユーザー間の コミュニケーション(SNS)が出来るようになっている。 ★モバゲーがアバターを流行らせたことのすごさ アバター(仮想空間のキャラクター)を使ったサイトやコミュニティはたくさんあれど、 実は日本では海外ほど大成功を収めていない。 韓国や中国などでは、アバター文化が定着しており、 ユーザーがアバターの服を買うためにリアルなマネーを使ったりもするほどだ。 韓国で圧倒的な支持を持つSNSサイト、サイワールドではアバターが受け入れられており、 実際に、アバターの服を買うためにリアルマネーを払っ
カレーはあまり好きじゃないKeitaです。 映画サイトの映画生活のデザインリニューアルをして、いくつかデザイン以外の修正もあり、サーバ停止時間が発生するため、メンテナンス画面を作ることにしました。今日はその簡単なトピックスを書いてみたいと思います。 まず最初に、メンテナンス画面は次のような形の要件があるかなと思っています。 ドメイン以下すべてがメンテナンス画面になる クローラー対策でヘッダで503を出力する 癒される 特にクローラー対策は、クローラーがきておかしいものをキャッシュされると結構痛いかなと思うので、503が的確かはともかく、そこらへんのエラーを出すことにしました。 最初、ここら辺のすべての処理をmod_rewriteだけで実現できるかなと思ったのですが、残念ながら、mod_rewriteでは300番系のエラーを出すことができますが、503のエラーは出せないようなのでさくっ
にわかに注目を集めている、URLをIDとして利用する認証プロトコル、OpenID。本連載ではこのプロトコルの仕組みを技術的に解説するとともに、OpenIDが今後どのように活用されていくのかを紹介する(編集部) OpenIDってなんだろう? 現在、国内外でにわかに注目されつつあるOpenIDという仕組みを聞いたことがあるでしょうか? これはユーザー中心の分散ID認証システムですが、まだ日本での普及は進んでいない状況です。 これにはいくつか原因が挙げられるでしょうが、筆者はOpenIDが正しく理解されていないことが原因だと考えます。 本連載ではOpenIDの現行仕様、およびその拡張仕様とともに、実装を例に取りつつOpenIDとは何かということを明らかにしていきます。最終的にはOpenIDが切り開く未来を見るため、現在策定中の次期仕様についても触れていきたいと思います。 広がりつつあるブラウザベ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く