こんにちは。検索グループ解析チームの nabokov7 です。 今回は、livedoor キーワードでの事例より、テキストの類似度を測るのに便利な手法を紹介します。 livedoor キーワードは、livedoor ブログでその日その日で話題になった語をランキング表示するサービスです。 当初、はてなキーワードやWikipediaを足して2で割ったようなサービスを作れといった開き直った指示のもとで開発が開始されたともいう、分社化前の芸風の名残で、キーワードの検索結果にはユーザが自由に解説を書き込める Wikipedia 的スペースもついています。 で、この解説部分に、さまざまなサイトから文章をまる写ししちゃう人がとても多いのですね。 特に多いウィキペディア日本語版からの剽窃を防止するために、livedoor キーワードでは以下のような対策を講じることにしました。 ウィキペディア日本語版の解説
はてブのコメントに「どうやって耳コピしているのか」とあったので手順をリストにしてみました 参考になればいいですが>< まずは音源を手に入れます サントラ、ようつべ、ニコ動etc... 再生速度の変更が可能なソフトでスロー再生します (場合によっては等速でコピります) もちろんピッチは変えずに (miniturboの場合) ルートとなるCと聴いている音を比べて相対的にコピっています いわゆる相対音感?絶対音感と違って、楽器経験のある方は備わってるはず miniturboは絶対音感ありません ルートとなるCの他にも、携帯電話の通話ボタンを押したときに聞こえる音 (ソ、すなわちG) も目安になりますね あとはひたすた聴きながら打っては聴いて修正して...を繰り返します 先にメロディとベースをコピってその曲の調を確認すると楽です (miniturboの場合) ピアノとか、鍵盤楽器があるとかなり楽で
はてなで日記を書き、twitterで呟きつつ、Skypeで会議する。 …そんなインターネットを使い倒している人たち、情報の自由を享受しているユーザーたちの利益を政治的に代弁する組織を作ります。 今まで情報技術に関わる政治的意思決定は、得てして「偉い人にはそれがわからんのですよ」となりがちでした。でも、ただ諦めて無力さを嘆いてみせるだけだと、本格的にまずい。規制によってどんどん窮屈になってしまい、私たちが空気のように感じている情報の自由さが失われていきます。 もう一度言いましょう。 ネットワークの自由には価値があります。 でもネットワークの自由は古い制度に縛られています。 なのに、ネットワークの自由を主張し擁護する組織的主体はありません。 だから作ることにしました。 それがMIAUです*1。 組織の目的 私どもMIAUは、「情報技術を応用することで、現在よりも自由で幸福な社会を作れる」と考え
最近、パリス・ヒルトンみたいなでかいサングラスをしている若い女子をよく見かけますよね。日中ならばなんら問題ありませんが、これまた夜にそーいう人見かけるでしょ。見ちゃうとどうなりますか?若手芸人じゃなくても「夜ですけど!」という突っ込みを入れたくなります。冬に半ズボンの「寒くない?」と同じパターンです。 残念ながらこの突っ込みに対するナイスなリアクションつまり、切り返す言葉は今だ見つかっていません。大方彼女たちは「夜だよ」と突っ込まれたときに以下のような返しをしていると思われます。 「そんなの関係なくない?」 「ぶっちゃけオシャレ優先みたいな」 「つーか、全然見えるんですけど」 「だってメイクしてないしー」 「うぜーー」 一部を除き、いわゆる開き直り系の回答が最も多いはずです。これじゃダメです。そんな彼女たちを救うべく「夜だよ」の突っ込みを切り返すナイスな台詞を考えました。これです。 「それ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く