このサイトで生成している図表は GFDL (v. 1.2 or later. Credit: WikiChecker.com) にて公開しています。 その他および使用しているプログラム等については特記のない限り WikiChecker.com が著作権を保有します。
こんにちは。検索グループ解析チームの nabokov7 です。 今回は、livedoor キーワードでの事例より、テキストの類似度を測るのに便利な手法を紹介します。 livedoor キーワードは、livedoor ブログでその日その日で話題になった語をランキング表示するサービスです。 当初、はてなキーワードやWikipediaを足して2で割ったようなサービスを作れといった開き直った指示のもとで開発が開始されたともいう、分社化前の芸風の名残で、キーワードの検索結果にはユーザが自由に解説を書き込める Wikipedia 的スペースもついています。 で、この解説部分に、さまざまなサイトから文章をまる写ししちゃう人がとても多いのですね。 特に多いウィキペディア日本語版からの剽窃を防止するために、livedoor キーワードでは以下のような対策を講じることにしました。 ウィキペディア日本語版の解説
普段、なかなか、このメッセージ欄も更新されないので、たまに何か書くときには、せめて明るい、希望に満ちた話をしたいが、今日の話題は、私がこの6年間、一度も語ってこなかった極めて不愉快なとある出来事についてである。内容が内容だけに、冷静に書くことは難しいが、それでも私は、今という時は、これについて語る時だと考えている。 きっかけは、wikipediaだった。私は普段、何かについてネットで調べようという時、恐らくは多くの人と同じように、直接wikipediaに飛ぶということはなく、大体、検索してみて、ついでに引っかかったwikipediaも見てみるというくらいである。内容は、今はまだ玉石混淆で、非常に洗練されたレヴェルに達している項目もあれば、あまり有益な情報が掲載されていない項目もある。当然のことながら、私は自分の名前を検索することはないから、wikipediaの自分の項目がどうなっているのか
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く