ドワンゴ技術勉強会で発表した際の資料です。 詳細は、ドワンゴ研究開発ブログ( http://info.dwango.co.jp/rd/ )を参照ください。Read less
Compute expert-level answers using Wolfram’s breakthrough algorithms, knowledgebase and AI technology Mathematics ›Step-by-Step SolutionsElementary MathAlgebraPlotting & GraphicsCalculus & AnalysisGeometryDifferential EquationsStatisticsMore Topics »Science & Technology ›Units & MeasuresPhysicsChemistryEngineeringComputational SciencesEarth SciencesMaterialsTransportationMore Topics »Society & Cul
まだピクミン2をクリアしてないのでケジメ的に新作ゲームを買えないmikioです。今回は、Tokyo Cabinetを使って激烈簡単に特定サイトの専用の検索機能を設置する方法について説明します。クローリングから検索までを10分くらいの作業で可能にします。 特定サイトの検索エンジン Web全体の検索機能を作るのは、途方もない技術力と設備を持っているGoogleやMicrosoftなどのビッグプレーヤでないと難しいのが現実です。でも、自分が気に入っているいくつかのサイトを対象とした検索エンジンを作るのであれば個人だってできます。また、インターネットから手が届かないイントラネットのコンテンツの検索機能は自分達で手がけないと構築できません。 ということで、企業用の検索システムが数多く売られていますし、LuceneやGroongaやHyper Estraierなどのオープンソース製品も世に多数存在しま
梅雨。部屋干しした洗濯物による異臭騒ぎに苦しむmikioです。今回は、Tokyo Cabinetのテーブルデータベースで超お手軽に全文検索をする方法について説明します。 使い方 テーブルデータベースについてまずおさらいしておきましょう。PerlやRubyのハッシュのようにコラム名とその値を関連づけた構造を、主キーを識別子として保存するデータベースです。例えばRubyからデータを保存するに以下のように行います。データベースであることをほとんど意識させないというのが素敵ポイントです。APIはCでもPerlでもRubyでもほとんど同じなので、言語にかかわらず同じようにレコードを操作できます。 require 'tokyocabinet' include TokyoCabinet # データベースを開く tdb = TDB::new tdb.open("casket", TDB::OWRITER
GoogleのFellowであるJeffrey Dean氏のWSDM'09における講演"Challenges in Building Large-Scale Information Retrieval Systems"のスライドを翻訳してみました。Googleの検索システムの10年間の進化の軌跡が紹介されており、興味深い話が満載です。個人的にはディスクの外周部と内周部を使い分けている話がツボでした。なお、イタリック体で一部解説・感想をいれています。翻訳は素人なので詳しくは元の資料を参照してください。 スライドの入手元:Jeffrey Dean – Google AI 検索システムに取り組む理由 チャレンジングなサイエンスとエンジリアニングのブレンド 多くの魅力的な未解決な問題が存在する。 CS(コンピュータサイエンス)の多数の領域にまたがる。 アーキテクチャ、分散システム、アルゴリズム、圧
harukiです。 ケータイユーザも検索エンジンから来るユーザも増えています。 そのため、携帯サイトも検索エンジンのクローラへ対応する必要があります。 ・Mobile Link Discoveryの記述を追加する PC用のページのheadタグ内に <link rel="alternate" media="handheld" href="(ケータイURL)" /> の記述を追加するだけです。 Mobile Link Discoveryに対応しているサイトでは、ケータイからのアクセス時に直接アクセスしてもらえるようになります。 Mobile Link Discovery 仕様 http://www.sixapart.jp/docs/tech/mobile_link_discovery_ja.html 検索エンジンでは、Googleモバイルのgoogle mobile proxy http
SEOmoz | Google Search Engine Ranking Factorsにて、世界34人のSEOのプロの投票によって決定したGoogleの検索ランキングアルゴリズムに関係すると推測される構成要素のランキングが掲載されています。各項目に対する採点は1から5までの5段階でおこなわれ、その平均点を元にランキングされています。これは一読の価値ありです。 以下に、各カテゴリとその投票結果を紹介します。カテゴリは「キーワード」「ページ特性」「サイト/ドメイン特性」「インバウンド・リンク」「クロール/ランキング特性」の5つです。点数は3ポイントが“ある程度重要”な基準点になっているので、平均点が3点以上のものをボールドで示しています。 キーワードに関する要因 1. titleタグで使われるキーワード(4.9) 2. bodyで使われるキーワード(3.7) 3. bodyにあるテキストの
「Java News.jp(Javaに関する最新ニュース)」の安藤幸央氏が、CoolなプログラミングのためのノウハウやTIPS、筆者の経験などを「Rundown」(駆け足の要点説明)でお届けします。(編集部) プログラミングと検索エンジンは切っても切れない プログラミングと検索エンジンの関係は切っても切り離せないものです。プログラミングに役立つドキュメントやノウハウを探したり、参考になるサンプルプログラムを見つけ出せます。 さらにバグの回避方法を見つけたり、エラーメッセージを検索エンジンで探して、解決方法が見つかることも多いでしょう。良質のソースコードから、的確なアルゴリズムや、思いもしなかったようなコード例を見いだすのも新たな楽しみです。 さて、ここではプログラミングの際に便利に利用できるソースコード専用の検索エンジンをいくつか紹介しましょう。ソースコード専用の検索エンジンを利用した検索
Google Searchは便利で多くの場合において適切な結果を返してくれる最大の検索エンジンだが、すべての検索に対して常にパーフェクトであるわけではない。これはMSN SearchにもYahoo! Searchにもいえることだ。ふだん使っている検索エンジンが何であるにせよ、その検索エンジンがすべての検索に対してパーフェクトであるということはない。 たとえばテキスト検索においてはGoogle Searchが多くの場合で優れた結果を返すかもしれないが、ソーシャルブックマーク検索、ソーシャルネットワーク検索、画像検索、動画検索、オーディオ検索、ファイナンス検索、エンターテイメント検索、業種別検索、健康関連検索、物件検索、旅検索……などなど、ターゲットを絞ってみると、その分野で評価されている検索エンジンがある。 そこで紹介したいのが総合検索サービス「sidekiq」だ。 図1 総合検索サービス「
●googleを超える検索2.0サイトたち AI Favored Search 2.0 Solution Read/WriteWebの読者が選ぶ「検索2.0」のコンセプト。 人工知能の期待が高いですね。 人工知能:HakiaやPowerset 人力検索:del.icio.usやChaCha バーティカル検索:SimplyHiredやTechnorati パーソナル検索:Collarity クラスタリング:ClustyやSearchMash ソーシャル検索:EureksterやRollyo 可視化:Quintura やKartoo プレビュー:SnapやLive Image Search 日本ではとりあえずsnapは見かける機会が増えました。technoratiも便利です。EureksterのようなSNS+検索サイトはもう少しあっても良い気もします。 googleを超えるサイトはここからでて
観光名所や空港などにウェブカメラが設置されている例は少なくありませんが、それらをGoogleでまとめて探し出す方法がありました。近いところでは淡路島のあわじ花さじきや治部坂スキー場、また海外のバーやシュトゥットガルトの空港なども見ることができます。 詳細は以下の通り。 その方法は簡単、Googleの検索窓に「inurl:ViewerFrame?Mode=」と入れるだけ。これだけでいろんなウェブカメラが見つかります。 inurl:ViewerFrame?Mode= - Google 検索 人でにぎわう繁華街や北海道の町の風景、空港の様子などは見ていて面白いです。中にはコインランドリーの監視カメラのようなものもあります。 また、検索フレーズは上記のもの以外に inurl:ViewerFrame?Mode=Refresh inurl:axis-cgi/jpg inurl:axis-cgi/mjp
Thank you for being patient. We are doing some work on the site and will be back shortly.
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く