タグ

programmingとsearchに関するmyrmecoleonのブックマーク (36)

  • Tolle et Lege Diary

    2009年7月28日(火) 紀伊國屋書店から、アーサー・C・クラーク『ザ・ベスト・オブ・アーサー・C・クラーク2 90億の神の御名』(中村融編/1000円+税/ハヤカワ文庫SF)[amazon.co.jp, bk1, 楽天, 紀伊國屋書店, Yahoo! Books]、カリン・ロワチー『艦長の子』(嶋田洋一訳/1000円+税/ハヤカワ文庫SF)[amazon.co.jp, bk1, 楽天, 紀伊國屋書店, Yahoo! Books]、ブランドン・サンダースン『ミストボーン2 霧の落とし子』(金子司訳/820円+税/ハヤカワ文庫FT)[amazon.co.jp, bk1, 楽天, 紀伊國屋書店, Yahoo! Books]、カール・セーガン『悪霊にさいなまれる世界 上』(青木薫訳/820円+税/ハヤカワ文庫NF)[amazon.co.jp, bk1, 楽天, 紀伊國屋書店, Yahoo! B

    myrmecoleon
    myrmecoleon 2009/07/30
    「bk1の詳細検索にはどうも不思議な癖があって、予約註文ができる本も含めて検索したいときに…「ジャンル」といふ項目で「文庫・新書・ブックレット」を選ぶと、予約註文できる本が結果に出てこないことがある」
  • Tolle et Lege Diary

    2009年7月29日(水) 今日も、Jack Vance The Languages of Pao を読みながら出勤。半分を越える。目的別のたくさんの言語を習得して主人公は故郷の星に帰る。言葉を習得した人が言語学者ではないと思ふのだが、そんな感じでlinguistといふ言葉を使ってゐる。あ、数カ国語に通じた人といふ意味もあるのか、linguistといふ言葉には。それならいいんだけど。 昨日に引き続いてbk1の検索について。今まで、新刊情報の検索には「http://www.bk1.jp/webap/user/SchDetailBibList.do?keyword=.....」といふURLを使ってゐた。前に、ウェブ・アプリケーションはこのURLなんていうお知らせがあったからだ。ところが、これを利用していると表示件数を25にしても、どうも10件しか情報を取得してゐないやうなのだ。変だなあと思って

    myrmecoleon
    myrmecoleon 2009/07/30
    bk1の検索に関するtips。
  • 3行でできる超お手軽全文検索 - mixi engineer blog

    梅雨。部屋干しした洗濯物による異臭騒ぎに苦しむmikioです。今回は、Tokyo Cabinetのテーブルデータベースで超お手軽に全文検索をする方法について説明します。 使い方 テーブルデータベースについてまずおさらいしておきましょう。PerlRubyのハッシュのようにコラム名とその値を関連づけた構造を、主キーを識別子として保存するデータベースです。例えばRubyからデータを保存するに以下のように行います。データベースであることをほとんど意識させないというのが素敵ポイントです。APIはCでもPerlでもRubyでもほとんど同じなので、言語にかかわらず同じようにレコードを操作できます。 require 'tokyocabinet' include TokyoCabinet # データベースを開く tdb = TDB::new tdb.open("casket", TDB::OWRITER

    3行でできる超お手軽全文検索 - mixi engineer blog
  • news - Wolfram|Alphaは検索エンジンじゃないよ : 404 Blog Not Found

    2009年05月17日23:30 カテゴリNewsiTech news - Wolfram|Alphaは検索エンジンじゃないよ というわけで、噂のWolfram|Alphaで遊んでみた。 Wolfram|Alpha 【レポート】ついに姿を現した"Googleキラー"、「Wolfram|Alpha」の実力は? (1) 確かな”答え”が返ってくる計算知識エンジン | ネット | マイコミジャーナル米Wolfram Researchが開発している新検索サービス「Wolfram|Alpha」の試験公開が始まった。同社は米国時間の5月18日の正式公開に向けて同15日に最終テストを実施、問題が生じなければ同日から試験公開すると予告していた。 あれは検索サービスではない。 演繹サービスだ。 検索サービスというのは、すでにある情報の中からなるべく適切なものを提示するサービス。検索サービス自体は情報を生成す

    news - Wolfram|Alphaは検索エンジンじゃないよ : 404 Blog Not Found
    myrmecoleon
    myrmecoleon 2009/05/18
    フリーのMathematicaみたいなものなのか。
  • PHPはそのニセ科学的な文化が問題なのでは? - よくわかりません

    もうおまえらPHPerは正規表現をブログにうpするんじゃねえ! と言われても無理もなくなってしまうのではないか。 http://blog.livedoor.jp/dankogai/archives/51189905.html 弾さんの咆哮に対して、「PHP関係ねぇ!十把一絡げにすんな」的な反論がブコメでもチラホラ見られる。それは正論だし、当然ちゃんとしたPHPerも少なからず居るはずだと思う。だけど、あえてそれを無視して暴論を。 PHP周辺が、ハッカー達から蔑ずまれ叩かれやすいのは、単に正規表現が間違っていたかという単体の事象達が問題なんじゃなくて、そういう事象を生み続けるPHP文化圏、そこに属する人達の態度が誠実でない傾向が原因じゃないだろうか。 彼らは、プログラミングに関わる諸問題を科学的に研究してきているコンピューターサイエンスに対して、リスペクトも関心も払わず、対象の問題内容もろ

    myrmecoleon
    myrmecoleon 2009/03/23
    「PHPerは、Rubyistにコピペコーダーと馬鹿にされたら」フイタ/自分がPHPを知る前は,CGIといえばPerlで,しかも下手糞なのがあちこちに配布されてたっけ。
  • 次期CiNiiの試験公開をはじめました - @i2kのブログ

    この4月にリニューアルする、国立情報学研究所の論文検索サービスCiNii(サイニィ)の試験公開をはじめました。 http://ciexam.nii.ac.jp/ http://ci.nii.ac.jp/(追記:正式版を公開しました) CiNiiのリニューアルは2年がかりの大仕事で、ぼく個人としても研究所での仕事の大半はこれでした。このような形で公開することができて、まずは一段落というところです。 新しいCiNiiですが、基的には論文検索サービスを粛々と提供するということで機能的に大きな変化はありません。長らくの課題だった負荷対策を万全にするのと、デザイン・ユーザビリティをよくするのが第一のテーマでした。 それに加えて、ぼくがどうしても入れたかったのがメタデータを提供する機能です。検索機能はOpenSearchに対応し、RSS 1.0(すなわちRDF)とAtom 1.0を返すようにしました

    次期CiNiiの試験公開をはじめました - @i2kのブログ
    myrmecoleon
    myrmecoleon 2009/03/11
    おおう,CiNiiの中の人か! 「著者情報がFOAFで記述されていて(簡単なものですが)、ソーシャルグラフの抽出に使える」「正式版はもっと速いです」wktk!
  • 検索エンジンとタグシステムの融合:ナレッジ!?情報共有・・・永遠の課題への挑戦:オルタナティブ・ブログ

    myrmecoleonさんがタギング関係の研究の紹介ということで「タグを自動的に付与するシステムの研究」という論文へのリンクを貼っていた。こうしたシステムを使った文書の自動分類については、私個人としては正直まだテクノロジーが追いついておらず実用には早いと思っているのは以前にも書いたとおり。 ただ、実際に膨大な情報にいろいろなタグを付与して分類していく作業には負担感が大きく、これを何とかしたいというニーズは高い。先の研究ではブログのカテゴリ名を元にシステムが自動的にタギングを行う事を実験しているが、タグ=カテゴリだと分類としはちょっと荒すぎる気がする。 で、この件については、うちのあるコンサルタントがアイデアベースではあるが面白い案を出している。 検索エンジンにキーワードを入力して検索結果を得た後に、ユーザがその一覧をみて選択肢をクリックする際に対象にこの最初の検索キーワードをタグとして自動

    検索エンジンとタグシステムの融合:ナレッジ!?情報共有・・・永遠の課題への挑戦:オルタナティブ・ブログ
    myrmecoleon
    myrmecoleon 2009/03/09
    「最初の検索キーワードをタグとして自動的に埋め込んではどうか」そんな話があったのか。
  • Tritonnプロジェクト MySQL Sennaによる全文検索 〜

    This webpage was generated by the domain owner using Sedo Domain Parking. Disclaimer: Sedo maintains no relationship with third party advertisers. Reference to any specific service or trade mark is not controlled by Sedo nor does it constitute or imply its association, endorsement or recommendation.

    myrmecoleon
    myrmecoleon 2009/02/03
    MySQLのSennaとmecab組み込みパッケージか。ほー
  • KOF 2008 の発表資料 - naoyaのはてなダイアリー

    KOF 2008 での発表資料「はてな流大規模データ処理」を以下にアップロードしました。 http://bloghackers.net/~naoya/ppt/081108huge_data.ppt 一部参考文献からの引用 (Introduction to Information Retrieval から Vector space model の図、たつをの ChangeLog から転置インデックスの図) があります。この場を借りて感謝。 環境によってはおそらくフォントの表示がいまいちだと思いますが、ご了承ください。 追記 SlideShare にアップロードしました。 081108huge_data.pptView SlideShare presentation or Upload your own. (tags: linux mysql) 追記: メモリはディスクの 150 倍について

    KOF 2008 の発表資料 - naoyaのはてなダイアリー
    myrmecoleon
    myrmecoleon 2008/11/13
    ドキュメントを無限次元のベクトル空間化して類似度を求めるアルゴリズムとか使ってるのか。すごい面白い /格ゲーネタだと思ってスルーしてた派。
  • 末永匡――Sennaとニコニコ大百科を作る偽プログラマ - @IT自分戦略研究所

    エンジニアにとって仲間とはどういう存在なのだろうか。極端なことをいえば、自分1人で作業が完結できてしまうエンジニアにとって、仲間とのコミュニケーションにはどんな意味があるのか。エンジニア同士のネットワークを通じて、エンジニアにとっての仲間とは何かを探る。 第7回|1 2|次のページ コミュニティで活躍するエンジニアたちの輪。8人目は、前回の溝口浩二氏(参考:溝口浩二――コードを愛する「動画中継職人」)から紹介された、未来検索ブラジルの末永匡(たすく)氏だ。 「グニャラくん」の相性で親しまれている末永氏。「ニコニコ動画版Wikipedia」「ニコニコ大百科」の開発者としての顔が最も有名だろう。 オープンソースの全文検索エンジン「Senna」(セナ)の開発に携わる末永氏。彼にとって、コミュニティとはどんな存在なのだろうか。 ■オープンソース活動が生んだ転職 末永氏が開発を担当するニコニコ大百科

    myrmecoleon
    myrmecoleon 2008/11/11
    「コミュニティの集まりは、コンピュータのネタが分かる飲み会」
  • ブログや動画のメタデータのみを収集するウェブクローラー“ContextMiner”

    米国議会図書館(LC)の全米デジタル情報基盤整備・保存プログラム(NDIIPP)の助成のもと、ノースカロライナ大学チャペルヒル校が、ウェブ上のブログ・動画のメタデータのみを収集するクローラー“ContextMiner”を開発・公開しました。 ContextMiner http://www.contextminer.org/ ContextMiner: A Metadata Collection Tool http://www.digitalpreservation.gov/news/2008/20081106news_article_contextminer.html ちなみに同校は、NDIIPPの助成によるプロジェクト“VidArch”のもと、YouTubeの動画をクロールする“TubeKit”など、他のツールも開発しています。 VidArch at SILS http://www.il

    ブログや動画のメタデータのみを収集するウェブクローラー“ContextMiner”
  • 県内図書書像マップの関連図書検索のロジックを変えてみた - natu_nの日記

    WebcatPlusにISBNを喰わせて連想検索を行い、それぞれのISBNと書名をJSONで返す部分を書き直した。 以前、Web::Scraperでスプレイプしようとした時に図書情報のページの構造がtableのネストが多く、また書名やISBNの位置がかなり不定なのでちょっとムリかなと思っていたが、久しぶりにWebcat Plusが吐くHTMLを眺めたら必要な文字列にすべて同一のclass名が付いていることを発見 大雑把にこんな感じにコードを書くと my $uri = URI->new($ISBN_SEARCH_URL_PREFIX . $isbn . $ISBN_SEARCH_URL_SUFFIX); print Dump scraper { process '//a[@href=~/DocDetail/]', 'values' => ['@href', \&get_detail]; }-

    県内図書書像マップの関連図書検索のロジックを変えてみた - natu_nの日記
  • mixiの検索システムを開発する29歳スーパークリエータ|【Tech総研】

    独創的発想で活躍している若手エンジニアを探し出して紹介するこのシリーズ!今回登場するのは、日初のSNSサービスで今や、1110万人を超えるユーザーを有する『mixi』で、膨大なコンテンツの検索システムを自社開発した研究開発グループの若手マネージャーだ。 1978年生まれ。立命館大学政策科学部を卒業後、01年に大手OA機器メーカーに入社。システムエンジニアに。独立行政法人情報処理推進機構(IPA)の2004年度第2回未踏ソフトウェア創造事業で、全文検索システム「Hyper Estraier」を開発、スーパークリエータに認定される。2006年6月、ミクシィ入社。研究開発に従事。 株式会社ミクシィ 2004年2月から日初のSNS(ソーシャル・ネットワーキングサービス)として『mixi』を展開。「居心地の良いサイト」「身近な人や趣味・興味が同じ人との交流」をコンセプトに開発、人気を集め、今や1

    myrmecoleon
    myrmecoleon 2007/10/31
    Hyper Estraierの人がやってたんだ。
  • グーグル、コード検索の新サービス「Google Code Search」を発表

    Googleは専門分野の検索機能を、お気に入りのターゲット層であるソフトウェア開発者の役に立てようとしている。 Googleは米国時間10月5日、新サービス「Google Code Search」を発表した。プログラマーはこのサービスを利用して膨大な数のソースコードを検索できるという。 Code SearchはもともとGoogle Labsの初期技術グループが考え出したもので、公開されているコードを検索する。対象となるのは大部分がオープンソースプロジェクト内のコードだ。GoogleのプロダクトマネージャーTom Stocky氏によると、ウェブページ上のコードだけでなく、圧縮ファイル内にあるコードも検索できるという。 Googleではこのサービスに関して、他人のコードを探し出してコピーする手段としてではなく、学生やまじめなプログラマーの学習ツールとしての使用法を第一に考えている。 Stock

    グーグル、コード検索の新サービス「Google Code Search」を発表
  • 【レビュー】これは便利! 書籍 2.0 書籍の中のコードを検索 - O'Reilly Code Search (1) O'Reillyの新サービスはSearch (MYCOMジャーナル)

    米O'Reilly Mediaは1月23日(米国時間)、同社のオンラインサービス「Safari Books Online」に新しいサービス「Rough Cuts」を追加したことを発表。これは出版前の書籍データにアクセスして閲覧できるというサービスで、関係者の多くを驚ろかせた。同社のオンライン書籍サービスはすでに2000年には開始されている。同社はその書籍が多くのデベロッパから人気を得ているが、Web 2.0という概念の提唱やRough Cutsなど話題作りにも事欠かない。 そんな同社からまた新しいサービスが提供されている。技術書籍を手がけ、Web 2.0を提唱した同社らするとそれほど驚くべきことでもないのかもしれないが、同社の書籍やオンライン書籍サービスを活用しているユーザとしては大きな恩恵を受けることができるものだろう。稿では同社の新しいサービス「Code Search」を紹介する。

  •  美崎薫さんと言えば、BTRONなんだそうだが... - bookscanner記

    美崎薫さんと言えば、巷では、BTRONというもので有名なんだそうだが、知らんかった。 そもそもBTRONというものを知らんかった。 私はてっきり、美崎さんと言えば、「記憶する住宅プロジェクト」の人なのだと、ず〜っと思ってた。少なくとも今年の初めくらいまでは。今は、「あ、美崎さんね、BTRONの人でしょ?」って言える。でも、いまだにBTRONについては、あまり知らず。 それはさておき、このヘンテコなプロジェクトを知った2003年っていうのは、私が勝手に「大量スキャンプロジェクト元年」って呼んでる年。なんでかって言うと、 2003年を振り返ってみると、 2003年3月3日、日がひな祭りで浮かれている中、米国の自動ブックスキャナ会社であるKirtas Technologies社が、突然、「来月、自動ブックスキャナを展示会に出すよ」って発表した。実際に展示会に出したんだけど、日人はあまり知らな

     美崎薫さんと言えば、BTRONなんだそうだが... - bookscanner記
    myrmecoleon
    myrmecoleon 2006/09/26
    美崎さんのやってるのは一種のライフログですね。自分史の発展版。自分の生活の中で生じた情報のすべてを記録する。/コメント欄がたいそう興味深い。