タグ

2009年9月30日のブックマーク (8件)

  • Web検索エンジンのインデックスを用いた同位語とそのコンテキストの発見 | CiNii Research

    タイトル別名 Web ケンサク エンジン ノ インデックス オ モチイタ ドウイゴ ト ソノ コンテキスト ノ ハッケン Discovering Coordinate Terms with Their Contexts Using Web Search Engine Index 研究では,ユーザが与えた1語のクエリに対して,Web検索エンジンが持つ情報のみから同位語とそのコンテキストを発見する手法について提案する.同位語とは,共通の上位語を持つような語のことである.従来研究として,同位語や,上位語,下位語などを求めるような研究は数多くあるが,それらはWeb上の文書を利用するものも含めて,巨大なコーパスを解析して大量の結果を求めるというものであった.我々の提案する手法では,Web文書のタイトルやスニペットといったWeb検索エンジンが持つ情報のみを,少ない回数のWeb検索によって取得し,それ

    hiromark
    hiromark 2009/09/30
    あとで論文読む。
  • ソフトウェアアーキテクトが知るべき97のこと / 池袋ジュンク堂で鈴木雄介さん、小野和俊さんとイベント - naoyaのはてなダイアリー

    "97 Things Every Software Architect Should Know" という洋書の邦訳が、"ソフトウェアアーキテクトが知るべき97のこと" (www.oreilly.co.jp, www.amazon.co.jp)というタイトルで 10月5日、オライリーから発売です。 ソフトウェアアーキテクトが知るべき97のこと 作者: 鈴木雄介,Richard Monson-Haefel,長尾高弘出版社/メーカー: オライリージャパン発売日: 2009/10/05メディア: 単行(ソフトカバー)購入: 17人 クリック: 362回この商品を含むブログ (82件) を見る 第一線で活躍するソフトウェア・アーキテクト達が、独自の視点でアーキテクトという職業やソフトウェア開発にまつわる事柄についてのエッセイをそれぞれ執筆、それが 97 あるというコラム集です。 邦訳版では、日

    ソフトウェアアーキテクトが知るべき97のこと / 池袋ジュンク堂で鈴木雄介さん、小野和俊さんとイベント - naoyaのはてなダイアリー
    hiromark
    hiromark 2009/09/30
    これはおもしろそう。
  • Unicode の文字列をソースコードに埋め込む方法 - bkブログ

    Unicode の文字列をソースコードに埋め込む方法 Unicode の文字列をソースコードに埋め込む場合、直接 UTF-8 などで文字列を書く方法と、\uXXXX などのようにエスケープして表記する方法があります。後者の方法についてまとめてみました。 \uXXXX 形式の場合 Java, JavaScript, Python, C++, C (C99から) などの多くの言語では \uXXXX という表記 (universal character names) でUnicode の文字を文字列の中に埋め込めます。たとえば、「あいう」は "\u3042\u3044\u3046" となります。 \uXXXX で埋め込んだ文字がどのように解釈されるかは言語や処理系によって異なります。 gcc/g++ の場合、 -fexec-charset オプションで、実際に使う文字セット・エンコーディングを指

    hiromark
    hiromark 2009/09/30
    使わないと思うけどとりあえずメモっとく。
  • 3億のユーザーを抱えるFacebookのデータセンター。移動は自転車、希望は100Gbイーサネット

    ユーザー数が全世界合計で3億人を突破した、と9月15日に発表したばかりのFacebook。Webサイトの利用者数は、グーグル、ヤフー!に次ぐ規模だといわれています。 同社のエンジニアDonn Lee氏が、そのFacebookのデータセンターとネットワーク構成の内容を、Ethernet Allianceのイベントで紹介していました。EETimesが公開しているプレゼンテーションのビデオから、3つほど興味深いシーンを紹介しましょう。 まずは同社のデータセンターで稼働している典型的なサーバラックの様子。クアッドコアをマザーボード上に複数搭載した強力な1Uのサーバが、ラック上部でアグリゲーションされている、と説明されています。 データセンターのこの巨大さはどうでしょう。奥の方までずっとラックが続いています。これは標準サイズのデータセンターとのこと、そして写真中央にあるように、移動にはしばしば自転車

    3億のユーザーを抱えるFacebookのデータセンター。移動は自転車、希望は100Gbイーサネット
    hiromark
    hiromark 2009/09/30
    すげえ。
  • 真っ当な研究者・開発者はぐるなびやホットペッパーで検索しない - かふぇ・べいぶ別館

    今までがんばってくれていたU山補佐が交代するために慰労会が企画されているので,お店の選定がどうなっているかH氏とU越氏に聞いたときに,「忙しいんで,適当にぐるなびで検索して選びます」という返答だった. そこで,以前にここに書いたように,ぐるなびを使って店を選ぶなと言い出そうとすると,横からT氏までが「ぐるなびは店舗情報を知るために使ってもよいが,店を選ぶのに使ってはいけない」と言い出してくれて,これは情報処理研究者の共通認識であることを確認した. 結局,ぐるなびのように店舗情報掲載で収入を得ている場合には,まともな評価システム・ランキングシステムは目的に反するために内部に構築することはできないのだ.だから,評価・ランキングは,一般のサーチエンジンやクチコミサイトなど,別のシステムで代替する必要があるのだ. また,優秀な研究者・開発者はたいていグルメであるということもある.結局,普段から

    真っ当な研究者・開発者はぐるなびやホットペッパーで検索しない - かふぇ・べいぶ別館
  • アメリカと日本の研究者の賃金格差 - 武蔵野日記

    My Life in MIT Sloan より 技術者が金儲けして何が悪い?−頭脳流出のススメとポスドクはアメリカでも報われない?を読む。 まず「頭脳流出のススメ」から。流出したほうがいいんじゃない、とのことで、1番目に上げられている理由だが、アメリカエンジニアは日より遙かに待遇がよい(そんなたくさん働かなくてもいいし、お金もたくさんもらえるし)というのは知らない人は知っていてもよい知識だと思うが、だからといって無邪気に「日を捨てて海外に行きなさいよ」と言うのもなんだかなぁ、と自分は思う。 日は給料安いかもしれないが、住むには非常にいいところだと思うし、給料のよさだけで働く国(場所)を決めるのは、給料いいからと東京で働くようなものであり、総合的には人生損しているんじゃないかな。もちろん東京みたいなところが好きな人もいるだろうし、そういう人がもしかしたら多数派なのかもしれないが、地方

    アメリカと日本の研究者の賃金格差 - 武蔵野日記
    hiromark
    hiromark 2009/09/30
    激しく同意。
  • TechCrunch | Startup and Technology News

    Welcome back to TechCrunch’s Week in Review — TechCrunch’s newsletter recapping the week’s biggest news. Want it in your inbox every Saturday? Sign up here. OpenAI announced this week that…

    TechCrunch | Startup and Technology News
    hiromark
    hiromark 2009/09/30
    検索に5千人。
  • iv.xight.org - 情報視覚化

    ■ Information Visualization の用途 情報検索 データ解析 プログラムデバッグ ■ Information Visualization に必要な技法 必要なものだけ表示する技法 画面の表示可能領域に制限 情報を選択的に表示 ズーミング手法・フィルタリング手法・重要度計算手法・画面を歪ませて表示する手法 e.t.c. 全体と詳細を同時に見る技法 全体を概観しながら詳細も見ることが可能 ズーミングの応用 抽象データの画面へのマッピング技法 表示すべきデータがユーザ操作により変化 表示すべき情報をどのような位置,形,色で表示するか グラフの自動配置手法・階層構造の表示手法 e.t.c. 自動レイアウト技法 重なりがちゃんと見えるように グラフの自動配置手法の一つ? インタラクション技法 直接操作によって画面を移動・拡大させたり,条件を変更して動的検索を行ったりする手法

    hiromark
    hiromark 2009/09/30