タグ

2007年11月5日のブックマーク (10件)

  • Google Japan Blog: 大規模日本語 n-gram データの公開

    突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。 一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」 と 「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

    Google Japan Blog: 大規模日本語 n-gram データの公開
  • 平凡なエンジニアが未踏ソフトウェア創造事業をやったらどうなるのか書いてみた - Akasata's Page(あかさたのページ)

    2007-11-01 14:29 : 平凡なエンジニアが未踏ソフトウェア創造事業をやったらどうなるのか書いてみた 最近、八角研究所で技術記事を書いているのですが、私が参加した 2006 年度下期未踏ソフトウェア事業(2006 年 11 月 ~ 2007 年 8 月末まで)の体験談を書いてみました。 未踏の体験談を書こうと思った動機について書きます。 私がお世話になった PM は東工大の千葉先生だったのですが、同じ PM 配下でも他の方は凄腕のエンジニアであり、能力的にも住む世界が異なるという感じでした。そういうエンジニアは目立つので、私は未踏のエンジニアというともの凄い凄腕ばかりを思い浮かべてしまうのですが、未踏ソフトウェア創造事業そのものは、適切な提案ができれば平凡なエンジニアにも門戸が開かれています。 というか、普通のエンジニアこそ挑戦すべき制度です。とはいえ、

  • 一度見たら止まらなくなる。マンションの住人達を観察するFLASH。

    久々に面白いFLASHを見てしまった。 これは一度見てしまったら気になって仕方がない。 8部屋あるマンションで全ての部屋で、浮気、喧嘩、パーティ、等、様々な事が同時に起こります。 詳細は以下で。 住人達の面白い立ち回りが気になったら負け 8部屋+階段の踊り場4つで、当に様々な事が起こる。 そして、全てを一回で見る事は多分即読の達人以外不可能。 ズーム機能があるため、それで見るとなにが起こっているのかが見えるのですが、それ以外はやはり何度も何度も見ない限りわからない・・・。 あの人がここでようやくつながった! 出産? 包丁振り回している・・・ いきなり喧嘩が始まる・・・ 浮気がばれてる・・・ 短時間で様々な事が同時に起こり、何度も見てしまう羽目になる。 時間のないときは見ないほうがいいかも・・・。 下のほうに、全ての壁を透過する『RevealAllStorles』というボタンがありますので

    一度見たら止まらなくなる。マンションの住人達を観察するFLASH。
  • はじめてのカーネル・ソース 第1回 どうしたら読めるようになるのか:ITpro

    なかなかハードルが高く,多くの人が踏み出せないでいるカーネルのソース・コードの読解。連載では,今までカーネル・ソースなんて見たことがないという人に,読みこなすコツをお教えします。今回は,どうしたらカーネル・ソースを読みこなせるようになるのか,筆者の経験をお話します。 Linuxユーザーなら誰しもカーネルのソース・コード(カーネル・ソース)を読んで,どのような処理を行っているのかを確認したり,自分なりの変更を加えたりしたくなるのではないでしょうか。しかし,カーネル・ソースの量は膨大な上,C言語で書かれているので,コンピュータ内部やOS(オペレーティング・システム)の仕組みを理解したプログラマでないとなかなか読みこなせません。そのため,カーネルを読むための第一歩を踏み出せない人が数多くいることは事実です。 講座では,プログラマではないごく普通のLinuxユーザーが,カーネルをある程度自力で

    はじめてのカーネル・ソース 第1回 どうしたら読めるようになるのか:ITpro
  • これがないと生きていけない検索業界のウェブサイト5選 | Moz - SEOとインバウンドマーケティングの実践情報

    いま、ビギナーズガイド書き直しネタの次のやつを仕込んでいる最中なんだけど、もう疲れちゃった。3時間かけてニューヨークに来てみてもさっぱりはかどらない。だから、この作業はちょっと脇に置いて、みんなで意見を出し合えるものをやろうかと思った次第。 検索業界のウェブサイト(検索エンジンを除く)で、みんなが一番参考にしているサイトを5つあげるとしたら――これがないと生きていけない(もしくは、これがないと稼げないとか)といえるものは何かな? 僕の答はこうだ。 Techmeme 1日に何回かTechmemeを見ておけば、ブログ界やハイテク業界での大きな話題を見逃すことはまずない。その点だけでもすごく貴重だ。これがなかったら、今頃どうなっていたことやら。話題を見逃さないために、もっとたくさんのサイトを眺めて回らなければならなかったに違いない。 Search Engine Land 検索業界において、業界ニ

    これがないと生きていけない検索業界のウェブサイト5選 | Moz - SEOとインバウンドマーケティングの実践情報
  • 最速の『Vista』搭載ノートパソコンは『MacBook Pro』 | WIRED VISION

    最速の『Vista』搭載ノートパソコンは『MacBook Pro』 2007年10月31日 IT コメント: トラックバック (3) Charlie Sorrel 『PC World』の「フォトギャラリー:2007年最も注目すべきノートパソコン」は、同社が2007年に行なった各社ノートパソコンのテスト結果を、「最大」「最小」「最もスタイリッシュ」「バッテリーが最も保つ」など、さまざまなテーマによって掲載している。 例えば最も重いのは『Acer Aspire 9810-6829』で、電源ケーブル込みの重さは約8.6キログラムだが、いちばん驚かされたのは、最速の『Windows Vista』搭載機種として、17インチの『MacBook Pro』が選ばれたことだ。 われわれが今年テストしたWindows Vista搭載ノートパソコンのうち、最速は『Mac』だった。もう一度言おう。今年テストしたな

  • 不機嫌な日本全国コストセンター化(その1) - michikaifu’s diary

    日経ビジネスに連載している、糸井重里さんの話が面白い! http://business.nikkeibp.co.jp/article/life/20071023/138300/ http://business.nikkeibp.co.jp/article/life/20071031/139184/ やたらなんでも管理することが正義になって、誰もリスクをとらなくなってしまっている、というお話。確かにそうだなぁー、と思う。シリコンバレーではSOX法のせいでベンチャーがIPOできなくなっているとか、子供の遊び場でもスポーツの試合でも、訴訟リスクが怖くてなんでもかんでも事前に「訴訟しません」という書類にサインさせられるとか、当地でも似たようなことは多い。 でも、この「不機嫌」な閉塞感は、日のほうが強いような気がする。なんでかな、と考えると、英語でいう「upward potential」(上昇する

    不機嫌な日本全国コストセンター化(その1) - michikaifu’s diary
  • 高木浩光@自宅の日記 - 無線LANのMACアドレス制限の無意味さがあまり理解されていない

    ■ 無線LANのMACアドレス制限の無意味さがあまり理解されていない 職業マスメディアに代わって、ブログスタイルのニュースサイトが人気を博す時代になってきた。海外の話題を写真の転載で紹介する安直なニュースも人気だ。 このことろなぜか、無線LANのセキュリティ設定について書かれた記事を何度か見た。おそらく、ニンテンドーDSがWEPしかサポートしていないことが不安をもたらしている(そして実際に危険をもたらしている)ためだろうと思われる。 セキュリティの解説が増えてきたのはよいことなのだが、内容に誤りのあるものが少なくない。 実は危険な無線LAN, らばQ, 2007年10月21日 この記事には次の記述があるが、「接続されなければMACアドレスは盗まれない」という誤解があるようだ。 MACアドレスというのは、機器固有のIDのようなものです。たいていの無線LANアクセスポイントにはMACアドレスフ

  • 電脳がいつかは人脳に勝つ理由 - 書評 - ボナンザVS勝負脳 : 404 Blog Not Found

    2007年11月04日03:00 カテゴリ書評/画評/品評 電脳がいつかは人脳に勝つ理由 - 書評 - ボナンザVS勝負脳 こんな大事なを読み落としていたとは。思い出させてくれた「レジデント初期研修用資料: 終了判定の問題を考えている人がいた」に感謝。 ボナンザVS勝負脳 保木邦仁 / 渡辺明 書を読んで確信できた。 私の目の黒いうちに、電脳が人脳に勝つ日が来ることを。 書、「ボナンザVS勝負脳」は、現在最も有名なコンピューター将棋プログラムBonanzaの開発者と、それと戦って見事勝利した、勝負脳の持ち主とが、それぞれの立場で持論を読者に遠慮なく語った一冊。 目次 はじめに 第一章 ボナンザ誕生 保木邦仁 第二章 コンピュータとの対決 渡辺明 対談 ボナンザ誕生 保木邦仁 x 渡辺明 第三章 コンピュータ将棋の新たな可能性 保木邦仁 第四章 プロ棋士はこう考える 渡辺明 終章 科学

    電脳がいつかは人脳に勝つ理由 - 書評 - ボナンザVS勝負脳 : 404 Blog Not Found
  • 現代美術を観るにはどんな知識が必要か?:アルファルファモザイク

    実際の作品を出来るだけナマで見る。何はともあれこれは大切。 「現代」美術ってことで新鮮な作家のはリアルタイムで見ておこう。