タグ

ブックマーク / d.hatena.ne.jp/nokuno (4)

  • 大規模データを無料で手に入れることのできるサイトまとめ - nokunoの日記

    大規模データが公開されているサイトについて以下のQuoraでid:makimotoさんが質問していました。Data: Where can I get large datasets open to the public? - Quora以下、紹介されているサイトの一覧です。一部有料のものもあるようです。UCI Machine Learning RepositoryPublic Data Sets : Amazon Web ServicesCRAWDADno titleCity of Chicago | Data PortalGovLoop | Social Data Network for Governmentdata.gov.uk | Opening up governmentData.Medicare.GovData.Seattle.Gov | Seattle’s Data SiteOp

  • 【これはすごい】Twitter検索を3倍高速化した記事の翻訳 - nokunoの日記

    これはすごい! というわけでTwitter検索を3倍高速化したという記事を翻訳してみました。Twitter Engineering: Twitter Search is Now 3x Faster2010年春。Twitterの検索チームは、我々の増え続けるトラフィックに対応し、エンドユーザにとっての遅延を減らし、我々のサービスの可用性を向上させ、新しい検索の機能を素早く開発できるようにするため、検索エンジンを書きなおす作業を始めた。 その努力の一部として、我々は新しいリアルタイム検索をリリースし、検索のバックエンドをMySQLからLuceneのリアルタイム版に変更した。そして先週、我々はRuby-on-Railsに取って代わるフロントエンドをローンチした。我々がBlenderと呼ぶJavaサーバーである。我々はこの変更によって検索のレイテンシが3分の1になり、検索機能の開発を促進できるよう

  • WBC見ながら考えた、野球における「読み」の確率モデル - nokunoの日記

    WBC見ながら、バッター視点で相手バッテリーの配球を読むときの確率モデルを考えてみた。野球というゲームは適度に複雑なルールを持っていて、こういった思索にはちょうどいい。 簡単のためカウントは2ストライク3ボールで、ボールが来て見送ればフォアボール、という状況を想定し、次の球はストライク(s)か、ボール(b)かを予測したいとする。予測をどう決定するかを定式化すると、読み(y)が与えられたときのヒット確率P(h|y)を最大化するように、yを最大化するのが単純な方法である。hは塁に出ることを表し、ヒットとフォアボールを両方含むとする。この予測結果は、単に読みが当たる確率を最大化する定式化とは異なる可能性がある。読みが外れても、判断を変えてバットを止めたりボール球を打ったりして、塁に出ることもあるからだ。 これに、ピッチャー(pi)、キャッチャー(ca)、カウント(co)、イニング(ini)、点差

  • 「かんたん特許検索」がすごい件 - nokunoの日記

    サポート掲示板で特許関係の書き込みがあり、それは勘違いだったので良いのですが、特許検索システムを探していて凄いヤツを見つけてしまったので、紹介します。 かんたん特許検索 | 無料・簡単操作で特許検索これまでの特許検索は専門家向けの難しいものでした。もっと誰でも気軽に使えるようにしたい!そこで「もっと簡単に」「もっと身近に」をコンセプトに生まれたのが「かんたん特許検索」です。まるでグーグルのようなトップページ。 検索結果。要約もうまく抽出できます。 あるキーワードに関する出願人の出願数ランキングもあります。 出願件数の推移もわかりやすくグラフ化できます。 2年前に未踏で調べたときはこんな便利なものなかったぞ! というわけで日語処理関係をちょっと調べてみました。マイクロソフトのIMEに関する特許(PDF)従来のユニグラムへのバックオフがもたらす品質の低下を防止することができる言語モデルを作成

  • 1