タグ

2008年12月24日のブックマーク (5件)

  • XML DBや半構造データについて思うこと

    This Page has moved to a new address: kunishi’s blog: XML DBや半構造データについて思うこと Sorry for the inconvenience… Redirection provided by Blogger to WordPress Migration Service

    mamoruk
    mamoruk 2008/12/24
  • オークションのカテゴリ情報について

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog オークション事業部 開発部 まぁ坊です。 今回は、オークションのカテゴリ情報について、 簡単にお話させていただこうと思います。 オークションのカテゴリは木構造をとっています。 木構造は、ノードとリーフで構成されていて、 始まりのノードをルートと言ったりします。 末端がリーフとなります。 では、オークションのカテゴリ情報はというと、 ルートノードは、オークショントップページの「オークション」となります。 その下には、 コンピュータ 家電、AV、カメラ 音楽 、雑誌 映画、ビデオ おもちゃ、ゲーム ホビー、カルチャー アンティーク、コレクション スポーツ、レジャー 自動車、オートバイ ファッション アクセサリー、時計 ビューティー、

    オークションのカテゴリ情報について
    mamoruk
    mamoruk 2008/12/24
  • Confidence Weighted Linear Classificationを読んだ - 射撃しつつ前転 改

    ICML2008で発表されたDredzeらのConfidence Weighted Linear Classificationを読んだ。これは線形分類器を学習する新しいオンライン学習型アルゴリズムの提案である。すぐに使える実装としてはOLLというオープンソースのライブラリがあり、実際に良い実験結果が出ているようだ。 Confidence Weightedのアイデアは、よく出てくる素性に関しては一回の更新における数値の変更量を減らしてやり、あまり出てこない素性に関しては、一回の更新でぐっと値を変更してやろう、というものである。 こういった新しい更新方法を考案した動機を明らかにするために、Perceptronを使って、単語を素性として評判分類の学習を行うような問題を考えてみる。肯定的な評価のサンプルとして"I liked this author."というものがあったとすると、このサンプルの分類

    Confidence Weighted Linear Classificationを読んだ - 射撃しつつ前転 改
    mamoruk
    mamoruk 2008/12/24
  • Loading...

    mamoruk
    mamoruk 2008/12/24
  • ウェブサイエンスの抱える「再現性」の問題 - 図書館情報学を学ぶ

    ここしばらく利用履歴について記事を書いてきましたが、それに関連して「ウェブサイエンスにおける再現性の問題」について少し語ってみたいと思います。 ウェブサイエンスとは 現在のウェブは、ブログやSNS、ソーシャルブックマークといった様々な形態のウェブサービスによって複雑に構成されています。そのウェブのネットワークを分析し、ユーザーの情報行動や話題の伝播を解き明かし、応用技術を生み出していくのがウェブサイエンスという研究分野です。 社会のあらゆる情報がウェブにある現在、ウェブサイエンスは人々の生活環境を整える重要な研究であるといえます。 しかし、私の考えでは、ウェブサイエンスには再現性の点で問題点を抱えていると思います。 再現性とは 科学における重要な概念として、「再現性」というものがあります。再現性とは、ある研究で示された実験結果が再現できることを指します。科学の最大の目的は普遍的な法則性の発

    ウェブサイエンスの抱える「再現性」の問題 - 図書館情報学を学ぶ
    mamoruk
    mamoruk 2008/12/24