タグ

2017年12月19日のブックマーク (8件)

  • Relative Standard Deviation: Definition & Formula

    takuti
    takuti 2017/12/19
  • Word2Vec, MeCab, ComeJisyo で病気の症状類似語を出してみた - Qiita

    エムスリー(ヘルスケア系)のAdvent Calendar に参加しているので、ヘルスケア系機械学習ネタ ちょっと前に業務とは関係なく、症状類語辞書をつくりたいなーーというときがあった。(結局できてないけど そのときに去年流行った word2vecを使って機械学習で症状の類義語がどれくらい精度よく出てくるかをやってみたのでその話を書く 今回の流れ 医療文書が入ったtextファイルを作成 MeCab へ医療用辞書 ComeJisyo を設定 MeCab で分かち書く word2vec で学習 word2vec を利用 浅い浅い考察と感想 医療文書が入ったtextファイルを作成 今回は精度を比較するために、2つのテキストを用意した。 一つ目は word2vecでは鉄板の大量の単語があるWikipediaのデータから、もう一つは医療系文書のデータを使用した。 1.Wikipediaのテキストファ

    Word2Vec, MeCab, ComeJisyo で病気の症状類似語を出してみた - Qiita
    takuti
    takuti 2017/12/19
  • 協調フィルタリングで声優の流行を可視化する - Qiita

    出演者が大勢いる声優イベントに参加すると、当然自分が知らない声優さんもいらっしゃいます。そんな時、出演者の立ち位置や評価を俯瞰できるといいなーと思うことがあったので、簡単に作ってみました。 大体以下のようなテーマで取り組みました。 ある声優がどのようなクラスタに属していて誰に支持されているのかがわかる その声優の流行がわかる 1.は声優とファンのインタラクションを利用して声優をベクトル化できればクラスタリングもできそうなので、レコメンド系の手法をベースにします。2.は時刻に関する情報なので、時系列拡張したレコメンドアルゴリズムを実装してみました。 データ ユーザーと声優の関係データを用います。声優イベント管理ツールであるEventernoteは、気になる声優をお気に入り登録する機能を提供しています。今回はこのデータを拝借しました。 基的なレコメンドはユーザーとアイテムの関係のみを入力しま

    協調フィルタリングで声優の流行を可視化する - Qiita
    takuti
    takuti 2017/12/19
  • 更新頻度の多いデータのキャッシュ : DSAS開発者の部屋

    @methane です。 ISUCON 7 戦で最大のスコアアップできたポイントが、 status と呼ばれる重い計算の結果となるJSONのキャッシュでした。 近年のISUCONによくある、「更新が成功したら以降のレスポンスにはその更新が反映される必要がある」(以降は「即時反映」と呼びます)タイプの問題だったのですが、今回のように更新頻度の高くかつ即時反映が求められるデータをキャッシュする方法について、より一般的に解説しておきたいと思います。 即時反映が不要な場合 まずは基として、即時反映が不要な場合のキャッシュ方法からおさらいします。この場合、一番良く使われるのは参照時に計算した結果を Memcached などにキャッシュし、時間で expire する方法です。 このタイプのキャッシュには、参照元が分散している場合(Webサーバーが複数台あるなど)に Thundering Herd

    更新頻度の多いデータのキャッシュ : DSAS開発者の部屋
    takuti
    takuti 2017/12/19
  • Oh, shit, git!

    Git is hard: screwing up is easy, and figuring out how to fix your mistakes is fucking impossible. Git documentation has this chicken and egg problem where you can't search for how to get yourself out of a mess, unless you already know the name of the thing you need to know about in order to fix your problem. So here are some bad situations I've gotten myself into, and how I eventually got myself

    takuti
    takuti 2017/12/19
    オチがいい(年に2回くらいやる
  • Welcome to WWW8

    Welcome to WWW8. The website where you get your questions about web design, web development and best practices answered by professionals. All answers are written by people who have atleast 10 years of professional experience in a relevant field. We want to make sure that the answers we provide are easy to understand and easy to implement. Do you have a question that you want us to answer? If so yo

    Welcome to WWW8
    takuti
    takuti 2017/12/19
  • ハッシュ木 - Wikipedia

    バイナリハッシュ木の例 暗号理論および計算機科学において、ハッシュ木(Hash tree, ハッシュツリー)またはマークル木(Merkle tree)とは、全ての葉ノードにデータブロックのハッシュ値がラベル付けされ、内部ノードには、その子ノードのラベルのハッシュ値がラベル付けされている木構造である。ハッシュ木を使用すると、大規模なデータ構造の内容を、効率的かつ安全に検証することができる。このデータ構造はハッシュリストとハッシュチェインの組み合わせでできている。 特に、ハッシュ関数にTigerを使用したものはTiger TreeまたはTiger Treeハッシュとも呼ばれる。 ハッシュ木は、単独または複数のコンピュータで保存・処理・転送される任意のデータの検証処理に利用できる。現在の主な用途としては、Peer to Peerネットワークにおいて他のピアから受信したデータブロックが破損したり改

    ハッシュ木 - Wikipedia
    takuti
    takuti 2017/12/19
  • Merkle tree - Wikipedia

    An example of a binary hash tree. Hashes 0-0 and 0-1 are the hash values of data blocks L1 and L2, respectively, and hash 0 is the hash of the concatenation of hashes 0-0 and 0-1. In cryptography and computer science, a hash tree or Merkle tree is a tree in which every "leaf" node is labelled with the cryptographic hash of a data block, and every node that is not a leaf (called a branch, inner nod

    Merkle tree - Wikipedia
    takuti
    takuti 2017/12/19