タグ

PythonとDockerに関するSyunpeiのブックマーク (3)

  • Python使いがLibraを爆速で試してみる(行けるところまで) - Qiita

    はじめに LibraとはFacebookが開発している仮想通貨。Facebook、VISA、Uber、Spotifyなどが参加するリブラ財団を後ろ盾として持ち、法定通貨と連動するステーブルコインということで、他の仮想通貨とは一線を画している感があります。最近は、仮想通貨系の勉強会でもLibraの話題になると参加者が何割増しかになるみたいですし(笑) 2020年のリリースを予定しているとのことですが、米政府からも懸念を示されていたりして実際にどうなるのかはもう少し経たないとわかりません。一方で、純粋に技術的な観点でLibraを見た場合、幾つか興味深い点が有るようです。まずはその手始めとして「触ってみる」というのをやってみたいと思います。 Libraを試す Libraを試したい場合、家サイトの通りにやればほぼ問題なくできるでしょう。ただ、Rustで書かれたソースgit cloneしてRust

    Python使いがLibraを爆速で試してみる(行けるところまで) - Qiita
  • Elasticsearchで分散表現を使った類似文書検索

    概要 Elasticseachに分散表現のベクトルに対する類似文書検索が実装されたということで、以下のElasticのブログ記事を参考に類似文書検索を試してみました。 Text similarity search in Elasticsearch using vector fields | Elastic Blog 類似文書検索とは、与えられたクエリの文書と似ている文書を文書集合内から検索する技術です。この際に必要となるのが「似ている」という概念で、計算機上でどうやって2つの文書間の類似度を数値として表現するかがポイントになります。例えば、互いの文書に出現する単語の一致度や重複度合いを測ったり、TF-IDFやBM25などで文書をベクトル化して比較する方法があります。ただしこれらの方法では、言い換え表現や表記の違いにより同じ意味の単語が異なる単語だと判定されたり、文書の中では重要でない単語に

    Elasticsearchで分散表現を使った類似文書検索
  • 機械学習案件を納品するのは、そんなに簡単な話じゃないから気をつけて - Qiita

    はじめに 昨日のTwitterで書いたこちらが非常に反響を呼びました。 半年間かけたデータ解析の仕事が全くうまくいかなかった 今回の失敗は契約書に納品物を明記していなかったこと 機械学習の依頼は学習済みモデルのファイルを納品しただけでは、先方は検収できず、結果支払いを受けられない この教訓をひとりでも多くの人に知ってもらいたい — キカガク代表 吉崎亮介 (@yoshizaki_kkgk) 2017年11月20日 そうなんですよね。 全く先方が悪いわけでもなく、私自身が「機械学習のお仕事=解析」だと思いこんでいたことが失敗の始まり。 結局のところ、機械学習系のプロダクトを依頼されて、学習済みモデルを作成して即納品とはいかず、検証結果を示されないと検収できないよとなってしまうので、結局アプリケーション側まで組み込まないと納得感はないんですよね。 この検証とは、訓練データと検証データを分けた時

    機械学習案件を納品するのは、そんなに簡単な話じゃないから気をつけて - Qiita
  • 1