タグ

2020年4月30日のブックマーク (6件)

  • Elasticsearchのベクトルフィールドをテキスト類似性検索に活用する

    テキスト埋め込みとは?さまざまなタイプのテキスト埋め込みについて詳しく検討し、従来型の検索アプローチと比較してみましょう。 テキスト埋め込みテキスト埋め込みモデルは、単語を密な数ベクトルとして表現します。これらのベクトルは、単語のセマンティックな(意味論上の)プロパティを捉えるためのものです。単語のベクトルが相互に近ければ、セマンティックな意味でも類似している、ということになります。すぐれた埋め込み技術において、ベクトル空間の各方向性は、その単語の異なる側面に結び付いています。たとえば、“カナダ”のベクトルは、ある方向性では“フランス”に近い可能性があり、別の方向性では“トロント”に近いかもしれません。 NLPと検索のコミュニティは、このような語のベクトル表現に長年関心を寄せてきました。この数年で、多くの従来型のタスクがニューラルネットワークを使って再考されたことに伴い、テキスト埋め込みへ

    Elasticsearchのベクトルフィールドをテキスト類似性検索に活用する
  • Sentencepiece : ニューラル言語処理向けトークナイザ - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 少し時間が経ってしまいましたが、Sentencepiceというニューラル言語処理向けのトークナイザ・脱トークナイザを公開しました。MeCabやKyTeaといった単語分割ソフトウエアとは趣旨や目的が異なるソフトウェアですので、少し丁寧にSentencepieceの背景、応用、実験結果等をお話したいと思います。 サブワード ニューラル言語処理の中心となる要素技術にLSTM (RNN)があります。テキスト(トークン列)を低次元のベクトルに符号化したり、ベクトルからテキストを復号化したり、その応用範囲は多岐にわたります。ニューラル機械翻訳 (N

    Sentencepiece : ニューラル言語処理向けトークナイザ - Qiita
  • SentencePieceをpythonスクリプトから使ってみる

    こんにちは、ぐぐりら(<a href="https://twitter.com/guglilac">@guglilac</a>)です。 modelの学習はコマンドラインからやるのが普通、みたいな記事をみましたが、pythonからでもできるのでそちらでやります。 他の記事ではわざわざsubprocessを使ったりしていますが、普通にpythonライブラリにtrainerを用意してくれているのでありがたく使えばよいです。 日語の記事がなかったので一応書きます ## sentence pieceとは 文章をいくつか区切ってそれらを機械学習モデルにわせる、みたいなことはよくやります。 MeCabを使って形態素解析するのがよくやられる手法です。 Mecabでは対応する辞書を使って文章を分割します。辞書にはneologdとかがよく使われます。 これでも上手くいくことも多いですが、語彙数が大きくなっ

    SentencePieceをpythonスクリプトから使ってみる
  • 障害対応時にまずはissueを作ると良い - そーだいなるらくがき帳

    先日のAmazon SQSの障害には色々と肝を冷やした人も多いのではないでしょうか。 classmethod.jp 今回のようなケースとは別に障害は大小あれど、みなさん日々戦っていることだと思います。 障害対応はエンジニアの花形であるものの、サービスに対する知識やソフトウェアの知識など経験と技術の両方が必要です。 そのため、どうしてもトラブルシューティングはエースエンジニアなどの一部の人に依存してしまう…などの問題が発生しがちです。 そこで今日は私の経験から障害対応のいろはを書いて行きたいと思います。 今回のスコープの外 実際に障害時の具体的な対応、例えば障害切り分けやRDBMSのボトルネックの探し方などの話はしません。 まずissueを作ると良い 題です。 トラブルを認知したらまずはissueを作りましょう。 issueを作るときはtemplateが事前に設定されていると便利です。 g

    障害対応時にまずはissueを作ると良い - そーだいなるらくがき帳
    f-suger
    f-suger 2020/04/30
  • WebStorm 2020.1: 外観の改善、Vuex のサポート、保存時の Prettier 実行など | Post Blog

    IDEs AppCode CLion DataGrip DataSpell Fleet GoLand IntelliJ IDEA PhpStorm PyCharm RustRover Rider RubyMine WebStorm Plugins & Services Big Data Tools Code With Me Quality Assurance JetBrains Platform Scala Toolbox App Writerside JetBrains AI Grazie Team Tools Datalore Space TeamCity Upsource YouTrack Hub Qodana .NET & Visual Studio .NET Tools ReSharper C++ Languages & Frameworks Kotlin Ktor MPS Am

    WebStorm 2020.1: 外観の改善、Vuex のサポート、保存時の Prettier 実行など | Post Blog
    f-suger
    f-suger 2020/04/30
  • Goのアーキテクチャとフレームワークについて - pospomeのプログラミング日記

    社内slackGoについて質問されて、それなりに長文で回答したのでその内容を加筆修正したものをブログに残しておく。 質問内容としては以下のイメージ。 RubyだとRailsがあり、MVCを利用することになるが、Goだとそこらへんはどうなるのか? Go初心者なのでGoのモダンなアーキテクチャとフレームワークについて教えて欲しい。 これ系の質問はGo経験者であれば「あーこれなー」と思うだろーし、 Go初心者のときに一度は悩んだことがあるだろう。 なので、個人的な意見を残しておく。 自分の意見が正しいかどうかは自己判断して欲しい。 結論 アプリケーションアーキテクチャの複雑化とMVCフレームワーク システムアーキテクチャの複雑化とフルスタックなフレームワーク マイクロフレームワーク 改めて質問内容を振り返る pospomeが考えるGoのフレームワーク選定 pospomeが考えるGoのアーキテク

    Goのアーキテクチャとフレームワークについて - pospomeのプログラミング日記