タグ

2022年4月27日のブックマーク (3件)

  • TOEICを600点から940点に上げた7つのコツ|議論メシ編集部

    ここでは下記3点メリットがあります! ①掲示板note書き方やkindleの売り方を相談することが出来ます! ②今まで出版したが読み放題! ③週4回のメンバー限定記事投稿! 是非皆様の創作にお役に立てれば幸いです!

    TOEICを600点から940点に上げた7つのコツ|議論メシ編集部
    sh19910711
    sh19910711 2022/04/27
    "TOEIC / リスニング: 問題を聴く前に設問を読む: 最初の放送は無視して3問の設問及び選択肢の先読み / 『品詞・文法・語彙』が問われる内容: 全部読まなくて良い + ___の直前 / リーディング: 「設問→文書→選択肢」の順"
  • バッチ処理系の刷新とArgo Workflow移行

    これはPTAアドベントカレンダーの7日目の記事です。 5年間運用されてきたバッチ処理系を刷新し、Argo Workflowを用いたバッチ処理系に移行したのでその紹介記事です。 背景 GKE上でバッチ処理のワークロードを実行しており、ワークフローエンジンとしてDigdagを採用していました。ユースケースとしては定期実行のバッチ処理、ETL、機械学習等。 Digdagを用いたワークフロー定義はシンプルかつ運用に必要な機能を提供してくれています。実際のワークフロー内部の処理としては、ワークフローの各タスクにおいては基的にはロジックは持たずKubernetes Jobの実行のみを行います。そのためにDigdagとKubernetes Job間で協調動作するための仕組みが独自で用意されていました。このようなバッチ処理系が約5年程運用されてきました。 この仕組で今まで元気に動いてはいたのですが次のよ

    バッチ処理系の刷新とArgo Workflow移行
    sh19910711
    sh19910711 2022/04/27
    Digdag => Argo Workflow (2021) / "ワークフロー定義のコード行数が82%削減 / Kustomize: Argo Workflowマニュフェストの構成管理 / 振る舞いに関する入力はWorkflowから渡す + Workflow起動時に渡す > コード内で現在時刻を取得し使わない"
  • 検索エンジンPyTerrierを使った日本語検索パイプラインの実装 - エムスリーテックブログ

    エムスリーエンジニアリンググループ AI機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。検索とGoが好きです。 今回は社内でPyTerrierを採用して文書検索BatchをPythonで実装したので、PyTerrierの紹介とPyTerrierで日語検索を実装する方法を紹介します(日語でPyTerrierを扱う記事は多分初?)。 PyTerrierとは 弊社でのPyTerrier利用 PyTerrierで日語検索 Phrase Queryの注意点 まとめ We're hiring !!! PyTerrierとは Terrierのロゴ PyTerrierは、Pythonでの情報検索実験のためのプラットフォームです。 JavaベースのTerrierを内部的に使用して、インデックス作成と検索操作を行うことができます。基的なQuery RewritingやBM

    検索エンジンPyTerrierを使った日本語検索パイプラインの実装 - エムスリーテックブログ
    sh19910711
    sh19910711 2022/04/27
    "PyTerrier: 情報検索実験のためのプラットフォーム / パイプラインを演算子で構築できるのが特徴 > pipeline = (tfidf % 100) >> bm25 / PandasのDataFrameをそのままインデックスするインターフェースが用意されているので便利"