2024年3月27日のブックマーク (4件)

  • 世界の春日プロジェクトで出た英会話チャンクビンゴ一覧が勉強になる - VTRyo Blog

    オードリー春日が一年間かかさず英語の勉強をした成果が放送されました。 www.nhk.jp 最初は語彙力も文法もバラバラだったところから、実際に渡米して面倒なハンバーガー注文ができるようになっています。 その前に、日で観光客にインタビューして「これまで学んできたチャンクを使ってこい」というロケ。 このときに使われていたチャンクが雑談とかで使えそうなので文字起こししてみることにしました。 Kasuga's Chunk Bingo 〜でつながっている文章の訳は、春日がロケしていた文脈で解釈しています。※勝手に訳してるのでニュアンスに違いがあったら遠慮なく指摘してほしいです。 Is this your first time in Japan? 日ははじめてですか? Just go straight down this road. この道をまっすぐ行ってください Sounds good. いい

    世界の春日プロジェクトで出た英会話チャンクビンゴ一覧が勉強になる - VTRyo Blog
  • 入社4ヶ月目で73時間かかるバッチ処理を7倍以上高速化した話 - エムスリーテックブログ

    こんにちは。エンジニアリンググループの武井です。 私は現在、デジカルチームに所属し、クラウド電子カルテ、エムスリーデジカルの開発に携わっています。 昨年夏にエムスリーに入社し、早くも半年が経過しました。 digikar.co.jp この記事では、私が入社してから4ヶ月目に取り組んだ、バッチ処理の運用改善について振り返ります。 特に、新しくチームに加わったメンバーとして意識した点に焦点を当ててみたいと思います。 これから新しいチームに参加する方の参考になれば幸いです。 改善したバッチ 現状の正確な理解 現状に馴染む技術選定 自分なりの+αを加える 改善の結果 We're hiring 改善したバッチ 今回の改善対象は、特定の医療機関に紐づく全患者の全カルテをPDFファイルとして出力する、というバッチです。 デジカルのデータを医療機関側にエクスポートする用途で使われています。 移行前のアーキテ

    入社4ヶ月目で73時間かかるバッチ処理を7倍以上高速化した話 - エムスリーテックブログ
  • Jaccard係数に基づく類似文書検索の高速化技法 - LegalOn Technologies Engineering Blog

    こんにちは、LegalOn Technologiesでエンジニアをしている神田(@kampersanda)です。 記事では、Jaccard係数に基づく類似文書検索の高速化技法を解説し、契約書検索での実験結果を報告します。 背景と目的 共起に基づく類似文書検索の必要性 契約書検索での注意点 記事の目的 準備 表記 Jaccard係数 Overlap係数との関係 問題設定 線形探索による解法 高速化の方針 Length Filtering Position Filtering 高速化のための要素順序 アルゴリズム 転置索引を使った解法 基的なアイデア Prefix Filteringに基づくトークンの絞り込み 高速化のための要素順序 アルゴリズム 実験 データセット 統計量 Length Filterの検出率に関する結果 検索時間に関する結果 おわりに メンバー募集中!! 背景と目的 共

    Jaccard係数に基づく類似文書検索の高速化技法 - LegalOn Technologies Engineering Blog
  • Pydanticを活用してCSVファイルを型安全に扱う - RevComm Tech Blog

    RevCommでバックエンド開発をしている小門です。 最近、CSVファイルのアップロードを受け付けて処理するバックエンドAPIの機能開発を担いました。 CSVファイルのパース、バリデーションにPydanticが便利でしたので紹介したいと思います。 なお開発言語はPython、コードの動作バージョンは以下です。 Python 3.12 Pydantic: 2.6.0 PythonCSVファイルの取り扱い Pythonでは組み込みモジュールcsvを使うことで基的なCSVファイルの読み取り・書き込みができます。 # persons.csv の例 """ "name","age" "alice",20 "bob",21 """ import csv with open("persons.csv", newline="") as csvfile: reader = csv.DictReader(

    Pydanticを活用してCSVファイルを型安全に扱う - RevComm Tech Blog