yag_aysのブックマーク / 2022年11月5日

yag_ays id:yag_ays

2022年11月5日のブックマーク (6件)

yamlについて思うこと
yaml、どうしてこんなに使われているのだろうか。kubernetesにも責任があるというのはありそうな話だけど、色々考えてみるとそこまで簡単な話でもなさそうな気がする。例えばtravis-CIの設定ファイルがyamlであったりというように、この分野ではyamlは割と広く使われていたんじゃないかという気がする。思い起こせばGoogle AppEngineもapp.yamlに設定を書いていたし、設定にyamlというのは割とよくあることであった、のではないかなあ。しかしなぜyamlなんだろうか。yamlのフォーマットには問題がたくさんあることが知られているし、自分も全く好きではない。例えばyamlの問題の一つとして、キーに任意のデータ構造を持ってこれるという話があり、これが一部のプログラミング言語で問題を厄介にしている。またエイリアスがあってデータ構造がツリーにならない（複数の経路から同じ
yag_ays 2022/11/05
リンク
Twitterの話題はMailbrewで収集する - chroju.dev
ここ数年、Twitterを見る時間はなるべく減らすようにしていて、通知は受け取らないようにしているし、見る場合も「タイムライン」ではなくて必要最低限に絞ったリストを使うようにしたりなど、いろいろ工夫している。それでもTwitterを完全に見ない、というのもなかなか難しくて、あれの良いところとしては「なんとなく眺めていると今話題になっていることがわかる」という点がある。炎上ネタなどはどうでもよいのだが、少しホットになりつつあるセキュリティ事象とか、最近この技術に言及されている機会が多いな、だとか、そういったことはRSSなど他の手段だと収集が難しい。もちろん、それが本当に必要な情報なのか、という視点はあるとは思うが。以前はこの用途で Nuzzel を使っていた。これはTLやリストで多く言及されているリンクがあると、Slackなどに通知してくれるサービスで、「話題」をキャッチする上で重宝して
yag_ays 2022/11/05
リンク
Mailbrew - Your personal email digest
Your personal daily digestThe links you can't miss, the best content from your favorite creators and newsletters, in a daily em ail digest.
yag_ays 2022/11/05
リンク
Machine Learning in Production: Why You Should Care About Data and Concept Drift
yag_ays 2022/11/05
リンク
今日 Twitter 日本法人を解雇された皆さんへ #OneTeam - The Decisive Strike
Twitter #OneTeam の皆さん、こんにちは。昨年まで Twitter (Scaled Enforcement Heuristics, Health Engineering) で Data Scientist として働いていた Kazushi と言います。 Elon Musk によって解雇された皆さん、おつかれさまでした。これから転職先を探す方もいらっしゃると思います。しかしその前に、まだ自分以外にこの点について公に言及されている方がいらっしゃらないようなので、簡単にブログに書いておきます。これは不当解雇であり、法廷で争うべきことです。労働者の庇護が日本ほど手厚くないアメリカでも、訴訟が起こっています。戦いましょう。今日解雇された Twitter 日本法人社員も不当解雇として法廷で争って欲しい。整理解雇要件を満たすのは難しいはず。 https://t.co/mscQURXi70
yag_ays 2022/11/05
リンク
BigQueryによる最大内積検索の実装
はじめに機械学習エンジニアの本田志温です。最近担当した類似アイテム推薦の案件で、BigQueryを使って最大内積検索（MIPS; maximum inner-product search）1 を実装したので、その方法と高速化のテクニックを紹介します。類似アイテム推薦は「多数のアイテム候補から、クエリとなるアイテムに最も類似したK件を抽出する」というタスクなので、MIPSないし近傍探索の枠組みで解くことが一般的です。一定の規模を持つサービスでMIPSを実装しようとすると、アイテム数×特徴量次元の行列が何かと厄介です2。第一に、MIPSを素朴な行列積で実装すると、時間・空間計算量がアイテム数の2乗でかかってきます。典型的には空間計算量の方がボトルネックになりやすく、RAMの制約に収めるための工夫が必要になるでしょう。第二に、アイテム数が膨大な場合、特徴量マートから全アイテムの特徴量を転送
yag_ays 2022/11/05
リンク
- 2022年11月6日
- 2022年11月5日
- 2022年11月4日