yanbeのブックマーク - はてなブックマーク

iTermをやめてVSCodeのターミナルに寄せる - yasuhisa's blog

背景担保したいこと 1: ホットキーで一撃で呼び出せる 2: ウィンドウを透過させてターミナルと他のウィンドウを同時に眺められること調査したこと & 解決方法ホットキーで呼び出せるか => hammerspoonで割り当てで対応ターミナルの透過 => 無理そうなので、代替手段で対応メモ: ターミナル関係のキーバインド tmuxっぽくしたいその他キーバインド背景 iTermをずいぶん長く使ってきたけど*1、VSCodeのターミナルが急速に進化しているので、乗り換えを検討した。 VSCodeが色々便利になってきた自分が使っている範囲だと、vimキーバインドも特に問題ない*2 普段のコーディングはVSCode、コマンド操作くらいしかiTermは使っていない特にCopilot系の進化は目覚ましい、長い物には巻かれろというか長期的にはエコシステムに乗っておきたいエディタだけでなく

yanbe 2024/03/04

リンク

dbtで見やすいER図を生成する - yasuhisa's blog

背景: dbtを使っていてもER図は欲しい! どうやってER図を生成するかどうやってER図を見やすくするかまとめ背景: dbtを使っていてもER図は欲しい! dbtはモデル間のリネージなど可視化が得意なツールではありますが、万能なわけではありません。モデルの生成過程などはリネージで担保できますが、分析時に「どれとどのモデルがJOINできて、JOINする際のキーはこれを使って」というER図で扱うような可視化はディフォルトではできません。 DWHを作っている側からすると「このテーブルはあの辺のテーブルと一緒に使うと便利で、いつもあのキーでJOINして」というのが頭の中に入っていることが多いため、ER図がなくてもどうにかなることも多いでしょう。しかし、分析に慣れていない人や分析に慣れている人であっても、普段と異なるドメインのテーブルを触るときはER図が提供してくれる情報は有用です。ちなみに

yanbe 2024/02/04

dbt

リンク

dbtのモデルとLooker Studioのレポートの依存関係をexposureで表現して、データ管理を効率的に行なおう - yasuhisa's blog

シリーズの第三弾です。読者の宿題にしてたけど、誰も書いてくれなさそうだったので結局自分で書きました。背景 Looker StudioはGoogle Workspaceを使っていれば基本的に無料で使えますし*1、権限管理にGoogle Groupとも連携できるので、人気のBIの一つだと思います。私が初めて触ったBIもLooker Studioだったので、(API強化して欲しいとか不満は山のようにありつつも)何だかんだで憎めないし、さっとダッシュボード作りたいときはLooker Studioを使うことが多いです。会社によっては社内の公式のダッシュボードをLooker Studioで作っているところもあると思います。 dbtで作ったテーブルがConnected Sheetsから参照されている場合、一定程度利用されているスプレッドシートからのテーブルの参照状況はデータ基盤を管理する人間としては把

yanbe 2024/01/21

dbt

リンク

dbtで管理しているデータの可用性をelementaryで分析する - yasuhisa's blog

データの可用性を可視化したいデータの可用性の解像度を上げたい: elementary-data elementaryによる細かい可視化大雑把にデータセット単位で可用性を可視化したいまとめデータの可用性を可視化したいデータ品質は正確性や最新性など様々な項目に分解することができますが、可用性(Availability)はその中でも基礎的な項目です。使いたいときにデータが使えないと困るので。自分が所属しているチームはdbt(cli)およびdbt cloudを使っていますが、可用性を考えるのであれば cli: dbt runの実行結果 dbt cloud: Jobsの実行結果をそれぞれ確認したり、こけているようであればアラートを飛ばすという運用が多いと思います。これだけだと「いつこけた」しか分からないので、Datadogを使って「いつこけた」「いつ復旧した」「こけて落ちていた時間はど

yanbe 2023/09/16

リンク

dbt-osmosisを利用して、なるべくコストを抑えつつ効率的にメタデータ管理を行なう - yasuhisa's blog

3行まとめビジネスメタデータはデータ生成者にとってもデータ活用者にとっても重要しかし、カラムのメタデータを同じ説明をあちこちに書いていくのは大変... dbt-osmosisはビジネスメタデータの管理を省力化したり、自動化できる便利なツール 3行まとめ背景: メタデータの重要さとメタデータ管理の大変さ大変さ1: 多段のデータレイヤーにどうメタデータを付与していくか大変さ2: 継続的な運用をどうするか dbt-osmosisでメタデータ管理を行なう依存関係を考慮したメタデータの伝播自動化による継続的な運用基本的な使い方使ってみた感想背景: メタデータの重要さとメタデータ管理の大変さデータマネジメントにおいてメタデータの重要性は今さら説明するまでもないと思います。メタデータは以下の3種類が代表的です。 A: テクニカルメタデータ B: オペレーショナルメタデータ C: ビ

yanbe 2023/08/16

リンク

データエンジニア / Analytics Engineer向けの権限管理のためのTerraform紹介 - yasuhisa's blog

これは何? 背景: 権限管理とTerraform 権限管理の対象誰に権限を付与するのかどのスコープで権限を付与するのかどの強さで権限を付与するのか Terraformについて Terraformの概要: 権限管理でTerraformを使うと何がうれしいのか例: roles/bigquery.jobUserを付与してみるコラム: どこでTerraformを実行するか Terraformでの権限管理の例例: データセットの作成例: データセットに対する権限付与サービスアカウントの管理 iam_member関連の注意点: AdditiveとAuthorativeを意識する Terraformで管理されていなかったリソースをTerraform管理下に置く: terraform import Terraformの登場人物 terraform planやterraform applyの

yanbe 2023/03/10

bigquery

リンク

データ活用の関係者に課題感のヒアリングをする時の型を紹介する - yasuhisa's blog

背景: データマネジメントのアセスメントのために各部署に現場の課題感をヒアリングしたい課題: よいヒアリングをするのは簡単ではない解決案: ヒアリングの型を決めるヒアリングの質問とリサーチの質問を別々に持っておくヒアリング対象者について事前に理解を深める全員に同じ項目を聞かない & 全体のカバレッジも担保するその場で問題解決を始めないまとめ参考背景: データマネジメントのアセスメントのために各部署に現場の課題感をヒアリングしたいデータガバナンスを強化したいときにアセスメント(データマネジメント成熟度アセスメント)をやる人は多いと思う。データ基盤やデータに強い人だけでアセスメントをやって「えいや!!」と優先度を決めるのも一つの手ではある。しかし、データを通じてユーザーに価値を届けるということまで考えると、データ活用に関わる幅広い職種の現場へヒアリングに行くことが、データ

yanbe 2022/11/21

interview

リンク

実タスクで能動学習を試してみた - yasuhisa's blog

実タスクで簡単な能動学習を試してみました。結論としては、1200件で到達できる精度に400件程度のアノテーションでも到達でき、それによりアノテーションに要する時間をかなり削減できそうということが分かりました*1。今後、アノテーションを必要とする機械学習タスクをやる際には能動学習で一手間かけるのを検討してみようと思います。能動学習をする動機ここしばらく仕事のタスクで機械学習の教師用のデータをアノテーションをする機会がありました。機械学習する上で、1000件程度は学習データ欲しいという想定でポチポチとアノテーションをしていました。一人1時間で大体100件くらいのデータが作れるようなタスクでしたが、1000件アノテーションするには約10時間の作業工程が必要です。アノテーション自体よりはコードを書いたり実験するのが好きな人間なので、5時間くらいずっとアノテーションしていると疲労します。同じ精度

yanbe 2016/10/11

リンク

面白そうと思いつつ読めてない論文達 - yasuhisa's blog

自分用メモ。今は読んでる場合じゃないのだけれど(誰か紹介して)、どっかにメモっとかないと忘れる論文。"かなり"重要そうなのをピックアップしてある。 Painless Unsupervised Learning with Features (pdf, presentation) Parsing Natural Scenes and Natural Language with Recursive Neural Networks (pdf) Joint Parsing and Alignment with Weakly Synchronized Grammars (pdf, presentation) Type-Based MCMC (pdf, presentation) Distance Dependent Chinese Restaurant Processes (pdf) というかまだ読ん

yanbe 2011/07/26

リンク

はてなブックマーク

タグ

ブックマーク / www.yasuhisay.info (9)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第5週）

今週のはてなブックマーク数ランキング（2024年6月第4週）

今週のはてなブックマーク数ランキング（2024年6月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス