yasuhisa's blog[B!]人気記事・評価 - はてなブックマーク

今年よかった習慣: ライフログ収集および可視化 - yasuhisa's blog

583 users

www.yasuhisay.info

データを眺めるのが好き収集している情報実現方法データから分かった知見(?) 今後年末なので、今年買ってよかったものに引き続き、今年やってみてよかった習慣について書いてみたいと思います。データを眺めるのが好き昔からデータを眺めるのは好きだったんですが、今年の5月くらいから自分に関するデータをとにかく収集してみました。可視化することで何か有益な視点だったり、生活の改善点が見つかるのではないか、という目的です。色んなデータを集めまくった結果、以下のようなグラフができあがります。ちょっと画像が小さいですが、毎日の歩いた歩数や体重、気温、録画した番組名、自宅マシンの負荷状況などが載っています。収集している情報上の画像ではとりあえずBlogに上げれるようなデータしか見せていないですが、収集している情報としては以下のようなものがあります。使用しているスクリプトで公開できるものはgithu

テクノロジー
2015/12/21 00:12

機械学習をプロダクトに入れる際に考える採用基準について - yasuhisa's blog

463 users

www.yasuhisay.info

サービスに機械学習技術(例えばSVM)を入れる際に、「この機械学習技術は本番サービスに投入しても大丈夫なものか?」を考える基準がまとまっていると人に説明するときに便利だなとふと思ったのでまとめてみました。散々言われ尽くされている話だとは思います。前提考慮に入る採用基準予測精度 (コードの)メンテナンスの容易性計算オーダー学習時予測時挙動のコントロールのしやすさ/予測説明性の容易さチューニングの必要性その他まとめ前提機械学習がプロダクトの主要な武器になる(例えば最近話題になっているGoogle翻訳におけるNMT)ものではなく、サービスにデータがまずあり、機械学習でデータを活用することにより、そのサービスを支えていくようなものを前提に考えています(例えばCGMサービスのスパム判定)。また、投稿内容は私個人の意見であり、所属組織を代表するものではありませんとお断りしておき

テクノロジー
2016/11/21 08:30

Google機械翻訳の仕組み&できるようになったこと/まだ難しいことについて、社内の機械学習勉強会で説明します - yasuhisa's blog

432 users

www.yasuhisay.info

社内の機械学習勉強会で最近話題になった機械学習関連のエントリを取り上げているのですが、ここ一ヶ月ではGoogle Neural Machine Translation(GNMT)がとても話題になっていました。GNMTで使われているEncoder-Decoderやattentionのような仕組みを直近で使う予定は特にはないですが、機械学習を使うエンジニアとして知っておいて損はないし、技術的に何が変わったことにより何ができるようになって、何はまだできないのかを知ろう、というのが目的です。技術的な項目は興味ない人も多そうなので、最後に持っていきました。 Google Neural Machine Translation(GNMT)の最近の進化についてできるようになったこと定量的な評価まだまだ難しいこと技術的な詳細 Encoder-decoder Attention based encod

テクノロジー
2016/11/23 22:04

Looker Studioの魅力と便利な使い方を紹介します - yasuhisa's blog

410 users

www.yasuhisay.info

初めて使ったBIツールはLooker Studioのid:syou6162です。これまでTableau / Looker(≠ Looker Studio) / Metabase / Redash / Connected Sheetsなど色々なBIツールを触ってきましたが、不満は色々ありつつも個人的に一番しっくりきて愛着があるのはLooker Studioです。このエントリでは、その魅力と便利な使い方や注意点について書きます。例によって、社内勉強会向けの内容を外向けに公開しているため、内容の網羅性などは特に担保していないことにご注意ください。 Looker Studioの魅力利用のハードルが限りなく低い & Google Workspaceとの連携が便利複雑過ぎることができないので、諦めが付けやすいちゃんとBIツールになっている Looker Studioの便利な使い方多様なデータソ

テクノロジー
2024/07/22 08:28

はてな社内の勉強会で構造学習について発表しました - yasuhisa's blog

326 users

www.yasuhisay.info

先週末、はてな社内の勉強会で構造学習、特に実装が簡単な構造化パーセプトロンについて発表しました。発表資料と説明用にサンプルで書いたPerlの品詞タグ付けのコードへのリンクを張っておきます。今日からできる構造学習(主に構造化パーセプトロンについて) from syou6162 structured_perceptron/structured_perceptron.pl at master · syou6162/structured_perceptron 「えっ、Perlかよ」という人がいるといけないので、Clojureで構造化パーセプトロンを使った係り受け解析のサンプルコードへのリンクも張っておきます(2種類あります)。PerlもClojureもあれば8割くらいの人はカバーできそうなので、安心ですね。 syou6162/simple_shift_reduce_parsing syou616

テクノロジー
2016/06/27 08:32

データ分析を元にFAQサイトを継続的に改善する - yasuhisa's blog

242 users

www.yasuhisay.info

FAQサイト、サポート問い合わせをせずとも自分で疑問を解決できて便利ですよね。でも、検索した単語が一件もヒットしないと、ちょっとガッカリしてしまします。そういったガッカリを減らすために、簡単なデータ分析を使ってFAQサイトを継続的に改善する話を書いてみます。 ...というのも、自分が仕事で関わっているMackerelでは最近FAQをリニューアルしたからなのでした。 MackerelのFAQではZendesk Guideを利用していますが、Zendesk Guideは便利なAPIが用意されているので、それと既存のデータ基盤を組み合わせて改善していく形です。 FAQサイト内の検索語を列挙するまず、FAQサイト内でどういった単語が検索されているのかを列挙します。Google Tag Manager経由でFirebase Analyticsにデータを飛ばすと閲覧状況が分かりますが、そのログをBi

テクノロジー
2020/07/09 17:32

KaggleのCTR予測コンペで上位10%に入るまでの試行錯誤 - yasuhisa's blog

234 users

www.yasuhisay.info

週末KagglerとしてavazuのCTR予測コンペに参加しました。Kaggleは機械学習版のISUCONだと思ってもらえばよいです。コンペ自体は終わっているので、late submiteであまり意味はないかもしれません、練習です。leaderboard上で上位10%以内に行けたので、そこまでの試行錯誤をメモしておきます。謎ノウハウ(?)を持っているガチ勢じゃないと上位に行けないものかと思っていましたが、基本に忠実にやればこれくらいの順位(上位7.6%)に行けましたし、他の人の工夫を垣間見えるという意味でも現場の機械学習やり始めたエンジニアにお薦めできそうでした。参加の動機目標感: 頑張りすぎずに上位10%以内に入る試行錯誤 AthenaとRedashによる探索的データ解析ベンチマークをまず超える線形分類器でシンプルな特徴量時系列要素を忘れていて過学習発生特徴量エンジニアリン

テクノロジー
2018/03/18 12:42

社内でKaggleの布教活動をやっている話 - yasuhisa's blog

231 users

www.yasuhisay.info

最近、社内勉強会で機械学習についてエンジニアに説明する機会があり、その際にKaggleについても説明しました。一方でうーん、「Kaggler はパラメータチューニングやアンサンブル等の自明でインクリメンタルな改善『しか』できない」というような誤解はどうやって解いていけばいいんだろう。— im132nd (@im132nd) 2018年4月4日という話もあり、(特にデータサイエンティスト以外の職種の人が)Kaggleをやる意義/メリットについてまとめてみました。ガッと勢いで書いたので、項目に結構被りがあります。なお、書いている本人はKaggleほぼ初心者であまり説得力がないです。Kaggle Masterの人がもっといいエントリを書いてくれるのを期待しています、議論の叩き台エントリです!! Kaggleをやる意義/メリット様々なデータセットを触ることができる kernelでデータ分析の

テクノロジー
2018/04/05 20:17

コロナ禍での転職活動(データエンジニア)についてのメモ - yasuhisa's blog

206 users

www.yasuhisay.info

Twitterでは先に言っていましたが、現職のはてなを3月末で退職します。3/19が最終出社日でした。はてなでの思い出はこちらに書きました。そのため、転職活動をしたわけですが、コロナ禍での転職活動は平常時と異なる部分も結構ありました。また、データエンジニアとしての転職は初めての経験でした。誰かの参考になるかもしれないので、私が考えたことや感じたことをメモ書きとして残しておきます。在宅勤務と就業可能な地域 Web上でのアウトプットデータエンジニアという職種の多様性転職にあたって重視したこと魅力に感じた点当然、不安もある在宅勤務と就業可能な地域カジュアル面談させてもらった企業さんは、ほぼ在宅勤務に移行済みだった隔週や月一で物理出社という会社も半々くらい? 緊急自体宣言が出ていない時期(夏〜秋)にカジュアル面談させてもらったので、今は状況が違うかもカジュアル面談、採用面談もz

テクノロジー
2021/03/21 17:07

dbtで見やすいER図を生成する - yasuhisa's blog

196 users

www.yasuhisay.info

背景: dbtを使っていてもER図は欲しい! どうやってER図を生成するかどうやってER図を見やすくするかまとめ背景: dbtを使っていてもER図は欲しい! dbtはモデル間のリネージなど可視化が得意なツールではありますが、万能なわけではありません。モデルの生成過程などはリネージで担保できますが、分析時に「どれとどのモデルがJOINできて、JOINする際のキーはこれを使って」というER図で扱うような可視化はディフォルトではできません。 DWHを作っている側からすると「このテーブルはあの辺のテーブルと一緒に使うと便利で、いつもあのキーでJOINして」というのが頭の中に入っていることが多いため、ER図がなくてもどうにかなることも多いでしょう。しかし、分析に慣れていない人や分析に慣れている人であっても、普段と異なるドメインのテーブルを触るときはER図が提供してくれる情報は有用です。ちなみに

テクノロジー
2024/02/03 18:54

はてなで働き始めてからほぼ5年になるので振り返ってみる - yasuhisa's blog

170 users

www.yasuhisay.info

そろそろ前職を退職してから、はてなで働き始めて5年(!)が経とうとしている。5年も働いていると、昔何をやっていたか、その当時どういう気持ちで働いていたかを忘れてしまう。備忘録っぽく書き残しておこう。ポエムです、長いです、大体自分向けに書いてる。 NTT CS研 => 株式会社はてなチーム開発への適応インフラ苦手意識の克服教師なし機械学習の本番環境での運用データ基盤とCustomer Reliability Engineerへの挑戦今後はデータエンジニアリング NTT CS研 => 株式会社はてな基礎研究職からWebアプリケーションエンジニアへの転職だった。ログを残しておくと、こういう時に振り返れて便利。 NTT CS研を退職して、株式会社はてなに入社しました - yasuhisa's blog 割と珍しい(?)転職ではあったかもしれないが、機械学習や自然言語処理はアルゴリズム単

テクノロジー
2021/01/15 04:32

AWS Lambdaに入門する - yasuhisa's blog

165 users

www.yasuhisay.info

Amazon Elasticsearch Serviceに引き続き、AWS Lambdaに入門しました。Lambdaを使って、Amazon Elasticsearch Serviceで特定の単語を検索をさせてslackに書き込んでくれるbot君を練習台でやってみました。やりたいこと準備: 適切なポリシーを設定する Goで書いたプログラムをapexを使いAWS Lambdaに転送 Lambda上からAmazon Elasticsearch Serviceで検索 MackerelのAWS連携でLambdaを監視まとめやりたいこと AWS強化月間(?)ということでAmazon Elasticsearch Serviceに入門していました。自宅のElasticsearchとKibanaをAmazon Elasticsearch Serviceに引越し - yasuhisa’s blog

テクノロジー
2017/03/31 08:51

NTT CS研を退職して、株式会社はてなに入社しました - yasuhisa's blog

136 users

www.yasuhisay.info

エイプリルフールも一段落したので、退職&入社エントリを書こうと思います。これまで 3/31付けで前職のNTT CS研を退職しました。CS研には(インターン期間も含め)4年間お世話になりました。 CS研はとても研究する上でよい環境 CS研は研究をする上でかなりよい環境であったと思っていて世界で活躍しているトップの研究者がわらわらいて、日々ディスカッションできる (全くないわけではないですが)雑用が少なく、研究に集中できる研究をする上で必要なリソース(計算機、データなど)が十分にある足りないものやデータ等を新しく作りたい場合は、上長をちゃんと説得すればお金をかけて作ることができる自然言語処理の研究をする上でかなり重要などなど、とても研究しやすい環境です。AAAIやEMNLP、CoNLLなどに行くことができたのもこうしたCS研の環境なしではありえなかったと思います。ここで4年間働けた

テクノロジー
2016/04/03 23:06

昔は苦手だったモブプロを今は推進する側になっていた - yasuhisa's blog

115 users

www.yasuhisay.info

3~4年前はモブプロにめちゃくちゃ苦手意識があったんだけど、最近はなぜか(?)モブプロを推進していく旗振りをしている。モブプロの取り組み自体については今度会社のTech Blogに書く予定だけど、このエントリでは自分の心境の変化にフォーカスを当てる。人間、数年すると割と変わるもんだなぁと思って面白かったので、記録に残しておく。モブプロが苦手だった頃なぜモブプロしようとなったか今はどうモブプロしているか所感モブプロが苦手だった頃前職の開発チームにいた頃(3年前くらい)で、状況はこんな感じ。 7~8人くらいの規模の開発チーム京都と東京でそれぞれメンバーは分かれているが、まだ物理出社している時期だったので、大きなディスプレイに写された自分の画面をみんなが見るスタイル時間は60~90分くらいだったかなタイピストはガンガン交代するスタイルではなく、1回を1~2人のタイピストで回して

テクノロジー
2021/06/13 23:54

異常検知ナイトでLT登壇しました - yasuhisa's blog

109 users

www.yasuhisay.info

機械学習の中でもマイナーなテーマであろう異常検知がテーマの勉強会、異常検知ナイトというイベントでLTの登壇をしてきました。マイナーテーマなのに300人以上が集まる東京怖い。 3ページしかないですが、発表資料も置いておきます(LTのレギュレーションで3ページ5分)。異常検知ナイト LT登壇資料はてな id:syou6162 from syou6162 LTのテーマは、現在自分がどんなデータで異常検知をやっているか、どういう困り事があるかを発表してプロの方からアドバイスをもらおうというものです。Mackerelで今まさに異常検知機能の開発をしていて、時系列周りのモデルのハイパーパラメータを開発データでチューニンングしたいけれども、そもそも異常データを含む開発データって手に入らないことが多くてどう対応していくのがよいのか?という質問をさせてもらいました。プロからのアドバイスは動画で見れるので

テクノロジー
2018/02/16 00:16

Go言語でWebアプリを書くときにオートリロードどうするといいの問題 - yasuhisa's blog

103 users

www.yasuhisay.info

Go言語を書く際、成果物がシングルバイナリになるのは便利です。deployするときや他人に使ってもらうときに、それだけ渡せば使ってもらえるので。cliツールやapiサーバーを書くときにはこの方式で困っていなかったのですが、いわゆるWebアプリをGo言語で書くときのベストプラックティスが分からなかったのでエントリにしておきます。前提 Go言語側は重厚なフレームワークは特に使わない net/httpやhtml/templateといった標準ライブラリを使うフロント側はVue.js シングルバイナリを作るまでの過程以下の過程をMakefileに書いてmake buildとやってシングルバイナリを作っていました。 webpackでJavaScript関係をbundle.jsという感じで一つのファイルにまとめる go-assets-builderを使って、index.htmlやbundle.js

テクノロジー
2018/06/07 21:12

データエンジニア / Analytics Engineer向けの権限管理のためのTerraform紹介 - yasuhisa's blog

96 users

www.yasuhisay.info

これは何? 背景: 権限管理とTerraform 権限管理の対象誰に権限を付与するのかどのスコープで権限を付与するのかどの強さで権限を付与するのか Terraformについて Terraformの概要: 権限管理でTerraformを使うと何がうれしいのか例: roles/bigquery.jobUserを付与してみるコラム: どこでTerraformを実行するか Terraformでの権限管理の例例: データセットの作成例: データセットに対する権限付与サービスアカウントの管理 iam_member関連の注意点: AdditiveとAuthorativeを意識する Terraformで管理されていなかったリソースをTerraform管理下に置く: terraform import Terraformの登場人物 terraform planやterraform applyの

テクノロジー
2023/03/09 19:17

派生先テーブルの参照回数も考慮して安全にテーブルを撤退する - yasuhisa's blog

88 users

www.yasuhisay.info

3行まとめテーブルの撤退時にはテーブルの参照回数を見ることが多いと思いますが、テーブル単独の参照回数を見るだけだと不十分なことが多いです派生先のテーブルの参照回数まで考慮すると、テーブルが撤退できるか安全に判断することができますリネージ上の親子関係をWITH RECURSIVEで考慮しながら、累積参照回数をSQLで導出できるようにし、安全にテーブル撤退を判断できるようにしました 3行まとめ背景: テーブルの撤退にはテーブル単独の参照回数を見るだけだと不十分アイディア: 累積参照回数を計算する実装テーブル間の親子関係を抽出する WITH RECURSIVEでテーブルの親子関係を辿るテーブルの親子関係を考慮しながら、累積参照回数を計算するまとめ背景: テーブルの撤退にはテーブル単独の参照回数を見るだけだと不十分データエンジニアやアナリティクスエンジニアの仕事をしていると、

テクノロジー
2023/10/09 01:24

PyCon mini Osakaで異常検知システム構築の裏側について発表しました - yasuhisa's blog

83 users

www.yasuhisay.info

現在仕事で作っている異常検知システムについてPyCon mini Osakaで登壇してきました。異常検知というマイナーなトピックですが、多くの人に聞いてもらえてよかったです。 #pyconjp #pyconosaka 「Pythonを用いた異常検知システム構築の裏側」吉田康久さんです！たしかはてなの人だったはず。 pic.twitter.com/hRacSgV59D— PyCon mini Osaka (@OsakaPyConMini) 2018年5月19日はい、はてなのMackerelチームの中の人です。機械学習の人からすると「なんだただの混合ガウス分布か」と思われるかもしれませんが、異常検知のシステムを実際に作ろうとすると考えることが色々あります。今回の発表ではユーザーのどのような要望から異常検知機能を作るに至ったか異常検知とはそもそも何か、どういった問題設定か異常検知手

テクノロジー
2018/05/19 20:31

yasuhisa's blog

69 users

www.yasuhisay.info

2024-06-21 Google Cloud Champion Innovatorに選ばれました BigQuery 先日のdbtのCommunity spotlightに引き続き、めでたいことが続いてありがたい限りですね。Google Cloud Champion Innovatorに選ばれました。 https://cloud.google.com/innovators/champions/directory?hl=ja&text=yasuhisa より「そもそもChampion Innovat… 2024-06-19 BigQueryを補完する技術: DuckDBとDataflowでのデータ処理入門 BigQuery DuckDB Dataflow 背景 & Disclaimer DuckDB 概念や代表的なユースケース使ってみる 1週間〜一ヶ月などある程度の期間、分析で使いたい場

テクノロジー
2007/08/21 01:30

2017年の振り返り技術編 - yasuhisa's blog

66 users

www.yasuhisay.info

ふと思いたったので書く。2016年は自然言語研究者からWeb系エンジニアになったということで、今振り返ってもキャッチアップで精一杯だったなーと思うが、2017年は去年よりは慣れたこともあり、もう少し自分にとって新しいことに取り組めたかなーと思う。といっても、XXXやり始めたという内容のほとんどが仕事で必要だったという理由なので、Mackerelチームで働くための基礎体力が本当になかったんだなと改めて痛感している(なぜはてなに入社できたのか謎)。飽きる暇もなく勉強の毎日です。来年はもう少し狭く深く掘り進めていきたいかな。 Go言語やり始めた Pythonやり始めた異常検知やり始めた深層学習やり始めた AWSやり始めた Docker&Ansible始めた IDEに魂を売った Go言語やり始めた仕事でGo言語をやる必要があって勉強し始めたのが今年の初めだった。A Tour of Goを最初

テクノロジー
2017/11/22 08:15

自然言語処理の深層学習において転移学習はうまく行くのか? - yasuhisa's blog

60 users

www.yasuhisay.info

このエントリはDeep Learning Advent Calendar 2016 5日目のエントリです。EMNLP2016に出ていたHow Transferable are Neural Networks in NLP Applications?を読んだので、それについて書きます。 [1603.06111] How Transferable are Neural Networks in NLP Applications? モチベーション画像方面では、あるタスク(source side)で学習させた深層学習の結果を、別データセット(target side)でソフトマックス層だけ再学習させる転移学習(Transfer Learning)がうまくいっていると報告されています。 [1311.2901] Visualizing and Understanding Convolutional Ne

テクノロジー
2016/12/05 00:26

はてなブックマーク

はてなブックマーク

『yasuhisa's blog』

複数の企業でデータエンジニアとして求められたスキル - yasuhisa's blog

今年よかった習慣: ライフログ収集および可視化 - yasuhisa's blog

確率論、統計学関連のWeb上の資料 - yasuhisa's blog

機械学習をプロダクトに入れる際に考える採用基準について - yasuhisa's blog

Google機械翻訳の仕組み&できるようになったこと/まだ難しいことについて、社内の機械学習勉強会で説明します - yasuhisa's blog

Looker Studioの魅力と便利な使い方を紹介します - yasuhisa's blog

はてな社内の勉強会で構造学習について発表しました - yasuhisa's blog

データ分析を元にFAQサイトを継続的に改善する - yasuhisa's blog

KaggleのCTR予測コンペで上位10%に入るまでの試行錯誤 - yasuhisa's blog

社内でKaggleの布教活動をやっている話 - yasuhisa's blog

コロナ禍での転職活動(データエンジニア)についてのメモ - yasuhisa's blog

実タスクで機械学習を導入するまでの壁とその壁の突破方法 - yasuhisa's blog

dbtで見やすいER図を生成する - yasuhisa's blog

LaTeXのこととかまとめておく - Seeking for my unique color.

はてなで働き始めてからほぼ5年になるので振り返ってみる - yasuhisa's blog

AWS Lambdaに入門する - yasuhisa's blog

さくらインターネットに色々インストールする - yasuhisa's blog

NTT CS研を退職して、株式会社はてなに入社しました - yasuhisa's blog

昔は苦手だったモブプロを今は推進する側になっていた - yasuhisa's blog

異常検知ナイトでLT登壇しました - yasuhisa's blog

Go言語でWebアプリを書くときにオートリロードどうするといいの問題 - yasuhisa's blog

データエンジニア / Analytics Engineer向けの権限管理のためのTerraform紹介 - yasuhisa's blog

派生先テーブルの参照回数も考慮して安全にテーブルを撤退する - yasuhisa's blog

はてなインターン全日程終了しました - yasuhisa's blog

PyCon mini Osakaで異常検知システム構築の裏側について発表しました - yasuhisa's blog

Rによる最適化、パラメータ推定入門 - yasuhisa's blog

yasuhisa's blog

2017年の振り返り技術編 - yasuhisa's blog

自然言語処理の深層学習において転移学習はうまく行くのか? - yasuhisa's blog

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

『yasuhisa's blog』

このページはまだブックマークされていません

キーボードショートカット一覧

公式Twitter

はてなのサービス

このページはまだ
ブックマークされていません