タグ

ブックマーク / yoheikikuta.github.io (7)

  • BigQuery を使って分析する際の tips (part2)

    TL;DR part2 はスカラー関数・集計関数・分析関数、サブクエリ、型変換について書く BigQuery は便利な機能が色々備わってるので、それらの基的な振る舞いを頭に入れておくと便利 文と全然関係ないけど自分のブログはコードブロックの表示とかイマイチなので改善せねばか… part1 に続いて part2 として、分析する際によく使うことになる道具について理解しておくとよいことをいくつかピックアップしてまとめる。 ちなみに今回の tips シリーズではクエリのパフォーマンスは気にしない。 自分が現状仕事で書いてるものはほぼクエリのパフォーマンスを気にしなくてよいのと、そもそも BigQuery が強力なので細かいことを気にせずに書いてしまって殆どの場合問題ない、というのが理由。 実行前のデータスキャン量だけ見ておいて、数百 [GB] 以上のクエリをガンガン実行しそうとなったらコスト

    BigQuery を使って分析する際の tips (part2)
  • BigQuery を使って分析する際の tips (part1)

    TL;DR BigQuery で分析する際の tips をまとめてみる。長くなりそうなのでいくつかに分割して書く part1 はエディタとして何を使うかとか実行結果の連携などについて書く BigQuery console/DataGrip を使いつつ、結果を GitHub issues/Google Sheets/Bdash Server で共有するという感じで使っている 仕事で BigQuery を使って分析することが多いので、いくつかの回に分けて BigQuery を使って分析する際の tips をまとめていくことにする。今回は part1 としてエディタとして何を使うかとか実行結果の連携などについて書く。 個人的な探索的・アドホック分析用途の話に限定して、組織的にどういうデータ分析基盤を使うかとかそういう話はしない(会社だと ETL の L として dbt https://www.g

    BigQuery を使って分析する際の tips (part1)
  • 機械学習アルゴリズムの学習法

    TL;DR 機械学習のアルゴリズムには詳しくなりたいけど実装はしない、という立場の人向けの学習資料まとめ 知人向けで、具体的には同僚医師がターゲット読者(めちゃ狭い!)だが、一定度他の人にも役に立つかも 改めて色々眺めてみてやっぱり大学の講義は質の高いものが多いと思った 知人が機械学習のアルゴリズムを学びたいと言っているので、オススメの資料などを見繕ってみるブログエントリ。 機械学習への関わり方を雑にアルゴリズムと実装で分けた場合に、アルゴリズムには詳しくなりたいけど実装をするわけではない、という立場の人向けである。 このようなタイプの人はそんなにいないと思うけど、具体的にはドメインエキスパートとして機械学習エンジニアと一緒にアルゴリズム・データ改善に取り組んでいて、アルゴリズムでどんなことをやっているかをちゃんと理解したい、みたいなのが一例となる。 なんとなくのイメージ的な理解だけだと、

    機械学習アルゴリズムの学習法
    clavier
    clavier 2020/07/06
  • Ubie 株式会社に入社します

    TL;DR 求職活動の結果 Ubie 株式会社に入社することにしました 決め手は「ストーリーを語りたくなるような仕事ができそう」だから エンジニアも絶賛募集中なので、一緒に働きましょう! https://note.com/ubie/n/n454a0d04a1eb 最近は求職活動に勤しんでいましたが、色々な人に話を聞いたり実際に選考を受けた結果 Ubie 株式会社 に入社することにしました。 このエントリは、私の求職活動を振り返りつつ、その過程でお世話になった人々への報告に代えさせていただこうというものです。 求職活動の経緯に関しては以下をご覧ください。 ついに求職活動をすることにしました。 機械学習エンジニア/リサーチャーのポジションで求職中です。 関係各位の方々、よろしくお願いします。 詳しくはブログで!https://t.co/2X2SuHyE5G — Yohei KIKUTA (@y

    Ubie 株式会社に入社します
    clavier
    clavier 2020/03/25
  • 技術書典用に書いていた本「A Primer on Adversarial Examples」を公開した

    TL;DR PDF ファイルは こちら GitHub repository は こちら 無料で公開してますが、役に立ったという人はぜひ BOOTH の商品 を買っていただけると!(内容は同じです) 技術書典 8 で販売しようと思っていた adversarial examples のを公開します。 技術書典、初参加の予定だったので楽しみだったんですが、中止となってしまったのは残念です(致し方ないですが)。 運営の方々は大変な決定だったと思います、改めてこの場で労いと感謝の意を表明しておきます。 オンラインで開催されるという話ですが、元々は 2 月末に出そうと思って準備していて一通りは完成したので、ここで公開しておきます。 (オンラインで開催されるようならそちらにも出したいとは思っています) とコードをセットで書きました。 自分は有料じゃないと見れない情報とか好きじゃないので、無料で公開し

    技術書典用に書いていた本「A Primer on Adversarial Examples」を公開した
  • 機械学習をやる上で線形代数のどのような知識が必要になるのか

    TL;DR 「機械学習をやるなら線形代数はやっとけ」的な話が出るけど具体的な話があまり見当たらない 研究でなく実務レベルで機械学習を扱う場合にどのような線形代数の知識が必要になるのか考えてみた 高校でやるベクトル・行列+αくらいあれば概念的には十分で、計算が苦じゃない基礎体力が重要では? 機械学習が流行ることで、機械学習に必要な数学的基礎にも話が及ぶことが多くなってきている。 特に、線形代数や微積に関しては基礎を押さえとけみたいなことを言う人が結構いる気がする。 中身のない話をしたい場合はまあそれだけでもいいのだけれど、具体的に何が必要になるのかを説明してくれてる人はあまりいない。少なくとも自分の観測範囲では。 レベル感が様々なので万人に通用する議論はできないのはしょうがないが、「自分としてはこれは必要だと思っている」みたいな意見は聞いてみたい。 自分の考えはどうだろう、ということで線形代

    機械学習をやる上で線形代数のどのような知識が必要になるのか
  • Deep Learning with Python を読んだ

    TL;DR Deep Learning with Python を読んだ よく書かれているで、特に初学者〜中級者が Keras を使ってモデル構築ができるようになるには最適 扱っているトピック自体は他のと比べてそこまで変わっていないが、一つ一つの質は高い 個人的には Keras の実装の話などをもっとして欲しかった Keras 作者の Chollet 氏が書いた deep learning ということで、どんな内容なんだろうと思って読んでみた。 結論から言うととてもよく書けているで、対象読者は Keras を使って deep learning を始めたい(始めてみた)という人かと思う。 どんな経緯で出したかとかそういうのは全然知らないが、deep learning が使えるようになるための getting started となる決定版を書いたぞ、という印象を受けた。 自分としては

    Deep Learning with Python を読んだ
  • 1