yag_aysのブックマーク / 2019年9月5日

カルチャーとエンジニアリングをつなぐデータプラットフォーム - Speaker Deck

All slide content and descriptions are owned by their creators.

yag_ays 2019/09/05

リンク

GBDTの理解に役立つサイトまとめ - copypasteの日記

GBDTは分析コンペや業務で頻出しますが、アルゴリズムの詳細はパッケージごとに異なるため複雑です。できることなら公式ドキュメント・論文・実装を読み込みたいところですが、私の実力的にそれは厳しいので参考サイトをまとめておきます。ゆるふわ理解に留まっている自分用のメモです。 GBDT Gradient Boosting Interactive Playground トイデータを使ってGBDTの挙動を確認できる。しばらく遊べる。 YouTube とてもわかりやすい解説動画。Part1~4を視聴すればアルゴリズムの基本が理解できる。 Gradient Boost Part 1: Regression Main Ideas Gradient Boost Part 2: Regression Details Gradient Boost Part 3: Classification Gradient

yag_ays 2019/09/05

リンク

Real Time Data Engineering Pipeline for Machine Learning -

Our focus in this post is to leverage Google Cloud Platform’s Big Data Services to build an end to end Data Engineering pipeline for streaming processes. So what is Data Engineering? Data Engineering is associated with data specifically around data delivery, storage and processing. The main goal is to provide a reliable infrastructure for data which includes operations such as collect, move, store

yag_ays 2019/09/05

リンク

デザインドックで学ぶデザインドック | フライウィール

エンジニアの太田です。皆さん、デザインドックはご存知でしょうか？いわゆる設計書ですが、エンジニアによって書かれ、書いた本人またはチームによって実装される点と、技術的な詳細を明確にし技術的な議論をすることにフォーカスがある点が特徴です。他人に開発を依頼するための設計書や、既存のシステムを解説するための文章とは性質が異なります。デザインドックを書くことの利点としては以下のような点があります。開発を始める前に全体のシステムを考察する機会を得る文章化することで、曖昧な部分が明確になる早い段階でチームメイトや専門家、関係者からフィードバックを得る機会を得るシステムの設計について明確な承認を得られる新しいメンバーがシステムの概略を理解する手助けになる弊社でもすでに多くのデザインドックを利用しており、エンジニア間での議論の活発化を担っています。具体的にどのような内容を書けばいいのでしょうか？今回

yag_ays 2019/09/05

リンク

Research

yag_ays 2019/09/05

リンク

Continuous Delivery for Machine Learning

Automating the end-to-end lifecycle of Machine Learning applications Machine Learning applications are becoming popular in our industry, however the process for developing, deploying, and continuously improving them is more complex compared to more traditional software, such as a web service or a mobile application. They are subject to change in three axis: the code itself, the model, and the data

yag_ays 2019/09/05

リンク

Introduction to Kubernetes

この資料は「Kubernetes という名前ぐらいは知っているけど、実際には使ったことがない、何ができるのかよく知らない」という人を対象に、Kubernetes の基本的な使い方を説明しています。この資料を読めば、Kubernetes 上に単純な Web アプリケーションをデプロイできるようになるはずです。

yag_ays 2019/09/05

リンク

Python の CUI デバッガ「PuDB」の紹介と使い方 - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

yag_ays 2019/09/05

リンク

「Amazon Forecast」が正式リリース。過去の時系列データを与えるだけで機械学習による予測をしてくれる、専門知識不要のサービス

「Amazon Forecast」が正式リリース。過去の時系列データを与えるだけで機械学習による予測をしてくれる、専門知識不要のサービス Amazon Forecastは、なんらかの時系列データおよびその時系列データに影響を与えたであろう周辺情報、例えばある店舗の売り上げの時系列データおよび、その店舗の場所の天候、気温、交通量、曜日や祝祭日など売り上げに影響すると思われる周辺情報を与えると、予測に必要な機械学習モデルの構築、アルゴリズムの選定、モデルの正確性の検証や改善などを全て自動で実行し、売り上げに関する予測のデータを出力してくれるというサービスです。一般に、機械学習を活用するには、学習用のデータと検証用のデータを用意し、学習用のデータから求められた予測結果を検証用データで検証して正確性を評価し、より適切なモデルやアルゴリズムを選択する、といった作業が発生します。 Amazon Fo

yag_ays 2019/09/05

リンク

写真検索の近傍探索ServiceをPythonからC++に置き換えた話 | メルカリエンジニアリング

この記事は、Mercari Bold Challenge Month の 8 日目の記事です。こんにちは。メルカリのAI EngineeringでSoftware Engineerをしている@wakanapoです。私は、2019年4月にメルカリに新卒入社して、6月にAI Engineering teamに配属されました。今回は、配属されてから私が最初に担当したタスク「写真検索の近傍探索Service実装のPythonからC++への置き換え」について紹介します。写真検索システムについてメルカリでは、今年の3月からiOSで写真検索の機能を提供しています。 about.mercari.com メルカリの写真検索は過去のMercari Engineering Blogで詳しく説明されていますが、図1のようなアーキテクチャで動いています。 tech.mercari.com 図1 今回、この中の

yag_ays 2019/09/05

リンク

はてなブックマーク

タグ

2019年9月5日のブックマーク (10件)

カルチャーとエンジニアリングをつなぐデータプラットフォーム - Speaker Deck

GBDTの理解に役立つサイトまとめ - copypasteの日記

Real Time Data Engineering Pipeline for Machine Learning -

デザインドックで学ぶデザインドック | フライウィール

Research

Continuous Delivery for Machine Learning

Introduction to Kubernetes

Python の CUI デバッガ「PuDB」の紹介と使い方 - Qiita

「Amazon Forecast」が正式リリース。過去の時系列データを与えるだけで機械学習による予測をしてくれる、専門知識不要のサービス

写真検索の近傍探索ServiceをPythonからC++に置き換えた話 | メルカリエンジニアリング

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス