サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
体力トレーニング
myui.hateblo.jp
10月上旬にRecSys'18というレコメンデーション分野の国際会議に初参加してきた。出張報告がてらに聴講した内容をまとめる。twitterに記録していたので文章はそこから起こした。時差ぼけもあり、全部は聞けていないので悪しからず。 レコメンデーション分野はNetflix、Spotify、Hulu、Pandora、Criteoなどインダストリでの研究が盛ん。実データを持ってたり、実際にビジネス適用しているので研究背景に説得力がある。 Industrial Sessionもそうだったけど推薦だと企業もエッジな研究していて良い..(critriaがどこも異なるのでやりやすい )*1日本の推薦業界の人もこの辺まできて発表してほしい。 Netflixにおける取り組みなど企業の取り組みの方がアカデミアよりも進んでいるところもあった。日本からもGyao!(Yahoo!J)、U-next、Abema、リ
こんにちは。好きな本(山ジャンル)は山野井泰史の「垂直の記憶」*1、植村直己 の「青春を山に賭けて」*2、ちょっと前からハマっている漫画は「山と食欲と私」のmyuiです。2017年の山行を振り返ります。 垂直の記憶 (ヤマケイ文庫) 作者: 山野井泰史出版社/メーカー: 山と溪谷社発売日: 2012/10/01メディア: Kindle版この商品を含むブログを見る 青春を山に賭けて 作者: 植村直己出版社/メーカー: 文藝春秋発売日: 2012/09/20メディア: Kindle版購入: 1人 クリック: 1回この商品を含むブログを見る 山と食欲と私 1巻 (バンチコミックス) 作者: 信濃川日出雄出版社/メーカー: 新潮社発売日: 2016/04/09メディア: Kindle版この商品を含むブログ (3件) を見る TD登山部のメンバにtakutiとakama氏を引き入れて何個か一緒に登っ
8/3〜9/30 の2ヶ月間、トレジャーデータ(以下、TD)ではSummer Internで3名の学生を受け入れ、その受入責任者を担いました。 初めての試みでしたが、いずれの学生も優秀で与えられたタスク*1を成功裏にこなしてくれました。 熱が冷めないうちに、来年度のためにもここに内容をまとめます。 TDインターンの特徴 TDインターンの特徴は、基本的に開発成果をオープンソースソフトウェアとして公開することです。Fluentdのnanosecondサポート、マルチプロセスでのソケット共有、HivemallへのFactorization Machineの実装それぞれgithubでオープンに開発しております。 成果を全てオープンソースとすることはTD的には利点ばかりではありませんが、インターン生にはインターン期間が終わっても自身が携わったプロダクトに興味を持って頂けえば、と思っております。 イン
Treasure Data(以下、TD)に入社して早2週間が経ちました。 入社してから、平成14年度IPA未踏ユース第1期で同期でスーパークリエイタであった西田さんがTDで働いているのを知りました。MapReduceやHadoopが登場した頃、「Googleを支える技術」という技術書*1でお世話になったのですが、いつの間にかTreasure Dataを支える人になっていたんですね*2。 Googleを支える技術 ?巨大システムの内側の世界 (WEB+DB PRESSプラスシリーズ) 作者: 西田圭介出版社/メーカー: 技術評論社発売日: 2008/03/28メディア: 単行本(ソフトカバー)購入: 47人 クリック: 1,166回この商品を含むブログ (374件) を見る TDではおかげさまで結構なペースでお客さんが増えていて事業規模拡大に備えて幅広い職種で人材募集中です。今回はTDのバッ
3/31付けで4月から国立研究開発法人になった産業技術総合研究所を退職致しまして、4/1からTreasure Dataに入社しました。第一号のResearch Engineerとして東京オフィスで働きます。 CTOの太田さんから2013年頃に一度お誘いを受けておりましたが、2014年になってまた声を掛けて頂き、2年越しでの入社となりました。 なんでTreasure Data? 現在のTreasure Dataでは、毎秒45万レコード、4,000億レコード/日ものデータが投入されていて、Hiveで処理されるデータ量も3+ペタバイト/日と急速な発展をとげております。研究でもこの規模のデータ量を扱うことはGoogleやFacebook等の一部の研究者を除いてはありませんから、非常に挑戦的な課題に取り組める環境であることにDB研究者として第一に魅力を感じました。優秀なエンジニアが集まっていて刺激的
以前、Prestoのバイトコード生成部分のソースコードを読んだので、hack再開時のためにメモしておく。 コード生成にはobjectwebのASMを利用している。Parser generatorはANTLR。 ExpressionCompiler#internalCompileFilterAndProjectOperator codegenしているのはfilter句とprojection句のみ。Joinは残念ながらcodegenされていない。 SqlStageExecution#startTasks evaluate planの中身はremote taskというのがsubStages(StageExecutionPlan)があると作られる join関係のrewriteはPredicatePushDown。Volcanoのexchange抽象operatorでremoteの実行を抽象化。Lo
このページを最初にブックマークしてみませんか?
『myui.hateblo.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く