「treasure-data」を検索 - はてなブックマーク

1 - 40 件 / 1400件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

treasure-dataの検索結果1 - 40 件 / 1400件

開発支援系のサービスが充実しすぎて転職か廃業を考えた | Ore no homepage
- 1242 users
- hiroakis.com
- テクノロジー
- 2013/11/07
なんて表現したらいいかわかんなくて、開発支援系サービスって謎表現したけど…。なんつーか、開発支援向けのサービス？クラウドってやつ？ってかいわゆる外部がやってくれる系のサービス(モニタリング/ホスティング/etc)が充実してますよね。んで、一介のWebエンジニアのおれがこの先生きのこるにはどうするかを真剣に考えていたところだった。きのこ。何割かはネタ。思いついたものを挙げてみる。AWSやGitHubは割愛。言うまでもねーだろ…。 New Relic http://newrelic.com/ 有名なNew Relic。これも説明するまでもないかな。今のチームでコレのお金払う版を使ってるんだけど、「外部APIとの通信個所とDBとの通信個所が遅いように思えるので調査しますわ」→「それNew Relicで見れるよ」とか「各テーブルへのアクセス頻度集計しますわ」→「それNew Relicで見れるよ」
- 開発
- webサービス
- ツール
- development
- cloud
- webservice
- DB
- クラウド
- サービス
- web
現代のエンジニアのための強力なメモ帳 Jupyter notebookのすゝめ - クックパッド開発者ブログ
- 739 users
- techlife.cookpad.com
- テクノロジー
- 2015/12/11
会員事業部の有賀(id:chezou)です。今年一年、社内では勝手に"Jupyterの伝道師"を標榜してJupyter notebookの普及活動を展開してきました。先日、社内でハンズオンも行ったおかげもあり、かなり社内のマシンにPython環境が構築されてきました :) Jupyter notebookとは？ひとことで言うとブラウザで動くすごい便利なREPL*1です。百聞は一見にしかず、見てみましょう。このように、Rubyの対話環境であるpryを触っているようにインタラクティブにコードを書くことができます。以降で説明をしますが、Jupyter notebookは記録・共有・再現がとても得意です。特に図表があるときにその効果を発揮します。 Jupyter notebookの良い所過去のコードを改変、再実行できるセルと呼ばれる入力部分にはMarkdownやコードが記述できます
- jupyter
- python
- あとで読む
- ruby
- cookpad
- プログラミング
- markdown
- ツール
- tools
- Jupyter Notebook
日本人CTOがシリコンバレーで25歳で起業し、660億円で買収されるまでの道のり
- 689 users
- techblitz.com
- テクノロジー
- 2021/03/30
大学時代に日本屈指の技術系スタートアップCTOを経験。25歳で日本から飛び出して、シリコンバレーで起業した ――まず太田さんがシリコンバレーで起業するまでの経緯を聞かせてください。高校生の時に初めて携帯電話を買ってもらいました。その携帯がiアプリといって、Javaのプログラムが動作する端末でした。そこで近くの書店でプログラミングの本を買って、簡単なシューティングゲームを作りました。すると、それが40万件以上ダウンロードされたんです。塾の帰りなど、隣にいる人が自分の作ったゲームをプレイしているのを見て驚きました。それが最初のコンピュータ、インターネットの原体験で、そこからプログラミングにのめり込んでいきました。太田一樹（Treasure Data 共同創業者取締役） 1985年生まれ。東京大学大学院情報理工学研究科修士課程修了。学部課程在学中の2006年、自然言語処理と検索エンジン
- 起業
- あとで読む
- CTO
- ビジネス
- 投資
- 企業
- business
- startup
- hadoop
- IT
Fluentdとはどのようなソフトウェアなのか - たごもりすメモ
- 681 users
- tagomoris.hatenablog.com
- テクノロジー
- 2013/12/03
Fluentd というソフトウェアがある。日本国内ではそこそこ話題になってきたが、何ができるのか、何に使うと嬉しいのか、何に使えるのか、という点について詳細をよく知らないという人もおそらくまだ多いことでしょう。なので、簡単にまとめる。 http://fluentd.org/ なお以下の個別項目ごとに書いていくが、その手前にまとめを置いておくので忙しい人はそれだけ読むとよい。インストールや設定については導入部分については日本語の記事はもう多くあるので、触れない。概要できることログの収集センサデータ等の収集汎用データ処理プロセッサとして頻出ユースケースログの収集データの集約簡単なリアルタイム集計ソフトウェアとしての特徴コアプラグイン安定性性能開発体制コミュニティぶっちゃけどうなの？まとめ現時点で、複数の場所に分散したデータや常に増え続けるデータの安全な転
- fluentd
- log
- 管理
- tagomoris
- development
- linux
- adventcalendar
- 解説
- ソフトウェア
- web
おねえさんが、センサー + Raspberry Pi + fluentd + Treasure Data + αで自宅の揺れを検知＆分析してみるよ① - ○○おねえさんのつぶやき
- 631 users
- suzu.hatenablog.com
- テクノロジー
- 2014/05/31
タイトル通り、センサー + Raspberry Pi + fluentd + Treasure Data + 様々なプロダクトを組み合わせて、自宅が揺れる原因を分析してみるお話です♪ 長丁場になりそうなので、これから数回に分けて綴っていこうと思います。第1回の今回は、揺れ分析をはじめた理由、やりたいこと、システム構成についてお話します。はじめた理由実は・・自宅マンション周辺の大規模工事が終わった頃から、毎日ふとした時に自宅が揺れています！震度１～２くらいかな？と思ってYahoo!の地震情報を確認してみるのですが、地震は起きていません。天井から吊してあるパネルも揺れるので、気のせいではないはずなのに。。管理会社に問い合わせてみましたが、「よくわからないですねー」と素っ気ない返事しか返ってきません。むむむっ、結構重要な問題だと思うんだけどー＞＜。揺れの原因によっては引っ越しも考
- Raspberry Pi
- fluentd
- Treasure Data
- raspberry
- 開発
- 分析
- データ
- RaspberryPi
- development
- data
小中規模のIT系企業における技術的選択と雇用戦略に関する雑感 - たごもりすメモ
- 629 users
- tagomoris.hatenablog.com
- テクノロジー
- 2015/05/11
でっかい主語で入ったが、要するに2月にあちこち会社巡りをしたときに感じたことについてつらつら書こう、というのが目的。特定の会社について書いてもしょうがないので、あれこれ*1回ったうちから少なくとも2〜3ケースで該当するなあ、と思ったことについて書く。特定の1社のみに該当する事項はこのエントリにはひとつも出てきません。またエントリの主旨からして超上から目線になりますが、どうかご容赦ください。これから成長が本格化するのでインフラを支えられる人材がほしい正直に言ってこれが一番多かったパターン。スタートアップ的にサービスを作ってきたがその一方でデプロイや監視などの運用まわりが後手後手になっており、そのあたりを支えられる人物がほしい。話としてはわかるのだが、気になったのは、これを聞くとき、詳しい内容を突っ込んでみると、どうも実際にはそう困ってはいない、というケースがほとんどだったように思え
- スタートアップ
- 会社
- business
- 仕事
- IT
- 運用
- インフラ
- サービス
- 技術
- あとで読む
柔軟なログ収集を可能にする「fluentd」入門 | さくらのナレッジ
- 582 users
- knowledge.sakura.ad.jp
- テクノロジー
- 2013/12/09
複数台のサーバーやクラウド環境を組み合わせてのサービス運用においては、ログの収集方法に工夫が必要となる。こういった場合に有用なのが、さまざまなログの収集手段を提供するfluentdだ。今回はfluentdのアーキテクチャやそのインストール/設定方法、基礎的な設定例などを紹介する。さまざまな方法でログを収集できるfluentd 今回紹介するfluentdは、Treasure Dataが開発するログ収集管理ツールだ（図1）。オープンソースで公開されており、Linuxや各種UNIXで動作する。図1 fluentdのWebサイトログ収集のためのソフトウェアとしてはsyslogdやsyslog-ngなどが有名だが、fluentdがこれらと異なる点としては、以下が挙げられる。さまざまなソースからのイベントをさまざまな媒体に出力できる fluentdの大きな特徴としては、ログの収集方法やログの記
- fluentd
- ログ
- 監視
- インフラ
- 分析
- チュートリアル
- web制作
- log
- tool
- web
イベントログ収集ツール fluent リリース！ - Blog by Sadayuki Furuhashi
- 578 users
- frsyuki.hatenablog.com
- 暮らし
- 2011/09/29
こんにちは。Treasure Data の古橋です^^; 先日の Treasure Data, Inc. 壮行会で、イベントログ収集ツール fluent をリリースしました！ Fluent event collector fluent は syslogd のようなツールで、イベントログの転送や集約をするためのコンパクトなツールです。ただ syslogd とは異なり、ログメッセージにテキストではなく JSON オブジェクトを使います。またプラグインアーキテクチャを採用しており、ログの入力元や出力先を簡単に追加できます。 Twitterでも話題沸騰中です：イベントログ収集ツール #fluent 周りの最近の話題背景「ログの解析」は、Webサービスの品質向上のために非常に重要です。Apacheのアクセスログだけに限らず、アプリケーションからユーザの性別や年齢などの詳しい情報を集め
- fluent
- log
- fluentd
- ログ
- ruby
- json
- ツール
- server
- tool
- サーバ
MessagePack: It's like JSON. but fast and small.
- 466 users
- msgpack.org
- 暮らし
- 2009/02/25
It's like JSON. but fast and small. MessagePack is an efficient binary serialization format. It lets you exchange data among multiple languages like JSON. But it's faster and smaller. Small integers are encoded into a single byte, and typical short strings require only one extra byte in addition to the strings themselves. Next: MessagePack is supported by over 50 programming languages and environm
- MessagePack
- serialization
- json
- rpc
- programming
- library
- msgpack
- ruby
- serialize
- プログラミング
Fluentdとログ収集のパターン - Go ahead!
- 462 users
- repeatedly.github.io
- テクノロジー
- 2014/07/31
「ログを集めて保存する」と言うのは簡単だけど，ログ収集の構成にはいくつか方法があり，勉強会などでちょくちょく聞かれるので，いくつかのパターンについて書く．「俺はもうバリバリログ収集やってるぜ！」という人は多分すでに知っていることが書かれているので，タブを閉じて良い．ここではログコレクタにFluentdを想定しているが，他のログ収集プロダクトにも適用出来るはず．ただ，Fluentdはタグベースのルーティングを持ち，単体でもキューのように動作させることが可能で，既存のものより複雑な問題を解決しようとしているので，少し工夫が必要かもしれない． Fluentdそのものについては公式ドキュメントや，Fluentdとはどのようなソフトウェアなのかを参考に．クライアントから直接保存するいきなりFluentdを使わないパターン．JavaScript SDKを提供している解析サービスやモバイル端末
- fluentd
- logging
- ログ
- log
- インフラ
- development
- プログラミング
- Apache
- システム
- パターン
Treasure Data - naoyaのはてなダイアリー
- 442 users
- naoya-2.hatenadiary.org
- テクノロジー
- 2013/03/22
少し前にログの話を書いた http://d.hatena.ne.jp/naoya/20130219/1361262854 ときに、Treasure Data については後日にもう少し詳細に書くと言ったので書くとしよう。近頃 Treasure Data (以下、時折 TD) という名前をちらほら聞いたことがある人は多いのではないかと思います。「ビッグデータのクラウドサービスである」とか「日本人が創業したシリコンバレーのベンチャー」、あるいは Yahoo! 創業者の Jerry Yang が投資したとか、Fluentd と何か関係があるといった文脈などなど。けど、具体的に Treasure Data がどういうサービスで、どういう機能を持っていて、どんな場面で利用されるものなのかはまだあまり良く知られていないかもしれない･･･ようにも見える。今日はその辺から少し紹介していこうかなと思う。
- treasuredata
- fluentd
- bigdata
- hadoop
- Treasure Data
- MapReduce
- log
- ログ
- data
- programming
続々・リトライと冪等性のデザインパターン - あらゆる操作を冪等にする方法 - Blog by Sadayuki Furuhashi
- 412 users
- frsyuki.hatenablog.com
- テクノロジー
- 2017/08/10
いつも心に冪等性。古橋です。リトライと冪等性のデザインパターンの完結編です。だいぶ間が空いてしまいましたが！最後に冪等性を実装する汎用的な実装手法についてまとめていきます。パターン６：操作ログとリクエストIDでUPDATEを冪等にする同じIDで識別される値がUPDATEされる場合、つまりmutableである値の管理は、一般に冪等に行うのが難しい。例えば、ユーザーごとに「最後に購入したアイテム」を更新する操作を考えてみると： 1. ユーザーAが最後に購入したアイテムをアイテム1に変更する（UPDATE） 2. ユーザーAが最後に購入したアイテムをアイテム2に変更する（UPDATE）この操作に何の対策もなくリトライを実装した場合、後続のUPDATE処理の結果を古い内容で上書きしてしまう可能性がある： 1. ユーザーAが最後に購入したアイテムをアイテム1に変更する（UPDATE）→
CTOを辞めた彼のエントリーを読んで - UNIX的なアレ
- 410 users
- wadap.hatenablog.com
- テクノロジー
- 2015/03/19
nobkz.hatenadiary.jp 昨日だが、このエントリーがバズっていて僕自身もtwitterでいくつか言及した。twitterってその場の思いを素早く伝えるのは非常に便利なんだけど、コンテキストが重要なものが説明しづらいとか、フロー的な情報という問題もあるため改めてブログに書いてみる。率直な感想まず、彼自身がCTOじゃなく１人のエンジニアとしてこの会社にジョインしていたのであればまぁわかるよという内容だ。エンジニアとしての美学を追求し続けたけど、それじゃビジネスが立ち行かなくなった。俺のことをわかってくれるVCが日本にはいない！まぁここまではよくある話だと思う。誰もが失敗はするし、最初からうまくいく人なんてごく少数だと思う。問題は、この事自体を環境のせいにしているということだと思う。技術的負債を早く返しすぎたのが失敗と書いてあるが彼がそう感じているのであればそうなんだ。た
近年のデータ分析基盤構築における失敗はBigQueryを採用しなかったことに全て起因している - データエンジニアの酩酊日記
- 400 users
- uma66.hateblo.jp
- テクノロジー
- 2019/10/17
久しぶりにペラペラな思いつきを書き捨てて、寝ます。 2、3年前ぐらいにSIerやコンサルでTreasure Dataとか使ってマネージドDWH作ろうぜっていう風潮が流行って、今は運用フェーズに入ってどこも結構苦しんでるってのが僕のすごく狭い観測範囲での印象。 AWSのReadshiftしかり。なぜ苦しんでるかっていうと、言うほどスケールしないからであり、言うほどマネージドじゃないから。 Treasure Dataは基本的に割当メモリが固定でオートスケールしないので、ピーク時に合わせて必要なメモリを確保しておかないといけない。そうなるとメモリ使用量とか負荷とかをモニタリングしないといけないわけだけど、Saasだから内部のアーキテクチャが隠蔽されていていちいちサポートに問い合わせないといけなかったりする。 Redshiftの場合はそもそも自前でクラスタ管理しなくちゃいけないのでそれが大変って
- BigQuery
- あとで読む
- アーキテクチャ
- aws
- 運用
- データ基盤
- 分析
- データ
- GCP
- エンジニア
Fluentdで始めるリアルタイムでのログ有効活用
- 387 users
- codezine.jp
- テクノロジー
- 2013/02/14
はじめに Fluentdは、ログを収集し格納するためのログ収集基盤ソフトウェアです。Fluentdにインプットされた、すべてのログをJSONに変換し、アウトプットします。インプットとアウトプットはモジュール化されており、モジュールを追加することでインプット元とアウトプット先を追加できるようになっています。 Fluentdは急速に知名度を高め、多くのWebサービス会社で実際に使用されるようになりました。従来のログが抱えていた問題も、Fluentdが適切な解決策となっていると認知され、かつ簡単に導入・スモールスタートできるミドルウェアであったことが大きかったと思います。本稿では、Fluentdの簡単な仕組みと導入方法、シンプルな動作事例について紹介します。対象読者システム管理者データサイエンティスト必要な環境 UNIX系OS Ruby 1.9 ログを出力する理由システム運用を始める
- fluentd
- log
- ログ
- MongoDB
- growthforecast
- 運用
- webサービス
- web
- ソフトウェア
- json
2019年のDevOps/MLOpsエンジニアの標準的スキルセット - Qiita
- 377 users
- qiita.com/poly_soft
- テクノロジー
- 2019/08/21
ちなみに、IT業界全体のシェアとしてはMicrosoftのAzureの方がGCPを上回っていますが、Web業界においてIaaSにAzureを採用している企業さんは2019年時点ではまだまだ少ないので、現状ではとりあえずAzureへのキャッチアップは後回しにしておいて問題ないと思われます。クラウドアーキテクチャ設計前述したAWSやGCPの各種マネージドサービスを適切に組み合わせてアーキテクチャ設計を行い、それを構成図に落とし込める能力は必須となります。いわゆる「アーキテクト」という職種の担当領域でもありますが、「サービスを安定稼働させたまま、バリューをユーザに迅速に届ける」ためには、自動化のしづらい構成が採用されてしまったり、無駄な機能が開発されてしまったり、アンマネージドなツールやサービスが使用されて管理工数が肥大化したりしないように、アーキテクチャ設計の段階からDevOpsエンジニ
- devops
- あとで読む
- エンジニア
- cloud
- gcp
- 学習
- aws
- kubernetes
- サービス
- ツール
グリー技術者が聞いた、fluentdの新機能とTreasure Data古橋氏の野心
- 358 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2013/10/07
fluentdのほかにもバイナリシリアライゼーションフォーマット「MessagePack」の開発などで知られる古橋氏だが、学生時代からその技術力の高さには定評があり、注目され続けてきたスーパーエンジニアでもある。今回、fluentdのユーザーでもあり、古橋氏とは旧知の仲でもあるグリー開発本部リーダーの森田想平氏がインタビュアーとなり、fluentdにまつわるトピックや、トレジャーデータでの開発、オープンソースへの想いなどを訊いている。本稿では、その模様をお伝えしながら、“エンジニア・古橋貞之”の魅力に迫ってみたい。 fluentd v11の注目ポイント森田　まずは、グリーでも大変お世話になっているfluentdについて、いろいろ聞かせてください。開発中の新バージョン（v11）では、かなり大きな変更や機能追加があると伺っていますが、注目ポイントをいくつか教えてもらえますか。フィルタ
- fluentd
- TreasureData
- データベース
- interview
- DB
- gree
- エンジニア
- database
- Data
- ログ
巨大なバッチを分割して構成する〜SQLバッチフレームワークBricolage〜 - クックパッド開発者ブログ
- 352 users
- techlife.cookpad.com
- テクノロジー
- 2015/06/27
トレンド調査ラボの青木峰郎（id:mineroaoki）です。好きなRubyのメソッドは10年前からString#slice(re, nth)ですが、最近はRubyよりCoffeeScriptとSQLのほうが書く量が多くて悩んでいます。今日はわたしが開発している「たべみる」の背後で働いている巨大バッチの構成について話したいと思います。たべみるのバッチは約3000行のSQLで構成されており、処理時間が1日で4時間程度かかる、そこそこの規模のプログラムです。このバッチ処理プログラムをBricolage（ブリコラージュ）というフレームワークで構造化する手法について説明します。「たべみる」とはまず最初に、「たべみる」がどういうものなのかごく簡単にお話ししておきましょう。「たべみる」は企業のみに提供しているB2Bの分析サービスで、クックパッドのレシピ検索の分析をすることができま
- sql
- バッチ
- batch
- cookpad
- ruby
- 分析
- クックパッド
- db
- フレームワーク
- あとで読む
本日12月1日より、プログラマ有志による2014年の技術系Advent Calendarが各所ではじまる | gihyo.jp
- 352 users
- gihyo.jp
- テクノロジー
- 2014/12/01
本日12月1日より、プログラマ有志による2014年の技術系Advent Calendarが各所ではじまる本日12月1日より、プログラマ有志による2014年の各技術系Advent Calendar（アドベントカレンダー）が一日目を担当する人のblogではじまっている。技術系Advent Calendarの数の増加傾向は今年も続いており、Qiitaを利用したものがとても多くなっている。一般的なAdvent Calendarは、12月25日のクリスマスを楽しみに待つために、12月1日から24日までのカレンダーの日付それぞれの部分が扉になっており、1日ずつその日の日付の部分を開くと天使や動物の絵などが見えるという仕組みになっている（もちろん、様々なバリエーションがある⁠）⁠。これに発想をえて、技術系Advent Calendarでは基本的に、12月1日から25日までの25日間、特定のプログラ
サラリーマンプログラマに向かない人の生きる道
- 350 users
- wirelesswire.jp
- テクノロジー
- 2015/03/31
サラリーマンプログラマに向かない人の生きる道 2015.03.31 Updated by Ryo Shimizu on March 31, 2015, 14:44 pm JST 元日立で現VA Linuxの社員プログラマーらしき人が日立を辞めた後の転職を猛烈に後悔していることが話題になりました。「年功序列などで働きづらい」として転職した元日立社員、転職後「日立のほうが良かった」と後悔して話題に/Slashdot この騒動を受けた本人のブログエントリを拝見しましたが、個人的にはあまり同情できません。騒動の内容と今後について上記のエントリを読んでいただければ私の言いたいことはだいたい伝わると思います。残念ながら、世の中には、どれだけそれが好きでも、また、それに関する才能があったとしても、会社員には向いていないタイプの人が居るのです。たぶん今回の騒動の主となる人は会社員としてプログラマを
- プログラマ
- 転職
- 仕事
- 生き方
- あとで読む
- 考え方
- life
- employment
- linux
- career
A/Bテストの数理 - 第1回：人間の感覚のみでテスト結果を判定する事の難しさについて - - doryokujin's blog
- 347 users
- doryokujin.hatenablog.jp
- 学び
- 2012/05/21
データ解析の重要性が認識されつつある（?）最近でさえも，A/Bテストを始めとしたテスト（ = 統計的仮説検定：以後これをテストと呼ぶ）の重要性が注目される事は少なく，またテストの多くが正しく実施・解釈されていないという現状は今も昔も変わっていないように思われる。そこで，本シリーズではテストを正しく理解・実施・解釈してもらう事を目的として，テストのいろはをわかりやすく説明していきたいと思う。スケジュールスケジュール第1回 [読み物]：『人間の感覚のみでテスト結果を判定する事の難しさについて』：人間の感覚のみでは正しくテストの判定を行うのは困難である事を説明し，テストになぜ統計的手法が必要かを感じてもらう。第2回 [読み物]：『「何をテストすべきか」意義のある仮説を立てるためのヒント』：何をテストするか，つまり改善可能性のある効果的な仮説を見いだす事は，テストの実施方法うんぬんより本質
- 統計
- statistics
- 統計学
- 数学
- ABTest
- math
- mathematics
- marketing
- テスト
- 読み物
Treasure Data を退職しました - k0kubun's blog
- 346 users
- k0kubun.hatenablog.com
- テクノロジー
- 2022/07/25
約5年5か月働いたTreasure Dataを7/22に退職した。7/25からShopifyに入社し、RustでJITコンパイラを開発してRubyを高速化する仕事をする。仕事としてやりたい分野が変わってきて自分は今回転職したけど、とても良い会社なので、この記事がTreasure Data (以下TD) で働くことに興味がある人の参考になれば良いと思っている。*1 5年勤続記念にいただいたトロフィーやっていたこと APIチーム元々TDにはJavaで分散システムを書きたくて入社したのだが、TD入社前に特にそういう経験があるわけでもなく主にRailsをやっていたこともあり、Railsでプラットフォームを開発するチームに入った。基盤開発をやりたいと思いながらサービス開発者として最初働き、後に基盤開発チームにジョインするみたいな過去の経験があったので、今回もそういう感じでいけると考えていた。実
- キャリア
- あとで読む
- 退職
- career
- 仕事
- 開発
- 会社
- ruby
- エンジニア
- rails
2013年Chefの話題を一挙に振り返るまとめ | Engine Yard Blog JP
- 344 users
- www.engineyard.co.jp
- テクノロジー
- 2013/12/18
早いもので2013年もまもなく終わります。特にChefについては今年は大きな飛躍の1年になりました。Chefについては話題の流れも多く、自身としても何があったのかを即座には思い出せません。今回はすでにChefを使っている人の話題の復習や、Chefをまだキャッチアップしていない人が今からでも間に合う情報収集としてまとめてみます。はてなブックマーク上でも2013年の記事でChefタグが付けられた3ブックマーク以上の記事が800エントリを超え、ブックマークの回数は3万2千回を超えるというとてつもない状況です。今回はその中でも100ブックマーク以上が付いた記事の中から特に注目が集まった話題を時系列で振り返ります。 2013年1月:「兆し」 2013年早々にChefの大躍進の契機になるエントリが@naoya_itoさんのブログに投稿されます。「開発メモ#4 : EC2スナップショットとの差分は c
- chef
- devops
- vagrant
- インフラ
- まとめ
- chef-solo
- Architecture
- infra
- Infrastructure
- *infrastructure
Qiita はなぜここまで退会炎上したのか？｜横江 as a なんとか
- 340 users
- note.com/yokoe3
- テクノロジー
- 2020/03/26
極めつけは、2019年12月に起きた、さくらインターネットへの不満の記事を Qiita 側で勝手に非公開にした一件だ。「さくらインターネット側が公開停止要請をしたのでは？」と騒がれたが、Qiita が独自判断で非公開にしたとわかり、真摯に対応をしようとしていたさくらインターネットにまで迷惑をかけてしまう結果となった。管理社会としての姿エンジニアは、コミュニティーのために情報共有をオープンにする姿勢でいる。時間をかけて見つけた答えに、他者がすぐにたどり着けるようにできれば全体の生産性を上げられるゆえの貢献だ。一方で、Qiita がユーザーに見せてしまった姿は、Qiita 独自の判断で情報統制がおこなわれるクローズドな管理社会だ。この結果、エンジニアから Qiita への不信感は積もり続けたまま今日に至り、それがついに爆発してしまった。今回の件は個人情報の取扱として問題があるが、仮
CCC、Tポイントデータをオープン化 - 7000万人の会員データが利用可能に
- 334 users
- news.mynavi.jp
- テクノロジー
- 2022/07/28
CCCマーケティングとトレジャーデータは7月28日、CDP（Customer Data Platform）領域において業務提携を行い、同意取得済のT会員データ（Tポイントデータ）を、生活者のライフスタイルを基点とした情報プラットフォーム「CDP for LIFESTYLE Insights」として8月から提供を開始すると発表した。 2022年3月現在、名寄せをし重複を排除したT会員数は7025万人で、週間の利用者は2469万人、月間利用者は4175万人だという。この会員により、年間35億件以上の購買トランザクション、15万店舗のネットワークで扱われる60億種類の商品データ、数千項目からなる顧客DNAのペルソナデータ、オフライン・オンライン上の移動・行動データやメディア接触データ、またCCCマーケティンググループオリジナルのエンハンスデータなとが得られ、データベースに蓄えられている。 20
エンジニア不足はいつまで続くのか（メモ） - yoshidashingo
- 331 users
- yoshidashingo.hatenablog.com
- テクノロジー
- 2015/09/05
吉田真吾（@yoshidashingo）です。フリーランスでたくましくやってます。本日は後ほどこちらにエンジニア代表として参加予定です。 ll.jus.or.jp そこでこんなお題を事前にいただいてます。 Web業界に特有の人材不足の原因とは人材不足はいつまで続くのかどうすれば解決するのか、あるいは取り組んでること頭の整理も兼ねて一通り自分の考えを記載しておきたいかなと思います。統計などとの突き合わせはできてませんので、経験則に基づく仮説レベルになってる点はご了承ください。 Web業界に特有の人材不足の原因とは 1. Webに対するニーズに人材供給が追いついてないのではないか説今回のイベントのお題ではIT業界の中でもとくにWeb業界にフォーカスしています。ITにおけるWeb業界というのは生まれてここ20年くらいの業界です。その前にはそもそもWeb上でのマネタイズがされてなかった（
- エンジニア
- 仕事
- あとで読む
- development
- business
- IT
- engineer
- work
- 労働
- web
”仕事で始める機械学習”の要点をまとめてみたらとても良い入門書だった
- 330 users
- medium.com/@SEKAINOOKAZAWA
- テクノロジー
- 2017/10/28
最近、販売された仕事で始める機械学習を買ったので、購入を考えられている方や機械学習を始めたいと思っている方に読んで、参考になればと思います。この記事の目的と全体の流れただ読むのと、アウトプット（ブログに書く）前提で読むのとはインプットの質が違うということがわかったので、ブログに書きながら理解していく形を取ります。全体の流れとしては、章の要約。あぁこの内容知ってるなって人は買わずに済むし、わからないこと多いという人は購入を検討して頂ければ。（出版関係者でもなければ、アフィリエイトなどの営利目的でもなく、いち消費者としての個人的意見になります。ご了承ください。）結論から言うと（書評）いままでのオライリーのデータサイエンス本だと英語から翻訳したのでわかりにくい日本語が非常にうっとうしいのですが、この本は、日本の方が書かれており、日本語スムーズに理解できます。また、非常に論理立てられて
はてなブログで開設されている12＋αの企業の技術ブログをご紹介します【追記あり】 - 週刊はてなブログ
- 324 users
- blog.hatenablog.com
- テクノロジー
- 2014/07/04
IT技術者、ことにWeb系のエンジニアにとって知見を公開し、共有することはたいへん重要です。はてなブログ／はてなダイアリーでも、たくさんの技術者にブログを書いていただいています。ソースコードをハイライト表示できたり、GitHubと同様にMarkdownが使えたり（ブログのみ）と、エンジニア向きの仕様があるためかもしれません。個人のエンジニアブログのみならず、各企業が運営する公式の技術ブログも、その会社ならではの大規模な事例を紹介してくれるなど、チェックしておきたい存在です。そこで、はてなで運営されている12の企業の技術系ブログをまとめました（広報ブログなど非技術系のものは除いています）。【07-05 追記】Mokosoft開発者ブログを追記し、タイトルを修正しました。 ※本記事に掲載した企業ブログは、執筆時に編集部で調べたもので、はてなで開設されている技術ブログを網羅したものではありま
並列データ転送ツール『Embulk』リリース！ - Blog by Sadayuki Furuhashi
- 322 users
- frsyuki.hatenablog.com
- テクノロジー
- 2015/02/16
こんにちは。古橋です。先日の*1 データ転送ミドルウェア勉強会で、新しいオープンソースツール Embulk をリリースしました。 Embulk, an open-source plugin-based parallel bulk data loader from Sadayuki Furuhashi Embulk は、リアルタイムなログ収集では常識となった fluentd のバッチ版のようなツールで、ファイルやデータベースからデータを吸い出し、別のストレージやデータベースにロードするためのコンパクトなツールです。 fluentd と同様にプラグイン型のアーキテクチャを採用しているため、RubyやJavaで簡単なコードを書くことで、様々なファイルフォーマットやストレージに対応することができます。一方で fluentd とは異なり、高速性やトランザクション制御、スキーマを使ったデータのバリ
- embulk
- fluentd
- バッチ
- parallel
- ツール
- ログ
- log
- tool
- data
- batch
41歳のエンジニア、マネージャーからICへのキャリアチェンジ | おそらくはそれさえも平凡な日々
- 314 users
- songmu.jp
- テクノロジー
- 2021/10/21
最初にお断りしておくと、このエントリは驚くほど僕固有の私的な話に終止するので、他の人の参考にはならないでしょう。 ICというのはIndividual Contributorの略で、最近だとHashiCorp創業者のあのMitchell Hashimoto氏が、HashiCorp社内でICになるというのも話題になりました。日本でも、こにふぁーさんがそういう動きをしていたりして、ちょいちょい聞くようになってきた印象です。今回の僕の転職は、言ってしまえば、自分が培ってきたソフトウェアエンジニアとしてのスキルを活かして世界の舞台で戦いたいという気持ちを抑えきれなかった、という幼稚な理由です。自分が求めているものがLaunchableにはあるように感じて入社しました。振り返ってみると、最近の自分の転職における決め手は「自分を一番必要としてくれるところ」という側面が強かったと感じています。その結果
- career
- エンジニア
- あとで読む
- engineer
- キャリア
- 仕事
- マネジメント
- life
- IC
- プログラマ
リモートでアメリカの大学院に通い始めた - k0kubun's blog
- 314 users
- k0kubun.hatenablog.com
- テクノロジー
- 2020/12/14
今年春に出願、夏に合格して秋学期からオンラインのコンピュータサイエンス修士コースで勉強している。ちょうど秋学期が終わって成績が返ってきたので、どういう感じだったか書いておく。 I've been officially admitted to Georgia Tech's OMSCS (Online Master of Computer Science). I'm excited for being a student again. I chose the online course to take it without quitting my job, but due to COVID-19 it's probably not that different from other people's experience.— k0kubun (@k0kubun) July 31, 2020 ど
- 大学
- あとで読む
- 大学院
- education
- 教育
- アメリカ
- システム
- university
- study
データ分析基盤まとめ（随時更新）
- 300 users
- zenn.dev/yuichi_dev
- テクノロジー
- 2024/03/15
はじめにデータ分析基盤の資料を力尽きるまで追記していきます。構成図にあるアイコンや記事の内容から技術要素を調べて記載していますが、不明分は未記載にしています。修正のコメント頂ければ助かります。あと、この記事追加してっていう要望も歓迎いたします。テンプレート記事公開日 : 会社名（サービス名）データソース : データ処理 : アウトプット : 画像 URL 2025年 2024/03/14 : 株式会社エス・エム・エス（カイポケ）データソース : Amazon Aurora データ処理 : Datastream、BigQuery、dbt アウトプット : Looker Studio 2024/03/12 : 株式会社マイナビデータソース : SQL Server、Amazon S3 データ処理 : Embulk、Amazon MWAA、Apache Airflow、Snowf
- データ分析
- あとで読む
- データ
- 分析
- データ基盤
- 基盤
- BigQuery
- まとめ
- 統計
- AWS
Fluentd | Open Source Data Collector
- 292 users
- www.fluentd.org
- テクノロジー
- 2012/05/30
Fluentd is an open source data collector for unified logging layer. Fluentd allows you to unify data collection and consumption for a better use and understanding of data.
- fluentd
- json
- log
- logging
- fluent
- server
- mongodb
- development
- ログ
- data
83億レコードを移行し、日々2,500万レコードのアクセスログをBigQueryに記録している話（インフラ編） - Money Forward Developers Blog
- 291 users
- moneyforward-dev.jp
- テクノロジー
- 2016/08/03
こんにちは。インフラエンジニアの村上です。マネーフォワードのインフラチームは、サービスに関わるインフラから、自社の作業環境、開発環境、さらにはサービスのインフラの中でも物理的なものからOS・ミドルウェア・アプリケーションのメンテナンス・ビルド・リリース・運用まで幅広く関与しています。今回はGoogle Cloud PlatformのBigQueryを活用してアクセスログの分析環境を構築した時の話を紹介します。この記事に書かれる事データ分析基盤としてBigQueryを使用した話とデータ量を例示しながら使用を開始した時のトラブルシュートとパフォーマンスについて紹介する。データ移行のコツもうまく含めながら書いていく。 BigQueryを採用した訳マネーフォワードの家計簿は350万人以上のお客様に利用いただき、アクセスログは日々2.500万件程度増えております。サービス開始から
- bigquery
- embulk
- インフラ
- あとで読む
- infrastructure
- mysql
- moneyforward
- データ分析
- データ
- 開発
会社の本番環境をDocker(ECS)に置き換えるために準備したこと気づいたこと
- 275 users
- techblog.housmart.co.jp
- テクノロジー
- 2017/11/06
エンジニアの@macs_6です。このブログでは社内のAWS EC2上で運用しているアプリケーション群をECS移行したプロジェクトについて紹介します。ローカルの開発環境をDockerした話は以前の記事(複数の rails プロジェクトが共存する開発環境を Docker 化した話を晒してみる)で西辻が紹介しているので、そちらを参照して下さい。概要プロジェクトを始める前に感じていた課題目指す状態 ECSを選択する理由設計移行のために必要な作業 Digdagによるスケジューリングについて ECSを使って見て気づいたこと今後やりたいことプロジェクトを始める前に感じていた課題ローカル・本番で再現性のある環境を簡単に作れるようにしたい簡単にスケールできるようにしたいコストを抑えたい ECS移行プロジェクトを始める前にはこれらの3つの事に課題感を持っていました。 1.ローカル・本番
- docker
- ECS
- AWS
- あとで読む
- ec2
- Developer
- インフラ
- EC
- エンジニア
Digdag + embulk + BigQuery + Re:dash でデータ分析基盤構築の夢を見る - 雑なメモ
- 271 users
- yukiyan.hatenablog.jp
- テクノロジー
- 2016/06/20
Digdag が Apache License 2.0 の元でオープンソース化されましたよ！さぁ試すんだ…！今すぐにでも！ https://t.co/Uzc4a5GLCe ドキュメント：https://t.co/PF8wy5KHln— Sadayuki Furuhashi (@frsyuki) 2016年6月15日 Digdagが先日リリースされたのをきっかけにデータ分析基盤構築の夢を見た。今回は、Google Cloud Platform（以下、GCP）のコストを可視化かつ分析可能にしてみて、まずはDigdagの使用感を試してみることにする。事前知識 Digdagとは Workload Automation Systemである。以下の記事が詳しい。 EmbulkとDigdagとデータ分析基盤と分散ワークフローエンジン『DigDag』の実装 at Tokyo RubyKaigi
- digdag
- embulk
- redash
- bigquery
- あとで読む
- bigdata
- データ分析
- 可視化
- GCP
- JSON
ログ集計システムを自前で作る - Y's note
- 267 users
- yut.hatenablog.com
- テクノロジー
- 2014/02/12
Index ログ集計システムの要件 DB設計データ保存方針 table設計サーバ構成 Fluentd fluentd,fluent-plugin-mysql-bulk install td-agent.conf mysqlにデータが格納される事を確認する集計用のバッチその他 Table肥大化防止可視化ログ集計システムの要件爆弾ログ処理班の@yutakikuchi_です。ログ集計システムというものを作る時に皆さんはどのように対応していますか？以下の候補から要件のレベルで使い分けをしている人が多いと予想しています。ざっくりの評価ですが、導入難易度、正確性、可視化、リアルタイム、長期集計、スケール、運用費用という点で評価を書いています。ツール導入難易度正確性可視化リアルタイム長期集計スケール運用費用リンク GA(スタンダード) ○ × ○ ○ ○ ○ ○ Go
- fluentd
- mysql
- ログ
- log
- kibana
- db
- MySQL
- hadoop
- 可視化
- logging
分散データシステム入門の決定版『データ指向アプリケーションデザイン』をたった30分で学んでみた #DataEngineeringStudy | DevelopersIO
- 266 users
- dev.classmethod.jp
- テクノロジー
- 2023/02/19
基調講演「30分でわかるデータ指向アプリケーションデザイン」・スピーカー斉藤太郎氏　Twitter：@taroleo / Github：@xerial Principal Software Engineer , Treasure Data 東京大学理学部情報科学科卒。情報理工学 Ph.D。データベース、大規模ゲノムデータ処理の研究に従事。その後、スタートアップであるTreasure Dataに加わり、アメリカ、シリコンバレーを拠点に活動中。日本データベース学会上林奨励賞受賞。OSSを中心にプログラミングやデータ処理を簡単にするためのプロダクトを作成している。「30分でわかるデータ指向アプリケーションデザイン」最新の論文にも触れながら、分散データシステムの世界の魅力を伝えていきます。後半、@tagomoris https://t.co/TQ2TnsFIOT… — Taro L.
- データベース
- あとで読む
- 本
- データ
- 設計
- book
- ソフトウェアデザイン
- database
- DB
- 技術
突撃！隣の開発環境パート12【Treasure Data編】 in シリコンバレー | DevelopersIO
- 254 users
- dev.classmethod.jp
- テクノロジー
- 2015/10/19
こんにちは！しんやです。今回はおおはしりきたけが書き連ねている人気シリーズ『突撃！隣の開発環境』に乗っかる形で私もこのシリーズエントリを書かせて頂きたいと思います。突撃！隣の開発環境とは技術事例やノウハウなどは、ブログや勉強会などで共有されることが多いと思います。しかし、各社の開発環境や開発体制などは意外と共有されていないこと多いと思います。ノウハウの流出になるかもしれませんが、それ以上に、より良い開発を目指している会社さん同士で情報交換を行い、良いチーム、良いプロダクトを作っていくという志の会社さんの為の情報共有のための企画になります。開発環境や開発体制なども技術領域によっても変わってくると思いますが、この突撃！隣のシリーズでは様々な会社さんのイケてるツールの使い方や、仕事が捗る開発体制についてインタビューを行っていく予定です。 Treasure Data社紹介今回第12回目として
- Treasure Data
- 開発環境
- Development
- treasuredata
- aws
- office
- Develop
- あとで読む
- data
- dev
学生エンジニアは時給1000円のベンチャーでバイトをするのをやめろ - 未来永劫
- 254 users
- shopetan.hatenablog.com
- テクノロジー
- 2017/12/24
この記事はklis Advent Calendar 2017の24日目の記事です． adventar.org 私はklis13(3編)で，slis17の @ss_shopetan です．アドベントカレンダーエモい日記書こうと思うのですが何読みたいですか?— shopetan (@ss_shopetan) 2017年12月7日投票により表題の話が最も需要があるらしい．私自身，再来年には就職をしている予定なので，自分のバイト経験を交えながら昨今の学生エンジニア事情を考えてみる．一番言いたいこと低賃金で働くのはやめよう．給与が低水準なのは私たちにとっても不幸だし，これを良しとし続けるならば今後業界水準も上がらないので長期的に考えても不幸になる．また，現在安い金額で働かなくても，知識と実力をつければ将来的に大きな額で働くことができる．*1 特に地方の人間は搾取されがち．つくば市も例
- work
- あとで読む
- 労働
- 仕事
- IT