[B! データ] karahiyoのブックマーク

karahiyo id:karahiyo

データに関するkarahiyoのブックマーク (19)

Stable Diffusion を基礎から理解したい人向け論文攻略ガイド【無料記事】
karahiyo 2022/10/15
画像

技術

データ

機械学習
リンク
Niantic Project
What is this "Niantic Project"?
karahiyo 2015/05/09
Google

android

daisuke osada

一時退避

Ingress

データ

company

AR

人類は滅亡する

デザイン
リンク
山手線リアルタイム混雑情報で遊んでみよう
去年から公開されてる「JR東日本アプリ」ですが、機能の一つに「山手線トレインネット」というものがあります。これは山手線の各車両の現在位置、混雑状況、室内温が見えるというもので、座りやすい車両を探すのに便利だったりします。山手線トレインネットから取得した車両位置と混雑率電車の運行情報がここまで時間粒度細かく公開されているのは世界的にも珍しいので、特に目的も無しにデータをクローリングして遊んでみました。データをクローリングするまずは山手線トレインネットの車両位置・混雑情報をクローリングします。 JR東日本アプリの山手線トレインネット。今の車両内の混雑や室内温が見える。すごい！「山手線トレインネット」はブラウザから見えるページが存在しない、iPhone/Androidアプリ専用の画面です。なので普段の「FirebugでAJAXの通信を見てAPIをリバースエンジニアリング」ほど簡
karahiyo 2015/04/07
ajax

android

api

iPhone

data

データ

鉄道

JR

交通
リンク
Goのガーベジコレクタを視覚化するツール | POSTD
（環境変数GODEBUGは、ランタイムパッケージで提供されています）この環境変数を指定してプログラムを起動すると、標準出力に以下の追加出力が出力されます（少し簡略化されています）。 % env GODEBUG=gctrace=1 godoc -http=:6060 ... gc76(1): 2+1+1390+1 us, 1 -> 3 MB, 16397 (1015746-999349) objects, 1436/1/0 sweeps, 0(0) handoff, 0(0) steal, 0/0/0 yields gc77(1): 2+0+1582+1 us, 2 -> 4 MB, 14623 (1016248-1001625) objects, 1436/0/0 sweeps, 0(0) handoff, 0(0) steal, 0/0/0 yields scvg0: inuse:
karahiyo 2014/09/08
gc

go

HTTP

データ

ツール

development

golang

visualization

OSS
リンク
オンライン寄せ書きyosetti(ヨセッティ)
お支払いについて「色紙プリント」「PDFダウンロード」は有料メニューです。お支払いにはクレジットカード・デビットカードがご利用いただけます。カードをお持ちでない方はコンビニで購入できるプリペイド式の「Vプリカ」や「バンドルカード」などのご利用をご検討ください。お届けについて「色紙プリント」は日本郵便でお届けしております。平日午前9時までのご注文は当日発送いたします。ゆうパケットで発送する場合は送料無料です。ゆうパックをご指定の場合は別途550円がかかります。
karahiyo 2014/09/07
https

スマートフォン

データ

WEB

webサービス

webservice

service

ギフト

プレゼント

*WEBサービス
リンク
ストリームデータ分散処理基盤Storm
2012年12月10日 NTTデータオープンソースDAY 2012 講演資料『ストリームデータ分散処理基盤 Storm』 NTTデータ基盤システム事業本部 OSSプロフェッショナルサービス岩崎正剛 http://oss.nttdata.co.jp/hadoop/
karahiyo 2014/09/06
データ

OSS

オープンソース

システム

hadoop

twitter

database

storm

データ分析
リンク
BigQuery と Google の Big Data Stack 2.0 - naoyaのはてなダイアリー
先日、有志で集まって「BigQuery Analytics」という書籍の読書会をやった。その名の通り Google BigQuery について書かれた洋書。 BigQuery を最近仕事で使い始めたのだが、BigQuery が開発された背景とかアーキテクチャーとかあまり調べもせずに使い始めたので今更ながらその辺のインプットを増やして以降と思った次第。それで、読書会の第1回目は書籍の中でも Overview に相当するところを中心に読み合わせていった。それだけでもなかなかに面白かったので少しブログにでも書いてみようかなと思う。 BigQuery の話そのものも面白いが、個人的には Google のインフラが書籍『Google を支える技術』で解説されたものが "Big Data Stack 1.0" だとして、BigQuery は Big Data Stack 2.0 の上に構築されており
karahiyo 2014/08/31
BigQuery

google

development

データ

database

SQL

nosql

mpp

bigdata

MapReduce
リンク
Norikra: Stream processing with SQL for everybody
Schema-less Stream Processing with SQL Norikra is a open source server software provides "Stream Processing" with SQL, written in JRuby, runs on JVM, licensed under GPLv2. Schema-less event streams (called as 'target') Input/Output event streams as JSON objects, which can contain any fields with a target name. SQL processing Norikra's query is SQL with window specifier support (It's actually Esper
karahiyo 2014/08/30
sql

schema

as

event

plugins

fluentd

データ

json

dev

norikra
リンク
memcachedと“正反対”、Redisが仮想メモリをサポート－＠IT
2010/09/07 KVS（キー・バリュー・ストア）に分類されるオープンソースのRedisの新バージョン、「Redis 2.0.0」が2010年9月5日にリリースされた。Redisはmemcachedと同様にキーと値のペアをメモリ上に保持するKVSの一種だが、3つの際立った特徴がある。1つはハッシュ以外のデータ構造もサポートしていることで、リスト型、集合型、順序付き集合型などのデータ構造が扱え、サーバ側でコレクションに対するpush/pop、コレクション同士のunion/intersection、数値のincr、decrなどの操作がアトミックに行える。バージョン2.0では複数の操作を1つにまとめてアトミックに操作するコマンドも増えている。もう1つのRedisの特徴は、マスター・スレーブによるレプリケーション設定ができ、リード側のスケールアウトが容易にできること。そして3つ目の特徴は、
karahiyo 2014/08/14
メモリ

redis

データ

db

ソフトウェア

database

MySQL

オープンソース

nosql

memcached
リンク
Treasure Data, Inc. | Finding Gems in Your Big Data
CREATE THE CONNECTION Do more than capture and analyze customer signals. Act on them. Customer Data Cloud unites operations, service, sales, and marketing teams around the same unified customer profiles. When every department has the data and insights they need, they can work together to create connected customer experiences and improve business value. Schedule Demo Watch Video
karahiyo 2014/06/23
data

cloud

データ

ビジネス

treasuredata

Analysis

dwh

service

DARPA

Storage
リンク
戦略的アプローチとリテンション効果向上はプライベートDMPで実現する！ adingoが示す自社データ活用術
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
karahiyo 2014/06/23
DMP

データ

アドテク
リンク
Redis の永続化について調べた - akishin999の日記
Redis でのデータの永続化方法について調べたので、忘れないうちにまとめておきます。調べた時の Redis のバージョンは 2.6.13 です。スナップショット(RDB) Redis のデフォルトの永続化の仕組みこの設定が有効な場合、Redis は定期的にデータベースの内容をディスクに出力する Redis を再起動するとこのファイルからデータが読み込まれ復元される一定回数の更新 + 一定間隔でディスクにファイル出力ファイル出力タイミングは設定ファイル、CONFIG コマンドで変更可能無効にもできる出力は非同期で行われるため、プロセスがクラッシュした場合には前回のスナップショット以降のデータが失われる可能性あり多少のデータロスを許容できるようなデータならスナップショットのみでもイケそう手動で実行するには SAVE コマンドまたは BGSAVE コマンドを実行 SAVE は
karahiyo 2014/06/15
redis

設定

データ

コマンド

software

*programming

*server
リンク
リトライと冪等性のデザインパターン - Blog by Sadayuki Furuhashi
リトライを肴に一晩酒が飲める古橋です。大規模なデータに触れることが日常茶飯事になっている今日この頃。この分野のおもしろいところは、いつまで経っても終わらないプログラムを簡単に作れてしまうことかもしれません。エラー処理、リトライそして冪等性*1の３つを抑えていないプログラムは、小規模なデータなら問題ないが、データ量が多くなると使い物にならなくなる可能性が大です。大規模データをバッチ処理するケース以外でも、リトライは一般にプログラムの信頼性に関わる重要な問題です。そんなわけで、リトライに関わるいくつかのデザインパターンを、連載でまとめておこうと思います*2。では、第1回は背景から：なぜリトライが必要なのかプログラムは色々な理由で失敗する。例えば、 A) 通信先のプログラムが高負荷すぎて応答できなかった B) メモリを消費しすぎてメモリ確保に失敗した。またはOOM KIllerに殺さ
karahiyo 2014/06/10
データ

メモリ

programming

プログラミング

development
リンク
WWDC 2014 発表内容まとめ
huin Job : Software Engineer(iOS, Android) Use : Objective-C, Swift, Java Like : Gadget, Apple, Photography, Art, Design, UI, UX More posts by huin. 今年もやって来ましたApple WWDC 2014。昨年は幸運にもチケットが手に入ったので現地で生で観れたのだけど、今年はハズれてしまったので大人しく家から中継みてました。今回は、過去最大レベルで開発者向けのアナウンスが多かったように感じます。正直、ぜんぜん把握しきれてませんが、ひとまず発表内容をまとめてみます。 ※写真はThe Vergeへのリンクになっています。 WWDCについてのアナウンス 25回目の開催 69カ国からの参加、70%は初参加. 世界には900万人の開発者が登録.過去１
karahiyo 2014/06/03
OSX ヨセミテ

mac

ios

OS X

デザイン

os

mail

データ
リンク
Googleの虎の子「BigQuery」をFluentdユーザーが使わない理由がなくなった理由 #gcpja - Qiita
「BigQueryは120億行を5秒でフルスキャン可能」は本当か？先日、kaheiさんがGoogle BigQuery（Googleクラウドの大規模クエリサービス）について、こんなエントリを書いていた。とにかくパフォーマンスがすごい。（Fluentd Meetupでの）プレゼン中のデモで、ディスクに収められた5億件のデータをSQLでフルスキャンするのに3秒しかかからない。9億件のデータを正規表現を含んだSQLでスキャンしても、7秒で終わる（これ、記憶がちょっとあいまい。もう少しかかったかも）。これには驚いた。佐藤さんがGoogleに入社して一番驚いた技術が、一般公開される前のBigQueryだったと言っていたが、その気持ちはわかる。 From Fluentd Meetupに行ってきましたこれを読んだ時、BigQueryの検索スピードについてちょっと補足したくなった。確かにFluent
karahiyo 2014/05/20
BigQuery

データ

hadoop

fluentd

Google

データベース

bigdata

gcpja

クエリ
リンク
tree-tips: mysqldumpでロックせずオンラインバックアップする | MySQL
mysqldumpのオンラインバックアップ mysqldumpのオプション mysqldump時にロックをかけないオプションは「--single-transaction」です。 --single-transaction このオプションはサーバからデータをダンプする前にBEGIN SQLステートメントを発行します。InnoDBといったトランザクションテーブルに対してのみ便利です。なぜなら、アプリケーションをブロックせずに、BEGINが発行された当時のデータベースの状態をダンプするからです。このオプションを使用しているときは、一定の状態でダンプされるのはInnoDBテーブルのみだということを留意してください。例えば、このオプションを使用中にダンプされたMyISAMやMEMORYテーブルは状態が変化する可能性があります。 mysqldump — データベースバックアッププログラムリファレンス
karahiyo 2014/05/15
sql

innodb

データ

memory

リファレンス

session

tips

mysql

mysqldump

Backup
リンク
みんなが知らずに使ってるAkamai(2):Geekなぺーじ
特定の更新があって、世界中のコンピュータが同時に同じ更新ファイルをダウンロードした時の瞬間最大風速的トラフィックは恐らく凄いです。 Microsoft社がWindows Updateで新ファイルを公開した次の瞬間に世界中で国際間にある光ファイバがパンクしないのはアカマイ社があるからとも言えそうです。４秒ルール？表示に4秒以上かかると75％の顧客は購買意欲がなくなるという調査結果もあるようです。「BBC NEWS : Websites face four-second cut-off」 Shoppers are likely to abandon a website if it takes longer than four seconds to load, a survey suggests. The research by Akamai revealed users' dwindli
karahiyo 2014/05/02
IT

Microsoft

research

コンピュータ

データ

news

windows

Server

dns

ネットワーク
リンク
今さらだけどMySQLのパーティショニング機能を試してみた - (ﾟ∀ﾟ)o彡 sasata299's blog
2013年03月21日18:11 MySQL 今さらだけどMySQLのパーティショニング機能を試してみた最近は花粉が飛んでて辛い季節ですがみなさまいかがお過ごしでしょうか。でももうちょっと我慢すればサクラの季節ですよ〜。花見良いですよね、飲みたいだけですが。・・さて、今回はちょっと必要になったので、MySQLのパーティショニング機能なるものを試してみました。存在は知ってたけど、実際に試してみたことは無かった…。パーティショニングとは？これはどういうものかと言うと、MySQL5.1から使えるようになった機能で、ひとつのテーブルのデータを条件によって複数の領域（パーティション）に振り分けて管理することができる、というものです。例えば日別にデータを別々のパーティションに振り分けたり。パーティショニングするとデータの削除が高速だったり（通常は削除ってものすっごい遅いけど、特定のパーティシ
karahiyo 2014/05/02
データ

mysql

プログラミング

db

パーティショニング

高速化

パーティション

partition

PINNED
リンク
バンディットアルゴリズム入門と実践
Tokyowebmining発表用資料です。複数の選択肢がある場合に、どのように選択を行うのが効率的なのか？という問題を解決するためのアルゴリズムです。
karahiyo 2014/04/30
ゲーム

仕事

ビジネス

広告

メール

アルゴリズム

Algorithm

データ分析

確率

データ
リンク
1