[B! データ] ang65のブックマーク

ang65 id:ang65

データに関するang65のブックマーク (20)

dfltweb1.onamae.com – このドメインはお名前.comで取得されています。
このドメインは、お名前.comで取得されています。お名前.comのトップページへ Copyright © 2020 GMO Internet, Inc. All Rights Reserved.
ang65 2016/02/23
データ

可視化

グラフ
リンク
これが原因！47人の女性に聞いた彼女ができない人の8つの共通点を解説
ang65 2016/02/10
分析

研究

データ
リンク
コクヨ
ang65 2016/01/07
データ

アプリ

Android

ガジェット

gadget
リンク
情報系の人が株をやってみたくなった時にまず読むべき10冊 - ペリャウドの日
情報系の学生さんなどが株をやってみたくなるというのはTLを見ていてもよくあることだと思います。しかし、情報系の方が予備知識なく株や為替の取引に手を出そうとすると、ついつい時系列データをニューラルネットワークにぶちこんで予測をはじめたりなど、気がつけばコンピュータ占星術の世界に突入してしまうことが多いようです。教授が、「株をやりたいんだったらまず10冊本を読んでください。読み終わったら好きにやってもいいです。」と言っていましたが本当にそのとおりです。それに、プログラマなんだから、車輪の再発明は避けたいです。そこで今日は皆さんが占星術の誘惑を跳ね除け、株投資をはじめるまでに読むべき10冊をピックアップしました。ウォール街のランダム・ウォーカーウォール街のランダム・ウォーカー　<原著第10版>―株式投資の不滅の真理作者: バートン・マルキール,井手正介出版社/メーカー: 日本経済新聞
ang65 2015/12/28
投資

ブログ

データ

プログラミング
リンク
Wikipedia からスクレイピングして… とか言ってる人におすすめしたい，DBPedia からの情報抽出 - Qiita
Wikipedia からスクレイピングして… とか言ってる人におすすめしたい，DBPedia からの情報抽出rdfスクレイピング WikipediaSPARQLdbpedia みなさん DBPedia をご存知でしょうか．DBPedia とは，Wikipedia から構造化データ (RDF) として情報を抽出するものです．DBPedia では Linked Data として情報が体系化されているので，Wikipedia 内の必要な情報を，非常に簡単に抽出することができます．「◯◯ の情報を Wikipedia からスクレイピングして取ってきて…」みたいな話をよく耳にし，そんなのスクレイピングしなくても DBPedia 使えば一瞬なのに… と感じることが最近多々あるので，DBPedia の普及もかねて簡単にまとめてみることにしました．DBPedia なんて初めて聞いたという方は，ぜひチェック
ang65 2015/11/25
簡単

データ

あとで読む

データマイニング

Wikipedia
リンク
Facebook Relayについてまとめ - Qiita
Reactがもっと広まって欲しいと思っている今日このごろ。React EuropeでJoseph Savona氏の講演でRelayについての「モヤっと」がいっきにかなり解消された気がするので、要点を本編を翻訳しながら自分なりにまとめておきます。私の理解が誤っている可能性は十二分にありえるので、ご指摘いただければ幸いです。はじめに ReactとFluxって組み合わせと共によく目にするのが↓の図。矢印は一方向にしか進まないのが特徴で、わかりやすいってのがいろんなところで書かれているんですけど、結局データをサーバからとってくるところってどうなってるの？ってのが疑問として残ります。つまり、図で表現すると↓の部分の仕組みがどうなっているかってところです。その部分を、Instagramのようなサービスを例に説明しています。クライアントはどのようにしてサーバからデータを取得すべきかまず、I
ang65 2015/08/15
データ

サービス

サーバ
リンク
強固なデータ・インフラストラクチャを構築するためのログの活用（デュアル書き込みがダメな理由）PART 2 | POSTD
PART 1.はこちら : 強固なデータ・インフラストラクチャを構築するためのログの活用（デュアル書き込みがダメな理由）PART 1. ログが使われる場面について4つ説明したいと思います。まずデータベースストレージエンジンの内部です。 B-tree はアルゴリズムの授業で学びましたよね？　ストレージエンジンに広く使われているデータ構造です。ほぼ全てのリレーショナルデータベースと、多くの非リレーショナルデータベースで使われています。 B-treeについて簡単に説明しましょう。B-treeは、ディスク上で固定長のブロックとなるページから構成されており、通常、その固定長は4KBか8KBです。ある特定のキーを探したい時は、まずtreeのルートにあるページから探索を始めます。そのページは他のページへのポインタを内包していて、各ポインタはキーのレンジ（範囲）にタグ付けられています。例えば、もしキー
ang65 2015/07/17
ログ

データ
リンク
強固なデータ・インフラストラクチャを構築するためのログの活用（デュアル書き込みがダメな理由）PART 1. | POSTD
これは Craft Conference 2015 で私が行った講演を編集して記事にしたものです。その時の動画とスライドもご覧頂けます。あなたのデータベースは、どのようにして確実にデータをディスクに保存しているのでしょう？　ログを使っているのです。データベースのレプリカは、どのようにして他のレプリカと同期するのでしょう？　ログを使っているのです。 Raft などの分散アルゴリズムはどのようにして合意を取っているのでしょう？　ログを使っているのです。 Apache Kafka などのシステムでは、アクティビティデータはどのように記録されるのでしょう？　ログを使っているのです。あなたのアプリケーションのデータ・インフラストラクチャはどのように規模相応の堅牢性を保つのでしょうか？　答えは･･･ログは至るところにあります。私はプレーンテキストのログファイル（syslogやlog
ang65 2015/07/17
ログ

データ

アルゴリズム

データベース
リンク
AIやDX関連のコンテンツDA関連のニュース・情報　|　データアーティスト株式会社
データアーティスト株式会社のコンテンツ一覧ページ。Data Artist（DA）は、機械学習やディープラーニングなど、AI（人工知能）やDX（デジタルトランスフォーメーション）関連のブログや事例など様々なコンテンツを定期的に配信します。
ang65 2014/12/31
キーワード

分析

統計

データ
リンク
衆議院議員活動統計（46期） | 国会議員白書
衆議院議員活動統計（46期：2012/12/16～2014/12/14） 2012年衆院選（第46回衆議院議員総選挙）の当選議員、および次の衆院選までに繰上や補選で当選した議員について任期中の議会活動の統計をまとめています。国会議員白書ではこれらの議員を46期衆議院議員と呼んでいます。 46期衆議院議員の五十音順一覧はこちら、選挙区順一覧はこちら、そのほかの期の議員一覧はこちらにあります。 2014年衆院選立候補者についてまとめたページがこちらにあります。 ※46期範囲：2012/12/16～2014/12/14 政党は選挙時の公認を示しており、追加公認やその後の移動等は反映していません。国会活動とデータの性質上、大臣、副大臣等の政府役職就任者の委員会出席数は少なくなるなど、データを見る際には気を付けたほうがよい注意事項があります。こちらをご参照ください。※画面が狭いため、本会議、委員会
ang65 2014/12/10
資料

リファレンス

統計

データ

政治
リンク
『アドテクスキルアップゼミ　カラムナーデータベース検証まとめ』
皆様こんにちは。アドテク本部カラムーデータベースゼミチームです。今回の記事ではゼミチームが行った検証結果について発表させていただきます。また、この記事につきましては 11/12 に行われた db tech showcase Tokyo 2014 にて発表させて頂きました内容になります。プレゼン資料はこちらにあがっています。 ※追記 Impala / Presto の File Format についてご指摘を頂きましたのでデータロード及びまとめの部分に追記しました。アドテクスキルアップゼミカラムナーデータベース検証まとめ目的広告システムでは大量のデータをデータベースに入れて解析を行います。小規模から中規模なデータはRDBMSで行えますが、数TBを超えると RDBMS以外の選択肢を探さないといけません。ビッグデータ用のデータベースは比較資料が少なく、また、あったとしても検証
ang65 2014/11/15
データベース

データ

database

BigQuery

Presto

Impala

RedShift
リンク
linuxで立てる録画サーバに必要なことまとめ（録画編） - kariaの日記 @ Alice::Diary
録画サーバ立て直し中なのでメモ代わりに書いておきます。まず最初にどういう保存方針で行くのか考えておきましょう。主にハードウェア構成に影響してきます。録画して見たらすぐ消す（TSそのままの状態で）保存する mp4などにエンコードして保存するハードウェアまずはパココンがないと何も出来ないですねということで。 CPU エンコードをしない（TSそのままで保存・視聴する）のであれば、割と何でもよさそうです。とはいえ、録画中は延々とTSのストリームをHDDに保存し続けるわけで、全くCPUを食わないわけではありません。あまりに太古のCPUだとかATOMだとかは、避けた方が無難かと思います。ATOMで頑張ってる人もいないわけではないので、その辺はググりましょう。エンコードをしようと思ってるなら当然ながらなるべく強力なCPUを……と思うのですが、Intelの最近のCPUにはQSV(Quick
ang65 2014/10/28
アニメ

linux

データ

あとで読む

クラウド
リンク
文法圧縮入門：超高速テキスト処理のためのデータ圧縮（NLP2014チュートリアル）
言語処理学会第２０回年次大会（2014/3）のチュートリアル講義資料です。 - 要旨 - 文法圧縮とは，入力テキストをよりコンパクトな文脈自由文法（CFG）に変換する圧縮法の総称である．文法圧縮の強みは圧縮テキストを展開すること無く，検索等のテキスト処理を効率よく行える点にある．驚くべきことにその処理速度は，元テキスト上での同じ処理を理論的に，時には実際にも凌駕する．また近年，ウェブアーカイブやログ，ゲノム配列等の大規模実データを高効率に圧縮できることで注目を集めている．しかしながら，文法圧縮についての初学者向けの解説資料はまだまだ少ない．そこで本チュートリアルでは，文法圧縮の歴史的背景から最新動向までを幅広く紹介する．具体的には文法変換アルゴリズム，圧縮テキスト上での文字列パターン検索，文法圧縮に基づく省メモリデータ構造等の解説を行う．Read less
ang65 2014/03/19
データ

圧縮

データ圧縮

アルゴリズム

自然言語処理

nlp
リンク
ParaView - Wikipedia
ParaViewは科学技術可視化の並列化と対話操作のための、自由に利用できるオープンソースプログラムである。 ParaViewはデータセットのリモート可視化を可能にするクライアントサーバアーキテクチャを持ち、level of detail(LOD) モデルを生成することで大規模なデータセットに対しても対話的なフレームレートを維持する。ParaViewはVisualization Toolkit (VTK) ライブラリ上に構築されている。VTKとはデータ、タスク、パイプラインメカニズムのための可視化サービスを提供するライブラリのセットであり、ParaViewは共有メモリ／分散メモリ型のマルチコンピュータやクラスタ上でのデータ並列化を行うアプリケーションとして設計された。また、シングルコンピュータのアプリケーションとしても実行できる。概要[編集] ParaViewはオープンソース、マルチプラ
ang65 2013/11/19
データ

可視化

プログラミング
リンク
TechCrunch | Startup and Technology News
Yellow, an asset financier for solar energy and digital devices in Africa has raised $14 million series B funding in a round led by Convergence Partners with participation from the Energy Entrepreneur Fisker, the electric carmaker founded by the Danish auto designer Henrik Fisker, is gearing up to enter the Chinese market where competition is increasingly cut-throat, following in the footsteps of
ang65 2013/08/22
統計

プログラミング

excel

MATLAB

データ

分析
リンク
株式会社ALBERT（レコメンドエンジン）
データ分析から導き出されたインサイト無しにAI（人工知能）の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって本当に必要なデータを活用するための方法を知っています。将来を見据えたオペレーション体制を備えている企業の半数以上（52％）は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ
ang65 2013/05/01
データ

統計

statistics

math

統計データ

多変量解析
リンク
https://jp.illumina.com/events/webinar_japan.html
ang65 2013/03/27
研究者

データ

技術

bioinformatics
リンク
TechCrunch | Startup and Technology News
Yellow, an asset financier for solar energy and digital devices in Africa has raised $14 million series B funding in a round led by Convergence Partners with participation from the Energy Entrepreneur Fisker, the electric carmaker founded by the Danish auto designer Henrik Fisker, is gearing up to enter the Chinese market where competition is increasingly cut-throat, following in the footsteps of
ang65 2012/09/24
サービス

フリーランス

データ
リンク
最近のtrieの話（xbwなど） - Preferred Networks Research & Development
ブログの更新がとまっていましたが、また少しずつ更新してきたいと思います。今回はtrie（トライ）の最近の話をしたいと思います。 trieはキー集合を扱うためのデータ構造の一種です。例えば、単語集合からなる辞書であったり、クロールしたURL情報を扱ったり、最近だと、KVS（Key Value Store)のようにキーを介してデータを保存、読み込みをしたりと様々な場面で利用されます。同じようにキー集合を格納するデータ構造としてハッシュを利用する方法があります。キーからハッシュ値を計算し、その場所に文字列へのポインタを格納しておくデータ構造です。ハッシュを利用した場合とtrieを利用した場合の一番の大きな違いは、trieの場合だと、ある文字列から始まるキーを全て列挙する、いわゆる接頭辞探索ができることです。例えば”te”で始まる文字列を網羅的に調べることができます。木をたどって、”te”の下
ang65 2012/08/10
Trie

データ

programming

データ構造
リンク
統計を学びたい人へ贈る、統計解析に使えるデータセットまとめ - ほくそ笑む
はじめに統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。それでは実際のデータをどうやって手に入れましょうか？実験や調査をして実際のデータを得るのは大変でお金もかかります。幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。というわけで、今日は、
ang65 2012/02/14
R

統計

データ

statistics

まとめ
リンク
1