So you wanna be a data scientist? A guide to 2015's hottest profession Are you good at math? Like, really good at math? Do you also know Python and, oh yeah, have deep knowledge of a particular industry? On the off chance that you possess this agglomeration of skills, you might have what it takes to be a data scientist. If so, these are good times. LinkedIn just voted "statistical analysis and dat
My unscientific, incomplete, thoroughly biased view of interesting things that happened with Clojure in 2014. No doubt about it: Clojure is making inroads in big business. Cisco acquired ThreatGRID, a malware/threat analysis company using Clojure. There hasn’t been what I’d call an official announcement from Amazon, but it’s clear from tweets and job listings that they’re using Clojure in producti
You probably have heard expressions like “Clojure”, “Scala”, “Erlang” or even “Java now has lambdas”. And you might know it has something to do with "Functional Programming". If you’re participating to any Programming Community, this subject probably has popped up already. If you'd google "Functional Programming", you'll see there's nothing new. One of the first language created already embraces i
UPDATE: Slides and video from a more comprehensive presentation available here (and if you understand the Either monad, read this first!). UPDATE 2: This is one of my most popular posts, and it is a useful approach to error handling, but please don’t overuse the idea! See my post on “Against Railway-Oriented Programming”. In the previous post, we saw how a use case could be broken into steps, and
画像ファイルの画素数や色数などを調べるには、GIMPなどのグラフィックソフトでそのファイルを開いてみればいい。しかし、単に大きさを知りたいだけなのに、Xを起動してGIMPを実行し、ファイルを開くのでは時間がかかる。このようなときは、ImageMagickに付属しているidentifyコマンドを使うといい。 identifyコマンドは、引数として指定された画像ファイルの種類や画素数などの情報を調べる。 $ identify sample.tif sample.tif TIFF 1152x864 DirectClass 16-bit 5839kb 0.2u 0:01 例では拡張子が.tifとなっているが、中身が画像ファイルであればsample.gazouなどというファイル名であっても構わない。より詳しい情報が必要なときは、-verboseオプションを付けてidentifyコマンドを実行すればい
この記事は, Spark, SQL on Hadoop etc. Advent Calendar 2014 - Qiita の 12 月6日のための記事です. 今回の記事では,最近話題になっている word2vec の Apache Spark 実装を EC2 上で動かす方法について解説します. word2vec とは? 自然言語処理に新風を巻き起こしたWord2Vecとは何か - 日経BigData の説明を拝借すると,word2vec とはつぎのような説明になります Word2Vecは、その名前の表す通り、単語をベクトル化して表現するする定量化手法である。例えば日本人が日常的に使う語彙数は数万から数十万といわれるが、Word2Vecでは各単語を200次元くらいの空間内におけるベクトルとして表現する。 それぞれの単語を200個の要素の組み合わせとして表現するため、このような手法は「分散表
About reserved postingIf you register a secret article by the day before the same day, it will be automatically published around 7:00 on the same day. About posting periodOnly articles submitted after November 1 of the year can be registered. (Secret articles can be registered anytime articles are posted.)
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く