タグ

data miningに関するyamada_kのブックマーク (3)

  • Twitter、学術研究にツイートデータを無料で提供する「Twitter Grants」を発表

    Twitterは2月5日(現地時間)、公開されているTwitterデータ(いわゆる「Firehose」)を学術研究者に無償で提供する試験的なプロジェクトTwitter Grants」を発表した。 参加を希望する非営利の学術研究機関はエントリーページから申し込める。締め切りは3月15日。選考後、一部の参加希望者がFirehoseに無償でアクセスできるようになる。 公開ツイートは1日当たり5億件以上投稿されており、累計すると膨大な量になる。Twitterは米Microsoftなどの企業には有償でこのデータへのアクセスを提供している。Twitterが同日発表した2013年10~12月期の決算によると、データライセンスなどの売り上げは2300万ドルだった。 Twitterは社内のエンジニアリングチームで開発したツイートデータを使った幾つかの視覚化動画を発表している。また、これまで一部の学術機関

    Twitter、学術研究にツイートデータを無料で提供する「Twitter Grants」を発表
  • データ・サイエンスのプログラミング言語はRからPythonに置き換わる | readwrite.jp

    これまでデータ・サイエンティストの選ぶプログラミング言語はRだったのだが、急激にPythonに置き換わろうとしている。 このシフトの理由はいくつかあるようだが、第一にはPython自体が汎用的で比較的学びやすい言語であるのに対し、Rが習得するにあたってやや複雑であることがあげられるだろう。 データにますます依存しつつある現代社会とデータに飢えたサイエンティストにとっては「簡単さ」こそが鍵となるのだ。 Rは実際にはプログラミング言語ではないRを覚えることに苦労する人が多い理由として考えられるのは、Rが実際にはプログラミング言語ではないからかもしれない。R専門家のジョン・クックいわく、Rとは「統計のためのインタラクティブな環境」であり、厳密にはプログラミング言語ではないのだ。彼はさらに「Rをプログラミング言語だと考るのではなく、Rがプログラミング言語を内包しているのだと考えた方が良いと分かった

    データ・サイエンスのプログラミング言語はRからPythonに置き換わる | readwrite.jp
  • この取り組み、無駄だけど凄いなあと思える人は挙手 - やまもといちろうBLOG(ブログ)

    10分ぐらいしか時間がないので雑に書く。エッセンスだけ分かる人に届け。 なぜ景気の「今」はわからないのか http://event.yahoo.co.jp/bigdata/keiki/ これ単品では凄いことです。ヤフーはやっぱり偉大だし、たいしたものだ。 ここまで洗練された方法でビッグデータを集計しているというのは、当に素晴らしいのは間違いありません。 ただ、証券で刑期もとい景気の先読みをやっている人からすると、意味がないのもまた事実です。大雑把な景気の未来予測自体は、かなり手法的にポピュラーなんすよ。問題は、突発事態が起きたときに前提条件が変わりうるので、リスク計算をどうするかが当に大変なんですけど。 ・ 比較対象が集計の遅い内閣府である ・ もっと少量のサンプルで到達可能な精度である というのもありますが、そもそも景気指標というのは未来予測の世界ですんで、当面の景気の先行きというの

    この取り組み、無駄だけど凄いなあと思える人は挙手 - やまもといちろうBLOG(ブログ)
  • 1