タグ

2017年9月8日のブックマーク (3件)

  • Apache Kafkaに対応したSQLエンジン「KSQL」リリース、ストリームデータをSQLで継続的に処理。Confluentがオープンソースで

    Apache Kafkaを用いたリアルタイムデータ処理の商用サービスを提供しているConfluentは、Apache Kafkaに対応したオープンソースのSQLエンジン「KSQL」のデベロッパープレビューをリリースしました。 Apache Kafkaはスケーラビリティに優れ、大量のデータをリアルタイムに処理できるソフトウェアです。さまざまなアプリケーションから送られてくるログや大量のセンサーなどから生成されるデータなど、リアルタイムに送信されてくるストリームデータをいったんKafkaで受け止め、それをまとめてHadoopなどの分析エンジンに渡してデータの分析を行う、といった形で使われます。 KSQLは、このKafkaに対応したSQLエンジン。これによりJavaPythonで複雑な処理を記述しなくとも、ストリームデータを柔軟に加工できるようになります。 SQLとKSQLの違いとは? 一般的

    Apache Kafkaに対応したSQLエンジン「KSQL」リリース、ストリームデータをSQLで継続的に処理。Confluentがオープンソースで
  • 足りないのは、データではなくサイエンス

    こんにちは、シバタアキラです。気づけばいつもご無沙汰しておりますが、DataRobotのお客様先などで「ブログ読んでます」などと言われる様になると、古いネタだけのブログも忍びなくなってきました。今回のお話も実は構想し始めたのは5月に招待されたオラクル社のイベントでの公演がきっかけでしたが、以来少しづつ温まってきました。 「うちにはこんなに沢山データが有るんです。 AIと組み合わせたらすごいことにななります」 今回のテーマを起案した頃の5月に出た英エコノミストのテーマは「世界で最も価値のある資源はもはやオイルではなく、データだ」という内容でした。 データに対して洞察のある方であれば引っかかるコンセプトですが、実際にはこういうお話を日々耳にします。おそらくHadoopを始めとするビッグデータ系のベンダーなどがそのようなことを吹聴し、「とにかくデータは取っておけば価値になる」とか、「全部取ってお

    足りないのは、データではなくサイエンス
    InoHiro
    InoHiro 2017/09/08
  • 「Slack」や「Qiita:Team」を理化学研究所が導入したら、チームがぐっと良くなった話 | HRナビ by リクルート

    クラウドの社内wikiやチャットツール、チケット管理ツールなどは、IT企業にとってもはや欠かせないコミュニケーションツールだ。 しかしこれらのツールは、開発現場での利用を想定したものが多い。IT業界以外でうまく利用している現場はあるのだろうか……と調べたところ、理化学研究所の情報基盤センター・バイオインフォマティクス研究開発ユニットの研究室(以下、ラボ)で活用し、チームのコミュニケーションがより円滑になったという話を知った。果たしてどのような使い方をしているのか。ユニットリーダーの二階堂愛さんに、ツールの活用事例についてお話を伺った。 ライフサイエンス系のラボで導入 我々のラボの研究対象は「ゲノム科学」と呼ばれる分野です。 生き物は細胞の集合体。ヒト1人あたり約36兆個の細胞が集まっており、その種類は約400~数千ともいわれています。それぞれの細胞の中にはDNAがあり、そこには「どういう体

    「Slack」や「Qiita:Team」を理化学研究所が導入したら、チームがぐっと良くなった話 | HRナビ by リクルート
    InoHiro
    InoHiro 2017/09/08