タグ

2011年10月28日のブックマーク (13件)

  • Jubatus : Distributed Online Machine Learning Framework¶

    Jubatus English Japanese

  • MSR Intern Beijing(滞在中)のご紹介(第29回)

    Microsoft Research滞在者のご紹介。第29回は、北京のラボに滞在中、奈良先端科学技術大学院大学の吉田 康久さんです。吉田さんは松研究室で自然言語処理と機械学習の研究に励む、NLP界期待の星です。 ・所属、学年、研究室 奈良先端科学技術大学院大学 (NAIST) 情報科学研究科 自然言語処理学研究室 博士前期課程 2年 ・博士(修士)論文のテーマ 自然言語処理と機械学習の研究をしています。特に商品レビューの極性(肯定的か否定的か)を判定する評判分析というタスクに取り組んでいました。例えば"long"という単語について考えてみましょう。カメラの分野の"the battery life of Camera X is long"という文脈では"long"は肯定的な意味になりますし、ソフトウェアの分野の"Program X takes a long time to complete

    MSR Intern Beijing(滞在中)のご紹介(第29回)
    gologo13
    gologo13 2011/10/28
  • Big Sky :: Learn Vim Progressively

    この文章は、 http://yannesposito.com/Scratch/en/blog/Learn-Vim-Progressively/で掲載されている「Learn Vim Progressively」の翻訳文です。 文内の全てはの筆者による物であり、訳文の内容については私による物となります。意訳が若干入っています。間違い等あればご連絡下さい。 tl;dr: 可能な限り速くvim(人類史上、最良と知られているテキストエディタ)を習得したい。その方法を提案する。生き残るには最小を学ぶ事から始め、その後徐々にトリックを混ぜて行く。 Vim 60億ドルのテキストエディタ 優れいて、強く、そして速い vimを学ぶ事、それはあなたあなたが学ぶ最後のテキストエディタになるでしょう。私が知る限りより優れたテキストエディタはない。学ぶのは難しいが、使うと素晴らしい。 4つのステップで学ぶ事をお勧めす

    Big Sky :: Learn Vim Progressively
    gologo13
    gologo13 2011/10/28
  • 大規模データ分析基盤技術「Jubatus」の公開 - 株式会社プリファードインフラストラクチャー

    2011年10月26日 報道関係者各位 プレスリリース 日電信電話株式会社 株式会社プリファードインフラストラクチャー ==================================================== ビッグデータのリアルタイム処理を可能にする 大規模データ分析基盤技術を世界に先駆けて開発 ~10月27日よりオープンソースソフトウェアとして公開~==================================================== 日電信電話株式会社(東京都千代田区、代表取締役社長:三浦 惺、以下「NTT」) と株式会社プリファードインフラストラクチャー(東京都文京区、代表取締役社長:西川 徹、以下「PFI社」)は、ビッグデータ*1と呼ばれる大規模データをリアルタイムに高速分 析処理する基盤技術「Jubatus*2」(第1版)を開発しま

  • NTT HOME > NTT持株会社ニュースリリース > ビッグデータのリアルタイム処理を可能にする大規模データ分析基盤技術を世界に先駆けて開発

    (報道発表資料) 2011年10月26日 日電信電話株式会社 株式会社プリファードインフラストラクチャー ビッグデータのリアルタイム処理を可能にする大規模データ分析基盤技術を世界に先駆けて開発 ~10月27日よりオープンソースソフトウェアとして公開~ 日電信電話株式会社(東京都千代田区、代表取締役社長:三浦 惺、以下「NTT」)と株式会社プリファードインフラストラクチャー(東京都文京区、代表取締役社長:西川 徹、以下「PFI社」)は、ビッグデータ*1と呼ばれる大規模データをリアルタイムに高速分析処理する基盤技術「Jubatus*2」(第1版)を開発しました。 直近の潮流変化を調べる等、対象データの新しさを意識したビッグデータ分析アプリケーションを作成するニーズに対して、従来のバッチ処理による定期的な一括処理は、新しいデータの分析が次の実行タイミングまで待たされる点で十分ではありませんで

    gologo13
    gologo13 2011/10/28
    Jubatusは、「大量データ」を「常に素早く」「深く解析」することを狙った(図1)、大規模分散リアルタイム解析フレームワークです
  • jubatus pressrelease

    2012/12/7にComSysで招待講演した際のプレゼン資料です。2013/1時点でのJubatusに関する全部入り資料になっています。 概要:Hadoopは非常に成功した大規模データの分散処理基盤である一方、データを貯めないリアルタイム処理や、統計的な手法で知見や予測モデルを得る機械学習技術のサポートは限定的である。Jubatusは、それらHadoopに足りない「分散・リアルタイム・機械学習」を実現するためのOSSフレームワークとして2011年にリリースされた。その技術的特徵は、オンライン学習アルゴリズムを分散化し、かつ分散環境でコストの高いデータ共有を排除してコンパクトな機械学習モデルのみを緩やかに共有するMix操作を中心とした計算アーキテクチャを採用していることにある。講演ではその動作原理を中心にJubatusの裏側を紹介する。

    jubatus pressrelease
  • NTTとPFI、ビッグデータ解析でリアルタイム処理可能な基盤技術を開発

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます NTTとプリファードインフラストラクチャー(PFI)は10月26日、ビッグデータをリアルタイムに高速分析処理する基盤技術「Jubatus(ユバタス)」を開発したことを発表した。10月27日からOSSとしてhttp://jubat.us/で公開する。 Jubatusはビッグデータを“常に素早く、深く解析”することを狙った大規模分散リアルタイム解析フレームワーク。常に素早く処理するために、データを複数のサーバに振り分けて並列かつ逐次的に処理させる。深く解析するために、複数のサーバがお互いの途中処理結果を共有する仕組みが必要になる。 共有するために、サーバ間通信によるボトルネックの発生リスクが伴うため、通信方法を工夫しないとトータルでの性能が

    NTTとPFI、ビッグデータ解析でリアルタイム処理可能な基盤技術を開発
  • 「 iCloud ってさあ、無料とか言いながら容量がたったの 5GB でしょ?少なすぎて使えねぇよ!」 →「いえ。余裕ですし、誤解です。」を解説します。 | 覚醒する @CDiP

    iCloud ってさあ、無料とか言いながら容量がたったの 5GB でしょ?少なすぎて使えねぇよ!」 →「いえ。余裕ですし、誤解です。」を解説します。 iOS5 がリリースされてはや2週間余り。iCloud使ってますか! アップル – iCloud – あなたのコンテンツを、あなたのすべてのデバイスで。 Photo by donpy 巷では毎日のように iCloud を使って「感動の嵐!」を謳いながらエントリーをされている方、「便利過ぎ!ワロタ!」などとツイートされている方がたくさんいらっしゃいます。そんな投稿を見ながら私も iCloud を色々実験的に手持ちのiPadだとか、お下がりになった iPhone4 などで試してみてはニヤニヤしています。 方や、未だ様子見の方や、まったく使っていないどころかアカウント登録すらしていない方々も多くいらっしゃるようです。 そんな方々の多くの理由は「

    「 iCloud ってさあ、無料とか言いながら容量がたったの 5GB でしょ?少なすぎて使えねぇよ!」 →「いえ。余裕ですし、誤解です。」を解説します。 | 覚醒する @CDiP
  • ヤフーが大阪で人材募集、開発拠点も冗長化へ

    東日大震災を機に、システムのディザスタリカバリや事業継続計画(BCP)の見直しを検討し始めた企業が多い。これを一歩進め、システム開発体制までを「冗長化」しようという狙いから、ヤフーでは大阪での求人を開始した。 現在、Yahoo! JAPANのサービス開発は「R&D統括部」が担っている。おおよそ1500~1600人のエンジニアが、大きく分けて、ユーザー管理やログイン、課金処理といった基的なプラットフォームおよびAPIの開発に当たる部隊と、それらを活用して実際のサービス/アプリを開発する部隊に分かれ、新規サービスの開発などに当たっている。そのほとんどが東京社での勤務だ。 しかし、サービス作りに携わるエンジニアが東京以外にはいない現状の体制では、「もしも東京に何かあったならリカバリがきかない」(ヤフー 人事部 キャリア採用室リーダー 的射場智之氏)。実際、3月の東日大震災が発生した際

    ヤフーが大阪で人材募集、開発拠点も冗長化へ
  • 職業としてのウェブエンジニア (水野 貴明 DeNA)

    ウェブサービスは開発の敷居が低く、個人でも開発が可能です。しかし職業としてウェブエンジニアにつくことは、趣味でサービスを運営するのとはまた違ったスキルが必要になったり、経験を得られたりと言ったことが多くあります。講演では実際にウェブエンジニアを職業とした経験を素に、それがどのような世界なのか、そしてそれを目指すに当たってどのようなことを考え、学んでいけばいいのかについて考えていきます。

    職業としてのウェブエンジニア (水野 貴明 DeNA)
    gologo13
    gologo13 2011/10/28
    PHP, MySQL, JQuery がなんとなく出来る人はたくさんいる。差別化を図るために、データマイニング、NLP、CSの知識が必須。/ テストを書け、分散処理を試せ
  • Big Sky :: ファイルタイプ別にテンプレートを選べるsonictemplate-vim書いた

    追記:template-vimはthincaさんの物と名前がバッティングしたので、「音速でコーディング出来る」と言う意味でsonictemplate-vimに改名しました。 既に似たのはあると思うので車輪の再発明臭いけど、僕の好みの奴は見た事無かったので自分で書いた。 欲しかった要件としては 同じファイルタイプだけど、使いたい雛形が数パターンある 初期カーソル位置とか欲しい Perlで「package Foo;」とか埋めてくれたら幸せ Go言語でライブラリ書くときとmain書くときで雛形違うよね みたいなところ。 mattn/sonictemplate-vim - GitHub template chooser for vim https://github.com/mattn/sonictemplate-vim これを使って # vim foo.pl と新しいPerlスクリプトファイルを開

    Big Sky :: ファイルタイプ別にテンプレートを選べるsonictemplate-vim書いた
    gologo13
    gologo13 2011/10/28
  • 大手ITからベンチャー「CROOZ」への転身で分かったこと - @IT

    2010/12/21 (2013/11/7更新 編集部注:小俣泰明氏はクルーズ株式会社を退職済み) 軽い茶髪にモヘアのカーディガン。腰よりも低く首から長く垂れ下がった柄物のストール。取材相手の男性は、デルのラップトップを片手に「ゆらり」と静かに会議室に現れた。 独特のスタイルに面らう。 モバイル系ベンチャー企業とはいえ「取締役 技術統括担当執行役員」の肩書きから想像できないスタイル。小俣泰明さんの存在感は強烈だった。 驚くことに、小俣さんは、もともとは大手ICT企業のNTTコミュニケーションズに勤務していたこともあるという。MCSE(Microsoft Certified System Engineer)の肩書きまで持つエンタープライズ系のエンジニアだった。一緒に取材に応えてくれた技術統括部の池田朋大さんも、伊藤忠テクノソリューションズ(CTC)に在籍していたサーバ運用技術者だったという

    gologo13
    gologo13 2011/10/28
    俺はまだ言ってることがすごいんか、普通なんか判断できん。ブコメでくだらんゲームとか言ってる人がいるけど、儲かってる方が勝ちだろ。
  • GitHub - retrieva/pficommon: General purpose C++ library for PFI

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - retrieva/pficommon: General purpose C++ library for PFI
    gologo13
    gologo13 2011/10/28