1. Hive/Pigを使ったKDD'12 track2 の広告クリック率予測 油井 誠 m.yui@aist.go.jp 産業技術総合研究所 情報技術研究部門 Twitter ID: @myui スライド http://www.slideshare.net/myui/dsirnlp-myuilt 1 http://goo.gl/Ulf3A 2. KDDcup 2012 track2 • 検索ログを基に、検索エンジンの広告のクリック 率(Click-Through Rate)を推定するタスク – 中国の3大検索エンジンの一つsoso.comの実データ • 検索語などはHash値などを利用してすべて数値化されてい る – Trainingデータ(約10GB+2.2GB, 15億レコード) – Testデータ(約1.3GB, 2億レコード) • 学習データの1.33割が評価用データセット –
サイオス、ビッグデータ市場向け新サービスで米国Treasure Data 社と国内初の販売パートナー契約を締結 2012年10月29日選択してくださいプレスルーム サイオステクノロジー株式会社(本社:東京都港区、代表取締役社長:喜多伸夫、東証マザーズ:3744、以下、サイオス)は、Treasure Data, Inc.(本社:米国カリフォルニア州、CEO:芳川裕誠、以下、Treasure Data)と、ビッグデータの活用を容易にするクラウドサービス「Treasure Data Cloud Data Warehousing Service」(以下、「Treasure Data Service」)の販売パートナー契約を締結し、本日より正式に国内での販売を開始します。 これまで企業が、WebアプリケーションのアクセスログやGPSデータといった非構造化データを含む大規模データを蓄積して活用するため
KDDIと子会社のmedibaは10月29日、スマートフォンアドネットワークサービス「mediba ad」で、スマートフォン向けのターゲティング広告配信を12月上旬から開始すると発表した。ユーザーの年齢や性別などに基づく「統計パターン推奨型広告」と、広告閲覧状況に基づく「閲覧パターン推奨型広告」の2種類を展開する。同サービスの開始にあたり、KDDIはプライバシー保護について十分に配慮したことを強調している。 統計パターン推奨型広告--取得情報を開示 統計パターン推奨型広告では、ユーザーがau IDでログインした状態でネットに接続した場合に、KDDIのウェブサイトや、ポータル、バナー広告枠などに、ユーザーの属性や嗜好に沿った広告を配信する。これにより、広告主が訴求したい情報とユーザーの趣味嗜好とのミスマッチを解消できるとしている。 広告配信にあたり、KDDIは対象者の基本情報(「性別」「年代
Welcome back to Instagram. Sign in to check out what your friends, family & interests have been capturing & sharing around the world.
10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...Koichi Hamada
Microsoft Research滞在者のご紹介。第33回は、北京のラボに滞在中、東北大学の成田和弥さんです。成田さんは乾・岡崎研究室で日本語事実性解析における問題を分析・整理し、語彙知識や言語現象を加味したモデルの構築に取り組んでいます。杜の都から来た初めてのインターンです。 ・所属、学年、研究室 東北大学 情報科学研究科 博士後期課程1年です。乾・岡崎研究室に所属しています。 ・博士論文のテーマ 自然言語処理、特にモダリティ・事実性といった深い意味の解析に取り組んでいます。例えば、「Aを買わない」という発言があったとします。これは、Aを買うことを否定している発言だ、というのが容易にわかると思います。同じように、「Aを買うかもしれない」という発言は、Aを買うことの可能性を述べているのだと解釈できますし、「Aを買いたい」という発言は、Aを買うことに対する願望を述べているのだと解釈できます
エンタープライズICTのNo.1情報誌「日経コンピュータ」とNo.1情報サイト「ITpro」がタッグを組んだ大型企画「日経コンピュータ×ITpro 連動特集」がスタートしました。今回はその第1弾として、「情報システムの基盤を国内外のどこに集約・配置するのか」という、多くの企業にとって大きな課題となっているテーマを取り上げた「世界最適のシステム立地戦略」をお届けします。 安く安定した高速回線とクラウド型のシステムが当たり前になった今、日本中、世界中のシステムを集約する動きが盛んになっている。集約先は必ずしも日本とは限らない。 ソニー、サントリー、OKIデータ--。彼らは日本で使うシステムを、アジアのデータセンター(DC)に移設した。シンガポール、マレーシア、タイ、香港、日本の地方都市。ユーザー企業にとって、これまで首都圏一辺倒だったDCの選択肢が、一気に広がっている。一方で、首都圏では新型D
Impala BE メモ 本文章は,Impala のメモ の TODO のうち,BackEnd の特にクエリの実行部を読み,文章化したものである. 概要 BackEnd(BE) は単体のデーモンとして動作し,FE 側でパースした結果(Job ID/Plan)に基づいて処理を実行する.FE と BE のやりとりには Thrift が用いられている. |FE| - パース結果(Job ID/実行Planなど) thrift -> |BE| 実行 Tree/Node について 実行プランは,Tree として表現される.Tree の構成要素を Node と呼ぶ.Node は Expr インタフェースを実装する必要がある. Tree は,FE で構築されて,Thrift 経由でシリアライズされ,BE 側の ExecNode::CreateTree() を実行することで再構築できる. Node の種類
I'm trying to port a C++ project using C++0x and Ogre on Max OS-X and I encounter a portability problem between OS-X versions. I succeeded in compiling my project on Mac OS-X 10.6 (Snow Leopard) using GCC 4.6.0 (because I needed C++0x). It was hard (probably because I a new OSX user) but it finally compiled it without error. I included all the required Components, Frameworks, Plugins etc. needed i
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く