タグ

ブックマーク / gihyo.jp (8)

  • 第1回 なぜ、Hadoopはどのように動くのか、を学ぶのか | gihyo.jp

    はじめに ビッグデータ解析のためのシステム基盤として、Hadoopをはじめとするオープンソースのデータ処理ソフトウェア(データ処理系)が広く利用されつつありますが、当該データ処理系をすでに利用している、もしくは利用の検討をしている読者の方々の中には、たとえば以下のような問題を抱えている方が少なからずいらっしゃるのではないでしょうか。 データ処理系の使い方はなんとなくわかるが、その内部をあまり理解できていない。または、内部の動作原理がよくわからないので、格的に使う気にならない。 同様の目的を達成する複数のデータ処理系において、どれを使って良いかがよくわからない。または、適切に使い分けられていない気がする。たとえば、どのような場合にHadoopを用いて、どのような場合に同類のデータ処理系であるImpalaやSparkを用いれば良いかが“⁠明確に⁠”わからない。 このような問題を解決するには、

    第1回 なぜ、Hadoopはどのように動くのか、を学ぶのか | gihyo.jp
  • 第1回 推薦システムが求められる背景 | gihyo.jp

    はじめに 今回から全11回の予定で、情報推薦システムの入門という題目で連載させていただくことになりました。連載は株式会社Gunosyの福島、関、吉田が連載ごとに担当します。よろしくお願いします。 近年、ビッグデータやデータサイエンティストといった言葉が巷を賑わせています。筆者自身は、これらの言葉はバズワードであり、盛り上がり過ぎていると冷静に見ています。一方で、Gunosyというサービスを提供する側としては、以下の2点について非常に重要な課題であると思っています。 データの分析結果を中心にした意思決定をどうやって組織に組み込んでいくか 大量で非構造なデータの解析結果をどうやってユーザの満足度の向上に反映させるか そしてデータ解析の有力な応用先といった文脈で、情報推薦システムへの注目が大きくなっていると筆者は感じています(それが少々過大にも思えるほど⁠)⁠。 連載では、情報推薦システムとは

    第1回 推薦システムが求められる背景 | gihyo.jp
  • 第1回 機械学習を実践する前の基礎知識 | gihyo.jp

    みなさん、次のようなことができたらいいと思ったことはありませんか? 「顧客ごとに、適したタイミングと内容で、DMを送信できたら……」 「CGM系サイトへの誹謗中傷なんかのスパム投稿を自動識別できたら……」 「サーバの負荷が高まるタイミングを事前に予測できたら……」 一見するとこれらは実現していることがまったく異なりますが、じつはある共通点があります。それは「データを分析し、その結果を活用している」という点です。 Data is Kingの考えから得られるメリット かつてAmazonに在籍していたRonny Kohaviは「Data is King at Amazon」と言い、データの重要性を説きました。事実、Amazonはユーザの購買履歴から商品のレコメンデーションを行い、ユーザのサイト内の遷移履歴やクリック率からサイト構造の改善を行うなど、データを徹底的に活用していることで知られています

    第1回 機械学習を実践する前の基礎知識 | gihyo.jp
  • Hadoopでレコメンドシステムを作ろう 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    Hadoopでレコメンドシステムを作ろう 記事一覧 | gihyo.jp
  • Android Studio最速入門~効率的にコーディングするための使い方 記事一覧 | gihyo.jp

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    Android Studio最速入門~効率的にコーディングするための使い方 記事一覧 | gihyo.jp
  • 第31回 RubyistのためのMongoDB入門(1) | gihyo.jp

    はじめに ここ最近、NoSQLというキーワードが注目を集めています。 リレーショナルデータベースは、一般的にスケールアウト(サーバの台数を増やして性能向上を図る手法)が難しく、特に大規模サービスにおいてパフォーマンス上のボトルネックとなりえます。また、タグやグラフ構造のようなデータは関係モデルに馴染みにくいため、それらを扱う際にはアプリケーションコードもぎこちないものになりがちです。 これらの問題を背景に、何にでもリレーショナルデータベースを使うのではなく、用途に応じてKVSなど他のデータストアを選択する流れが広まりつつあります。このムーブメントがNoSQL(Not Only SQL)と呼ばれているものです。 今回は、NoSQLなデータベースの1つであるMongoDBをご紹介します。 MongoDBとは MongoDBは高いパフォーマンスとスケーラビリティを特徴とするドキュメント指向型デー

    第31回 RubyistのためのMongoDB入門(1) | gihyo.jp
  • 第1回 一生の仕事を選ぶということ | gihyo.jp

    「一度しかない人生、思いっきり楽しもうぜ」 酒の席になるとやたらと人生哲学みたいなものを語り出して部下や後輩を困らせるという人がたまにいるが、私もあの手の「説教」を聞くのは得意ではない。しかたがないので、「⁠はあ、そうですか」とか「勉強になります」とか言いながらも、心の中では「早く終わらないかな」とか、その日に解決できなかったバグを「明日の朝にはどう攻略しようか」と作戦を練ったりしている私だ。 じゃあ自分なりの「人生哲学」みたいなものをまったく持っていないかというと、そうではない。ただ、そんな話はネチネチと時間をかけて語るものでもなければ、ましてや酒の席でするのに適した話ではないと思っているだけのことだ(私が、下戸だというのはさておいて⁠)⁠。 では具体的には何かと言えば、「⁠自分が当にやりたいことを見つけろ」という、とても単純な話だ。言い方を変えて「わがままに生きろ」でも「自分に正直に

    第1回 一生の仕事を選ぶということ | gihyo.jp
  • ムービー企画「 Subversion によるバージョン管理入門」WEB+DB PRESS Vol.39 誌面連動ムービー

    ムービー企画「Subversionによるバージョン管理入門」 WEB+DB PRESS Vol.39誌面連動ムービー バージョン管理ツールSubversionは、現在のプログラミング開発において欠かせないツールです。Subversionを利用することにより、ソースファイルの変更を管理することができます。また、複数の開発者がソースコードに対して同時並行に変更を施せます。 この記事では、Subversionの基操作方法をムービーでご紹介します。 なお、WEB+DB PRESS Vol.39、特集1「構成管理 実践入門」の誌面連動ムービーにもなっています。 誌面の第2章「Subversionによるバージョン管理入門」では、svnコマンドによるSubversionの使用方法をご紹介いたしました。 Windowsの場合は、第2章のコラムで紹介したTortoiseSVNを使って、GUIベースでSub

    ムービー企画「 Subversion によるバージョン管理入門」WEB+DB PRESS Vol.39 誌面連動ムービー
  • 1