タグ

ブックマーク / www.oreilly.co.jp (14)

  • word2vecによる自然言語処理

    Tomas Mikolovらによって提案されたニューラルネットワーク(CBOW, Skip-gram)のオープンソース実装word2vecについて、基的な使い方を体験し、さらにその仕組みを学ぶ書籍です。 基的な使い方から、自分の好きなコーパスの作り方、登場の背景、仕組み、さらには応用例や弱点についてもコンパクトなボリュームで概観できます。付録にはword2vecの出力結果を主成分分析を使って可視化する方法について解説しています。 著者の西尾さんによる書の解題[リンク] はじめに 1章 word2vecを使ってみる 書き換えてみよう 2章 コーパスを変えてみる text8 単語に分割する(MeCab) CSVからのコーパス作成 Facebook EPWING Wikipedia PDFからの抜き出し まとめ 3章 word2vecの生まれた理由 文章の表現 4章 word2vecの仕組

    word2vecによる自然言語処理
  • Spidering Hacks

    毎日欠かさずチェックしているウェブページがありますか?ウェブ上のデータを二次利用したくありませんか?ウェブサービスを駆使してみたくないですか?そう思ったことがあるのなら、このを読むべきです。書は、ウェブを横断して情報を自動収集するプログラム、スパイダを自由自在に操り、目的の情報を取り出す方法を詳しく解説しています。また、各Hackを積極的に日語化し、訳書版独自のHackや日語処理の注意点(付録)を収録するなど、至れり尽くせりの内容です。スパイダ通のテクニックが満載! 関連ファイル サンプルコード 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すでに修正が施されている場合がありますので、書籍最終ページの奥付でお手持ちの書籍の刷版、刷り年月日をご確認の

    Spidering Hacks
  • Backbone.jsアプリケーション開発ガイド

    Backbone.jsをはじめとして、コードの構造や保守の容易さを向上させてくれるJavaScriptフレームワークが人気です。書の解説は、MVCによって構造化されたJavaScript SPAアプリケーションを作成する方法など、Backbone.jsについての基礎的な事柄にとどまりません。モジュール形式の開発やさまざまなプラグインの紹介、開発者がよく遭遇する問題への解決策、アプリケーションの骨組みの自動生成やユニットテストに至るまで、Backbone.jsアプリケーション開発のさまざまな局面を多角的にとらえた一冊です。 まえがき 1章 イントロダクション 1.1 MVCとは 1.2 Backbone.jsとは 1.3 JavaScriptのMVCフレームワークが必要になるとき 1.4 Backbone.jsを検討するべき理由 1.5 書の構成 2章 MVC 2.1 MVCとは 2.1

    Backbone.jsアプリケーション開発ガイド
  • スタートアップ企業向けインフラ運用入門(1):監視 - O'Reilly Japan Community Blog

    スタートアップ企業等の少人数チームの場合、専任のシステム運用担当がいることは稀だと思います。記事では、そうした少人数チームの開発兼運用担当者を主な対象として、システム運用の重要な要素である「システム稼働状況の確認、障害対応」を省力化するための方法の一つとして「システムの監視」の方法について説明します。 少人数チームでのシステム運用 Retty開発担当の鹿島です。第1回で少し紹介しましたが、RettyはWebサイト、iPhoneアプリAndroidアプリの計3プラットフォームを、3人+αの開発者で開発を進めています。私は主にWebサイトの開発とインフラ全般を担当しているのですが、Webサイトの開発がメインのため、インフラ構築・運用に割ける時間はそれほど多くありません。 おそらく世間の小規模チームの大半では、我々と同様に専任の担当者がいないと思われます。今回の記事はそうしたスタートアップ企

  • バッドデータハンドブック

    TOPICS Data Science , Database 発行年月日 2013年09月 PRINT LENGTH 310 ISBN 978-4-87311-640-2 原書 Bad Data Handbook FORMAT PDF 値の欠落、形式から外れたレコード、エンコーディング形式が不明な文字列。「バッドデータ」と聞いた時に思い浮べる典型例です。しかし、これら以外にも「そもそもデータにアクセスできない」「消えてしまった」「昨日と違っている」「データはあるが形式が処理に適していない」など、データを収集・分析するエンジニアは、これらの「バッドデータ」と正面から向きあわなければならないことが多々あります。書では、これらの問題のあるデータのパターンを紹介し、その対処法を解説しています。 19人のデータ分析の専門家が、自らの経験を通して得た、さまざまな教訓、実践的な方法論等を詳述した書は

    バッドデータハンドブック
    mi_kattun
    mi_kattun 2013/09/12
    こういう本が読みたいと思ってた!是非epub/mobiな電子版で出してほしい。
  • ビッグデータの倫理

    ビッグデータへの注目が過熱する一方、そこに含まれる個人情報の取り扱いについて、さまざまな議論や問題が巻き起こっています。書はビッグデータを取り扱う業務に携わる読者に向けて、ビッグデータを扱う際の倫理について考え、議論を行う枠組みについて、「アイデンティティ」「プライバシー」「オーナーシップ」「信用」という4つの軸とともに紹介します。「倫理」という、個別性が高く、明快な答えの見つけづらい問題について、読者自身や組織の中で実りのある議論をする一助となるでしょう。なお書はEbookのみの販売となります。 まえがき 1章 ビッグデータのビッグインパクト なぜビッグデータなのか? ビッグデータは何を強制するのか? ビッグデータは倫理的に中立である 何をすべきかを尋ねてはいけない 重要な概念と用語 2章 価値と行動 価値を明確に表現する 価値を行動に変える 倫理的判断ポイント 3章 現在の業務 研

    ビッグデータの倫理
  • 入門 モダンJavaScript

    書は、JavaScriptの“モダンな”プログラミングを視点として、言語の基礎から、アプリケーション開発に必要な知識までを解説する入門書です。JavaScriptの初心者や、JavaScriptに触れたことはあるもののなぜそうするのかきちんと理解できていない初級者を主な対象としています。丁寧な解説で、言語の基礎から、開発に必要な基礎知識、さらにはアプリケーション開発のためのテクニックまでを提供。JavaScriptのモダンな扱い方だけでなく、なぜそう書くべきかという裏付けを得ながら理解を深めることができます。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すでに修正が施されている場合がありますので、書籍最終ページの奥付でお手持ちの書籍の刷版、刷り年月日を

    入門 モダンJavaScript
  • SQLアンチパターン

    書はDB設計やSQL記述の際に避けるべき事柄を1章で1つ、25個紹介する書籍です。リレーショナルデータベースを中心に据えたシステム開発には、様々な場面で陥りやすい失敗(アンチパターン)があります。書はデータベース論理設計、データベース物理設計、クエリの記述、アプリケーション開発という4つのカテゴリに分け、それぞれの分野におけるアンチパターンを紹介し、失敗を避けるためのより良い方法を紹介します。複数の値を持つ属性や再帰的なツリー構造の格納から、小数値の丸めやNULLの扱いに起因する問題、全文検索やSQLインジェクション、MVCアーキテクチャなど、実践的かつ幅広いトピックを網羅します。日語版では、MySQLのエキスパートとして著名な奥野幹也氏によるアンチパターンを収録。データベースに関わるすべてのエンジニア必携の一冊です。 書への称賛の声 監訳者まえがき はじめに I部 データベース論

    SQLアンチパターン
    mi_kattun
    mi_kattun 2013/01/15
    これは読みたい
  • Running Lean

    TOPICS 発行年月日 2012年12月 PRINT LENGTH 278 ISBN 978-4-87311-591-7 原書 Running Lean, 2nd Edition FORMAT PDF 成功したスタートアップの2/3が、当初のプランを途中で大幅に変更しています。成功のカギは、最初のプランが優れていたからではなく、リソースを使い切る前にうまくいくプランを見つけたからです。Running Lean(ラニング・リーン)とは、リソースを使い切る前に最初のプランからうまくいくプランへと反復的に移行する体系的なプロセスです。書では、顧客が必要とするMVPを構築する方法、構築・計測・学習ループを高速化する方法、製品/市場フィットを達成する方法などについて、リーンキャンバスや顧客インタビューの手法を使いながら具体的に解説します。 THE LEAN SERIESとは エリック・リースがキ

    Running Lean
  • Think Stats

    書は「プログラミングのスキルを統計の理解に役立てよう」というコンセプトで書かれたものです。数学的な観点から語られることが多い統計について、計算処理の観点から説明。実際にPythonのコードを示し、実データを分析しながら統計の基礎を解説しています。日語版では豊富な数学関数ライブラリを提供するPythonの科学技術計算用モジュールNumPyとSciPyに関する解説を付録として追加。NumPy/SciPyが持つ統計関数の解説のほか、書に登場した問題をNumPy/SciPyを使って解く方法を紹介します。Pythonで書かれたサンプルコードを使って実際に手を動かしながら統計が学べる、プログラマのための統計入門の決定版です。 はじめに 1章 プログラマのための統計的な考え方 1.1 第一子は出産予定日よりも遅れるか? 1.2 統計的なアプローチ 1.3 全米世帯動向調査 1.4 テーブルとレコー

    Think Stats
  • リーダブルコード

    美しいコードを見ると感動する。優れたコードは見た瞬間に何をしているかが伝わってくる。そういうコードは使うのが楽しいし、自分のコードもそうあるべきだと思わせてくれる。書の目的は、君のコードを良くすることだ。(書「はじめに」より) コードは理解しやすくなければならない。書はこの原則を日々のコーディングの様々な場面に当てはめる方法を紹介します。名前の付け方、コメントの書き方など表面上の改善について。コードを動かすための制御フロー、論理式、変数などループとロジックについて。またコードを再構成するための方法。さらにテストの書き方などについて、楽しいイラストと共に説明しています。日語版ではRubyやgroongaのコミッタとしても著名な須藤功平氏による解説を収録。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作

    リーダブルコード
  • Jenkins

    CI(継続的インテグレーション)ツールの決定版、Jenkinsのすべてを解説する書籍です。インストール、サーバーの設定、ビルドジョブなどの基礎から、セキュリティ、コード品質、分散ビルドや自動化デプロイと継続的デリバリといった高度なトピックまで、Jenkinsを使いこなすのに必要な情報を網羅しています。さらに日語版ではPlay! Frameworkを例としてJenkinsのプラグイン開発の手法を付録として収録。品質の高いソフトウェアを開発したいすべての開発者必携の一冊です。 目次 日語版に寄せて 訳者まえがき はじめに 1章 Jenkinsの紹介 1.1 はじめに 1.2 継続的インテグレーションの基礎 1.3 Jenkinsの紹介(旧名Hudson) 1.4 HudsonからJenkinsへ――その略史 1.5 JenkinsとHudsonのどちらを使うべきか? 1.6 自分の組織への

    Jenkins
  • Hadoop MapReduce デザインパターン

    TOPICS Database , Java 発行年月日 2011年10月 PRINT LENGTH 210 ISBN 978-4-87311-512-2 原書 Data-Intensive Text Processing with MapReduce FORMAT PDF 大量のデータにアクセスすることによって、商業、科学、コンピューティングといった様々な分野において新たな機会が生み出されています。MapReduceは、巨大なデータセットに対する分散処理を実行するプログラミングモデルであり、安価なサーバーからなるクラスタ上で大規模データの処理を行うためのフレームワークです。 書は、自然言語処理、情報抽出、機械学習などに共通する、テキスト処理のアルゴリズムに重点を置きながら、MapReduceのアルゴリズム設計について解説します。またMapReduceのデザインパターンの概念を説明し、様

    Hadoop MapReduce デザインパターン
  • 言語設計者たちが考えること

    C++Python、APL、FORTH、BASIC、AWK、Lua、Haskell、ML、SQL、Objective-C、Java、C#、UML、Perl、PostScript、Eiffel、そしてRuby。世界に多くの影響を与え、またソフトウェアの基盤を支えているさまざまなプログラム言語の設計者たちへのインタビュー集です。彼らが何を考え、どんな考えに基づいて言語を設計したのか。伝説的かつ著名な言語設計者たちが登場し、背景、動機、哲学、信念、秘話、教訓、課題を語ります。対話を通してパイオニアたちの飽くなき探究心と思考プロセス、情熱、そして底知れぬエネルギーが見えてくるはずです。 日語版には、Rubyのまつもとゆきひろ氏へのインタビューを追加収録しています。 目次 書推薦の言葉 まえがき 1章 C++(ビャーネ・ストラウストラップ) 設計上の意思決定 C++の使用 オブジェクト指向プロ

    言語設計者たちが考えること
  • 1