タグ

ブックマーク / www.oreilly.co.jp (103)

  • クラウドデータレイク

    TOPICS Database 発行年月日 2024年05月17日 発売予定 PRINT LENGTH 288 (予定) ISBN 978-4-8144-0067-6 原書 The Cloud Data Lake FORMAT Print PDF EPUB 大量のデータを効率的に管理し、ビッグデータ分析機械学習AIなどの高度なデータ分析を実現するためのデータ基盤として、クラウドデータレイクが注目されています。スケーラビリティと多様なデータ管理機能を兼ね備えたクラウドデータレイクは、現代のデータ分析ニーズにマッチする技術として、データの重要性が増す昨今、多くの企業の関心を集めています。書は、クラウドデータレイクのセットアップ、管理、ガバナンスについて、包括的に解説した実践的なガイドです。設計におけるポイントやベストプラクティス、データフォーマットとパフォーマンスの最適化、コスト管理、セ

    クラウドデータレイク
  • プログラミング言語AWK 第2版

    「AWK」という名前は開発者の頭文字Aho、Weinberger、Kernighanから来たもので、長い歴史を持つ、テキスト処理用のスクリプト言語です。Unix・Linuxにはデフォルトでインストールされており、多くの人に利用され、愛され続けています。改訂に伴い、計算/集計、データ分析といった話題の追加、CSV入力、Unicode対応など、時代に即したアップデートが行われています。 『プログラミング言語AWK』第2版 日語版まえがき まえがき 1章 Awkチュートリアル 1.1 さあ始めよう 1.2 簡単な表示 1.3 書式付き表示 1.4 選択 1.5 計算 1.6 制御フロー文 1.7 配列 1.8 便利な一行プログラム 1.9 さて次は? 2章 Awkの実践例 2.1 個人用ツール 2.2 選択 2.3 変換 2.4 データ要約 2.5 個人用データベース 2.6 個人用ライブラリ

    プログラミング言語AWK 第2版
  • データエンジニアリングの基礎

    データエンジニアリングとは、組織内外で日々生成されるデータを蓄積し分析するためのデータシステムを構築し維持管理することであり、急速に注目を集めている分野です。近年ではデータエンジニアリングを支えるツールやクラウドサービスが成熟し、組織へのデータ利活用の導入は容易になりましたが、明確な指針のないままデータシステムの構築を進めると費用と時間を無駄に費やすことになります。書は「データエンジニアリングライフサイクル」を軸にデータシステムの要件を整理することで、組織の「データ成熟度」に応じたデータシステム構築の指針を与えます。またデータエンジニアの立ち位置を明確にし、組織内でデータエンジニアが果たすべき役割を示します。 まえがき Ⅰ部 データエンジニアリングの基礎と構成要素 1章 データエンジニアリング概説 1.1 データエンジニアリングとは何か 1.1.1 データエンジニアリングの定義 1.1.

    データエンジニアリングの基礎
  • 詳説 データベース

    データベースを選択し、使用し、管理するには、その内部構造を理解することが不可欠です。しかし、今日ではたくさんの分散型データベースやツールが存在するため、それぞれが何を提供しているのか、どのように異なるのかを理解することは困難です。 書はデータベースとストレージエンジンの内部で利用されている概念を解説します。ストレージエンジンでは、ストレージの分類、Bツリーベースのストレージエンジンとイミュータブルなログ構造化ストレージエンジンの違いと事例を紹介します。ストレージの構成要素については、ページキャッシュ、バッファプール、ログ先行書き込みなどの補助的なデータ構造を使って、効率的なストレージを構築するためのデータベースファイルの構成を説明します。分散型システムでは、ノードとプロセスがどのように接続され、複雑な通信パターンを構築するのかを段階的に学びます。 データベースそれぞれで大きな違いがあるス

    詳説 データベース
  • 大規模データ管理

    データ管理と統合が急速に進化する中、複雑で緊密に結合したアーキテクチャから、現代のビジネスに対応できる、より柔軟なデータアーキテクチャへの移行が求められます。 書は、変化が激しい時代でも長期的に持続可能な方法で大規模なデータ管理を行い、さまざまなユースケースに対応できる統合アーキテクチャを紹介します。この統合アーキテクチャを構成する、膨大なデータ利用に向けた「読み出し専用データストアアーキテクチャ」、リアルタイムなアプリケーションのための「APIアーキテクチャ」、大容量のスループットを実現する「ストリーミングアーキテクチャ」を詳述します。また技術開発、法規制、プライバシーに関する懸念など、データ管理全体を説明し、データガバナンスとセキュリティ、マスターデータ管理、セルフサービスとデータマーケットプレイス、メタデータの重要性について解説します。 企業のデータ戦略にかかわる書は、アーキテク

    大規模データ管理
  • Efficient Linuxコマンドライン

    Linuxスキルをレベルアップする実用的な実践書。書では、コマンドを組み合わせて複雑なコマンドを作成することで、手動で行われているタスクを自動化するための方法を学びます。具体的には、パスワードの管理、大量のテストファイルの生成、テキストファイルを変換してデータベースのように扱う方法など、現実的なビジネスの問題を解決する方法を明らかにします。単なるテクニックではなく、背後で何が行われているかについても学べるので、Linuxのシェルに対する理解が深まります。それと同時に、Linuxコマンドに関するさらに上級レベルの知識とテクニックが身につきます。 賞賛の声 監訳者まえがき まえがき 第I部 主要な概念 1章 コマンドの組み合わせ 1.1 入力、出力、パイプ 1.2 コマンドラインに取り掛かるための6個のコマンド 1.2.1 コマンド① wc 1.2.2 コマンド② head 1.2.3 コマ

    Efficient Linuxコマンドライン
  • 雑に作る

    独学、手探りで、“雑に”電子工作を続けてきた3人の“先輩”による電子工作実践書。「完成度は低くてもまずは完成させること」を目標に、作りたいものがあるけど入門書の内容だけでは作れないという初心者や、何を作ったらよいのか思いつかない人を対象とし、最低限の技術を身につける方法、雑に使える電子部品など、限界まで敷居の低いノウハウを紹介。1つの技術で数多くの作品を作る方法、「そのうちやろう」問題への立ち向かい方など、アイデアを生み出し、そのアイデアを完成まで導くマインドセットも紹介します。「雑な作品作りでも大丈夫!」という平和な心で、電子工作、ものづくりの初心者を応援します。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すでに修正が施されている場合がありますので、

    雑に作る
  • 9月新刊情報『Pythonによる地理空間データ分析』

    Pythonによる地理空間データ分析 ―例題で学ぶロケーションインテリジェンス』 Bonny P. McClain 著、廣川 類 訳 2023年9月20日発売予定 272ページ(予定) ISBN978-4-8144-0032-4 定価3,740円(税込) 地理空間データ分析は、地図や道路などのオープンな情報を分析することで、渋滞予測やナビゲーションなどの有用な情報を得る強力な手段です。さらに、衛星に搭載された各種のセンサーによる画像や国勢調査の情報などを組み合わせることにより、森林破壊や人種差別問題などの社会的課題に対する知見を得る「ロケーションインテリジェンス」として活用することができます。書は、地理空間データ分析に必要な基的な知識―GIS、データの種類、空間統計学、可視化技術などを紹介し、公開データとJupyter Notebookで提供されているさまざまな社会課題に関するサンプ

  • プロダクトマネージャーのしごと 第2版

    プロダクトマネジメントは、小さなスタートアップから大企業まで、現代の組織にとって重要な役割です。プロダクトマネージャーは、人々が愛する製品を作るとともに、チームに目的と方向性を示して共に働くファシリテーターでもあります。 書では、プロダクトマネジメントの日々の業務とそれを行う方法を紹介します。プロダクトマネジメントで重要なのはコミュニケーション、組織力、リサーチ、実行の4つのスキルとし、これらを習得する方法を解説します。また、部門を超えた協働とコミュニケーションを促進する方法、ユーザーとの対話やステークホルダーとの協力方法、明確で実行可能な目標設定、チームを結びつけるためのロードマップの使用、限られた時間の優先順位づけなどについても詳述します。 ツールやフレームワーク、ベストプラクティスでは対応できない課題に対処する方法を解説する書は、プロダクトマネージャー必携の一冊です。 第2版への

    プロダクトマネージャーのしごと 第2版
  • Pythonによるデータ分析入門 第3版

    NumPy、SciPy、pandas、Matplotlib、Jupyterをはじめ、高機能で使いやすい数学・科学計算用ライブラリが充実しているPythonは、科学計算、統計解析、機械学習のみならず、金融や経済分野でも広く利用されています。書はPythonの代表的なデータ分析ツール、pandasの開発者Wes McKinneyによる、データ分析を行うための基を網羅しています。すべてのサンプルコードはダウンロード可能で、Jupyter Notebookで対話的に試し、実際に手を動かしながら知識を確実なものにすることが可能です。pandas 2.0に対応した待望の改訂版です。 まえがき 1章 はじめに 1.1 はじめに 1.1.1 どういうデータを扱うのか 1.2 なぜPythonデータ分析に使うのか 1.2.1 「糊(グルー)」としてのPython 1.2.2 「2つの言語」問題を解決す

    Pythonによるデータ分析入門 第3版
  • 8月新刊情報『Pythonによるデータ分析入門 第3版』

    Pythonによるデータ分析入門 第3版 ―pandas、NumPy、Jupyterを使ったデータ処理』 Wes McKinney 著、瀬戸山 雅人、小林 儀匡 訳 2023年8月12日発売予定 624ページ(予定) ISBN978-4-8144-0019-5 定価4,400円(税込) NumPy、SciPy、pandas、Matplotlib、Jupyterをはじめ、高機能で使いやすい数学・科学計算用ライブラリが充実しているPythonは、科学計算、統計解析、機械学習のみならず、金融や経済分野でも広く利用されています。書はPythonの代表的なデータ分析ツール、pandasの開発者Wes McKinneyによる、データ分析を行うための基を網羅しています。すべてのサンプルコードはダウンロード可能で、Jupyter Notebookで対話的に試し、実際に手を動かしながら知識を確実なもの

    8月新刊情報『Pythonによるデータ分析入門 第3版』
  • プログラミング文体練習

    レーモン・クノーの『文体練習』から着想を得て執筆された書は、1つの課題を異なるプログラミングスタイルで実装し、さまざまなスタイルの特性やスタイルが生まれた歴史的経緯などを解説します。家の『文体練習』は、「バスの中で起きた諍いと、その張人を後で目撃した」という内容を、公的文書風、宣伝風、業界用語風など、99の異なる文体で表現したものですが、書は、「単語の出現頻度をカウントして多いものから出力する」という課題を、40のスタイルで実装しています。リソース制約が大きかった時代の方法から、オブジェクト指向、純粋関数型、リフレクション、並行処理、ニューラルネットワークまで幅広いスタイルを扱い、マルチパラダイム言語Pythonの威力と魅力を感じられる構成となっています。 訳者まえがき 第2版 まえがき 第1版 まえがき 序章 第Ⅰ部 歴史的スタイル 1章 古き良き時代:アセンブリ言語 2章 Fo

    プログラミング文体練習
  • 詳解 システム・パフォーマンス 第2版

    書は、エンタープライズとクラウド環境を対象としたオペレーティングシステムとアプリケーションのパフォーマンス分析と向上について解説します。 主にLinuxベースのオペレーティングシステムに含まれるツールとその使用例を通じてシステムパフォーマンスを引き出す手法を説明します。システム評価のためのベンチマーク、キャパシティプランニング、ボトルネックの解消について解説しスケーラビリティを制限する要因を発見、分析し、解決する方法を学びます。 第2版では、perf、Ftrace、BPFの解説が加わり、Linuxとクラウドコンピューティングについての説明が充実しました。 システムのパフォーマンスを向上させ、コストを削減し、レイテンシの外れ値を減らすための方法を学ぶ書はエンジニア必携の一冊です。 まえがき 1章 イントロダクション 1.1 システムパフォーマンス 1.2 職種 1.3 作業 1.4 分析

    詳解 システム・パフォーマンス 第2版
  • 8月新刊情報『エンジニアリングマネージャーのしごと』

    エンジニアリングマネージャーのしごと ―チームが必要とするマネージャーになる方法』 James Stanier 著、吉羽 龍太郎、永瀬 美穂、原田 騎郎、竹葉 美沙 訳 2022年8月26日発売予定 376ページ ISBN978-4-87311-994-6 定価3,740円(税込) 書は、エンジニアリングチームのマネジメントの仕事全般を紹介し、エンジニアリングマネージャーに必要な考え方やスキルを解説します。はじめに、自分の役割と組織のさまざまな部分がどう関係するかを理解し、習慣を整えることで自分自身を管理することを学びます。そして、日々のマネジメント業務で必要なツールとプロセスを紹介し、スタッフとの関係性の構築、モチベーションの理解、評価や採用などを解説します。さらに社内政治や難しい状況での判断、その後のキャリアについて説明します。 マネジメントのさまざまな段階に沿って、日々の仕事に取

    8月新刊情報『エンジニアリングマネージャーのしごと』
  • リーダーの作法

    リーダーシップは一部の人だけに与えられる天職であり、複雑で膨大なリーダーシップの哲学を実践しなければならないと思われがちですが、そんなことはありません。ささいな行動を日々繰り返すことで、お互いを尊敬し、信頼し合うチームを作ることができます。 Netscapeでマネージャー、Appleでディレクター、Slackでエグゼクティブを経験した著者が、それぞれの立場のリーダーに必要な振る舞いを30のエッセイで紹介します。 1on1での傾聴、信頼関係の築き方、仕事の任せ方、メンバーのほめ方、チーム内のうわさ話への対応、組織の文化の作り方など、マネジメントの場面で出会うさまざまなテーマをとりあげ、リーダーとしての具体的な行動や考え方を解説します。 書への推薦の言葉 序文 はじめに エッセンス 第I幕 Netscape:マネージャー 1章 誰からでも学ぶことがあると考える 2章 会議ボケ 2.1 抱えす

    リーダーの作法
  • 初めてのTensorFlow.js

    TensorFlow.jsの待望の入門書。TensorFlow.jsはGoogleが開発したオープンソースのJavaScriptライブラリです。JavaScript機械学習したければ選択肢はTensorFlow.jsだけと言っても過言ではありません。書では、JavaScriptエンジニアAIエキスパートを対象に、サンプルを使った実践的なアプローチでTensorFlow.jsの基礎から応用までを解説します。読者はウェブ開発者という立ち位置を変えずにJavaScriptとブラウザで学べます。JavaScriptAIを活用しようと真剣に考えているエンジニアにお勧めです。 賞賛の声 序文 訳者まえがき まえがき 1章 AIは魔法 1.1 JavaScriptを用いたAIへの道 1.2 知能とは何か? 1.3 AI歴史 1.4 ニューラルネットワーク 1.5 今日のAI 1.6 なぜTen

    初めてのTensorFlow.js
  • カオスエンジニアリング

    ソフトウェアをはじめとするあらゆるシステムは、発展するにつれて必然的に複雑性が増していきます。 書は、カオスエンジニアリングの基となる理論と原則を説明し、組織が複雑性を受け入れながら、システムにおける弱点を発見するとともに、自信を持って障害に対処する力をつけるための実践方法を解説します。 ソフトウェアがビジネスの根幹を担う企業であるSlackGoogleMicrosoft、LinkedIn、Capital Oneでの事例を紹介し、ゲームデーを中心としたカオスエンジニアリングプログラムの実践、実験の選択や自動化にあたっての課題、継続的ベリフィケーションの設計と実施、さらにはデータベースやセキュリティ分野への応用例などについて説明します。 Netflixでカオスエンジニアリングチームを立ち上げた先駆者である著者に加え、さまざまな組織のリーダーたちがカオスエンジニアリングについて多角的に

    カオスエンジニアリング
  • 推薦システム実践入門

    情報化時代が到来し、日常で意思決定をする回数と選択肢の数が急増したことで、推薦システムの需要が高まっています。そのため、昨今では多くのウェブサービスへ新たに推薦システムの導入が検討されることも増えました。書では、推薦システムの概要から、UI/UX、アルゴリズム、実システムへの組み込み、評価まで紹介し、適切な推薦システムの実装ができるようになります。「実際の仕事に活かす」ことを目的に、著者たちが実務で経験した推薦システムの成功事例や失敗事例を交えながら、実サービスに推薦システムを組み込むという観点を重視した入門的な内容です。 正誤表 ここで紹介する正誤表には、書籍発行後に気づいた誤植や更新された情報を掲載しています。以下のリストに記載の年月は、正誤表を作成し、増刷書籍を印刷した月です。お手持ちの書籍では、すでに修正が施されている場合がありますので、書籍最終ページの奥付でお手持ちの書籍の刷版

    推薦システム実践入門
  • システム運用アンチパターン

    上層部がDevOpsに理解のない組織で働き、組織構造を変える権限を持っていない開発者であっても、チームにDevOpsを導入するための現実的な方法を紹介します。 重厚な承認プロセス、可視化されていない運用、プロセスの最後でのみ行われるソフトウェアテスト、ノイズだらけのアラート、インシデントから学習しない習慣、時間外のデプロイ、情報のため込みなどを取り上げ、ソフトウェアシステムの開発運用が滞るチームや組織に共通してみられる陥りがちな状況や犯しがちな間違いをアンチパターンとして紹介します。そして管理職やマネージャでなく、エンジニアが実行し、繰り返すことで改善できる具体的な行動を解説します。 組織で必要とされる変化を、エンジニアが行動することで実現する書は、ソフトウェアシステムをよりよく開発運用したいエンジニア必携の一冊です。 目 次 序文 書について 1章 DevOpsを構成するもの 1.1

    システム運用アンチパターン
  • データビジュアライゼーションの基礎

    情報を正しく伝え、美しくかつ明確な図やグラフを作成するための基を解説します。「ビジュアライゼーションで大切なことは、質を正しく伝えること」との信念に基づき、見栄えの悪い図、不適切な図、誤った図を避け、情報を正確にかつ効果的に伝えるために最適な要素、かたち、色の選択をするための指針をまとめています。著者は統合生物学の分野で著名な研究者であるだけでなく、cowplot、ggridgesをはじめ、数多くのRのデータ可視化関連パッケージの開発者であり、著者の豊富な経験から蓄積された知見の集大成と言える書からは、優れたグラフを作成するための原則、哲学、美学を学ぶことができます。書収録のグラフを作成したRコードはGitHubから利用可能。 訳者まえがき まえがき 1章 はじめに 1.1 見栄えの悪い図、不適切な図、誤った図 第Ⅰ部 データからビジュアライゼーションへ 2章 データを可視化する:

    データビジュアライゼーションの基礎