タグ

ブックマーク / gihyo.jp (9)

  • 前処理大全[データ分析のためのSQL/R/Python実践テクニック] | Gihyo Digital Publishing … 技術評論社の電子書籍

    前処理大全 [データ分析のためのSQL/R/Python実践テクニック] 著者 橋智光 著,株式会社ホクソエム 監修 発売日 2018年4月13日 更新日 2019年5月29日

    前処理大全[データ分析のためのSQL/R/Python実践テクニック] | Gihyo Digital Publishing … 技術評論社の電子書籍
    Rion778
    Rion778 2018/04/09
  • 前処理大全[データ分析のためのSQL/R/Python実践テクニック]

    このの概要 データサイエンスの現場において,その業務は「前処理」と呼ばれるデータの整形に多くの時間を費やすと言われています。「前処理」を効率よくこなすことで,予測モデルの構築やデータモデリングといった来のデータサイエンス業務に時間を割くことができるわけです。書はデータサイエンスに取り組む上で欠かせない「前処理スキル」の効率的な処理方法を網羅的に習得できる構成となっています。ほとんどの問題についてR,PythonSQLを用いた実装方法を紹介しますので,複数のプロジェクトに関わるようなデータサイエンスの現場で重宝するでしょう。 はじめに 0-1 書の目的 0-2 対象読者 0-3 書の構成 Part1 入門前処理 第1章 前処理とは 1-1 データ 1-2 前処理の役割 1-3 前処理の流れ 1-4 3つのプログラミング言語 1-5 パッケージ/ライブラリ 1-6 データセット 1

    前処理大全[データ分析のためのSQL/R/Python実践テクニック]
    Rion778
    Rion778 2018/04/05
  • 第4回 レポつく自由自在 ~R Markdownにまつわるエトセトラ~ | gihyo.jp

    はじめに 早いもので連載ももう4回目です。マラソンに例えると、折り返し地点を目前に、先頭を走るロサ・モタの後ろ姿をおぼろげながらも視界に捉えてきたというところでしょうか。 前回はコードチャンクごとの処理を効率化するということで、チャンクオプションを中心に解説しました。今回はR Markdownにまつわるエトセトラとして、レポートづくりをさらに加速するためのテクニックを紹介します。ただし全てのエトセトラをフォローできるわけではありませんので、疑問質問などはコメント欄またはツイッター@kohskeまでお願いします。 インラインコード 前回までに説明するつもりですっかり忘れていたのですが、文章中に簡単な計算結果を埋め込みたいときなどは、コードチャンクはちょっと大げさです。R Markdownでは、Rのコードをコードチャンク以外にインラインコードとしても記述することができます。書式は次のとおりで

    第4回 レポつく自由自在 ~R Markdownにまつわるエトセトラ~ | gihyo.jp
    Rion778
    Rion778 2015/07/06
  • サポートページ:WEB+DB PRESS Vol.58

    このページでは「WEB+DB PRESS Vol.58」に関する補足情報を公開しています。 サンプルファイルのダウンロード ■ご注意 ※ コーナーは,誌記事参考用資料としてのご提供を目的としております。 ※ 誌記載の内容およびサポートサイトで公開しているサンプルコードに基づく運用の結果について,記事の筆者,プログラムの作者/提供元,(株)技術評論社は一切の責任を負いかねます。ご自身の責任のもと,ご使用ください。 ※ 各サンプルファイル/ソースコードには,個別に,ライセンスやREADMEファイルなどで注意事項/制限事項が添付されている場合がございます。その場合,該当のライセンス,注意事項/制限事項を優先して適用とさせていただきますので,ダウンロード後,内容をご確認ください。 特集1「劇的に進化した新バージョン! 詳解Rails 3」 特集第3章「Rails 3実践チュートリアル」で使

    Rion778
    Rion778 2010/08/29
  • 「Tsukuba.R#7」活動報告 | gihyo.jp

    5月9日(日)に、Rの勉強会「Tsukuba.R#7」が開催されました。 Tsukuba.Rは、奇数回を都内、偶数回をつくばで行うのが慣例となっており、第7回の今回は東京大学理学部での開催となりました。今回は初の試みとして、スピーカー12人全員が各10分のLT形式で発表するという「LT祭り」を行いました。Ustreamの録画とともに、各セッションの内容を簡単にご紹介します。 1.wakutekaさん「Beautiful woRld」 最初は今回の主催者の一人であるwakutekaによるBeautiful woRldです。Rに興味を持ったばかりの方やR初心者の方に向けて、Rの簡単な説明からその利用法、そしてRに関する様々なウェブリソースの紹介やその活用法について話しました。 初心者には取っ付きづらいこと、Rという単語そのものが検索しづらいこと、まだまだ利用者が多くないことなどを克服するため、

    「Tsukuba.R#7」活動報告 | gihyo.jp
  • 第4回 時系列スタック法とタスクフォースの編成 | gihyo.jp

    前回は、情報カードの書き方について説明しました。今回は、情報カードをどのように蓄積し、運用するかについて解説していきます。 PoICでは、頭に浮かんだ順にカードを書き、そのままドックに放り込んでいきます。これを、「⁠時系列スタック法」と呼びます。情報蓄積法としては、最も自然な(そして原始的な)方法です。 PoICでは、頭に浮かんだ順にカードを書き、そのままドックに放り込んでいく(時系列スタック法) 「時系列」とは? 単に「時系列」と言った時、そこには二種類の意味が含まれています。まずは、この二種類の時系列の違いを確認しておきましょう。 絶対時系列 一つ目の時系列は、「⁠みんなに共通の時系列」です。例えば、私はある日の朝、街路樹が紅葉をし始めたのに気付き、同じ日の夕方、オフィスに友人が訪ねてきたとします。 当然、二つの出来事は、 ある日の朝、街路樹が紅葉をし始めたのに気付いた(R1) その日

    第4回 時系列スタック法とタスクフォースの編成 | gihyo.jp
  • 第3回 情報カードの書き方 | gihyo.jp

    はじめに 今回は、情報カードの書き方について説明します。PoICのカードの書き方は、一種の「作法」のようなものです。これに慣れると、カードを書くのに何の迷いもなくなります。 フォーマット PoICで書くすべてのカードには、共通するフォーマットがあります。方眼カードの上から3ブロック分がヘッダ、それより下がボディ(文)となります。ヘッダには、アイコン、タイトル、タグ、タイムスタンプを書きます。 カードは情報の種類に応じて、記録、発見、GTD、参照のいずれかに書き分けます。この4種類のカードを「4カード」と呼びます。アイコンとタグは、この4カードに対応しています。 記録、発見、GTD、参照のアイコン PoICのアイコンは、それぞれ、丸、電球(ひらめき⁠)⁠、四角(チェックボックス⁠)⁠、帽子(頭の上にある何か)をデザインしたものです。アイコンを使うことで、情報の種類を瞬時にとらえることができ

    第3回 情報カードの書き方 | gihyo.jp
  • 第2回 PoICの道具 | gihyo.jp

    前回は、PoICが生まれるまでの経緯とエッセンス、そしてこれが完全にアナログのシステムであることを紹介しました。今回は、PoICを始めるのに必要な道具を紹介しましょう。 情報カード 5x3 方眼 PoICでは、頭に浮かんだアイディア・身の回りの情報を捕獲・収集するメディアとして「情報カード」を使います。 情報カードには様々な種類がありますが、ここでは、5x3サイズ・方眼の情報カードを使用します。方眼の縦線・横線は、文字や絵を書く時に良い目安となります。PoICでは、カードの再利用性を高めるために、書き方を規格化します。これは方眼のカードを使った時に、一番簡単できれいに書けます。 方眼の情報カードは、コレクトとライフから発売されています。それぞれの違いは、グリッド間隔(5mmと6mm)とグリッドの色(ライトブルーとグレー)です。入手性や好みで好きな方を選んで下さい。 ドック 書いた情報カード

    第2回 PoICの道具 | gihyo.jp
  • PoIC : 情報カードの積み重ね:第1回 PoICとは何か?|gihyo.jp … 技術評論社

    近年のGTD、Lifehackの出現と相まって、情報カードやモレスキンといった、アナログ・ツールの使い方が議論されるようになりました。Lifehack.org、2ちゃんねるFlickrでは、その具体的な使い方について、日々情報交換がなされています。 GTDと情報カード David Allenは著書「Getting Things DONE」(⁠2001)の中で、後に「GTD」と呼ばれるタスク処理法を提唱しました。David Allenがそのの中で明らかにしたことの一つは、「⁠頭の中のことを紙に書き出して処理しても良い」ということでした。David Allen が、頭の中を全て書き出すメディアの一つとして挙げたのはアナログ・メディアの「カード」でした。 その後、Marlin MannはGTDとカードの具体的な組み合わせとして、Hipster PDAを示しました。5x3サイズの情報カード数枚

    PoIC : 情報カードの積み重ね:第1回 PoICとは何か?|gihyo.jp … 技術評論社
    Rion778
    Rion778 2007/09/09
    中の人の記事
  • 1