並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 75 件 / 75件

新着順 人気順

ビッグデータの検索結果41 - 75 件 / 75件

  • Googleが患者に無断で医療記録を収集していたと報告される

    By stevanovicigor Googleは「プロジェクト・ナイチンゲール」というコード名で呼ばれるプロジェクトの下、アメリカの21の州で何百万もの患者記録を収集していたと報告されています。この大規模な医療記録の収集プロジェクトについて、医師や患者への通知はなかったと報じられています。 Google’s alleged ‘Project Nightingale’ may be secretly gathering health records - The Verge https://www.theverge.com/2019/11/11/20959771/google-health-records-project-nightingale-privacy-ascension Wall Street Journalのロブ・コープランド氏は、プロジェクト・ナイチンゲールによって収集されたデ

      Googleが患者に無断で医療記録を収集していたと報告される
    • Retty、食領域のビックデータ連携基盤「Food Data Platform」--連携の第一弾は出光興産

      Food Data Platformは、「Retty」に蓄積され、日々更新され続けるFood領域の各種データを収集/格納/成形/統合/管理し、企業のデータベースとシームレスにデータ連携できるデータ基盤。企業が独自に保有するデータ・データ基盤とFood Data Platformを連携させることで、新たなコンテンツ体験機会の創出、ユーザーインサイトによるマーケティング精度の向上、トレンド分析、商品企画開発、位置情報を活用した出店戦略立案、消費動向調査など、企業独自データの品質向上などに利用できる。 また、データ基盤連携第一弾として、出光興産が運営する旅行プラン作成サイト「ドライブコンサルタント」と「Food Data Platform」の連携を開始した。 同社によると、出光興産が保有する全国に広がるサービスステーションを起点とした地域データと「Retty」の人気店データを掛け合わせることで、

        Retty、食領域のビックデータ連携基盤「Food Data Platform」--連携の第一弾は出光興産
      • 「感染症の専門家だからといってビッグデータとAIを扱えるわけではない」三浦瑠麗氏が感染者数のピーク予測を提供する理由 | 国内 | ABEMA TIMES | アベマタイムズ

        7日のABEMA『NewsBAR橋下』にゲスト出演した国際政治学者の三浦瑠麗氏が、政治と専門家の役割について橋下徹氏と議論した。三浦氏は先月から、自身の参加する民間有志チーム「CATs」(Collective Analysis Teams)による、東京都での新型コロナウイルス感染症の第6波ピーク予測を連日公開してきた。 橋下:尾身さんたち専門家の皆さんが日々努力をされていることには敬意を表するんだけど、ちょっと“同族グループ”すぎたんじゃないか。尾身さんっていう権威がいて、同じような考え方の、いわば弟子というか、知り合いを引っ張ってきちゃったから。違う考え方の専門家もいっぱいいるわけだし、そういう人たちも含めてどういう会議体にするか、そこは、最後は政治の責任だが、日本のコロナ対応で混乱が起きたことの一番の問題点は、専門家が“同族”すぎるからというところにあると思う。

          「感染症の専門家だからといってビッグデータとAIを扱えるわけではない」三浦瑠麗氏が感染者数のピーク予測を提供する理由 | 国内 | ABEMA TIMES | アベマタイムズ
        • 【初学者向け】データサイエンスにオススメの本80冊! | Octoparse

          ビッグデータの発展とともに、さまざまな分野の研究がデータ駆動型に変わってきて、データサイエンスも今広く知られるようになりました。大学にデータサイエンスを学べる学部ができたり、講座やコースなども多く開催され、データサイエンティストを目指している人もたくさんいます。この記事では、統計学から機械学習やマーケティングまで、初心者がデータサイエンスを学ぶのにおすすめの本を80冊紹介します! Part I: データサイエンス概論 1.『データサイエンス講義 』Rachel Schutt、Cathy O’Neil 著 本書では、データサイエンスを行う上で、どのようなプロセスが必要か、データサイエンティストとしてはどのようなスキルセットが必要で、どのような思考方法を選択する必要があるのかを実例を多数示しながら紹介します。 2.『戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック』Fost

          • Googleが警告、AI「Gemini」に“機密情報を入力しないで”。会話は従業員も閲覧(PHILE WEB) - Yahoo!ニュース

            GoogleはBard改めGeminiのプライバシーの取り扱いについて、ヘルプページの「Gemini アプリのプライバシー ハブ」で、AIアプリの使用時に注意すべきリスクを説明している。 Google Bardが「Gemini」に名称変更。高性能AIモデル「Ultra 1.0」も提供開始へ Googleは、Gemini アプリケーションが会話、位置情報、フィードバック、利用状況情報といった情報を収集すると説明。それらの情報を製品、サービス、機械学習技術の提供や向上、開発に利用すると述べている。 ただ、ZDNetは懸念すべき事項として、Geminiがユーザーの会話内容にアクセスする点を指摘している。Googleはこのページの「どのような種類のデータが収集され、どのように使用されますか?」という項目において、ユーザーの個人情報を他人に販売することはないとしているが、自動ツールを用いて会話のサブ

              Googleが警告、AI「Gemini」に“機密情報を入力しないで”。会話は従業員も閲覧(PHILE WEB) - Yahoo!ニュース
            • 【2024最新】データ分析に必要なオープンデータソース一覧70選! | Octoparse

              質のいいデータソースはデータ分析とデータ活用に大きく役割を果たしています。ビッグデータの収集は大変な仕事だと思っている方は多いかもしれませんが、実はそうでもありません。本記事では政府機関、医療・健康、 金融・経済、ビジネス・企業、ジャーナリズム・メディア、不動産・観光、文化・教育など、カテゴリ別に誰でも利用できる70選の面白いオープンデータソースの一覧を整理いたしました。ぜひデータ分析にお役に立てると思います。 一、政府機関の公開データ 1.日本総務省統計局 日本総務省統計局、統計研究研修所の共同運営によるサイトです。国勢の基本に関する統計の企画・作成・提供、国及び地方公共団体の統計職員に専門的な研修を行っています。 2.DATA.GO.JP これは日本各府省の保有データをオープンデータとして利用できる場をつくり、データの提供側・利用側双方にオープンデータのイメージを分かりやすく示すことを

              • 【データ分析入門】データ分析の現状と課題 - シー・エス・エス イノベーションラボ(ブログ)

                DXへの取り組みの加速により、企業は保有しているデータを分析・活用する必要性が高まってきました。「データドリブン経営」という言葉が一般的になってきたように、ビジネスでより良い判断をするために保有しているデータを活用することは最優先事項となっています。 前回はなぜ今データ分析を行うべきなのか、目的とメリットをご紹介いたしました。 ※前回の記事はこちら blog.css-net.co.jp 今回は、そのデータ分析における現状と課題点について詳しくご説明いたします。ぜひご自身の会社に当てはめてお考え下さい。 1.データ活用の現状 1-1.    データが散在しており、現状を把握出来ていない 1-2.    データを見てもビジネスの発想が出てこない 1-3.    顧客や成果のデータを可視化したい 1-4.    施策に有効なデータを選定できない 2.    効果的にデータを活用するために 2-1

                  【データ分析入門】データ分析の現状と課題 - シー・エス・エス イノベーションラボ(ブログ)
                • 【2023】データ分析・データ可視化ツールおすすめの30選! | Octoparse

                  ビックデータ時代の到来に伴い、データ活用やデータ利活用という言葉をよく耳にします。ビッグデータの活用というのは、簡単にいうと手元にある膨大なデータから様々な情報を引き出しから、それを未来の予測、ビジネスの意思決定、新産業の創出などに活用していくことができます。しかし、膨大なデータからどのように有益な情報と洞察をと得られますでしょうか?本記事ではデータを分析に役に立つデータ可視化ツール30選を紹介します。初心者向けのツールも含めていますから、データ分析に興味を持つ方はぜひご覧ください! ノーコード型データ可視化ツール 1.チャートグラフ|テクニカル分析ツール 1) Tableau Tableauは世界中で有名なデータ視覚化ツールとして、人々にデータを効果的な見える化にするサービスを提供しています。Tableauは非常に強力で柔軟な分析プラットフォームで、プログラミングなどの専門知識・スキル不

                  • データカタログ横断システム

                    データカタログ横断システムはSIP NIIコンソーシアムが開発したオープンデータに係る情報検索サイトです。

                    • 【禁断の比較?】SnowflakeとTreasure Dataを比べてみました

                      ここ最近「SnowflakeとTreasure Dataの違いを教えてほしい」 といった質問を頂くことが増えています。 どちらもクラウドDWH(データウェアハウス)や、 クラウドデータプラットフォームと呼ばれるように、競合するプロダクトですね。 クラウドのスケールメリットを活かしている点、 ユーザビリティの高いGUIが用意されている点など、共通点が多いです。 2011年に米国で日本人が創業し、 2013年から今日に至るまで日本国内での普及を着実に進めていったTreasure Data。 2012年に米国で元Oracle出身者が創業し、 グローバルでの評価を確固たるものとし、 満を持して2019年に日本法人を設立したSnowflake。 グローバルでの知名度は圧倒的にSnowflakeの方が高いのですが 日本国内での歴史はまだ浅く、 国内においてはTreasure Dataの方が知名度が高く

                        【禁断の比較?】SnowflakeとTreasure Dataを比べてみました
                      • スクレイピング違法 | Octoparse

                        Web上に公開されている情報の中から特定のデータだけを自動抽出する「Webスクレイピング」が注目されています。Webスクレイピングを活用することで、個人や企業活動のあらゆるビジネスシーンで業務効率化や、付加価値の創造に役立ちます。 しかしながら、世間ではWebスクレイピングに関する誤解も少なくありません。Webスクレイピングツールを開発する当社にも日々多くの質問が寄せられています。そこで本記事では、Webスクレイピングが違法かどうか、それからWebスクレイピングに関する他の質問についてご説明します。 本記事をご覧いただくことでスクレイピングに関する正しい知識を持っていただけたら幸いです。 関連記事:【徹底解説】スクレイピングとは|初心者にも分かるスクレイピングに関する解説! スクレイピング自体に違法性はない Webサイトから自動的にデータを集めるWebスクレイピングを使えば作業効率を飛躍的

                        • Apache Beam (Dataflow) 実践入門【Python】 - Qiita

                          はじめに この記事は、Apache Beam Documentation の内容をベースとしています。 Apache Beam Python SDK でバッチ処理が可能なプログラムを実装し、Cloud Dataflow で実行する手順や方法をまとめています。また、Apache Beam の基本概念、テストや設計などについても少し触れています。 Apache Beam SDK 入門 Apache Beam SDK は、Java, Python, Go の中から選択することができ、以下のような分散処理の仕組みを単純化する機能を提供しています。 Pipeline:処理タスク全体(パイプライン)をカプセル化します。処理タスクには、入力データの読み取り、変換処理、および出力データの書き込み等が含まれます。 PCollection:分散処理対象のデータセットを表すオブジェクトです。通常は、外部のデータ

                            Apache Beam (Dataflow) 実践入門【Python】 - Qiita
                          • データレイク解説シリーズ 第 1 回 : データレイクってなに ? - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS

                            こんにちは。今回から 4 回の予定でデータレイクについての連載をスタートします。現在データレイクの書籍を 4 名で執筆中なのですが、そこからエッセンスとなるポイントを抜き出し、builders.flash を読んでいただいている皆様にコンパクトにお届けします。第一回は「データレイクってなに?」です。 データレイクを一言で表すならば、多様なデータを一元的に、大量に保存して置ける場所です。データベースに入っているような構造化されたデータも、ソーシャルメディアのメッセージも、画像や音声ファイルも一箇所に集めたデータ置き場という意味です。 これを読んでいる皆様は「データベースでは駄目なの ?」と思われるかもしれませんね。巨大なデータを扱うという意味ではデータウェアハウスもありますが、これとはどう違うのでしょうか? 今回はデータレイク理解の最初の一歩として、データレイクは、データベースやデータウェア

                              データレイク解説シリーズ 第 1 回 : データレイクってなに ? - builders.flash☆ - 変化を求めるデベロッパーを応援するウェブマガジン | AWS
                            • 小売にはびこる「悪しき先入観や現場主義」をぶっ壊せ! データドリブンなグッデイ三代目社長は、何と戦ってきたのか

                              小売にはびこる「悪しき先入観や現場主義」をぶっ壊せ! データドリブンなグッデイ三代目社長は、何と戦ってきたのか:長谷川秀樹の「IT酒場放浪記」(1/4 ページ) メルカリのCIOを退任し、「プロフェッショナルCDOの道を切りひらく!」と宣言した長谷川秀樹氏が、酒を酌み交わしながら語り合う本対談。今回は、何を食べてもおいしい博多にやってまいりました。 ゲストは、北部九州・山口を中心にホームセンター65店舗を運営する「グッデイ」の三代目社長 柳瀬隆志さん。独学で統計分析ツールのRや、プログラミング言語のPythonを習得し、社員とともにデータドリブンな経営を目指しています。 POSデータは「過去は分かる」が、「未来は教えてくれない」――。そんな小売業の定説に、「せやろな」と同調していた東急ハンズ時代の長谷川氏にとって、柳瀬氏との出会いは衝撃的だったようで…… データドリブンな三代目社長はこうし

                                小売にはびこる「悪しき先入観や現場主義」をぶっ壊せ! データドリブンなグッデイ三代目社長は、何と戦ってきたのか
                              • Embulk & Digdag Online Meetup 2020|IT勉強会・イベントならTECH PLAY[テックプレイ]

                                概要 COVID-19の影響でキャンセルとなったEmbulk & Digdag Meetupですが、オンラインで実施することとなりました! Arm Treasure Dataが中心となって開発・提供をしているOSSプロダクトであるEmbulkとDigdagのMeetupを初開催します! Embulk/Digdagのオリジナル開発者である古橋(@frsyuki)や現在のコア開発チームも参加して、EmbulkとDigdagそれぞれの今後のロードマップについて発表します。 さらに、EmbulkとDigdagをプロダクション環境で利用しているZOZO TechnologiesとprimeNumber社の「troccoⓇ」開発チームの2社にも登壇いただき、EmbulkとDigdagの運用やプラグイン開発についてのディープなナレッジを共有します。 Youtube Live経由で配信します。https:

                                  Embulk & Digdag Online Meetup 2020|IT勉強会・イベントならTECH PLAY[テックプレイ]
                                • https://pages.awscloud.com/rs/112-TZM-766/images/20200604_data.pdf

                                  • BigQuery とは 概要から料金体系を5分で入門 | クラウドエース株式会社

                                    BigQuery とは 概要から料金体系を5分で入門 ※こちらは2021年4月19日時点で執筆された内容です。 実際の最新情報につきましては Google Cloud の公式情報をご確認ください。 こんにちは、クラウドエース編集部です。 Google Cloud のプロダクトの1つでもあり データウェアハウス(DWH)として人気の高い BigQuery について、概要から料金体系、他のクラウドサービスの同様のプロダクトとの比較など入門的な内容を5分で読めるボリュームで解説していきたいと思います。 本記事をご覧いただいている方の中には Google Cloud をはじめとした、クラウド化を検討されている方も多いと思われます。 もし Google Cloud について、もう少し詳しく知りたいという方にはこちらの《最新版》Google Cloud と Cloud Ace のご紹介資料がおすすめで

                                      BigQuery とは 概要から料金体系を5分で入門 | クラウドエース株式会社
                                    • 【SAS勉強会-第3回-】DATAステップ処理の裏側 - シー・エス・エス イノベーションラボ(ブログ)

                                      お久しぶりです。shimesaba_oishiです。 最近急に寒くなりましたね。。秋を返してほしいと思う今日この頃です。 最近SASの勉強をしているのですが、業務ではあまり意識していない「DATAステップ処理の裏側」についてご紹介しようと思います。 前回の記事はこちら👇 blog.css-net.co.jp 1.各フェーズについて 2.コンパイル・フェーズ 入力バッファ プログラム・データベクトル 構文チェック 変数の追加 ディスクリプタ部の作成 3.実行フェーズ 変数の初期化 INFILEステートメント INPUTステートメント DATAステップの最後 DATAステップの繰り返し 4.おわりに 1.各フェーズについて まずSAS DATAステップは2つのフェーズで処理されています。まずは各フェーズの名前とざっくりとした処理をみていきましょう。 コンパイル・フェーズ 入力バッファとプログ

                                        【SAS勉強会-第3回-】DATAステップ処理の裏側 - シー・エス・エス イノベーションラボ(ブログ)
                                      • 【SAS勉強会-第4回-】ODSステートメントを使用したHTML出力 - シー・エス・エス イノベーションラボ(ブログ)

                                        皆さま。こんにちは、marshmallow_bijouです。 今年も終わりに近づいてきましたね。私はクリスマスケーキを食べるのを指折り数えて楽しみにしているこの頃です。 さて今回は、ODSステートメントを使用して、HTML出力を作成し表示する方法についてお話していこうと思います。 前回の記事はこちら👇 blog.css-net.co.jp 1.ODSの動き 2.ODS出力先のオープン・クローズ 2-1.ODS出力先のオープン・クローズの仕方 2-2.複数の出力先を一度に閉じたい場合 3.オプションを使用したHTML出力 4.最後に 1.ODSの動き まず、HTML出力のお話の前に、ODSステートメントとは何かについて、軽く触れておきます。 *1 ODSでは、書式設定のオプションを与えることによって、出力の幅を広げることが出来るので、指定した形式で出力ファイルを作成したいときに使えるかと思

                                          【SAS勉強会-第4回-】ODSステートメントを使用したHTML出力 - シー・エス・エス イノベーションラボ(ブログ)
                                        • 三菱地所、全社員にデータ分析教育 役員含め1万人対象 - 日本経済新聞

                                          三菱地所がグループ全社員1万人を対象に新たなデジタル教育に乗り出す。データ分析の手法などを学ぶ約15時間の講座受講を必修とし、優秀な人材を選抜してマーケティングに生かせるデジタル技術を教える。経験に頼らず、データを生かした顧客への提案で効率的な営業に転換する。外資との競争が激しくなる中、デジタルトランスフォーメーション(DX)が遅れる不動産業界でも人材育成が本格化する。三菱地所がグループ全社員

                                            三菱地所、全社員にデータ分析教育 役員含め1万人対象 - 日本経済新聞
                                          • 一休.com代表が説く、データ活用の3つの利点 競合との比較から見出す“好機”

                                            コロナの影響が大きい、観光地・宿泊施設・レストラン 倉橋健太氏(以下、倉橋):よろしくお願いいたします。簡単に、みなさんの自己紹介から入っていきたいなと思います。榊さんからお願いしてもよろしいですか? 榊淳氏(以下、榊):一休の榊です。事業は主に、宿泊の予約事業とレストランの予約事業をやっていまして。ご存じのとおりインターネットの会社なので、対お客さん向けのサービスだとか、ホテルさんとかレストランさん向けのサービスに、データ活用などをやっております。よろしくお願いします。 倉橋:お願いします。では次、山本さんお願いします。 山本博士氏(以下、山本):スマレジの山本と申します。飲食店さんとか小売店さん向けのレジのアプリを作って販売している、ソフトウェア会社になります。今年2月の中旬ぐらいに、観光地で商売されているお客さま・店舗さまから「売り上げが一気に落ちている」とご連絡をいただいて。 「ス

                                              一休.com代表が説く、データ活用の3つの利点 競合との比較から見出す“好機”
                                            • 【データ分析入門】データ分析って?目的・メリットはなに?なぜ重要とされている? - シー・エス・エス イノベーションラボ(ブログ)

                                              DXへの取り組みの加速により、企業は保有しているデータを分析・活用する必要性が高まってきました。「データドリブン経営*1」という言葉が一般的になってきたように、ビジネスでより良い判断をするために保有しているデータを活用することは最優先事項となっています。 一方で、 ・    データ分析の概要が分からない ・    データを活用するメリットが分からない ・    データ分析を行うことでどのような成果につながるのか分からない といった悩みを抱えている方も多くいらっしゃることかと思います。 今回はなぜ今データ分析を行うべきなのか、目的とメリットをご紹介します。データの活用をご検討されている方はぜひご一読ください。 1.データ分析とは? 2.データ分析の目的とは? 3.データ分析のメリット 3-1.迅速な意思決定ができる 3-2.これまで見落としていた問題点や可能性を抽出できる 3-3.確度の高い

                                                【データ分析入門】データ分析って?目的・メリットはなに?なぜ重要とされている? - シー・エス・エス イノベーションラボ(ブログ)
                                              • 「Redash v10.1.0」で気になった新機能と機能改善 - kakakakakku blog

                                                2021年10月に Redash の最新バージョン「Redash v10.0.0」がリリースされた.そして現在は「Redash v10.1.0」まで出ている.また Redash 界隈ではよく知られた「正式リリースまで到達しなかった v9.0.0」という話もあり,実に2年振りの正式リリースとなる.Redash を使っている会社だとでは「v8 → v10」にアップデートする機会が多いと思う. バージョン リリース日 v9.0.0-beta 2020-06-11 リリース v10.0.0-beta 2021-06-16 リリース v10.0.0 2021-10-01 リリース v10.1.0 2021-11-23 リリース 今回は Change Log を確認しつつ,「個人的に気になった Redash v10.1.0 新機能と機能改善」を「計5点」紹介する.全ての変更点は以下に載っている. gi

                                                  「Redash v10.1.0」で気になった新機能と機能改善 - kakakakakku blog
                                                • データサイエンス入門スキル | Octoparse

                                                  近年、「ビッグデータ」の注目に伴い、ビッグデータを活用するための手段として、「データマイニング」にもよく耳にします。「データマイニング」とは、そもそもどのようなものなのでしょうか? データマイニングとは データマイニング(Data mining)とは、その言葉の示す通り、膨大なデータから有効な情報を採掘(マイニング)する技術です。大量のデータを統計学や人工知能などの分析手法を使って、データの相関関係や隠れたパターンなどを見つけるための解析方法です。 データマイニングはデータサイエンスの分野における重要な技術です。Glassdoorの「アメリカの仕事ランキングTOP50」のリストでは、データマイニングは、2018年から2021年にかけてアメリカで第1位と評価されています。 その上、2018年の17000件の求人情報と比べて、求人の件数は2年間で160%大幅に増加しました。データサイエンティス

                                                  • Amazon.co.jp: [増補改訂]ビッグデータを支える技術 ——ラップトップ1台で学ぶデータ基盤のしくみ (WEB+DB PRESS plus): 西田圭介: 本

                                                      Amazon.co.jp: [増補改訂]ビッグデータを支える技術 ——ラップトップ1台で学ぶデータ基盤のしくみ (WEB+DB PRESS plus): 西田圭介: 本
                                                    • Embulk & Digdag Meetup 2020|IT勉強会ならTECH PLAY[テックプレイ]

                                                      お知らせ 誠に残念ですが、Embulk & Digdag Meetup 2020の開催の延期をご報告いたします。 新型コロナウイルス感染症(COVID-19)の被害拡の状況下において、今回のミートアップ開催は望ましくないと判断し、延期させていただくこととなりました。 4月以降に状況を鑑み、再度ミートアップの企画させていただきますので、楽しみにお待ちください。 概要 Treasure Dataが中心となって開発・提供をしているOSSプロダクトであるEmbulkとDigdagのMeetupを2020年初開催します! Embulk/Digdagのオリジナル開発者である古橋(@frsyuki)や現在のコア開発チームも参加して、EmbulkとDigdagそれぞれの今後のロードマップについて発表します。 さらに、EmbulkとDigdagをプロダクション環境で利用しているZOZO Technologi

                                                        Embulk & Digdag Meetup 2020|IT勉強会ならTECH PLAY[テックプレイ]
                                                      • 中国、ビッグデータで感染経路を割り出し 行動を詳細把握

                                                        【北京=西見由章】国民のプライバシーが含まれるビッグデータや顔認証などの人工知能(AI)を利用して国民を統制・監視している中国当局が、これまで蓄積した技術を新型コロナウイルスの感染経路割り出しに活用している。 南京市当局は1月下旬、新型肺炎の感染者3人が過去に外出した際の詳細な移動経路を公表し、接触した可能性がある人に連絡を呼び掛けた。地下鉄の乗換駅も含めた詳細な経路やバスの乗降駅、スーパーや病院に滞在した時間も分単位でつきとめた。市当局は「ビッグデータを運用した」と説明する。 中国当局は治安維持のためにデジタル技術を活用。街中に設置された監視カメラと顔認証技術の情報に加えて、携帯電話の通話・位置情報、ライドシェアなど各種サービスの利用記録といったビッグデータを企業から収集し、個人の詳細な行動履歴を把握することが可能となっている。 国家衛生健康委員会の専門家チームメンバー、李蘭娟(り・らん

                                                          中国、ビッグデータで感染経路を割り出し 行動を詳細把握
                                                        • PowerPoint Presentation

                                                          © 2020, Amazon Web Services, Inc. or its Affiliates. Noritaka Sekiyama Big Data Architect, AWS Glue & Lake Formation 2020/6/11 データレイクの活用に 欠かせない運用のポイント © 2020, Amazon Web Services, Inc. or its Affiliates. AWSオンラインセミナーへようこそ お気軽にご質問ください! • 書き込んだ質問は主催者にしか見 えません • 最後のQ&A時間で、いただいたご 質問からピックアップしてご回答 をさせていただきます ① 吹き出しをクリック ② 質問を入力 ③ Sendをクリック © 2020, Amazon Web Services, Inc. or its Affiliates. 「AWSではじめるデー

                                                          • Icebergテーブルの内部構造について - やっさんメモ

                                                            この記事は MicroAd Advent Calendar 2023 と Distributed computing (Apache Spark, Hadoop, Kafka, ...) Advent Calendar 2023 の1日目の記事です。 qiita.com qiita.com 今年もアドカレの季節がやってきました🎄 今回は、ここ数年でデータ界隈で盛り上がっているOpen Table FormatのIcebergテーブルについて書いていきます。 Hiveテーブルとの比較とか、Icebergテーブルの特徴(Time Travel や Rollback、Hidden Partitioning、Full Schema Evolution等)については、あっちこっちで大分こすられてます。 そこで、Icebergテーブルの特徴がなぜ実現できているのかについて知るために、内部構造がどうな

                                                              Icebergテーブルの内部構造について - やっさんメモ
                                                            • イベント資料|Embulk & Digdag Online Meetup 2020 - TECH PLAY[テックプレイ]

                                                              グループを作れば、無料で誰でもイベントページが作成できます。情報発信や交流のためのイベントをTECH PLAY で公開してみませんか?

                                                                イベント資料|Embulk & Digdag Online Meetup 2020 - TECH PLAY[テックプレイ]
                                                              • 【SAS勉強会 -第2回-】SASのPROC FORMAT - シー・エス・エス イノベーションラボ(ブログ)

                                                                1.はじめに みなさん。こんにちは。luckystar_021008です。 ここ最近はずっと引きこもり続けていて、フットサルとかやりたいなと思う今日この頃です。 さて、今回もSASに関しての勉強を一緒に行っていきましょう。 前回の記事はこちら👇 blog.css-net.co.jp 1.はじめに 2.proc formatの利用の仕方 2-1.プログラムの作成例 2-2.フォーマットの作成 2-2-1.libraryとは 2-2-2.valueとは ★valueの値の定義に関して 2-3.作成したフォーマットを利用する ★定義したフォーマットの呼び出しに関しての注意点 2-4.結果の表示 3.終わりに 2.proc formatの利用の仕方 私がみなさんにお伝えする部分はSAS上でのフォーマットの作り方に関してです。 フォーマットとは、一言で言うと「読み替え」や「変換」を行うということで

                                                                  【SAS勉強会 -第2回-】SASのPROC FORMAT - シー・エス・エス イノベーションラボ(ブログ)
                                                                • バイクシェアリングの効率的な運用に新しい数学的手法、東京理科大学などが提案

                                                                  バイクシェアリングの効率的な運用に新しい数学的手法、東京理科大学などが提案 大学ジャーナルオンライン編集部 東京理科大学の池口徹教授らの研究グループは、日本工業大学と共同で、複数車両が再配置を行う「バイクシェアリングシステム・ルーティング問題(mBSSRP)」の準最適解を短時間で求めるために、新しい探索戦略を提案し、ポート数が多数になった場合でも合理的な時間内に良好な実行可能解が得られることを示した。 今回の研究では、再配置作業時間などのさまざまな制約を満たし、かつ実行可能な解を導き出すアルゴリズムを導出する手法を開発することに成功した。この手法により、小規模な問題に対しては、より短時間で最適解を得ることができるようになった。さらに、大規模な問題に対しては、実行可能解を探すだけではなく、実行不可能な解空間についての探索も行うという従来とは異なるアプローチにより、良好な近似解を得ることを可能

                                                                    バイクシェアリングの効率的な運用に新しい数学的手法、東京理科大学などが提案
                                                                  • 何故、グローバルに通用する日本発SNSがないのか?知られてない技術的背景【深田萌絵TV】

                                                                    メルマガ読者様から「何故、日本発SNSがないのか?説明して欲しい」と聞かれたので、業界外の人には知られてない技術的背景や政治的な話について解説します。 2010年前後のSNSやアーカイブサービスは、データセンター固定費や電気代などの費用が大変なのですが、それを舐めて「SNSなんてソフトウェアで簡単に作れる」とタカをくくって参入するとコスト死する恐怖のビジネスモデル・トラップの屍の山となりました(´;ω;`) 途中で、99%のビデオは見られない。ちょっとしか見る人がいない。の「ちょっと」は、人気の動画しか見る人がいないということを言いたかったらしいです!言葉足らずですみません。 ★深田萌絵チャンネルメンバー★★★★★★★★ 「猫組」メンバーになって応援してください ٩( 'ω' )و https://www.youtube.com/channel/UCJD2JwJNPzi1qcLizxmx

                                                                      何故、グローバルに通用する日本発SNSがないのか?知られてない技術的背景【深田萌絵TV】
                                                                    • 選挙予測を出し抜く 番狂わせの舞台裏で暗躍するデータサイエンティストたち:朝日新聞GLOBE+

                                                                      ケンブリッジ・アナリティカの元CEOアレクサンダー・ニックス氏(左)とトランプ米大統領(デザイン:木村デザイン事務所、写真はAP) 「どんな有権者が投票に行くのか、人々は根本的に見当違いをしていた。それが多くの予測調査が外れた理由だ」 英国の選挙コンサルティング会社ケンブリッジ・アナリティカ(CA)の元部長マシュー・オクズコースキー氏は、米大統領選後のイベントで、世論調査機関やメディアをこうこき下ろしつつ、胸を張った。「我々は(性別や年齢など)個々の属性より、その人の『性格』の方が、はるかにその行動や動機付けに影響を与えることを知っていた。我々はこれを政治の世界で使った」 米フェイスブック(FB)から最大8700万人分の個人情報を不正流用し、トランプ勝利に貢献したCAとは、どんな会社なのか。 1990年創業の親会社「戦略的コミュニケーション研究所(SCL)」は、データ分析で様々な事業を手が

                                                                        選挙予測を出し抜く 番狂わせの舞台裏で暗躍するデータサイエンティストたち:朝日新聞GLOBE+
                                                                      • ビッグデータとは?基礎知識やどう活用されるかを分かりやすく解説|コラム|クラウドソリューション|サービス|法人のお客さま|NTT東日本

                                                                        ビッグデータとは?基礎知識やどう活用されるかを分かりやすく解説 【こちらもチェック!】NTT東日本ではビッグデータ、クラウドAIの活用を支援させていただいております。詳しいサービス内容はこちらをダウンロードしてご確認ください! ビッグデータとは、簡単に言うと「日々生成される多種多様なデータ群」のことです。 その明確な定義は定まっていませんが、例えば交通系ICカードに記録される乗車履歴やGPSから得られる位置情報、メールの内容、SNSの投稿やコメントといったデータが大量に蓄積されたものをビッグデータと呼ぶことができます。 こうしたビッグデータを分析し、そこから得られた知見をビジネスにおける意思決定に活かすケースが増えてきています。 あなたの会社でも、こうしたビッグデータを活用していこうとする動きがあるのではないでしょうか? ただ、これまでにビッグデータを活用した経験が無い場合、 「そもそもビ

                                                                          ビッグデータとは?基礎知識やどう活用されるかを分かりやすく解説|コラム|クラウドソリューション|サービス|法人のお客さま|NTT東日本

                                                                        新着記事