


  • から
  • まで

121 - 155 件 / 155件

新着順 人気順

dataManagementの検索結果121 - 155 件 / 155件

  • Michael J. Cafarella

    Mike Cafarella Associate Professor Computer Science and Engineering 2260 Hayward St. University of Michigan Ann Arbor, MI 48109-2121 Office: 4709 Beyster Phone: 734-764-9418 Fax: 734-763-8094 Send email to me at michjc, found at umich dot edu Hi. I am an associate professor in Computer Science and Engineering at the University of Michigan. My research interests include databases, information extra

      Michael J. Cafarella
    • Ontop

      Documentation under CC-BY license | Copyright 2009-present - Free University of Bozen-Bolzano

      • Overview

        Collect, aggregate, and visualize a data ecosystem's metadata View on GitHub Quickstart Download Overview Marquez is an open source metadata service for the collection, aggregation, and visualization of a data ecosystem’s metadata. It maintains the provenance of how datasets are consumed and produced, provides global visibility into job runtime and frequency of dataset access, centralization of da

        • GAFAの強さの源泉「アイデンティティー管理」 第一人者に聞く

          みなさんがインターネット上のサービス、例えばAppleやGoogleなどのサービスを使うとき、「あなた本人が使っている」ことをサービス提供側は認識している。それを可能にするのが「アイデンティティー管理」(デジタルで扱うので「デジタルアイデンティティー管理」と呼ぶ)である。その第一人者は実は日本人で、OpenID Foundationという米国を本拠地にする国際標準化団体の理事長を務める崎村夏彦氏だ。同氏が著した『デジタルアイデンティティー 経営者が知らないサイバービジネスの核心』(2021年7月発行)は、DX経営者が自分の言葉で語らねばならないことをまとめているという。(聞き手=日経BP 技術メディアユニット クロスメディア編集) 崎村さんは何をしている人なのか、一言で説明するとどうなりますか? 「アイデンティティーのプロトコルを作成する人」です。AppleやGoogleなどが提供するサー

            GAFAの強さの源泉「アイデンティティー管理」 第一人者に聞く
          • How GDPR Will Change The Way You Develop — Smashing Magazine

            GDPR requires you to be more thoughtful about the sites and services you build, more transparent about the ways you collect and use data, more considerate of your users, and more thorough in your development and documentation processes. In this article, Heather Burns will explore what you, as a developer, need to know about the new data protection regime. At the end, you’ll understand how the chal

              How GDPR Will Change The Way You Develop — Smashing Magazine
            • The FAIR Guiding Principles for scientific data management and stewardship - Scientific Data

              There is an urgent need to improve the infrastructure supporting the reuse of scholarly data. A diverse set of stakeholders—representing academia, industry, funding agencies, and scholarly publishers—have come together to design and jointly endorse a concise and measureable set of principles that we refer to as the FAIR Data Principles. The intent is that these may act as a guideline for those wis

              • データ活用をもっともっと円滑に!�~データ処理・分析基盤編を少しだけ~

                データ活用をもっともっと円滑に!�~データ処理・分析基盤編を少しだけ~ 2016/7/26 Spark Summit2016報告会&データ分析勉強会Read less

                • GitHub - webdataset/webdataset: A high-performance Python-based I/O system for large (and small) deep learning problems, with strong support for PyTorch.

                  WebDataset format files are tar files, with two conventions: within each tar file, files that belong together and make up a training sample share the same basename when stripped of all filename extensions the shards of a tar file are numbered like something-000000.tar to something-012345.tar, usually specified using brace notation something-{000000..012345}.tar WebDataset can read files from local

                    GitHub - webdataset/webdataset: A high-performance Python-based I/O system for large (and small) deep learning problems, with strong support for PyTorch.
                  • Pentaho Download

                    Intelligent digital infrastructure and data platforms to reduce data center energy consumption and carbon footprint. Expertise to help you uncover insights to enable data-driven sustainability. Explore Sustainable Infrastructure

                      Pentaho Download
                    • LinkedIn Data Infrastructure - Software Engineering Daily

                      LinkedIn has become a staple for the modern professional, whether it’s used for searching for a new job, reading industry news, or keeping up with professional connections. As a rapidly growing platform that serves more than 675 million users today, LinkedIn is a company that can boast of having one of the largest user bases in the world. How these users interact with the site and react to recomme

                        LinkedIn Data Infrastructure - Software Engineering Daily
                      • Memento Database - Google Play のアプリ

                        メメントデータベースは、使いやすいデータベース管理のためのカスタマイズ可能なソリューションの複雑な、です。 メンメントは、あなたとあなたのチームがあらゆる情報を簡単かつ効果的に管理できるようにします。 他のデータベース管理ツールとは異なり、メメントデータベースは両方の経験豊富なユーザーやカジュアルな問題を解決するものにとって有用となるシンプルなユーザーインターフェースにパックされた強力な機能を提供します。 主な機能 ● カスタムフィールドを含むエントリの保存。 ● 集計、チャート作成、ソート、グループ化、および任意のフィールドによるエントリのフィルタリングを含む、データ分析の実行。 ● リスト、カード、テーブル、マップ、カレンダーの形式でデータを表示する。 ● グーグルスプレッドシートとの同期。 ● ライブラリへのアクセスを他のユーザーに提供することで、クラウドストレージとチームワーク。

                          Memento Database - Google Play のアプリ
                        • A Berkeley View of Systems Challenges for AI

                          A Berkeley View of Systems Challenges for AI Ion Stoica Dawn Song Raluca Ada Popa David A. Patterson Michael W. Mahoney Randy H. Katz Anthony D. Joseph Michael Jordan Joseph M. Hellerstein Joseph Gonzalez Ken Goldberg Ali Ghodsi David E. Culler Pieter Abbeel Electrical Engineering and Computer Sciences University of California at Berkeley Technical Report No. UCB/EECS-2017-159 http://www2.eecs.ber

                          • Facilitating the discovery of public datasets

                            Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more

                              Facilitating the discovery of public datasets
                            • Publicly Available Standards

                              In accordance with ISO/IEC JTC 1 and the ISO and IEC Councils, these International Standards are publicly available for Standardization purposes. Licence Agreement for Publicly Available Standards When you download (an) ISO publication(s) from this site, you accept the ISO Customer Licence Agreement ("Licence Agreement"), excluding clauses 2. Watermark, 5. Paper copies, and 6. Codes and Graphical

                              • Building Machine Learning Pipelines

                                Get full access to Building Machine Learning Pipelines and 60K+ other titles, with a free 10-day trial of O'Reilly. There are also live events, courses curated by job role, and more.

                                  Building Machine Learning Pipelines
                                • データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み

                                  These slides include many inappropriate graphs. If you want to tell the summary of the data correctly, you should avoid to use graphs in this presentation. They can mislead those who view them. In English, the title of presentaion is "24 slides including graphs that should not be absolutely drawn".

                                    データテクノロジースペシャル:Yahoo! JAPANにおけるメタデータ管理の試み
                                  • クラウドデータをノンコーディングでDBと同期する「CData Sync」、複数クラウドデータソース対応版としてリニューアル

                                    • HoloClean - Home

                                      A Machine Learning System for Data Repair and Predictions on Structured Data HoloClean is a statistical inference engine to impute, clean, and enrich data. As a weakly supervised machine learning system, HoloClean leverages available quality rules, value correlations, reference data, and multiple other signals to build a probabilistic model that accurately captures the data generation process, and

                                      • COAR Next Generation Repositories: Vision and Objectives

                                        Vision To position repositories as the foundation for a distributed, globally networked infrastructure for scholarly communication, on top of which layers of value added services will be deployed, thereby transforming the system, making it more research-centric, open to and supportive of innovation, while also collectively managed by the scholarly community. Technical Vision Our vision rests on ma

                                        • Abstract

                                          Data Lake Management: Challenges and Opportunities Tuesday, August 27, 11:00 – 12:30 -- VLDB 2019, Los Angeles, California Abstract The ubiquity of data lakes has created fascinating new challenges for data management research. In this tutorial, we review the state-of-the-art in data management for data lakes. We consider how data lakes are introducing new problems including dataset discovery and

                                          • Measuring the User Experience on a Large Scale: User-Centered Metrics for Web Applications

                                            Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more

                                            • Test data quality at scale with Deequ | Amazon Web Services

                                              AWS Big Data Blog Test data quality at scale with Deequ March 2023: You can now use AWS Glue Data Quality to measure and manage the quality of your data. AWS Glue Data Quality is built on DeeQu and it offers a simplified user experience for customers who want to this open-source package. Refer to the blog and documentation for additional details. You generally write unit tests for your code, but d

                                                Test data quality at scale with Deequ | Amazon Web Services
                                              • Andy Pavlo - Carnegie Mellon University

                                                I am an Associate Professor with Indefinite Tenure of Databaseology in the Computer Science Department at Carnegie Mellon University. My research interest is in database management systems, specifically main memory systems, self-driving / autonomous architectures, transaction processing systems, and large-scale data analytics. At CMU, I am a member of the Database Group and the Parallel Data Labor

                                                • リクルートにおけるデータのインフラ化への取組

                                                  Data Platform Confference Tokyo 2017 で話した「リクルートを支える横断データ基盤と機械学習の適用事例」です

                                                  • https://dl.acm.org/doi/10.1145/3299869.3314050

                                                    • Secure Knowledge Graph for Trusted AI | Fluree

                                                      Intelligent Database

                                                        Secure Knowledge Graph for Trusted AI | Fluree
                                                      • 「データマネジメントが30分でわかる本」を(ちょっと)実践してみた|たぽー | kübell

                                                        結論は「30分じゃ全く読み終わらない」。普通に3時間くらいかけて読み終えましたが、冒頭部に筆者からの宿題が出されていたので取り組んでみようと思います。 筆者からの宿題 ①自分の置かれた環境で解くべき課題は何か ②その課題に対して何ができるか①自分の置かれた環境で解くべき課題は何か 課題:キャンプ場の運営をしているが顧客管理の仕組みがないこと ひと昔前までは電話予約が主流だったキャンプ場も今はネット予約(OTA)を導入している施設が大半です。うちでも「なっぷ」「TAKIBI」といったOTAを利用しています。予約管理システムとしては十分なのですが、運営側としては「家族構成」「道具のレンタル有無」「平日/休日利用」などの顧客属性を元にプラン企画やマーケティングに活かしていきたいという思いがあります。 一応OTAにも「顧客情報CSV出力」「予約プランの分析」機能はあるのですが、顧客と予約が紐付いて

                                                          「データマネジメントが30分でわかる本」を(ちょっと)実践してみた|たぽー | kübell
                                                        • Three recommendations to enable Annotations on the Web

                                                          The Web Annotation Working Group has just published a Recommendation for Web Annotation in the form of three documents: Web Annotation Data Model—specification describes a structured model and format, in JSON, to enable annotations to be shared and reused across different hardware and software platforms. Common use cases can be modeled in a manner that is simple and convenient, while at the same t

                                                            Three recommendations to enable Annotations on the Web
                                                          • Data Catalogs Are Dead; Long Live Data Discovery

                                                            Image courtesy of Andrey_Kuzmin on ShutterstockAs companies increasingly leverage data to power digital products, drive decision making, and fuel innovation, understanding the health and reliability of these most critical assets is fundamental. For decades, organizations have relied on data catalogs to power data governance. But is that enough? Debashis Saha, VP of Engineering at AppZen, formerly

                                                              Data Catalogs Are Dead; Long Live Data Discovery
                                                            • Continuous Pipelines at Google

                                                              SRECon Europe 2015, USENIX, Dublin, Ireland, pp. 12 This article focuses on the real life challenges of managing data processing pipelines of depth and complexity. It considers the frequency continuum between periodic pipelines that run very infrequently through continuous pipelines that never stop running, and discusses the discontinuities that can produce significant operational problems. A fres

                                                              • Azure/AWSと連携してデータ管理を簡略化--ネットアップのクラウド戦略

                                                                印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます マルチクラウドやハイブリッドクラウドを導入・運用している企業が増えている。ストレージベンダーである米NetApp クラウドビジネス担当チーフアーキテクトのJoe CaraDonna氏に同社のクラウド戦略を聞いた。 CaraDonna氏によると、6000社のIT組織を対象に実施した米RightScaleの調査では、85%がマルチクラウド戦略を実施または計画中だった。また、調査対象企業の58%がハイブリッドクラウドへの移行計画を実施中または近日実施予定とした。 そうした状況の中、ハイブリッドクラウドを前提としたIT戦略の立案やアーキテクチャの検討、システムの開発・構築がますます必要になるとCaraDonna氏は説く。 また、クラウド戦略をI

                                                                • 2021/12/08 データモデリングの文脈変化 - /home/by-natures/dev*

                                                                  DMBOK で一番読むのを楽しみにしていたのがデータモデルの章だったのですが、いざ読んでみると細かすぎるというか、求めていたものと違う感覚がありました。私がドメイン駆動設計から生成されるモデルの実用性に興味をもっていた時期なので、実践的な内容を求めているだけかもしれませんが…。DMBOK ではデータモデリング・スキームが多数紹介されていたり、データモデリング戦略を立ててモデリングしていきましょう・・・といった内容が書かれており、現職で起きている問題を解決するのには役立たなそうだと感じました。 そんな中で見つけたこのデータ総研さんの記事で合点がいきました: (EDW報告その2)データモデリングの逆襲 | 株式会社データ総研 データ構造を固めなくてもデータを格納して貯めていけるNoSQLは、Webを中心としたシンプルなビジネスで数多く採用されています。テキストも画像も音声も動画も、なんでも構造

                                                                    2021/12/08 データモデリングの文脈変化 - /home/by-natures/dev*
                                                                  • Introducing the Model Card Toolkit for Easier Model Transparency Reporting

                                                                    Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more

                                                                      Introducing the Model Card Toolkit for Easier Model Transparency Reporting
                                                                    • The 2013 ACM SIGMOD/PODS Conference: New York, New York, USA - Welcome

                                                                      Conference Program: SIGMOD Sessions This page describes the complete SIGMOD Conference program. Please use the following links to skip to the sessions of interest: Research Sessions Industry Sessions Tutorials Demonstrations Keynote Talks and Research Plenary Session Undergraduate Research Poster Competition New Researcher Symposium SIGMOD RESEARCH SESSIONS Research 1: Data Analytics Location: 3.1

                                                                      • LINE DEVELOPER DAY 2021 振り返りレポート

                                                                        LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog Developer Successチームの佐藤です。 11月10日、11日の2日間、LINEの技術カンファレンス「LINE DEVELOPER DAY 2021」を開催しました。まずは、ご参加/視聴いただいた皆さま、登壇いただいたLINEおよびそのグループ企業の登壇者の皆さま、運営に携わっていただいた皆さま、本当にありがとうございました。 LINE DEVELOPER DAY 2021は、COVID-19感染拡大の影響で昨年に引き続き、オンラインイベントでの開催となりました。この記事では、LINE DEVELOPER DAY 2021がどのような傾向で登録・参加・視聴されたのかを各種数値とともに振り返ってみようと思います。 C

                                                                          LINE DEVELOPER DAY 2021 振り返りレポート