並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 2189件

新着順 人気順

dataの検索結果361 - 400 件 / 2189件

  • Find your way with field data in the Web Vitals extension update  |  Articles  |  web.dev

    Find your way with field data in the Web Vitals extension update Stay organized with collections Save and categorize content based on your preferences. The Web Vitals extension now shows you where your local experiences are in relation to real user experiences in the field. Core Web Vitals are the most important metrics to measure to understand your users' experiences, because when users have good

    • Data Meshとは何か?

      Aboutこの記事は、「Data Mesh」について書かれたものです。参考文献に記載された内容をベースとして、個人的な感想や意見を加えたものです。 事例ではありません。 TL;DRData Mesh はデータ基盤の新しいアーキテクチャ原則であり、現在主流である中央集中型のデータ基盤と、そこから起こる問題への解決策です。Data Mesh はマイクロサービスと DDD から着想を得ており、データの生成・管理・提供を中央ではなくドメインごとに管理します。管理が分散することでスケーラビリティ・自律性を確保しつつ、統一的なガバナンスを保持できるアイデアです。主な想定読者Data Mesh が気になる方データ基盤を開発・保守するデータエンジニアデータマネジメントをより洗練させたいと感じている方Data Mesh の登場した背景 (WHY)詳細に入る前に、Data Mesh が前提に置く現代のデータ基

        Data Meshとは何か?
      • Building a recommendation engine inside... | Crunchy Data Blog

        I'm a big fan of data in general. Data can tell you a lot about what users are doing and can help you gain all sorts of insights. One such aspect is in making recommendations based on past history or others that have made similar choices. In fact, years ago I wrote a small app to see if I could recommend wines based on how other ones were rated. It was a small app that I shared among just a handfu

          Building a recommendation engine inside... | Crunchy Data Blog
        • 「Always Data-Driven」を支えるデータサイエンスチーム。LINEの各事業の競争力を最大化するために意識していることとは

          LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog 2021年11月10日・11日の2日間にわたり、LINEのオンライン技術カンファレンス「LINE DEVELOPER DAY 2021」が開催されました。特別連載企画「DEVDAY21 +Interview」では、登壇者たちに発表内容をさらに深堀り、発表では触れられなかった関連の内容や裏話などについてインタビューします。今回の対象セッションは「データサイエンスによるLINE PayのLINE公式アカウントの情報受け取り体験の改善」です。 LINE PayのLINE公式アカウントは、新機能やキャンペーンなどの有益な情報を届ける重要なチャンネルですが、以前は必ずしも有用でない可能性があるメッセージをユーザーが高頻度で受信していると

            「Always Data-Driven」を支えるデータサイエンスチーム。LINEの各事業の競争力を最大化するために意識していることとは
          • Kaggle Data Science Bowl 2019 上位解法まとめ - ML_BearのKaggleな日常

            編集履歴 '20/01/28: 3rd solutionを追加 これはなに? Kaggleで10/24-1/23に開催されたData Science Bowl 2019コンペの上位解法まとめです。 1/27時点で公開されている10位以内の解法をまとめてみました。 Shake-up/downの激しいコンペでしたが、上位入賞されている方の解法には学ぶところが多く、上位に入るべくして入った方が多い印象でした。 流し読みしてまとめたので、間違っているところとかお気づきの点あればご指摘ください。 金メダル圏内のものがあと4つぐらい公開されていたので後で足そうと思います。 1st 1st place solution Stats private 0.568 / public 0.563 要約 LightGBMのシングルモデル(!) Foldごとにシードを変えた5Fold 詳細 Validation L

              Kaggle Data Science Bowl 2019 上位解法まとめ - ML_BearのKaggleな日常
            • GitHub - awslabs/diagram-maker: A library to display an interactive editor for any graph-like data.

              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                GitHub - awslabs/diagram-maker: A library to display an interactive editor for any graph-like data.
              • [DATAで見るケータイ業界] Tポイントからの離脱を決めたソフトバンク、焦点は共通ポイントへの対応

                  [DATAで見るケータイ業界] Tポイントからの離脱を決めたソフトバンク、焦点は共通ポイントへの対応
                • GitHub - nuvious/pam-duress: A Pluggable Authentication Module (PAM) which allows the establishment of alternate passwords that can be used to perform actions to clear sensitive data, notify IT/Security staff, close off sensitive network connections, etc

                  The PAM Duress is a module designed to allow users to generate 'duress' passwords that when used in place of their normal password will execute arbitrary scripts. This functionality could be used to allow someone pressed to give a password under coercion to provide a password that grants access but in the background runs scripts to clean up sensitive data, close connections to other networks to li

                    GitHub - nuvious/pam-duress: A Pluggable Authentication Module (PAM) which allows the establishment of alternate passwords that can be used to perform actions to clear sensitive data, notify IT/Security staff, close off sensitive network connections, etc
                  • No raw data, no science: another possible source of the reproducibility crisis - Molecular Brain

                    Editorial Open access Published: 21 February 2020 No raw data, no science: another possible source of the reproducibility crisis Tsuyoshi Miyakawa1 Molecular Brain volume 13, Article number: 24 (2020) Cite this article A reproducibility crisis is a situation where many scientific studies cannot be reproduced. Inappropriate practices of science, such as HARKing, p-hacking, and selective reporting o

                      No raw data, no science: another possible source of the reproducibility crisis - Molecular Brain
                    • GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server,

                      🔥PaddleOCR 算法模型挑战赛 火热开启!报名时间1/15-3/31,30万元奖金池!快来一展身手吧😎! 🔨2023.11 发布 PP-ChatOCRv2: 一个SDK,覆盖20+高频应用场景,支持5种文本图像智能分析能力和部署,包括通用场景关键信息抽取(快递单、营业执照和机动车行驶证等)、复杂文档场景关键信息抽取(解决生僻字、特殊标点、多页pdf、表格等难点问题)、通用OCR、文档场景专用OCR、通用表格识别。针对垂类业务场景,也支持模型训练、微调和Prompt优化。 🔥2023.8.7 发布 PaddleOCR release/2.7 发布PP-OCRv4,提供mobile和server两种模型 PP-OCRv4-mobile:速度可比情况下,中文场景效果相比于PP-OCRv3再提升4.5%,英文场景提升10%,80语种多语言模型平均识别准确率提升8%以上 PP-OCRv

                        GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server,
                      • Data Developer Platform

                        Home Data Developer Platform¶ A Data Platform Specification, open for adoption by any data platform developer. A modern way to run data engineering teams¶ Data teams are drained from continuously plumbing integrations and fragile pipelines, which leaves little to no time to focus on the real deal - data and data applications. Businesses that have a good grasp on data realise that today data makes

                        • Yoav Weiss - yoav@mastodon.social on Twitter: "In Japan, the web is slower towards the end of the month due to data caps, resulting in reduced engagement https://t.co/rKWClaqWUD"

                          In Japan, the web is slower towards the end of the month due to data caps, resulting in reduced engagement https://t.co/rKWClaqWUD

                            Yoav Weiss - yoav@mastodon.social on Twitter: "In Japan, the web is slower towards the end of the month due to data caps, resulting in reduced engagement https://t.co/rKWClaqWUD"
                          • Open Source Data Labeling | Label Studio

                            The most flexible data labeling platform to fine-tune LLMs, prepare training data or validate AI models. # Install the package # into python virtual environment pip install -U label-studio# Launch it!label-studio # Install the caskbrew install humansignal/tap/label-studio# Launch it!label-studio # clone repo git clone https://github.com/HumanSignal/label-studio.git # install dependencies cd label-

                              Open Source Data Labeling | Label Studio
                            • OpenIO | High Performance Object Storage for Big Data and AI

                              The Best Object Storage Offer on the Market OpenIO has joined OVHcloud, the leading European alternative cloud provider Learn more Object Storage on-prem, cloud-hosted, or at the edgeOpenIO is a software-defined open source object storage solution ideal for Big Data, HPC and AI. With its distributed grid architecture and unique self-learning ConsciousGrid™ technology, OpenIO scales easily without

                                OpenIO | High Performance Object Storage for Big Data and AI
                              • DevelopersIO 2022 Snowflakeトーク&ディスカッション~Snowflake Summit’22の最新情報を現地参戦できなかった二人のData Superheroと一緒に学ぼう!#devio2022 | DevelopersIO

                                さがらです。 DevelopersIO 2022 〜技術で心を揺さぶる3日間〜の2日目、2022年7月27日にSnowflakeトーク&ディスカッション~Snowflake Summit'22の最新情報を現地参戦できなかった二人のData Superheroと一緒に学ぼう!というタイトルで、Snowflake社のKTさん、弊社クラスメソッドの甲木、さがら、の3人で登壇しました。 本ブログではこの登壇内容について、紹介のあったSnowflakeの新機能を中心にまとめたいと思います。 登壇概要 概要 Snowflake社の最大のユーザーカンファレンスイベントである「Snowflake Summit」がラスベガスにて2022年6月13~16日の日程で開催されました。本セッションではSnowflake社のKT氏をお招きし、イベントに現地参戦できなかったData Supeheroesであるクラスメソ

                                  DevelopersIO 2022 Snowflakeトーク&ディスカッション~Snowflake Summit’22の最新情報を現地参戦できなかった二人のData Superheroと一緒に学ぼう!#devio2022 | DevelopersIO
                                • [DATAで見るケータイ業界] キャリア各社が注力する決済分野、クレジットカードなど各領域の現状を整理する

                                    [DATAで見るケータイ業界] キャリア各社が注力する決済分野、クレジットカードなど各領域の現状を整理する
                                  • GitHub - scratchdata/scratchdata: Scratch is a swiss army knife for big data.

                                    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                      GitHub - scratchdata/scratchdata: Scratch is a swiss army knife for big data.
                                    • Suspense for Data Fetching (Experimental) – React

                                      Caution: This page is somewhat outdated and only exists for historical purposes. React 18 was released with support for concurrency. However, there is no “mode” anymore, and the new behavior is fully opt-in and only enabled when you use the new features. For up-to-date high-level information, refer to: React 18 Announcement Upgrading to React 18 React Conf 2021 Videos For details about concurrent

                                        Suspense for Data Fetching (Experimental) – React
                                      • GitHub - jakekgrog/GhostDB: GhostDB is a distributed, in-memory, general purpose key-value data store that delivers microsecond performance at any scale.

                                        GhostDB stemmed from a University project. Due to the nature of these projects (time constraints etc.), we feel some corners were cut. For example, we opted for the memcached model of distribution to save on time as it was easier to implement. However, this wasn't the original vision of GhostDB. Myself and Connor also started new jobs and these took up a good chunk of our time. This combined with

                                          GitHub - jakekgrog/GhostDB: GhostDB is a distributed, in-memory, general purpose key-value data store that delivers microsecond performance at any scale.
                                        • Visualize Data Structures in VSCode

                                          September 17, 2020 VSCode Debug Visualizer is a VSCode extension that allows you to visualize data structures in your editor. This can be useful for visualizing watched values during debugging. I've found the extension can be helpful to visualize plots, tables, arrays, histograms and trees. Once the extension is installed, open some relevant scripts then navigate to the command palette and go to D

                                            Visualize Data Structures in VSCode
                                          • レッドブルの女性戦略家ハンナ・シュミッツとは? フェルスタッペンを支えるその仕事と人となり | Formula1-Data / F1情報・ニュース速報解説

                                            ミリ秒単位で結果が決まるF1において、その戦略的判断の一つひとつが勝敗を分ける事は全く珍しい事ではない。ハンガリーGPでの劇的勝利をお膳立てしたレッドブルのプリンシパル・ストラテジー・エンジニア、ハンナ・シュミッツ(Hannah Schmitz)とはどのような人物なのだろうか? パワーユニットにトラブルが発生した事でマックス・フェルスタッペンが10番手と後手に回った予選を経て、レッドブルは事前のシミュレーションに基づき第1スティントをハードタイヤで走る戦略を立てていたが、フォーメーションラップを前に急遽、ソフトタイヤへの変更を決断した。 結果、シャルル・ルクレール(フェラーリ)が一時はラップをリードしながらも最終6位と転落した事に象徴されるように、ハードを投入したマシンは軒並みペースを失い、フェルスタッペンはカレンダーの中で最もオーバーテイクが難しいコースとして知られるハンガロリンクで大逆

                                              レッドブルの女性戦略家ハンナ・シュミッツとは? フェルスタッペンを支えるその仕事と人となり | Formula1-Data / F1情報・ニュース速報解説
                                            • Bioinfomaticsのpublic domainのdataに対する性能改善手法の論文はほとんど研究不正?

                                              交差検証をしっかりして、n種類ためしてこの手法だけ既存手法を上回る精度になりました、すべて提案であって性能改善は検証されていないなどと正直に論文に書けばよいのでは無いかと思わなくもなく。

                                                Bioinfomaticsのpublic domainのdataに対する性能改善手法の論文はほとんど研究不正?
                                              • Netflix’s Polynote is a New Open Source Framework to Build Better Data Science Notebooks

                                                Netflix’s Polynote is a New Open Source Framework to Build Better Data Science Notebooks The new notebook environment provides substantial improvements to streamline experimentation in machine learning workflows.

                                                  Netflix’s Polynote is a New Open Source Framework to Build Better Data Science Notebooks
                                                • Developer Experience Redefined: Prisma & Cloudflare Lead the Way to Data DX

                                                  August 01, 2023 Developer Experience Redefined: Prisma & Cloudflare Lead the Way to Data DX Prisma and Cloudflare join forces to introduce Data Developer Experience (Data DX), revolutionizing data-driven applications. The partnership offers innovative tools and cloud infrastructure, reducing setup time and accelerating time-to-market for users. A new era for building data-driven applications Deliv

                                                    Developer Experience Redefined: Prisma & Cloudflare Lead the Way to Data DX
                                                  • Ask HN: What are some cool but obscure data structures you know about? | Hacker News

                                                    I'm very interested in what types of interesting data structures are out there HN. Totally your preference.I'll start: bloom filters. Lets you test if a value is definitely NOT in a list of pre-stored values (or POSSIBLY in a list - with adjustable probability that influences storage of the values.) Good use-case: routing. Say you have a list of 1 million IPs that are black listed. A trivial algor

                                                    • data-vocabulary.org schema deprecated の警告が出た!パンくずリストの構造化データを修正しましょう | mariweb

                                                      data-vocabulary.org schema deprecated って何? Google Search Console Team からいきなり警告のメールが来て驚かれた方も多いのではないでしょうか? まず data-vocabulary.org について簡単に説明すると、現在は、検索結果に表示されるパンくずリストをやレビュー・評価などの構造化データにはボキャブラリとして、 Googleも推奨しているschema.org がよく使われていますが、以前は data-vocabulary.org が使われることも多くありました。 data-vocabulary.org schema deprecated の意味は、「deprecated = 推奨されていない」なので、data-vocabulary.org というスキーマは推奨されていません。ということですね。 でも、これまでは dat

                                                        data-vocabulary.org schema deprecated の警告が出た!パンくずリストの構造化データを修正しましょう | mariweb
                                                      • Flourish | Data Visualization & Storytelling

                                                        Beautiful, easy data visualization and storytelling

                                                        • Back at my old job in ~2016, we built a cheap homegrown data warehouse via Postg... | Hacker News

                                                          Back at my old job in ~2016, we built a cheap homegrown data warehouse via Postgres, SQLite and Lambda.Basically, it worked like this: - All of our data lived in compressed SQLite DBs on S3. - Upon receiving a query, Postgres would use a custom foreign data wrapper we built. - This FDW would forward the query to a web service. - This web service would start one lambda per SQLite file. Each lambda

                                                          • [DATAで見るケータイ業界] 5Gネットワークの整備状況から見る「現在地」

                                                              [DATAで見るケータイ業界] 5Gネットワークの整備状況から見る「現在地」
                                                            • Dataplex: data governance

                                                              Centrally discover, manage, monitor, and govern data and AI artifacts across your data platform, providing access to trusted data and powering analytics and AI at scale.

                                                                Dataplex: data governance
                                                              • Microsoft Teams用 Project Oakdale に関する機能と Common Data Service の違いについて - 吉田の備忘録

                                                                データ Project Oakdale はリレーショナルデータ(親子関係などの構造化データ)に対応し、データを検索、フィルター、並び替えなどができます。また、文字列や数値などの主なデータタイプに対応しつつ、画像やファイルにも対応します。Project Oakdale は Common Data Service の恩恵を受け、通貨やロールアップ計算、計算項目も搭載します。 Project Oakdale により、新しい編集可能なグリッド(エディタブルグリッド)によって、素早くテーブル/表を作成し、データもExcelのように入力することが可能です。Common Data Model(CDM)としては、既定でユーザーテーブルが搭載されており、今後様々なテーブルが追加される予定となっております。 Common Data Service は上記の Project Oakdale に加え、ログなどの非

                                                                  Microsoft Teams用 Project Oakdale に関する機能と Common Data Service の違いについて - 吉田の備忘録
                                                                • DEV-0537 criminal actor targeting organizations for data exfiltration and destruction | Microsoft Security Blog

                                                                  April 2023 update – Microsoft Threat Intelligence has shifted to a new threat actor naming taxonomy aligned around the theme of weather. DEV-0537 is now tracked as Strawberry Tempest. To learn about how the new taxonomy represents the origin, unique traits, and impact of threat actors, and to get a complete mapping of threat actor names, read this blog: Microsoft shifts to a new threat actor namin

                                                                    DEV-0537 criminal actor targeting organizations for data exfiltration and destruction | Microsoft Security Blog
                                                                  • Retty、食領域のビックデータ連携基盤「Food Data Platform」--連携の第一弾は出光興産

                                                                    Food Data Platformは、「Retty」に蓄積され、日々更新され続けるFood領域の各種データを収集/格納/成形/統合/管理し、企業のデータベースとシームレスにデータ連携できるデータ基盤。企業が独自に保有するデータ・データ基盤とFood Data Platformを連携させることで、新たなコンテンツ体験機会の創出、ユーザーインサイトによるマーケティング精度の向上、トレンド分析、商品企画開発、位置情報を活用した出店戦略立案、消費動向調査など、企業独自データの品質向上などに利用できる。 また、データ基盤連携第一弾として、出光興産が運営する旅行プラン作成サイト「ドライブコンサルタント」と「Food Data Platform」の連携を開始した。 同社によると、出光興産が保有する全国に広がるサービスステーションを起点とした地域データと「Retty」の人気店データを掛け合わせることで、

                                                                      Retty、食領域のビックデータ連携基盤「Food Data Platform」--連携の第一弾は出光興産
                                                                    • GitHub - suhara/cis6930-fall2021: Course materials for Fall 2021 "CIS6930 Topics in Computing for Data Science" at New College of Florida

                                                                      This course covers a line of Deep Learning techniques that have been applied to a variety of computer science problems, especially in Computer Vision and Natural Language Processing. The course will start from Deep Learning fundamentals such as basic model architecture and optimization techniques before moving onto more sophisticated techniques. This course covers commonly used techniques for Comp

                                                                        GitHub - suhara/cis6930-fall2021: Course materials for Fall 2021 "CIS6930 Topics in Computing for Data Science" at New College of Florida
                                                                      • Postgres Indexes for Newbies | Crunchy Data Blog

                                                                        If you’ve read Crunchy blogs recently you probably noticed by now that we’re all big fans of indexing. Indexing is key to optimizing your database workloads and reducing query times. Postgres now supports quite a few types of indexes and knowing the basics is a key part of working with Postgres. The role of database indexes is similar to the index section at the back of a book. A database index st

                                                                          Postgres Indexes for Newbies | Crunchy Data Blog
                                                                        • GraphRAG: New tool for complex data discovery now on GitHub

                                                                          Download GraphRAG Download GraphRAG Accelerator Earlier this year, we introduced GraphRAG (opens in new tab), a graph-based approach to retrieval-augmented generation (RAG) that enables question-answering over private or previously unseen datasets. Today, we’re pleased to announce that GraphRAG is now available on GitHub (opens in new tab), offering more structured information retrieval and compre

                                                                            GraphRAG: New tool for complex data discovery now on GitHub
                                                                          • Hackers Steal Wealth of Data from Game Giant EA

                                                                            Hacking. Disinformation. Surveillance. CYBER is Motherboard's podcast and reporting on the dark underbelly of the internet. Hackers have broken into gaming giant Electronic Arts, the publisher of Battlefield, FIFA, and The Sims, and stole a wealth of game source code and related internal tools, Motherboard has learned. "You have full capability of exploiting on all EA services," the hackers claime

                                                                              Hackers Steal Wealth of Data from Game Giant EA
                                                                            • MySQL :: InnoDB Data Locking - Part 2 "Locks"

                                                                              In InnoDB Data Locking – Part 1 “Introduction” we’ve described the difficulties Lock System tries to solve using metaphor of people trying to concurrently edit spreadsheets. While it might be useful metaphor to get some intuitions about the problem, to talk about solutions it helps to know at least a little about the “reality” this metaphor maps to. In this post I’ll talk about how statements we’v

                                                                              • 大規模言語モデル(LLM)のエンジン:データセットの解説 - Platinum Data Blog by BrainPad

                                                                                本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。 この記事では、大規模言語モデルのデータセットのソース、収集方法、その信頼性と倫理性、そしてデータのクリーニングと前処理についての詳細を解説します。 近年に公開された大規模言語モデルの年表 *1 こんにちは、アナリティクスサービス部の金です。 今回の話題は、ビジネスや研究における大規模言語モデル(Large Language Models、略してLLM)の根幹を成すデータセットです。データセットの内容と構成は、大規模言語モデルの振る舞いに大きく影響を与えます。 この記事

                                                                                  大規模言語モデル(LLM)のエンジン:データセットの解説 - Platinum Data Blog by BrainPad
                                                                                • Cloud Native Data Center Networking超入門

                                                                                  社内カンファレンスで発表しました

                                                                                    Cloud Native Data Center Networking超入門