並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 1716件

新着順 人気順

dataの検索結果41 - 80 件 / 1716件

  • 12.6. B-Trees — CS3 Data Structures & Algorithms

    12.6.1. B-Trees¶ This module presents the B-tree. B-trees are usually attributed to R. Bayer and E. McCreight who described the B-tree in a 1972 paper. By 1979, B-trees had replaced virtually all large-file access methods other than hashing. B-trees, or some variant of B-trees, are the standard file organization for applications requiring insertion, deletion, and key range searches. They are used

    • GitHub - posit-dev/positron: Positron, a next-generation data science IDE

      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

        GitHub - posit-dev/positron: Positron, a next-generation data science IDE
      • 現地参加して良かった!Snowflake Data Cloud Summit 2024! - LayerX エンジニアブログ

        こんにちは。バクラク事業部 機械学習・データ部 データグループの@civitaspoです。2024年6月3日から6日にかけてサンフランシスコで開催されたSnowflake Data Cloud Summit 2024に現地参加してきました。本記事では、その様子や感想をレポートしようと思います。 Snowflake Data Cloud Summit 2024 とは? Snowflake Data Cloud Summit 2024(以下、Summit)は2024年6月3日から6日にかけてサンフランシスコのモスコーニ・センターで開催された、Snowflake社が年次で主催する最大のユーザーカンファレンスです。Snowflakeの最新技術やデータクラウドの未来を語る基調講演に始まり、450を超えるセッションやハンズオンが行われました。参加者は全体で約1万5000人にのぼり、日本からは250人が

          現地参加して良かった!Snowflake Data Cloud Summit 2024! - LayerX エンジニアブログ
        • GitHub - bluesky-social/pds: Bluesky PDS (Personal Data Server) container image, compose file, and documentation

          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

            GitHub - bluesky-social/pds: Bluesky PDS (Personal Data Server) container image, compose file, and documentation
          • [DATAで見るケータイ業界] NTTドコモの“真水”の回線数は約2年ぶりに純減、MVNOへの回線提供にもブレーキ

              [DATAで見るケータイ業界] NTTドコモの“真水”の回線数は約2年ぶりに純減、MVNOへの回線提供にもブレーキ
            • Azure OpenAI Service 「on your data」 構成でのセキュリティ性を向上させる - Taste of Tech Topics

              こんにちは、igaです。 先日、久しぶりにライブで声を出したらのどが枯れてしまいました。 前回に引き続き、Azure OpenAIのセキュリティを向上させるため、ネットワークのアクセス制限について確認します。 今回は、以前検証した独自データを使用する場合のネットワークのアクセス制限について確認します。 acro-engineer.hatenablog.com Azure OpenAIの構成 前回の構成で、Azure OpenAIに対してインターネットからのアクセス制限を行いました。 独自データ(原文の表記はon your data)を使用する場合、構築した直後はデータを保持するCognitive Searchがインターネット上のどこからでもREST APIによるリクエストが受信可能な状態になっています。 Cognitive Searchを利用するためには、通常、APIキーが必要になります。

                Azure OpenAI Service 「on your data」 構成でのセキュリティ性を向上させる - Taste of Tech Topics
              • jQuery Attack Hits NPM and GitHub; Can Extract Web Form Data

                jQuery Attack Hits NPM and GitHub; Can Extract Web Form Data The trojanized jQuery attack has been spread on npm, GitHub and elsewhere since May. A trojanized version of jQuery has been spreading on the npm JavaScript package manager, GitHub and elsewhere, for use in a jQuery attack, security researchers have discovered. Phylum researchers said they have been monitoring the “persistent supply chai

                  jQuery Attack Hits NPM and GitHub; Can Extract Web Form Data
                • A Cheat Sheet and Some Recipes For Building Advanced RAG — LlamaIndex, Data Framework for LLM Applications

                  It’s the start of a new year and perhaps you’re looking to break into the RAG scene by building your very first RAG system. Or, maybe you’ve built Basic RAG systems and are now looking to enhance them to something more advanced in order to better handle your user’s queries and data structures. In either case, knowing where or how to begin may be a challenge in and of itself! If that’s true, then h

                    A Cheat Sheet and Some Recipes For Building Advanced RAG — LlamaIndex, Data Framework for LLM Applications
                  • Anyone can Access Deleted and Private Repository Data on GitHub ◆ Truffle Security Co.

                    You can access data from deleted forks, deleted repositories and even private repositories on GitHub. And it is available forever. This is known by GitHub, and intentionally designed that way. This is such an enormous attack vector for all organizations that use GitHub that we’re introducing a new term: Cross Fork Object Reference (CFOR). A CFOR vulnerability occurs when one repository fork can ac

                      Anyone can Access Deleted and Private Repository Data on GitHub ◆ Truffle Security Co.
                    • Data Developer Platform

                      Home Data Developer Platform¶ A Data Platform Specification, open for adoption by any data platform developer. A modern way to run data engineering teams¶ Data teams are drained from continuously plumbing integrations and fragile pipelines, which leaves little to no time to focus on the real deal - data and data applications. Businesses that have a good grasp on data realise that today data makes

                      • GitHub - scratchdata/scratchdata: Scratch is a swiss army knife for big data.

                        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                          GitHub - scratchdata/scratchdata: Scratch is a swiss army knife for big data.
                        • Bioinfomaticsのpublic domainのdataに対する性能改善手法の論文はほとんど研究不正?

                          交差検証をしっかりして、n種類ためしてこの手法だけ既存手法を上回る精度になりました、すべて提案であって性能改善は検証されていないなどと正直に論文に書けばよいのでは無いかと思わなくもなく。

                            Bioinfomaticsのpublic domainのdataに対する性能改善手法の論文はほとんど研究不正?
                          • Developer Experience Redefined: Prisma & Cloudflare Lead the Way to Data DX

                            August 01, 2023 Developer Experience Redefined: Prisma & Cloudflare Lead the Way to Data DX Prisma and Cloudflare join forces to introduce Data Developer Experience (Data DX), revolutionizing data-driven applications. The partnership offers innovative tools and cloud infrastructure, reducing setup time and accelerating time-to-market for users. A new era for building data-driven applications Deliv

                              Developer Experience Redefined: Prisma & Cloudflare Lead the Way to Data DX
                            • [DATAで見るケータイ業界] 5Gネットワークの整備状況から見る「現在地」

                                [DATAで見るケータイ業界] 5Gネットワークの整備状況から見る「現在地」
                              • GraphRAG: New tool for complex data discovery now on GitHub

                                Download GraphRAG Download GraphRAG Accelerator Earlier this year, we introduced GraphRAG (opens in new tab), a graph-based approach to retrieval-augmented generation (RAG) that enables question-answering over private or previously unseen datasets. Today, we’re pleased to announce that GraphRAG is now available on GitHub (opens in new tab), offering more structured information retrieval and compre

                                  GraphRAG: New tool for complex data discovery now on GitHub
                                • Country Centered Map Projections - Engaging Data

                                  What does it look like if you center a map on a specific country? Click on a country to find out. World maps are used to show the geographic relationships between the countries and regions of the world. Their design shapes our perception of the world and those relationships. Two of the important aspects of map design are the choice of map projection and what is centered in the map. The idea for th

                                    Country Centered Map Projections - Engaging Data
                                  • OpenAI、トレーニング用の安全で広範なデータセット構築目指す「Data Partnerships」立ち上げ

                                    米OpenAIは11月9日(現地時間)、AIモデルをトレーニングするためのパブリックおよびプライベートのデータセットを構築するためにサードパーティと協力するパートナーシップ「OpenAI Data Partnerships」の立ち上げを発表した。 同社は公式ブログで、このパートナーシップの目的は「より多くの組織がAIの将来の舵取りを支援できるようにし」「より有用なモデルから恩恵を受けられるようにすること」と語った。 「最終的に全人類にとって安全で有益なAGIを実現するには、AIモデルがすべてのテーマ、業界、文化、言語を深く理解」する必要があり、そのために可能な限り広範なトレーニングデータセットが必要だとしている。 データには、画像、音声、動画などを含める予定で、多様な言語、トピック、形式での長文のテキストや会話など、「人間の意図を表現する」データも含める計画。 パートナーシップ参加組織と協

                                      OpenAI、トレーニング用の安全で広範なデータセット構築目指す「Data Partnerships」立ち上げ
                                    • FOSDEM 2024 - Fast JavaScript with Data-Oriented Design

                                      FOSDEM 2024/Schedule/Events/Developer rooms/Web Performance/Fast JavaScript with Data-Oriented Design Let’s squeeze the last bits of performance out of JS so that we can crunch massive amounts of data! In this presentation I will describe what I learned while optimizing the Firefox Profiler. The Firefox Profiler is a web application which needs to handle large profiles containing hundreds of thous

                                        FOSDEM 2024 - Fast JavaScript with Data-Oriented Design
                                      • Amazon Connectのフローでの離脱箇所と放棄呼をKinesis Data Streamsを用いて取得し、DynamoDBに保存してみた | DevelopersIO

                                        Amazon Connectのフローでの離脱箇所と放棄呼をKinesis Data Streamsを用いて取得し、DynamoDBに保存してみた はじめに Amazon Connectのフローで離脱箇所や放棄呼をAmazon Kinesis Data Streams(以降、KDS)を用いて取得し、DynamoDBに保存する方法をまとめました。 利用用途は以下が挙げられます。 IVRでの途中離脱箇所を知りたい オペレーターにつながる前に切られる放棄呼の有無を知りたい Connectは、各通話ごとに問い合わせレコード(CTR)として通話記録を保存します。 Connectでは、KDSに問い合わせレコードを出力することができます。通常は問い合わせレコードは、どのフローで切断されたか情報はありませんが、フロー内で工夫すると取得ができます。工夫内容は後述します。 以下の構成図をもとに処理の流れを説明し

                                          Amazon Connectのフローでの離脱箇所と放棄呼をKinesis Data Streamsを用いて取得し、DynamoDBに保存してみた | DevelopersIO
                                        • PythonのData Appsフレームワーク Streamlit, Dash, Panel を比較(With ChatGPT) - Qiita

                                          PythonのData Appsフレームワーク Streamlit, Dash, Panel を比較(With ChatGPT)PythonDashPanelStreamlitChatGPT 皆さん、こんにちは!Python Advent Calender2023の6日目担当の小川英幸(X: ogawahideyuki)です。 データから洞察を得る過程で、その発見を他の人と共有し、さらなるインサイトを得ることは非常に価値があります。そのような役割を検討した際に、既存のツールでは物足りない一方、「アプリを一から作るのは大変だな…」と感じたことはありませんか? ここで登場するのがData Appsです。Pythonだけで手軽にデータアプリを作成できるこれらのツールは、データ分析者にとって強力な味方。特にStreamlit、Dash、Panelを、簡単に使えるフレームワークとして、私は注目し、活

                                            PythonのData Appsフレームワーク Streamlit, Dash, Panel を比較(With ChatGPT) - Qiita
                                          • Ruby 3.2 introduces Data, a new core class for immutable value objects

                                            BlogRuby 3.2 introduces Data, a new core class for immutable value objects Ruby 3.2 introduces Data, a new core class for immutable value objects. Value objects are a powerful tool for improving the quality of code. They are easy to understand and use and can help improve the readability and maintainability of code by making it more concise, consistent, and easier to reason about. Value objects ar

                                              Ruby 3.2 introduces Data, a new core class for immutable value objects
                                            • On Your Data を超えていく!

                                              Copilot for Microsoft 365 ぶっちゃけどうなの?_生成AI新年会@GMO Yours・フクラス

                                                On Your Data を超えていく!
                                              • React Router v6のルーティング方法を解説 - createBrowserRouterとData APIsの活用法 | DevelopersIO

                                                こんにちは、戸田です。 今回は React Router v6.4 以降を使用する際にどのルーティング方法を使えばいいのか自分の言葉でブログにまとめました。 まず結論 シンプルなルーティングのBrowserRouterかcreateBrowserRouterで迷ったら基本的にcreateBrowserRouterを使いましょう! 以下がサンプルコードです。 import React from 'react'; import { Outlet, RouterProvider, createBrowserRouter } from 'react-router-dom'; const Parent = () => { return ( <div> <h1>Parent</h1> <Outlet /> </div> ) } const App = () => { const router = cr

                                                  React Router v6のルーティング方法を解説 - createBrowserRouterとData APIsの活用法 | DevelopersIO
                                                • [DATAで見るケータイ業界] MVNOは停滞期を抜け市場シェア15%が目前に

                                                    [DATAで見るケータイ業界] MVNOは停滞期を抜け市場シェア15%が目前に
                                                  • Data Fetching Patterns in Single-Page Applications

                                                    When a single-page application needs to fetch data from a remote source, it needs to do so while remaining responsive and providing feedback to the user during an often slow query. Five patterns help with this. Asynchronous State Handler wraps these queries with meta-queries for the state of the query. Parallel Data Fetching minimizes wait time. Fallback Markup specifies fallback displays in marku

                                                      Data Fetching Patterns in Single-Page Applications
                                                    • GitHub - kylebarron/parquet-wasm: Rust-based WebAssembly bindings to read and write Apache Parquet data

                                                      You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                        GitHub - kylebarron/parquet-wasm: Rust-based WebAssembly bindings to read and write Apache Parquet data
                                                      • Amazon ConnectとKinesis Data Streamsを使用し、エージェントの介在がないIVRの場合でも電話中のユーザーの発話を録音する方法 | DevelopersIO

                                                        Amazon ConnectとKinesis Data Streamsを使用し、エージェントの介在がないIVRの場合でも電話中のユーザーの発話を録音する方法 はじめに この記事では、Amazon ConnectとKinesis Data Streams(以下、KDS)を用いて、エージェントが介在しなくても、ユーザーの発話を録音する方法を紹介します。 Connectでは、下記のコンタクフローのブロックで録音できますが、録音条件は、顧客とエージェントが繋がってからのみ録音されます。 例えば「留守番電話」やAmazon Lexと組み合わせた「AIチャットボット」のように、エージェントが介在しない場合、通常の録音機能は利用できません。 解決策として、コンタクフロー内で「メディアストリーミングの開始」というブロックを利用し、Kinesis Video Streams(以降、KVS)にメディアデータを

                                                          Amazon ConnectとKinesis Data Streamsを使用し、エージェントの介在がないIVRの場合でも電話中のユーザーの発話を録音する方法 | DevelopersIO
                                                        • GitHub - SixArm/usv: Unicode Separated Values (USV) data markup for units, records, groups, files, streaming, and more.

                                                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                            GitHub - SixArm/usv: Unicode Separated Values (USV) data markup for units, records, groups, files, streaming, and more.
                                                          • GitHub - Hirrolot/datatype99: Algebraic data types for C99

                                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                              GitHub - Hirrolot/datatype99: Algebraic data types for C99
                                                            • GitHub - openbao/openbao: OpenBao exists to provide a software solution to manage, store, and distribute sensitive data including secrets, certificates, and keys.

                                                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                GitHub - openbao/openbao: OpenBao exists to provide a software solution to manage, store, and distribute sensitive data including secrets, certificates, and keys.
                                                              • ITスキルロードマップ roadmap.sh がすごい。Data Analyst について対応する本をまとめた - Qiita

                                                                ITスキルロードマップ roadmap.sh がすごい。Data Analyst について対応する本をまとめた機械学習データ分析キャリアデータアナリティクスデータアナリスト Developer Roadmapsというサイトがすごいです。ITエンジニアの分野別にスキルアップのロードマップが示されています。 言語、基盤、アプリ、かなり網羅されています。 ということで、AI and Data Scientist Roadmap について書きましたが 今回は Data Analyst Roadmap です。 雑感 このロードマップの続きにAI and Data Scientistがあり、Data AnalystをData Scientistの前段階的に位置付けているのが疑問。Data AnalystとData Scientistは並ぶものではないでしょうか。 そして、ビジネス、ドメイン知識や分析目

                                                                  ITスキルロードマップ roadmap.sh がすごい。Data Analyst について対応する本をまとめた - Qiita
                                                                • [DATAで見るケータイ業界] 2022年度は基地局工事の65%が全国系大手エンジニアリング会社3社に

                                                                    [DATAで見るケータイ業界] 2022年度は基地局工事の65%が全国系大手エンジニアリング会社3社に
                                                                  • mrcjkb.dev - Algebraic data types in Lua (Almost)

                                                                    Posted on August 17, 2023 Lua, in the realm of Neovim, is a curious companion. For personal configuration tweaks, it’s incredibly responsive, giving me immediate feedback. Moreover, when I’m uncertain about an idea’s potential, Lua offers a forgiving platform for prototyping without commitment. Yet, as the maintainer of a few plugins, who otherwise works with Haskell professionally, I have mixed f

                                                                    • AWS、自然言語による指示で面倒だったETLスクリプトを自動生成してくれる「Amazon Q data integration in AWS Glue」プレビュー公開

                                                                      AWS、自然言語による指示で面倒だったETLスクリプトを自動生成してくれる「Amazon Q data integration in AWS Glue」プレビュー公開 AWSは、ファイルやデータベースなどのデータソースからデータウェアハウスへデータを集積する際のデータ変換や転送処理などのスクリプトを、自然言語による説明から自動的に生成してくれる新サービス「Amazon Q data integration in AWS Glue」のプレビュー公開を発表しました。 Amazon Qは、昨年(2023年)11月に開催されたイベント「AWS re:Invent 2023」で発表された生成AIサービスです。このAmazon QをETLサービスであるAWS Glueと統合することも、AWS re:Invent 2023で予告されていました。 参考:[速報]AWS、Copilot対抗となる「Amazo

                                                                        AWS、自然言語による指示で面倒だったETLスクリプトを自動生成してくれる「Amazon Q data integration in AWS Glue」プレビュー公開
                                                                      • NVIDIA Releases Open Synthetic Data Generation Pipeline for Training Large Language Models

                                                                        NVIDIA today announced Nemotron-4 340B, a family of open models that developers can use to generate synthetic data for training large language models (LLMs) for commercial applications across healthcare, finance, manufacturing, retail and every other industry. High-quality training data plays a critical role in the performance, accuracy and quality of responses from a custom LLM — but robust datas

                                                                          NVIDIA Releases Open Synthetic Data Generation Pipeline for Training Large Language Models
                                                                        • MySQLのREPEATABLE READとREAD COMMITTEDのロック状況をdata_locksから観察する - $shibayu36->blog;

                                                                          前回MySQLのREPEATABLE READとREAD COMMITTEDの違いを知るために色々試した - $shibayu36->blog;という記事を書いたところ、yoku0825さんにMySQL 8.0以降だとperformance_schema.data_locksが使えると教えてもらったので試した。 ちなみに、後ろからロックがぶつかるクエリを実行しなくても、MySQL 8.0だとSELECT * FROM performance_schema.data_locksでロックの範囲を確かめることができます。 ギャップつきロックがInnoDBのスタンダードで、X lockがレコードとギャップのロック、X not gapが単なるレコードロックになります— yoku0825 (@yoku0825) February 27, 2024 テーブル定義 CREATE TABLE `posts`

                                                                            MySQLのREPEATABLE READとREAD COMMITTEDのロック状況をdata_locksから観察する - $shibayu36->blog;
                                                                          • AWS WAFのログから特定Cookieの機密情報をKinesis Data Firehose + Lambda関数でマスクしてS3に保存するIaCをCDKで実装する - Qiita

                                                                            AWS WAFのログから特定Cookieの機密情報をKinesis Data Firehose + Lambda関数でマスクしてS3に保存するIaCをCDKで実装するAWSwafaws-cdk AWS CDK Advent Calendar 2023の記事です。終わっても空いてた枠にシュルっと入りました。 NewsPicksのSREチームでセキュリティ周りも担当しているあんどぅといいます。 AWS WAFを利用する中で少しニッチな、しかし重要なロギングについてCDKで実装した例をご紹介します。 ボリュームが多いので、同じような構成でCDKを利用して実装する方の参考になれば幸いです。 WAFのログは重要。プライバシー保護も重要 同じアドカレ内でも書かれていますが、WAFを運用していると誤遮断がつきものなので、WAFのログは非常に重要です。 WAFのルールを適用する際は、COUNTモードで適用

                                                                              AWS WAFのログから特定Cookieの機密情報をKinesis Data Firehose + Lambda関数でマスクしてS3に保存するIaCをCDKで実装する - Qiita
                                                                            • [DATAで見るケータイ業界] キャリアショップ数は半年前から220店減少し全国7574店舗に

                                                                                [DATAで見るケータイ業界] キャリアショップ数は半年前から220店減少し全国7574店舗に
                                                                              • 【選考直結型】RECRUIT INTERNSHIP for Data Specialists 2024 | EVENT | Engineering at Recruit

                                                                                ※上記事例は全て社内セキュリティレベルと同様の環境下にて運用を行い、ご参加いただく学生の皆さんと機密保持に関する誓約を締結し、契約期間のみデータに触れることができる形で情報管理をしております。 過去の参加者の声 ・リクルートのデータスペシャリストとして1ヶ月半インターンシップに参加しました! ・【リクルートインターン参加記】BigQueryの全社的なスロット利用状況を可視化するツールの制作 ・VertexAIを利用した機械学習モデルにおける評価・分析パイプラインの構築 こんな方にオススメ ・国内最大級の膨大なデータを扱い、プロダクトを改善するための施策立案〜推進、新たな機能の拡充・開発、中長期を見据えた事業戦略の提案など、データを使用した専門スキルをベースに新たな価値の創造に貢献したい方。 必須スキル・経験 ※下記のスキルのうちどれか一つ有している方を対象としています。 ・数理統計学/解析

                                                                                  【選考直結型】RECRUIT INTERNSHIP for Data Specialists 2024 | EVENT | Engineering at Recruit
                                                                                • GitHub - amaiya/onprem: A tool for running on-premises large language models with non-public data

                                                                                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                                    GitHub - amaiya/onprem: A tool for running on-premises large language models with non-public data