並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 14 件 / 14件

新着順 人気順

Datasetの検索結果1 - 14 件 / 14件

  • postgres.new: In-browser Postgres with an AI interface

    Introducing postgres.new, the in-browser Postgres sandbox with AI assistance. With postgres.new, you can instantly spin up an unlimited number of Postgres databases that run directly in your browser (and soon, deploy them to S3). Each database is paired with a large language model (LLM) which opens the door to some interesting use cases: Drag-and-drop CSV import (generate table on the fly) Generat

      postgres.new: In-browser Postgres with an AI interface
    • Data Contractに向けたProtocol Buffersの調査 - yasuhisa's blog

      背景: データ品質を担保するにはデータソースの品質が重要 データソースの品質を担保する手段としてのData Contract Data Contractの表現方法の一つとしてのProtocol Buffers Data ContractとしてProtocol Buffersを使う データの入出力を一箇所に集約、Protocol Buffersで抑えるパターン ストレージのスキーマをProtocol Buffersで抑えるパターン 発展的な話題 & 読書会の案内 参考文献 背景: データ品質を担保するにはデータソースの品質が重要 私はデータエンジニアをしており、DWHやデータマートのデータ品質について考えることが多い。BigQueryなどにデータが取り込まれた後のレイヤリングやテスト、改善に向けたデータ品質の可視化について、以前発表した。 データが取り込まれた後の整理は進んでいるものの、やは

        Data Contractに向けたProtocol Buffersの調査 - yasuhisa's blog
      • Googleが人間レベルで競技ができるAI卓球ロボットを開発、上級者との対戦には課題も

        GoogleのAI研究部門であるGoogle DeepMindが、「アマチュアの人間レベル」で戦える卓球ロボットを開発しました。 [2408.03906] Achieving Human Level Competitive Robot Table Tennis https://arxiv.org/abs/2408.03906 Meet our AI-powered robot that’s ready to play table tennis. ???????? It’s the first agent to achieve amateur human level performance in this sport. Here’s how it works. ???? pic.twitter.com/AxwbRQwYiB— Google DeepMind (@GoogleDeepMind)

          Googleが人間レベルで競技ができるAI卓球ロボットを開発、上級者との対戦には課題も
        • LoRAを作ってみよう!~実践編・基本~ |とーふのかけら

          はじめに体調不良もあり、長らく更新しておらず申し訳ございませんでした。 前回は、LoRAについて基礎的なところを記事にしました。 今回は、その実践編になります。 本記事のお品書きとしては、前準備~基本的なLoRA学習までを取り扱おうと思います。 Contents 前準備(1)~コンセプトを決めよう~ 前準備(2)~教師画像を集めよう~ 前準備(3)~フォルダとファイルの下準備をしよう~ 前準備(4)~学習に必要な各種ツールを導入しよう~ 前準備(5)~キャプション付けを行おう~ 前準備(6)~学習パラメータを決定しよう~ 実践(1)~学習開始~ 実践(2)~実際に生成してみる~ 前準備 (1) ~コンセプトを決めよう~LoRAを作るぞー!!ってなっても、コンセプトが決まらなければ、データセットも用意することができません。 LoRAで出来ることは、基本的に「既知の情報に関連した新しい概念を追

            LoRAを作ってみよう!~実践編・基本~ |とーふのかけら
          • 350M Tokens Don't Lie: Love And Hate In Hacker News | Outerbounds

            Geeks, nerds, and hackers should find themselves right at home! Interestingly, while the community tends to be visionary and forward-looking (with technical matters at least), it definitely has a soft spot for (technical) nostalgia. While the modern world is amazing, we miss ZX Spectrum, Z80 assembly, and 8086 dearly. At least we find some comfort in PICO-8. On the anger-inducing side, most topics

              350M Tokens Don't Lie: Love And Hate In Hacker News | Outerbounds
            • MIRU2024参加レポート - ZOZO TECH BLOG

              こんにちは。ZOZO Researchの研究員の古澤・川島・平川、ZOZOのデータサイエンティストの荒木・小林です。2024年8月6日(火)から8月9日(金)にかけて熊本で開催された画像の認識・理解シンポジウムMIRU2024に参加しました。この記事では、MIRU2024でのZOZO Research・ZOZOのメンバーの取り組みやMIRU2024の様子について報告します。 目次 目次 MIRU2024 企業展示 全体の動向 招待講演・インタラクティブセッション [IS2-35] The Niau Dataset: A Comprehensive Resource for Fashion Image Recognition [IS2-126] 大規模視覚言語モデルを用いた「似合う」の自動評価法 [IS-2-097] Moon & SpencerのAesthetic Measureを用いたフ

                MIRU2024参加レポート - ZOZO TECH BLOG
              • 【Stable Diffusion】「LoRA」自作をとりあえずできるようになる【Kohya’s GUI】|カズヤ弟@ゲーム実況&生成AI

                ■記事の対象ユーザ 1.Stable Diffusion WebUIをローカルに構築して、イラスト生成しはじめた 2.LoRAが何かは知ってたり使ってたりするが、LoRAの作り方は知らない この記事を書くまでの■ようするに? ・学習用画像をあつめて加工する ・学習させるためのパラメータを設定をする ・学習させる → LoRAが出来る 適用するとそれっぽくなる 学習に使うツールの準備好きなやり方で先人の残した石碑によると幾つか方法があるらしい 俺は「Kohya’s GUI」とやらを使うぞJ〇J〇ォォォ! git clone https://github.com/bmaltais/kohya_ss黒い画面でセットアップ### kohya_ssをcloneして出来たフォルダの中でプロンプトを立ち上げて .\setup.bat実行すると何かメニューが出てくる 聞かれたら1と答えるんだよ Kohya

                  【Stable Diffusion】「LoRA」自作をとりあえずできるようになる【Kohya’s GUI】|カズヤ弟@ゲーム実況&生成AI
                • 【GA4 SQL】ページ単位のエンゲージメント分析 – Visual SEM Report

                  GA4において「エンゲージメント」という概念が取り入れられた。この「エンゲージメント」は一般的な用語としても使われ、GA4の指標の中にも「エンゲージメント」といった用語が付くものが多く、それぞれの「エンゲージメント」の付く指標の違いを理解しておく必要がある。また、この理解がないとコンテンツ単位のエンゲージメント分析をする際に間違った解釈をしてしまうこともあるため、先に「エンゲージメント」とは?の解説から入る必要がある。ここでいう「ページ」とは「コンテンツ」のことを指し、両者を同じ意味として扱う。 「エンゲージメント」の整理 GA4における「エンゲージメント」とは、時間のエンゲージメントと、肯定的なアクションについてのエンゲージメントに分けると理解しやすくなる。前者は「ユーザーエンゲージメント」と呼ばれる指標で、探索における説明では「サイトまたはアプリがユーザーのデバイスのフォアグラウンドで

                  • Next.js14 + ReactでSSR/SSG対応のメイソンリーレイアウトを実装する

                    こんにちは。音楽ディレクターの村上といいます。 なつかしの「メイソンリーレイアウト」 一時期(たぶんjQuery時代)、「メイソンリーレイアウト」って流行りましたよね。 Pintarestのように複数カラムを隙間なく上から埋めていくレイアウトのことです。 利点はスペースの節約になることで、画像ギャラリーなどでよく使われると思います。 ただしこのレイアウトはCSSGridだけでは不可能で、クライアントサイドで一度高さを算出しないといけないので、SSRやSSGと相性が悪いです。また、モバイルファーストだと関係ないのと、 パフォーマンスの問題もあり、今は割と敬遠されている気がします。 (ただし、CSSの機能にMasonry Layoutを実装しようという動きもあるようです。これが取り込まれれば、Javascript不要になります) 令和でも使いたい! 今回、佐々木恵梨という担当アーティストの公式

                      Next.js14 + ReactでSSR/SSG対応のメイソンリーレイアウトを実装する
                    • データカタログ | 富山県オープンデータポータルサイト

                      詳細検索 ライセンス: クリエイティブ・コモンズ 表示 タグ: 学校 組織: 富山県 富山県の私立小学校一覧 作成日 2019年11月29日 19:59:08 最終更新日 2023年05月11日 01:21:14 アクセス数 -- XLSX 富山県の私立中学校一覧 作成日 2019年11月29日 19:59:10 最終更新日 2023年05月11日 01:20:27 アクセス数 -- XLSX 富山県の私立高等学校一覧 作成日 2019年11月01日 09:34:02 最終更新日 2023年05月11日 01:19:09 アクセス数 -- XLSX 富山県の私立専修・各種学校一覧 作成日 2019年11月01日 09:34:03 最終更新日 2023年05月11日 01:18:09 アクセス数 -- XLSX 富山県の私立幼稚園一覧 作成日 2019年11月01日 09:34:00 最終更

                      • AIによる科学研究の自動化:「AI Scientist」が切り開く新時代|IT navi

                        論文執筆に関するコードは、主にai_scientistフォルダ内のperform_writeup.pyに書かれているのだろうと当たりを付けて、Claudeに解説してもらいました。 以下のコードの内容を日本語で詳しく解説して コード:(※perform_writeup.pyのコードをすべてコピペ) Claudeの回答は以下の通りです。 このコードは、科学論文の作成を支援するためのPythonスクリプトです。主な機能と構成要素について説明します: 1. LaTeX生成機能: - `generate_latex()` 関数: LaTeXファイルを生成し、PDFに変換します。 - 参考文献、図、セクションヘッダーの重複チェックや、LaTeXの文法エラーを修正します。 - `compile_latex()` 関数: LaTeXファイルをコンパイルしてPDFを作成します。 2. 引用支援機能: - `

                          AIによる科学研究の自動化:「AI Scientist」が切り開く新時代|IT navi
                        • Performance Best Practice for Efficient Queries - Top 10 Practices

                          Consider the following two queries: Original query string: short_descriptionLIKEemail Improved query string: short_descriptionLIKEemail^active=true By adding the active=1 condition, you can immediately reduce the intermediate result set from 3 million down to a few thousand! Keep the number of active tasks low, include the "active" column in your indexes and always add "active=true" to your filter

                          • SakanaAIのAIサイエンティストで独自の実験テンプレートを作ってみる(実験中)|shi3z

                            SakanaAIが昨日発表したAIサイエンティストでは、「こういう研究をしてみなせい」とAI科学者に指示できる。とりあえずサンプルは動かせるようになったので、自分で独自の実験テンプレートを作ってAI科学者に暇さえあれば研究させたい。 まず、テンプレートは「templates」というディレクトリにある。 とりあえず一番簡単なMNISTをやりたかったので、MNISTでテンプレートを作ってみる。 nanoGPTのテンプレートをコピーして、それぞれのファイルを変更する。 重要なファイルは以下 expereiment.py 実験の本体 --out_dirを受け取り、学習した結果を--out_dirに出力する plot.py 実験結果のグラフなどを出力する seed_ideas.json 元になるアイデアを指定する prompt.json 実験に関するプロンプトを指定する まずはexperiment.

                              SakanaAIのAIサイエンティストで独自の実験テンプレートを作ってみる(実験中)|shi3z
                            • BigQuery データ キャンバスのご紹介: AI 中心のエクスペリエンスでデータ分析を刷新 | Google Cloud 公式ブログ

                              Gemini 1.5 モデル をお試しください。Vertex AI からアクセスできる、Google のもっとも先進的なマルチモーダル モデルです。 試す ※この投稿は米国時間 2024 年 4 月 11 日に、Google Cloud blog に投稿されたものの抄訳です。 データから分析情報を導出するのは、複雑なプロセスであり、大変な労力を要することがあります。データの専門家は、データソースの取捨選択に貴重な時間を費やし、新しい質問が発生するたびに一からやり直しています。複数のツールを駆使し、コーディング言語を次々と切り替え、組織内のさまざまなチームと連携もしています。こうした断片的なアプローチにはボトルネックが多く、アナリストが分析情報を生成し、影響の大きい業務を素早く行うことの妨げとなっています。 Google は昨日の Google Cloud Next ‘24 で、データ専門家

                                BigQuery データ キャンバスのご紹介: AI 中心のエクスペリエンスでデータ分析を刷新 | Google Cloud 公式ブログ
                              1