並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 510件

新着順 人気順

Databricksの検索結果1 - 40 件 / 510件

  • LLM時代のX情報収集術|べいえりあ

    AI for Everyoneについては日本語版もあるのと、どちらのコースも日本語字幕付きで見られる(多分機械翻訳での英語字幕からの翻訳だが、翻訳の質は悪くない)ので、英語分からなくてある程度何とかなるんじゃないかと思います。 あと、余力のある人、最新のNLP研究を理解したい人はこちらの本を読むことをオススメします。アルゴリズムの詳細は必ずしも理解しなくても良いですが、どんなタスクがあるのかは理解しておいた方が良いかと思います。 NLPの知識がLLMを応用する上で実際にどう役に立つかですが、例えばで言うとNLP的には対話の中には「タスク指向型対話(task-oriented dialogue)」と「雑談(chit-chat dialogue)」があります。それぞれ対話の中で重要視されるものから評価の仕方まで全然違うのですが、NLPをやらずにLLMをやっている人と話しているとこれらをごっちゃ

      LLM時代のX情報収集術|べいえりあ
    • 39社のデータ基盤アーキテクチャ特集 - ツールの技術選定のポイントと活用術 - Findy Tools

      8つのデータ系ツール「BigQuery」「Databricks」「dbt」「Fivetran」「Lightdash」「Looker」「Snowflake」「TROCCOⓇ」に39社からご寄稿頂いたレビューから、各社のデータ基盤アーキテクチャをまとめた記事です。各社の技術選定の背景や工夫などの知見を得ていただく場となれば幸いです。 ※ツール名・ご寄稿企業名共にアルファベット順で掲載しております BigQueryBigQuery は、Google Cloud の費用対効果に優れたフルマネージド型の分析データ ウェアハウスです。ペタバイト規模に対応しており、膨大な量のデータに対してほぼリアルタイムで分析を行うことができます。 ▼BigQueryとは?機能や特徴・製品の概要まとめページはこちら https://findy-tools.io/products/bigquery/49 ▼Findy T

        39社のデータ基盤アーキテクチャ特集 - ツールの技術選定のポイントと活用術 - Findy Tools
      • データアーキテクチャ特集 データ利活用を推進する8社の技術選定 - Findy Tools

        毎回ご好評頂いているアーキテクチャ特集の今回のテーマは、データ分析基盤です。 データ活用に特に力を入れている日本のIT企業8社にご協力頂き、それぞれの技術選定の裏側と今後の展望についてご寄稿頂きました。 ※ご紹介は企業名のアルファベット順となっております 株式会社朝日新聞社 アーキテクチャ選択の背景や意図 これまでは、朝日新聞デジタル(朝デジ)のサービス開発・運用において、データを収集する基盤が存在せず業務ごとに Adobe Analytics や AWS QuickSight、 内製のツールなど様々なBIツールが乱立している状態でした。そこで、複数のシステムのデータソースを統合的に可視化・分析を可能にするために、分析基盤の構築に着手しました。 まず、データを集積・加工するETLとしては以下の点で TROCCO を選択しました。 1. データエンジニアが不足しているため、データアナリストで

          データアーキテクチャ特集 データ利活用を推進する8社の技術選定 - Findy Tools
        • モダンな開発環境のBtoB SaaSアーキテクチャ特集 技術選定のポイントと今後の展望 - Findy Tools

          ご好評頂いているアーキテクチャ特集の第三弾となる今回は、BtoB SaaSを提供する企業10社にご協力頂き、技術選定のこだわりや今後の展望をご寄稿いただきました。アーキテクチャを通して、各社の事業特性や設計思想にも触れられる内容となっております。※ご紹介は企業名のアルファベット順となっております 株式会社あしたのチーム会員限定コンテンツ無料登録してアーキテクチャを見る あしたのチームは「誰もが "ワクワク" 働ける世界を創る」をビジョンに掲げ、人事評価制度の構築・運用・クラウド化で "人と組織の成長" を支援しています。今回は、2024年4月にリリースされた同社の新サービス:パフォーマンスマネジメントプラットフォーム『Cateras™』のアーキテクチャについてご説明します。 アーキテクチャ選択の背景や意図 サービス立ち上げ初期はエンジニアの数が少ないこともあり、開発メンバーが開発と兼任でイ

            モダンな開発環境のBtoB SaaSアーキテクチャ特集 技術選定のポイントと今後の展望 - Findy Tools
          • Meta、無料で商用可の「Llama 3.1」リリース 「世界最大かつ最も高性能なオープンモデル」

            米Metaは7月24日(現地時間)、“オープンソースの”LLMの最新版「Llama 3.1」を発表した。最大モデルは4050億(405B)のパラメータを持ち、米NVIDIAの1万6000個以上の「H100」でトレーニングした。Llama 3の70Bモデルと8Bモデルもアップグレードされる。 4月にリリースした「Llama 3」同様に、ほぼすべての主要クラウドサービス(AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM、Snowflake)で利用可能になる。 15兆トークンを超えるトレーニングデータでトレーニングしたとしているが、データの出所は明示していない。 405Bモデルは、長文テキストの要約、多言語会話エージェント、コーディングアシスタント、将来のAI言語モデルのト

              Meta、無料で商用可の「Llama 3.1」リリース 「世界最大かつ最も高性能なオープンモデル」
            • Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に

              米Metaは4月18日(現地時間)、オープンソースのLLMの最新版「Llama 3」を発表した。80億パラメータと700億パラメータの2モデルで、いずれもほぼすべての主要クラウドサービス(AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM、Snowflake)で間もなく利用可能になる。 昨年リリースの先代「Llama 2」にも700億パラメータモデルはあったが、Llama 3は4000億パラメータの高密度モデル(こちらはまだ公開されていない)のトレーニングも継続中だとマーク・ザッカーバーグCEOは語った。 トレーニングデータセットは、Llama 2よりも7倍大きく、4倍のコードが含まれている。英語以外での利用に備えるため、データセットの5%以上が非英語データで構成されて

                Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に
              • データカタログ特集 データ利活用に向けたアーキテクチャ6選 - Findy Tools

                整備したデータ基盤を、事業部や会社全体で活用に持っていく中で「データカタログ」の必要性が増々注目を集めています。 今回は、データカタログを導入し、データ利活用に挑んでいる6社に、アーキテクチャの工夫ポイントからデータカタログ導入によって得られた効果などを伺いました。 株式会社10X事業内容10Xでは「10xを創る」をミッションとし、小売向けECプラットフォーム「Stailer」の提供を通じて、スーパーやドラッグストア等のオンライン事業立ち上げ・運営支援を行っています。Stailerでは業務構築におけるコンサルティングから、必要な商品マスタやお客様アプリ・スタッフ向けのオペレーションシステム等の提供、配達システムの提供、販売促進の支援など、データを分析しながら一気通貫での支援を行っています。 データカタログ導入の背景以前はデータ分析にデータレイクのテーブルがよく利用されており、カラムのメタデ

                  データカタログ特集 データ利活用に向けたアーキテクチャ6選 - Findy Tools
                • Databases in 2024: A Year in Review

                  Like a shot to your dome piece, I'm back to hit you with my annual roundup of what happened in the rumble-tumble game of databases. Yes, I used to write this article on the OtterTune blog, but the company is dead (RIP). I'm doing this joint on my professor blog. There is much to cover from the past year, from 10-figure acquisitions, vendors running wild in the streets with license changes, and the

                    Databases in 2024: A Year in Review
                  • Google BigQueryからSnowflakeへ。バクラクのデータ基盤技術移管事例 - Findy Tools

                    公開日 2024/12/10更新日 2024/12/10Google BigQueryからSnowflakeへ。バクラクのデータ基盤技術移管事例 はじめにLayerXでは、「バクラク」という企業のバックオフィス業務を効率化するクラウドサービスを提供しています。稟議、経費精算、法人カード、請求書受取、請求書発行といった経理業務に加え、勤怠管理といった人事領域(HRM)の業務を効率化するサービスも展開しています。最新のAI技術を活用し、お客様の業務が、より「ラク」になる環境の実現を目指しています。導入実績は10,000社を超え、多くのお客様に選んでいただいております。 バクラク | バックオフィスから全社の生産性を高める このようなサービスを支えるためには、ビジネスニーズに迅速に応えられる拡張性の高い効率的なデータ基盤が不可欠です。バクラクでは、サービスの成長と共に増大するデータ量や複雑化する

                      Google BigQueryからSnowflakeへ。バクラクのデータ基盤技術移管事例 - Findy Tools
                    • 生成AIはデータサイエンティストの仕事を奪うか? - NTT Communications Engineers' Blog

                      こんにちは。NTTコミュニケーションズでエバンジェリストをやっている西塚です。今日が10年目の結婚記念日です。 この記事は、NTT Communications Advent Calendar 2024 6日目の記事です。 情報通信白書によると、デジタルデータの活用が企業経営に対して効果があると複数の先行研究で明らかにされています。 ビッグデータを活用している企業はそうでない企業に比べて、イノベーションの創出が統計学的に有意な差で多いと言われています。 私自身もNTTコミュニケーションズにおいて全社データ基盤を立ち上げて、社内システムからデータを収集し、 データサイエンティストと協力しながら、蓄積された膨大なデータを活用してビジネス価値を生み出す取り組みを行ってきました。 さて、近年の生成AIブームに乗り、データサイエンティスト達は従来の機械学習・AI技術に加えて生成AIをデータ活用に利用

                        生成AIはデータサイエンティストの仕事を奪うか? - NTT Communications Engineers' Blog
                      • キャディでの Apache Iceberg 活用事例 - CADDi Tech Blog

                        こんにちは。Drawer Growth グループの江良です。 キャディが「製造業 AI データプラットフォーム」の構想を打ち出してから半年ほどが経ちました。 caddi.com このコンセプトの実現にあたっては、「AI」の部分だけでなく、「データ」の部分を支える仕組みづくりも重要になってきます。今回は、私が携わっているプロジェクトで導入した Apache Iceberg とその使いどころについて紹介したいと思います。 製造業におけるデータ活用の難しさ 本題に入る前に、まずは背景について少し補足します。 (Iceberg の話だけを読みたい人は「採用したアーキテクチャ」のところまでスキップしてください。) モノづくり産業における会社には多種多様なデータが存在する 製造業の世界で登場するデータにはさまざまなものがあります。 詳しくは キャディ、製造業AIデータプラットフォームとしての、第二章。

                          キャディでの Apache Iceberg 活用事例 - CADDi Tech Blog
                        • AI回答エンジンPerplexity、日本でもエチオピア産のオリジナルコーヒー豆を販売開始

                          AI回答エンジンPerplexity、日本でもエチオピア産のオリジナルコーヒー豆を販売開始~販売開始を記念して、渋谷で大人気のSedai Coffeeにて期間限定キャンペーンも開催~ AI回答エンジンPerplexityを展開するPerplexity AI, Inc.(本社:アメリカ合衆国カリフォルニア州サンフランシスコ、共同創業者兼CEO:Aravind Srinivas、アジア代表:森田俊、以下Perplexity)はこの度、エチオピアよりコーヒー豆を直接輸入し、日本での販売を開始いたしました。また、2025年3月28日(金)から、渋谷区に位置するカフェ Sedai Coffee(東京都渋谷区神宮前5丁目29−9 1F)にてこの豆を使用したコーヒーを販売するキャンペーンを実施します。 Perplexityは、コーヒー豆の販売と合わせてPerplexityのロゴが入ったマグカップの販売も

                            AI回答エンジンPerplexity、日本でもエチオピア産のオリジナルコーヒー豆を販売開始
                          • 秋の技術特集2024 - KAKEHASHI Tech Blog

                            「KAKEHASHI Tech Blog 秋の技術特集2024」は、カケハシで利用されている技術についてより深く知ってもらうため、9月の平日にブログを毎日更新していく特別企画です。(全19記事) 9月2日: Databricksでnotebookのセルの中身を検証する - KAKEHASHI Tech Blog 9月3日: Okta ログを AWS S3 にログストリームで保存する - KAKEHASHI Tech Blog 9月4日: 新しいチームでTypeScriptに素早くキャッチアップするためにやったこと - KAKEHASHI Tech Blog 9月5日: Slackリストを用いてSlackで管理を完結しましょう! - KAKEHASHI Tech Blog 9月6日: renovateとDependabotの連携による脆弱性管理 - KAKEHASHI Tech Blog 9

                              秋の技術特集2024 - KAKEHASHI Tech Blog
                            • Microsoft Build 2024 キーノート完全日本語化まとめ・意訳 - 吉田の備忘録

                              今年も開催されたMicrosoft Build 2024のキーノートを日本語でまとめをお届けします!今年は吉田が製品チームとして「Ask the Expert」ブース対応を現地で3日連続アサインされた上、夜は無謀にも48時間以内にPower Platform の発表について2時間にわたってお届けするイベントを開催した関係上、まとめが遅くなってしまいました。 Build 2024 のPower Automateブース その分、Satya Nadellaが登壇で利用したスライドを丸ごと日本語化し、より丁重なまとめ?(もはやフル原稿…)を作ることができました。このページの一番下にはスライド完全意訳版をダウンロードできるようにしてありますので、ぜひ読んでくださいね。 それでは以下、キーノートの情報をお伝えします! 開発者会議は常に最もエキサイティングで、最も楽しい瞬間です。私は成人してからの人生を

                                Microsoft Build 2024 キーノート完全日本語化まとめ・意訳 - 吉田の備忘録
                              • Apple・NVIDIA・AnthropicなどがYouTubeの動画字幕を許可なくAIのトレーニングに利用していたと判明

                                IT系メディアのProof Newsが、AppleやAnthrpic、NVIDIAなどがYouTubeに公開されている17万本以上の動画の字幕をAIの学習に許可なく使用していたと指摘しています。 Apple, Nvidia, Anthropic Used Thousands of Swiped YouTube Videos to Train AI https://www.proofnews.org/apple-nvidia-anthropic-used-thousands-of-swiped-youtube-videos-to-train-ai/ YouTube creators surprised to find Apple and others trained AI on their videos | Ars Technica https://arstechnica.com/ai/20

                                  Apple・NVIDIA・AnthropicなどがYouTubeの動画字幕を許可なくAIのトレーニングに利用していたと判明
                                • Databricks情報を手に入れろ!?Databricks関連書籍やウェブ上のポインタなど(長い)

                                  こんにちわ!Databricksはじめたいけど情報が、、、ない、、、?という方?あるよー!ここにあるよー! というわけで、Databricks関連情報をまとめていきたいと思います。 書籍 まずはこれ「データブリックス-クイックスタートガイド」Databricksとはなぜ生まれてきたのか、どういうアーキテクチャなのか、といった最初の一歩がうまく書かれている本です。 Unity Catalogなどが入る前の本なので若干古いのですが、アーキテクチャの思想や基本的な部分についてはわかりやすいのでぜひ。僕もここから入りました。 つぎはこれ、「Apache Spark 徹底入門」、Apache Sparkの書籍ですが、Databricksの情報も入っております。まずは基本となるSparkの知識を仕入れつつDatabricksの情報も仕入れていきましょう! 同人誌 有志の方々が出版されているDatabr

                                    Databricks情報を手に入れろ!?Databricks関連書籍やウェブ上のポインタなど(長い)
                                  • 大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてー

                                    関連URL Tanuki-8x8B Leaderboard3 Tanuki-8B Leaderboard3 大規模言語モデルTanuki-8B, 8x8Bの位置づけや開発指針など 全体像 フルスクラッチで開発した大規模言語モデルTanuki-8B, 8x8Bの性能についての技術的な詳細 Japanese MT-Benchにおける性能の詳細とJasterに関する一部言及 ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語モデルの日本語性能を評価する(2024年8月) ブラインドテスト形式で種々のモデル出力の優劣を人手で評価した結果と、各種ベンチマークとの関係性 大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてー 開発の鍵となった合成データ戦略に至るまでの試行錯誤など Tanuki-8B,8x8Bの開発完了までに考えていたこ

                                      大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてー
                                    • [2024年3月版] Databricksのシステムアーキテクチャ

                                      2024年3月版のDatabricksのシステムアーキテクチャについて説明します。

                                        [2024年3月版] Databricksのシステムアーキテクチャ
                                      • オープンソース大規模言語モデルまとめ、メタのLlama 2が「超重要になる」ワケ

                                        オープンソースのLLM(大規模言語モデル)がこれまでにないほど大きな注目を集めている。OpenAIのGPTモデルなどクローズドな大規模言語モデルが圧倒的なシェアを有する状況だが、それらに匹敵するオープンソースのLLMの開発が進んでいる。メタの「Llama 2(ラマツー)」を筆頭に、日本でもそれをベースにした日本語LLM「ELYZA-japanese-Llama-2-13b」が公開された。直近ではメタに対抗して、Databricksも「DBRX」をリリース。オープンソースLLMとは何か、クローズドモデルに比べてどのような利点があるのか。オープンソースLLMが注目される理由を探ってみたい(追記:最新のLlama 3(ラマスリー)については別記事を参照のこと)。 オープンソースのLLMが注目される理由 2023年はChatGPTを筆頭にコンシューマー向けの生成アプリケーションが広く普及した年とな

                                          オープンソース大規模言語モデルまとめ、メタのLlama 2が「超重要になる」ワケ
                                        • Google Colab で Llama 3 のファインチューニングを試す |npaka

                                          「Google Colab」での「Llama 3」のファインチューニングを試したので、まとめました。 【注意】Google Colab Pro/Pro+のA100で動作確認しています。 1. Llama 3「Llama 3」は、Metaが開発したオープンモデルです。 2. 学習Colabでの学習手順は、次のとおりです。 (1) Colabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」の「A100」を選択。 (2) パッケージのインストール。 # パッケージのインストール !pip install -U transformers accelerate bitsandbytes !pip install trl peft wandb !git clone https://github.com/huggingface/trl %cd trl(3) 環境変数の準備。 左

                                            Google Colab で Llama 3 のファインチューニングを試す |npaka
                                          • AIエージェントビジネスの現状と今後の考察 - 襖からキリン

                                            こんにちは!年末記事の第二弾、AIエージェントに関するビジネス記事になります。 現状のエージェントはどうなっているのか、今後エージェントを始める方が参考になるように説明します。 第一弾の記事は既に公開されています。 Weekly AI Agent News!から見えたAIエージェントの現在地 - 襖からキリン 私が公開しているWeekly AI Agent News!や論文のリポジトリはこちらです。 speakerdeck.com github.com AIエージェントに取り組む人材とは? 企業のAIエージェントの状況 現状の主力エージェント製品を解説 エージェントビルダー リサーチ、問い合わせ対応 データに基づく意思決定支援 様々なソースから資料作成 Agentic Process Automation これからのエージェントを考える 生成AIエージェントと業務ソフトウェアの結びつきが強

                                              AIエージェントビジネスの現状と今後の考察 - 襖からキリン
                                            • RedashからLightdashへ!delyのデータ分析環境を変革する挑戦

                                              Halo、毎日ニコニコしているニコです。 データエンジニアとして、今delyでデータに関するいろいろな楽しいことをしています。 日本語は自分の母語ではないのにガタガタ書いてみましたw! 日本語でブログを書くのは少し難しいですが、もっと上達したいため、今回挑戦しようと思っています! それでは、早速今日のトピックに入りましょう。Let's get started 👍 はじめに 最近、私たちはすべてのproductを一つのデータ集権化platformに統合しようと多くの計画を立てています。 なぜ私たちがすべてのproductを一つのデータ中央集権化platformに統合したいのかというと、この統合によって統一されたガバナンスを実現し、セキュリティを維持することができると信じているからです。また、これにより、今まで異なるデータ基盤やワークフローで分かれていたチーム間のsiloを解消することができ

                                                RedashからLightdashへ!delyのデータ分析環境を変革する挑戦
                                              • Databricksの生成AI戦略

                                                過去のウェビナーで使ったスライドです。

                                                  Databricksの生成AI戦略
                                                • Databricks Container ServiceでTensorRT-LLMを動かしてみた - NTT Communications Engineers' Blog

                                                  本記事ではDatabricksのDatabricks Container Serviceを用いてNVIDIA社の推論ライブラリであるTensorRT-LLMを実行可能なNotebook環境を構築する方法を紹介します。 目次 目次 はじめに Databricks Container Service NVIDIA TensorRT-LLM 解決したいこと TensorRT-LLM Container Imageの作成 Databricks Containers ベースイメージの変更 Pytorch バージョンの変更 TensorRT-LLMのインストール 動作確認 Databricks環境設定 TensorRT-LLMのインポート Llama2 HF-7b-instruct モデルの変換 TensorRT-LLMの呼び出し まとめ 参考文献 はじめに こんにちは、NTTコミュニケーションズの露

                                                    Databricks Container ServiceでTensorRT-LLMを動かしてみた - NTT Communications Engineers' Blog
                                                  • Llama 3.2 の概要|npaka

                                                    以下の記事が面白かったので、簡単にまとめました。 ・Llama 3.2: Revolutionizing edge AI and vision with open, customizable models 1. Llama 3.2「Llama 3.2 11B・90B」は、チャートやグラフを含むドキュメントレベルの理解、画像キャプション、自然言語の説明に基づいて画像内のオブジェクトの方向を正確に特定するなど、画像推論のユースケースをサポートします。 「Llama 3.2 1B・3B」は、多言語テキスト生成とツール呼び出し機能に非常に優れています。これらのモデルにより、開発者は、データがデバイスから外に出ることのない強力なプライバシーを備えた、パーソナライズされたオンデバイスエージェントアプリケーションを構築できます。 2. モデル評価「Llama 3.2 11B・90B」の視覚モデルは、画像

                                                      Llama 3.2 の概要|npaka
                                                    • DeltaLake Universal Formatを使ったクロスプラットフォーム分析 - NTT Communications Engineers' Blog

                                                      本記事では6月に開催されたDATA+AI Summit 2024でGeneral Availabilityが発表されたDatabricksのDeltaLake Universal Formatの機能を使ってクロスプラットフォームでの分析を実現する方法について紹介します。 DeltaLake Universal FormatはDeltaLakeに保存されたデータをApache Icebergなどの異なるフォーマットで読み出すことができるようにする機能です。本記事では実際にDatabricks上でDeltaLake Universal Formatの機能を有効にしたテーブルを作成し、Amazon AthenaからApache Iceberg形式でクエリを発行するサンプルを用いて、機能の使い方と本機能のメリットについて解説します。 目次 目次 はじめに データレイクとOpen Table For

                                                        DeltaLake Universal Formatを使ったクロスプラットフォーム分析 - NTT Communications Engineers' Blog
                                                      • Introducing Meta Llama 3: The most capable openly available LLM to date

                                                        Today, we’re introducing Meta Llama 3, the next generation of our state-of-the-art open source large language model.Llama 3 models will soon be available on AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM, and Snowflake, and with support from hardware platforms offered by AMD, AWS, Dell, Intel, NVIDIA, and Qualcomm.We’re dedicated to developing Llama 3

                                                          Introducing Meta Llama 3: The most capable openly available LLM to date
                                                        • Developer eXperience Day 2024【参加無料・アーカイブ配信あり】|EventRegist(イベントレジスト)

                                                          2024年7月16日(月)と17日(火)の2日間にわたり「Developer eXperience Day 2024」(一般社団法人 日本CTO協会主催)を、オフライン・オンラインのハイブリッド形式で開催いたします。 【参加無料・アーカイブ配信あり】です。ぜひご参加ください! 開催概要 名称:Developer eXperience Day 2024 開催日:2024年7月16日(火)・17日(水) 開催形式:オフライン(現地参加)・オンライン配信 会場:浅草橋ヒューリックホール&カンファレンス アクセス:https://hulic-hall.com/access/ JR総武線「浅草橋駅(西口)」より徒歩1分 参加方法:事前申込制(参加費:無料) 申込サイト:本イベントサイトよりお申込みください 参加対象: ソフトウェア開発の第一線で挑戦するエンジニアをはじめ、テックリード、エンジニアリン

                                                            Developer eXperience Day 2024【参加無料・アーカイブ配信あり】|EventRegist(イベントレジスト)
                                                          • 1Password joins the Rails Foundation: Strengthening the community, empowering developers | 1Password

                                                            We’re excited to share some big news: 1Password is officially joining the Rails Foundation! And we’re not just joining – we’re going all in as a core member, standing shoulder to shoulder with companies that support the brilliant minds behind Rails, including some of our fellow Canadians. This is more than just a badge of honor for us; it’s a commitment to support the Rails ecosystem in the best w

                                                              1Password joins the Rails Foundation: Strengthening the community, empowering developers | 1Password
                                                            • Open Source AI is the Path Forward | Meta

                                                              In the early days of high-performance computing, the major tech companies of the day each invested heavily in developing their own closed source versions of Unix. It was hard to imagine at the time that any other approach could develop such advanced software. Eventually though, open source Linux gained popularity – initially because it allowed developers to modify its code however they wanted and

                                                                Open Source AI is the Path Forward | Meta
                                                              • Amazon S3 Tablesにデータを投入してAthenaとRedshiftからクエリしてみた - Qiita

                                                                Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? この記事はBeeX Advent Calendar 2024の5日目の記事です。 遅刻しました。(12/5投稿予定だった) ※本記事には一部AWSのプレビュー機能も含まれており、一般公開された際には記事の内容から変更される可能性がありますので、認識の上ご覧ください。 はじめに 先日アメリカのラスベガスで開催された AWS re:Invent 2024では多くのAWSアップデートが発表されました。 本記事ではその中でもAmazon S3 Tablesにフォーカスして検証してみましたので、記録として書いていきます。 ざっくりどんなことをする

                                                                • Meta、「Llama」を「国家防衛のために米政府機関に提供している」

                                                                  米Metaは11月4日(現地時間)、“オープンな”LLM「Llama」シリーズを「防衛および国家安全保障アプリケーションに取り組んでいる機関を含む米国政府機関」に提供していると発表した。 Llamaを政府機関に提供するために、Accenture、AWS、Anduril、Booz Allen、Databricks、Deloitte、IBM、Leidos、Lockheed Martin、Microsoft、Oracle、Palantir、Scale AI、Snowflakeなどの企業と提携している。 例えば、Lockheed Martinは、コードの生成などのユースケースで防衛分野の顧客にLlamaを提供しているという。 Llama 3の利用規約では、「軍事、戦争、核産業または応用、スパイ活動、米国国務省が管理する国際武器取引規則(ITAR)の対象となる材料または活動での使用」を禁じている。

                                                                    Meta、「Llama」を「国家防衛のために米政府機関に提供している」
                                                                  • Introducing Llama 3.1: Our most capable models to date

                                                                    Meta is committed to openly accessible AI. Read Mark Zuckerberg’s letter detailing why open source is good for developers, good for Meta, and good for the world.Bringing open intelligence to all, our latest models expand context length to 128K, add support across eight languages, and include Llama 3.1 405B—the first frontier-level open source AI model.Llama 3.1 405B is in a class of its own, with

                                                                      Introducing Llama 3.1: Our most capable models to date
                                                                    • The Young, Inexperienced Engineers Aiding Elon Musk’s Government Takeover

                                                                      The Young, Inexperienced Engineers Aiding Elon Musk’s Government Takeover Engineers between 19 and 24, most linked to Musk’s companies, are playing a key role as he seizes control of federal infrastructure. Elon Musk’s takeover of federal government infrastructure is ongoing, and at the center of things is a coterie of engineers who are barely out of—and in at least one case, purportedly still in—

                                                                        The Young, Inexperienced Engineers Aiding Elon Musk’s Government Takeover
                                                                      • 2025年にDataformを使うことへの葛藤などなど

                                                                        どうも。マイベストのデータエンジニア snhryt です。[1] 今回の記事の主役はこちら↓ なんやかんやDataformと4年来の付き合いな私。 コミッターをしているとか、そんな立派な貢献ができているわけではないのですが、ミドルユーザーの端くれとして、今のDataformについて思うことや昔話を書いてみます。 TL;DR DataformでTransformationに求められる大体のことは実現できる。ただし、もどかしい部分は結構ある これからデータ基盤を構築しようとしている人で、もし導入のしやすさだけで安直にDataformを採用しようとしているなら、一度立ち止まって考えてみてほしい 私はDataformを使う。今はまだ Data Transformationツール情勢 世界のModern Data Stackをまとめている The Modern Data Stack Reposito

                                                                          2025年にDataformを使うことへの葛藤などなど
                                                                        • SaaStr CEO Jason Lemkinに聞く。AI時代のSaaS戦略と、市場で勝ち残るための「新SaaSプレイブック」

                                                                          ALL STAR SAAS FUNDのメールマガジン「ALL STAR SAAS NEWSLETTER」購読登録受付中ALL STAR SAAS FUNDがお届けする 最新SaaSニュース、ブログ記事情報を配信するSaaS業界にいる方は必見のメールマガジン! 今、SaaS業界は大きな転換点を迎えています。従来型のビジネスソフトウェアが苦戦を強いられる一方で、AI機能の実装により30〜40%の成長を実現する企業も現れています。巷では「SaaS is Dead」とささやく人もおり、AIネイティブ企業へ注目をシフトする投資家も。 しかし、アメリカのSaaS市場は2,000億ドル規模で20%の成長を続けており、2025年には新たに600億ドルの市場が生まれることが予想されていると言います。この相反する状況をどう読み解くべきでしょうか? SaaSの世界で起業家や投資家として、そして毎年1万人以上が参

                                                                            SaaStr CEO Jason Lemkinに聞く。AI時代のSaaS戦略と、市場で勝ち残るための「新SaaSプレイブック」
                                                                          • データ分析・基盤企業が占う2025年 命運を分ける要素は何なのか Databricks、Snowflake、Qlikに聞いた

                                                                            2024年には生成AIのビジネスでの活用が本格化し、その可能性と課題、生成AIを支えるデータ基盤の整備などの重要性が徐々に認識されるようになった。 2025年においてデータ分析分野ではどのようなムーブメントが起きるだろうか。データブリックス・ジャパンの笹 俊文社長、Snowflake日本法人の東條英俊社長、クリックテック・ジャパン今井 浩氏(カントリーマネージャー)に、2025年の見通しを聞いた。 2025年、データ分析に“必要なもの”とは 笹 俊文氏(データブリックス・ジャパン 代表取締役社長) 生成AIがデータ分析へのアクセスを民主化したのは間違いありません。しかし、商用大規模言語モデル(LLM)は一般公開情報だけで学習するため、企業が必要とする品質を提供することが困難な場合が多くあります。そこで各企業は、LLMに自社データとガバナンスを統合した「データ・インテリジェンス」の構築を始め

                                                                              データ分析・基盤企業が占う2025年 命運を分ける要素は何なのか Databricks、Snowflake、Qlikに聞いた
                                                                            • GGUFって結局どのサイズ選んだらいいの??

                                                                              検証内容 llama.cppのGGUFフォーマットについて量子化サイズ、手法での精度の変化を確認する 変換、量子化にはb3369のReleaseを使用 変換するモデルはtokyotech-llm/Llama-3-Swallow-8B-Instruct-v0.1 評価対象は次の84種類 Model CardのUsageに沿ってvllmで実行したfloat32(そのままをoriginal、system promptに日本語で回答する指示を加えたものをoriginal_ja) safetensors -> GGUFに変換したF32とF16のGGUF Q8_0からQ2_Kまでのimatrixを必要としない14種類の量子化GGUF Q6_KからIQ1_Sまでのimatrixを使用できるor必要とする22種類の量子化GGUF (4についてはimatrix作成のためのデータを3種類用意しそれぞれに22種

                                                                                GGUFって結局どのサイズ選んだらいいの??
                                                                              • LLMは「複合AIシステム」へ進化する、データブリックスCTOの主張を読み解く

                                                                                LLM(大規模言語モデル)単体ではなく、複数のLLMに検索システムなどを組み合わせた「複合AI(人工知能)システム」がこれからの主流になる――。そう指摘するのは、データ分析基盤を提供する米Databricks(データブリックス)の共同創業者、Matei Zaharia(マテイ・ザハリア)CTO(最高技術責任者)だ。 ザハリアCTOはカリフォルニア大学バークレー校(UCバークレー)の博士課程に在籍していた2009年に、ビッグデータ分析のオープンソースソフトウエア(OSS)である「Apache Spark」の開発プロジェクトを始めたことで知られる。データブリックスはSparkをベースにしたデータ分析基盤を提供するスタートアップで、ザハリアCTOは今もUCバークレーの准教授を務める。 複合AIシステム(Compound AI Systems)とは2024年2月に、ザハリアCTOがUCバークレーの

                                                                                  LLMは「複合AIシステム」へ進化する、データブリックスCTOの主張を読み解く
                                                                                • Meta、“オープンソースの”LLM「Llama」ダウンロードが3億5000万に

                                                                                  米Metaは8月29日(現地時間)、“オープンソース”を謳うLLM「Llama」のHugging Faceでの累計ダウンロード数が3億5000万回に迫っていると発表した。前年同時期の10倍以上であり、Llama 3.1をリリースした7月だけでも2000万回ダウンロードされたとしている。 今年の1月から7月にかけて、大手クラウドサービスプロバイダー(AWS、Microsoft Azure、Databricks、Dell、Google Cloud、NVIDIA、IBM、Groq、Snowflakeなど)の一部では、Llamaの月間使用量が10倍に増加し、5月から7月にかけては、ホストされているLlamaの使用トークン量が2倍以上に増加した。 Metaは、「Llamaの成功は、オープンソースの力によって実現された」と語る。同社はLlamaに独自のライセンスを付しており、例えば月間アクティブユーザ

                                                                                    Meta、“オープンソースの”LLM「Llama」ダウンロードが3億5000万に