本文「Databricks」を検索 - はてなブックマーク

1 - 40 件 / 506件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

Databricksの検索結果1 - 40 件 / 506件

LLM時代のX情報収集術｜べいえりあ
- 204 users
- note.com/csstudyabroad
- テクノロジー
- 2024/05/08
AI for Everyoneについては日本語版もあるのと、どちらのコースも日本語字幕付きで見られる（多分機械翻訳での英語字幕からの翻訳だが、翻訳の質は悪くない）ので、英語分からなくてある程度何とかなるんじゃないかと思います。あと、余力のある人、最新のNLP研究を理解したい人はこちらの本を読むことをオススメします。アルゴリズムの詳細は必ずしも理解しなくても良いですが、どんなタスクがあるのかは理解しておいた方が良いかと思います。 NLPの知識がLLMを応用する上で実際にどう役に立つかですが、例えばで言うとNLP的には対話の中には「タスク指向型対話（task-oriented dialogue）」と「雑談（chit-chat dialogue）」があります。それぞれ対話の中で重要視されるものから評価の仕方まで全然違うのですが、NLPをやらずにLLMをやっている人と話しているとこれらをごっちゃ
- LLM
- AI
- あとで読む
- 機械学習
- SNS
- 情報収集
- 論文
- column
- プログラミング
39社のデータ基盤アーキテクチャ特集 - ツールの技術選定のポイントと活用術 - Findy Tools
- 154 users
- findy-tools.io
- テクノロジー
- 2024/10/08
8つのデータ系ツール「BigQuery」「Databricks」「dbt」「Fivetran」「Lightdash」「Looker」「Snowflake」「TROCCOⓇ」に39社からご寄稿頂いたレビューから、各社のデータ基盤アーキテクチャをまとめた記事です。各社の技術選定の背景や工夫などの知見を得ていただく場となれば幸いです。 ※ツール名・ご寄稿企業名共にアルファベット順で掲載しております BigQueryBigQuery は、Google Cloud の費用対効果に優れたフルマネージド型の分析データウェアハウスです。ペタバイト規模に対応しており、膨大な量のデータに対してほぼリアルタイムで分析を行うことができます。 ▼BigQueryとは？機能や特徴・製品の概要まとめページはこちら https://findy-tools.io/products/bigquery/49 ▼Findy T
データアーキテクチャ特集　データ利活用を推進する8社の技術選定 - Findy Tools
- 130 users
- findy-tools.io
- テクノロジー
- 2024/09/12
毎回ご好評頂いているアーキテクチャ特集の今回のテーマは、データ分析基盤です。データ活用に特に力を入れている日本のIT企業8社にご協力頂き、それぞれの技術選定の裏側と今後の展望についてご寄稿頂きました。 ※ご紹介は企業名のアルファベット順となっております株式会社朝日新聞社アーキテクチャ選択の背景や意図これまでは、朝日新聞デジタル（朝デジ）のサービス開発・運用において、データを収集する基盤が存在せず業務ごとに Adobe Analytics や AWS QuickSight、内製のツールなど様々なBIツールが乱立している状態でした。そこで、複数のシステムのデータソースを統合的に可視化・分析を可能にするために、分析基盤の構築に着手しました。まず、データを集積・加工するETLとしては以下の点で TROCCO を選択しました。 1. データエンジニアが不足しているため、データアナリストで
モダンな開発環境のBtoB SaaSアーキテクチャ特集技術選定のポイントと今後の展望 - Findy Tools
- 94 users
- findy-tools.io
- テクノロジー
- 2024/06/26
ご好評頂いているアーキテクチャ特集の第三弾となる今回は、BtoB SaaSを提供する企業10社にご協力頂き、技術選定のこだわりや今後の展望をご寄稿いただきました。アーキテクチャを通して、各社の事業特性や設計思想にも触れられる内容となっております。※ご紹介は企業名のアルファベット順となっております株式会社あしたのチーム会員限定コンテンツ無料登録してアーキテクチャを見るあしたのチームは「誰もが "ワクワク" 働ける世界を創る」をビジョンに掲げ、人事評価制度の構築・運用・クラウド化で "人と組織の成長" を支援しています。今回は、2024年4月にリリースされた同社の新サービス：パフォーマンスマネジメントプラットフォーム『Cateras™』のアーキテクチャについてご説明します。アーキテクチャ選択の背景や意図サービス立ち上げ初期はエンジニアの数が少ないこともあり、開発メンバーが開発と兼任でイ
- アーキテクチャ
- あとで読む
- SaaS
- BtoB
- チーム
- 開発
- インフラ
- 設計
Meta、無料で商用可の「Llama 3.1」リリース　「世界最大かつ最も高性能なオープンモデル」
- 67 users
- www.itmedia.co.jp
- テクノロジー
- 2024/07/24
米Metaは7月24日（現地時間）、“オープンソースの”LLMの最新版「Llama 3.1」を発表した。最大モデルは4050億（405B）のパラメータを持ち、米NVIDIAの1万6000個以上の「H100」でトレーニングした。Llama 3の70Bモデルと8Bモデルもアップグレードされる。 4月にリリースした「Llama 3」同様に、ほぼすべての主要クラウドサービス（AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM、Snowflake）で利用可能になる。 15兆トークンを超えるトレーニングデータでトレーニングしたとしているが、データの出所は明示していない。 405Bモデルは、長文テキストの要約、多言語会話エージェント、コーディングアシスタント、将来のAI言語モデルのト
- AI
- Meta
- あとで読む
- LLM
- 世界
- データ
- 無料
Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に
- 59 users
- www.itmedia.co.jp
- テクノロジー
- 2024/04/19
米Metaは4月18日（現地時間）、オープンソースのLLMの最新版「Llama 3」を発表した。80億パラメータと700億パラメータの2モデルで、いずれもほぼすべての主要クラウドサービス（AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM、Snowflake）で間もなく利用可能になる。昨年リリースの先代「Llama 2」にも700億パラメータモデルはあったが、Llama 3は4000億パラメータの高密度モデル（こちらはまだ公開されていない）のトレーニングも継続中だとマーク・ザッカーバーグCEOは語った。トレーニングデータセットは、Llama 2よりも7倍大きく、4倍のコードが含まれている。英語以外での利用に備えるため、データセットの5％以上が非英語データで構成されて
Databases in 2024: A Year in Review
- 56 users
- www.cs.cmu.edu/~pavlo
- テクノロジー
- 2025/01/02
Like a shot to your dome piece, I'm back to hit you with my annual roundup of what happened in the rumble-tumble game of databases. Yes, I used to write this article on the OtterTune blog, but the company is dead (RIP). I'm doing this joint on my professor blog. There is much to cover from the past year, from 10-figure acquisitions, vendors running wild in the streets with license changes, and the
- database
- DB
- あとで読む
- data
Google BigQueryからSnowflakeへ。バクラクのデータ基盤技術移管事例 - Findy Tools
- 48 users
- findy-tools.io
- テクノロジー
- 2024/12/10
公開日 2024/12/10更新日 2024/12/10Google BigQueryからSnowflakeへ。バクラクのデータ基盤技術移管事例はじめにLayerXでは、「バクラク」という企業のバックオフィス業務を効率化するクラウドサービスを提供しています。稟議、経費精算、法人カード、請求書受取、請求書発行といった経理業務に加え、勤怠管理といった人事領域（HRM）の業務を効率化するサービスも展開しています。最新のAI技術を活用し、お客様の業務が、より「ラク」になる環境の実現を目指しています。導入実績は10,000社を超え、多くのお客様に選んでいただいております。バクラク | バックオフィスから全社の生産性を高めるこのようなサービスを支えるためには、ビジネスニーズに迅速に応えられる拡張性の高い効率的なデータ基盤が不可欠です。バクラクでは、サービスの成長と共に増大するデータ量や複雑化する
生成AIはデータサイエンティストの仕事を奪うか？ - NTT Communications Engineers' Blog
- 41 users
- engineers.ntt.com
- テクノロジー
- 2024/12/06
こんにちは。NTTコミュニケーションズでエバンジェリストをやっている西塚です。今日が10年目の結婚記念日です。この記事は、NTT Communications Advent Calendar 2024 6日目の記事です。情報通信白書によると、デジタルデータの活用が企業経営に対して効果があると複数の先行研究で明らかにされています。ビッグデータを活用している企業はそうでない企業に比べて、イノベーションの創出が統計学的に有意な差で多いと言われています。私自身もNTTコミュニケーションズにおいて全社データ基盤を立ち上げて、社内システムからデータを収集し、データサイエンティストと協力しながら、蓄積された膨大なデータを活用してビジネス価値を生み出す取り組みを行ってきました。さて、近年の生成AIブームに乗り、データサイエンティスト達は従来の機械学習・AI技術に加えて生成AIをデータ活用に利用
- AI
- 分析
- あとで読む
- データ
キャディでの Apache Iceberg 活用事例 - CADDi Tech Blog
- 39 users
- caddi.tech
- テクノロジー
- 2025/03/18
こんにちは。Drawer Growth グループの江良です。キャディが「製造業 AI データプラットフォーム」の構想を打ち出してから半年ほどが経ちました。 caddi.com このコンセプトの実現にあたっては、「AI」の部分だけでなく、「データ」の部分を支える仕組みづくりも重要になってきます。今回は、私が携わっているプロジェクトで導入した Apache Iceberg とその使いどころについて紹介したいと思います。製造業におけるデータ活用の難しさ本題に入る前に、まずは背景について少し補足します。（Iceberg の話だけを読みたい人は「採用したアーキテクチャ」のところまでスキップしてください。）モノづくり産業における会社には多種多様なデータが存在する製造業の世界で登場するデータにはさまざまなものがあります。詳しくはキャディ、製造業AIデータプラットフォームとしての、第二章。
AI回答エンジンPerplexity、日本でもエチオピア産のオリジナルコーヒー豆を販売開始
- 38 users
- prtimes.jp
- テクノロジー
- 2025/03/29
AI回答エンジンPerplexity、日本でもエチオピア産のオリジナルコーヒー豆を販売開始～販売開始を記念して、渋谷で大人気のSedai Coffeeにて期間限定キャンペーンも開催～ AI回答エンジンPerplexityを展開するPerplexity AI, Inc.（本社：アメリカ合衆国カリフォルニア州サンフランシスコ、共同創業者兼CEO：Aravind Srinivas、アジア代表：森田俊、以下Perplexity）はこの度、エチオピアよりコーヒー豆を直接輸入し、日本での販売を開始いたしました。また、2025年3月28日（金）から、渋谷区に位置するカフェ Sedai Coffee（東京都渋谷区神宮前5丁目29−9 1F）にてこの豆を使用したコーヒーを販売するキャンペーンを実施します。 Perplexityは、グッズ販売サイトにてコーヒー豆の販売及びPerplexityのロゴが入ったマグ
- !!
- 人工知能
- AI
- あとで読む
秋の技術特集2024 - KAKEHASHI Tech Blog
- 36 users
- kakehashi-dev.hatenablog.com
- テクノロジー
- 2024/09/12
「KAKEHASHI Tech Blog 秋の技術特集2024」は、カケハシで利用されている技術についてより深く知ってもらうため、9月の平日にブログを毎日更新していく特別企画です。(全19記事) 9月2日: Databricksでnotebookのセルの中身を検証する - KAKEHASHI Tech Blog 9月3日: Okta ログを AWS S3 にログストリームで保存する - KAKEHASHI Tech Blog 9月4日: 新しいチームでTypeScriptに素早くキャッチアップするためにやったこと - KAKEHASHI Tech Blog 9月5日: Slackリストを用いてSlackで管理を完結しましょう！ - KAKEHASHI Tech Blog 9月6日: renovateとDependabotの連携による脆弱性管理 - KAKEHASHI Tech Blog 9
Microsoft Build 2024 キーノート完全日本語化まとめ・意訳 - 吉田の備忘録
- 32 users
- memo.tyoshida.me
- テクノロジー
- 2024/05/27
今年も開催されたMicrosoft Build 2024のキーノートを日本語でまとめをお届けします！今年は吉田が製品チームとして「Ask the Expert」ブース対応を現地で3日連続アサインされた上、夜は無謀にも48時間以内にPower Platform の発表について2時間にわたってお届けするイベントを開催した関係上、まとめが遅くなってしまいました。 Build 2024 のPower Automateブースその分、Satya Nadellaが登壇で利用したスライドを丸ごと日本語化し、より丁重なまとめ？（もはやフル原稿…）を作ることができました。このページの一番下にはスライド完全意訳版をダウンロードできるようにしてありますので、ぜひ読んでくださいね。それでは以下、キーノートの情報をお伝えします！開発者会議は常に最もエキサイティングで、最も楽しい瞬間です。私は成人してからの人生を
- Microsoft
- あとで読む
- 日本語
- 人工知能
- AI
- ツール
- 開発
Apple・NVIDIA・AnthropicなどがYouTubeの動画字幕を許可なくAIのトレーニングに利用していたと判明
- 30 users
- gigazine.net
- テクノロジー
- 2024/07/17
IT系メディアのProof Newsが、AppleやAnthrpic、NVIDIAなどがYouTubeに公開されている17万本以上の動画の字幕をAIの学習に許可なく使用していたと指摘しています。 Apple, Nvidia, Anthropic Used Thousands of Swiped YouTube Videos to Train AI https://www.proofnews.org/apple-nvidia-anthropic-used-thousands-of-swiped-youtube-videos-to-train-ai/ YouTube creators surprised to find Apple and others trained AI on their videos | Ars Technica https://arstechnica.com/ai/20
- AI
- 著作権
- 人工知能
- 研究
- Apple
- YouTube
- web
Databricks情報を手に入れろ！？Databricks関連書籍やウェブ上のポインタなど（長い）
- 28 users
- blog.akuwano.net
- テクノロジー
- 2024/09/15
こんにちわ！Databricksはじめたいけど情報が、、、ない、、、？という方？あるよー！ここにあるよー！というわけで、Databricks関連情報をまとめていきたいと思います。書籍まずはこれ「データブリックス-クイックスタートガイド」Databricksとはなぜ生まれてきたのか、どういうアーキテクチャなのか、といった最初の一歩がうまく書かれている本です。 Unity Catalogなどが入る前の本なので若干古いのですが、アーキテクチャの思想や基本的な部分についてはわかりやすいのでぜひ。僕もここから入りました。つぎはこれ、「Apache Spark 徹底入門」、Apache Sparkの書籍ですが、Databricksの情報も入っております。まずは基本となるSparkの知識を仕入れつつDatabricksの情報も仕入れていきましょう！同人誌有志の方々が出版されているDatabr
- databricks
- データ
- oss
- database
- あとで読む
大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてー
- 27 users
- zenn.dev/matsuolab
- テクノロジー
- 2024/08/30
関連URL Tanuki-8x8B Leaderboard3 Tanuki-8B Leaderboard3 大規模言語モデルTanuki-8B, 8x8Bの位置づけや開発指針など全体像フルスクラッチで開発した大規模言語モデルTanuki-8B, 8x8Bの性能についての技術的な詳細 Japanese MT-Benchにおける性能の詳細とJasterに関する一部言及 ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語モデルの日本語性能を評価する(2024年8月) ブラインドテスト形式で種々のモデル出力の優劣を人手で評価した結果と､各種ベンチマークとの関係性大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてー開発の鍵となった合成データ戦略に至るまでの試行錯誤など Tanuki-8B,8x8Bの開発完了までに考えていたこ
- LLM
- 開発
- 人工知能
- techfeed
- あとで読む
[2024年3月版] Databricksのシステムアーキテクチャ
- 26 users
- speakerdeck.com/databricksjapan
- テクノロジー
- 2024/04/13
2024年3月版のDatabricksのシステムアーキテクチャについて説明します。
オープンソース大規模言語モデルまとめ、メタのLlama 2が「超重要になる」ワケ
- 23 users
- www.sbbit.jp
- テクノロジー
- 2024/04/16
オープンソースのLLM（大規模言語モデル）がこれまでにないほど大きな注目を集めている。OpenAIのGPTモデルなどクローズドな大規模言語モデルが圧倒的なシェアを有する状況だが、それらに匹敵するオープンソースのLLMの開発が進んでいる。メタの「Llama 2（ラマツー）」を筆頭に、日本でもそれをベースにした日本語LLM「ELYZA-japanese-Llama-2-13b」が公開された。直近ではメタに対抗して、Databricksも「DBRX」をリリース。オープンソースLLMとは何か、クローズドモデルに比べてどのような利点があるのか。オープンソースLLMが注目される理由を探ってみたい（追記：最新のLlama 3（ラマスリー）については別記事を参照のこと）。オープンソースのLLMが注目される理由 2023年はChatGPTを筆頭にコンシューマー向けの生成アプリケーションが広く普及した年とな
Google Colab で Llama 3 のファインチューニングを試す｜npaka
- 22 users
- note.com/npaka
- テクノロジー
- 2024/04/22
「Google Colab」での「Llama 3」のファインチューニングを試したので、まとめました。【注意】Google Colab Pro/Pro+のA100で動作確認しています。 1. Llama 3「Llama 3」は、Metaが開発したオープンモデルです。 2. 学習Colabでの学習手順は、次のとおりです。 (1) Colabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」の「A100」を選択。 (2) パッケージのインストール。 # パッケージのインストール !pip install -U transformers accelerate bitsandbytes !pip install trl peft wandb !git clone https://github.com/huggingface/trl %cd trl(3) 環境変数の準備。左
- LLM
- ai
- あとで読む
AIエージェントビジネスの現状と今後の考察 - 襖からキリン
- 20 users
- masamasa59.hatenablog.com
- テクノロジー
- 2024/12/06
こんにちは！年末記事の第二弾、AIエージェントに関するビジネス記事になります。現状のエージェントはどうなっているのか、今後エージェントを始める方が参考になるように説明します。第一弾の記事は既に公開されています。 Weekly AI Agent News!から見えたAIエージェントの現在地 - 襖からキリン私が公開しているWeekly AI Agent News!や論文のリポジトリはこちらです。 speakerdeck.com github.com AIエージェントに取り組む人材とは？企業のAIエージェントの状況現状の主力エージェント製品を解説エージェントビルダーリサーチ、問い合わせ対応データに基づく意思決定支援様々なソースから資料作成 Agentic Process Automation これからのエージェントを考える生成AIエージェントと業務ソフトウェアの結びつきが強
RedashからLightdashへ！delyのデータ分析環境を変革する挑戦
- 19 users
- zenn.dev/dely_jp
- テクノロジー
- 2025/03/04
Halo、毎日ニコニコしているニコです。データエンジニアとして、今delyでデータに関するいろいろな楽しいことをしています。日本語は自分の母語ではないのにガタガタ書いてみましたw! 日本語でブログを書くのは少し難しいですが、もっと上達したいため、今回挑戦しようと思っています！それでは、早速今日のトピックに入りましょう。Let's get started 👍 はじめに最近、私たちはすべてのproductを一つのデータ集権化platformに統合しようと多くの計画を立てています。なぜ私たちがすべてのproductを一つのデータ中央集権化platformに統合したいのかというと、この統合によって統一されたガバナンスを実現し、セキュリティを維持することができると信じているからです。また、これにより、今まで異なるデータ基盤やワークフローで分かれていたチーム間のsiloを解消することができ
- データ
- あとで読む
Databricksの生成AI戦略
- 18 users
- speakerdeck.com/taka_aki
- テクノロジー
- 2024/05/14
過去のウェビナーで使ったスライドです。
Databricks Container ServiceでTensorRT-LLMを動かしてみた - NTT Communications Engineers' Blog
- 17 users
- engineers.ntt.com
- テクノロジー
- 2024/04/26
本記事ではDatabricksのDatabricks Container Serviceを用いてNVIDIA社の推論ライブラリであるTensorRT-LLMを実行可能なNotebook環境を構築する方法を紹介します。目次目次はじめに Databricks Container Service NVIDIA TensorRT-LLM 解決したいこと TensorRT-LLM Container Imageの作成 Databricks Containers ベースイメージの変更 Pytorch バージョンの変更 TensorRT-LLMのインストール動作確認 Databricks環境設定 TensorRT-LLMのインポート Llama2 HF-7b-instruct モデルの変換 TensorRT-LLMの呼び出しまとめ参考文献はじめにこんにちは、NTTコミュニケーションズの露
- あとで読む
Llama 3.2 の概要｜npaka
- 16 users
- note.com/npaka
- テクノロジー
- 2024/09/26
以下の記事が面白かったので、簡単にまとめました。・Llama 3.2: Revolutionizing edge AI and vision with open, customizable models 1. Llama 3.2「Llama 3.2 11B・90B」は、チャートやグラフを含むドキュメントレベルの理解、画像キャプション、自然言語の説明に基づいて画像内のオブジェクトの方向を正確に特定するなど、画像推論のユースケースをサポートします。「Llama 3.2 1B・3B」は、多言語テキスト生成とツール呼び出し機能に非常に優れています。これらのモデルにより、開発者は、データがデバイスから外に出ることのない強力なプライバシーを備えた、パーソナライズされたオンデバイスエージェントアプリケーションを構築できます。 2. モデル評価「Llama 3.2 11B・90B」の視覚モデルは、画像
- AI
- あとで読む
DeltaLake Universal Formatを使ったクロスプラットフォーム分析 - NTT Communications Engineers' Blog
- 16 users
- engineers.ntt.com
- テクノロジー
- 2024/07/30
本記事では6月に開催されたDATA+AI Summit 2024でGeneral Availabilityが発表されたDatabricksのDeltaLake Universal Formatの機能を使ってクロスプラットフォームでの分析を実現する方法について紹介します。 DeltaLake Universal FormatはDeltaLakeに保存されたデータをApache Icebergなどの異なるフォーマットで読み出すことができるようにする機能です。本記事では実際にDatabricks上でDeltaLake Universal Formatの機能を有効にしたテーブルを作成し、Amazon AthenaからApache Iceberg形式でクエリを発行するサンプルを用いて、機能の使い方と本機能のメリットについて解説します。目次目次はじめにデータレイクとOpen Table For
- あとで読む
Introducing Meta Llama 3: The most capable openly available LLM to date
- 13 users
- ai.meta.com
- テクノロジー
- 2024/04/19
Today, we’re introducing Meta Llama 3, the next generation of our state-of-the-art open source large language model.Llama 3 models will soon be available on AWS, Databricks, Google Cloud, Hugging Face, Kaggle, IBM WatsonX, Microsoft Azure, NVIDIA NIM, and Snowflake, and with support from hardware platforms offered by AMD, AWS, Dell, Intel, NVIDIA, and Qualcomm.We’re dedicated to developing Llama 3
- Meta
- 人工知能
- AI
Developer eXperience Day 2024【参加無料・アーカイブ配信あり】｜EventRegist（イベントレジスト）
- 12 users
- eventregist.com
- テクノロジー
- 2024/07/03
2024年7月16日（月）と17日（火）の2日間にわたり「Developer eXperience Day 2024」（一般社団法人日本CTO協会主催）を、オフライン・オンラインのハイブリッド形式で開催いたします。【参加無料・アーカイブ配信あり】です。ぜひご参加ください！開催概要名称：Developer eXperience Day 2024 開催日：2024年7月16日(火)・17日(水) 開催形式：オフライン（現地参加）・オンライン配信会場：浅草橋ヒューリックホール＆カンファレンスアクセス：https://hulic-hall.com/access/ JR総武線「浅草橋駅（西口）」より徒歩1分参加方法：事前申込制（参加費：無料）申込サイト：本イベントサイトよりお申込みください参加対象：ソフトウェア開発の第一線で挑戦するエンジニアをはじめ、テックリード、エンジニアリン
- あとで読む
1Password joins the Rails Foundation: Strengthening the community, empowering developers | 1Password
- 10 users
- blog.1password.com
- テクノロジー
- 2024/12/03
We’re excited to share some big news: 1Password is officially joining the Rails Foundation! And we’re not just joining – we’re going all in as a core member, standing shoulder to shoulder with companies that support the brilliant minds behind Rails, including some of our fellow Canadians. This is more than just a badge of honor for us; it’s a commitment to support the Rails ecosystem in the best w
- 1Password
- rails
- Ruby
- Security
Open Source AI is the Path Forward | Meta
- 10 users
- about.fb.com
- テクノロジー
- 2024/07/24
In the early days of high-performance computing, the major tech companies of the day each invested heavily in developing their own closed source versions of Unix. It was hard to imagine at the time that any other approach could develop such advanced software. Eventually though, open source Linux gained popularity – initially because it allowed developers to modify its code however they wanted and
- あとで読む
Amazon S3 Tablesにデータを投入してAthenaとRedshiftからクエリしてみた - Qiita
- 10 users
- qiita.com
- テクノロジー
- 2024/12/07
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? この記事はBeeX Advent Calendar 2024の5日目の記事です。遅刻しました。(12/5投稿予定だった) ※本記事には一部AWSのプレビュー機能も含まれており、一般公開された際には記事の内容から変更される可能性がありますので、認識の上ご覧ください。はじめに先日アメリカのラスベガスで開催された AWS re:Invent 2024では多くのAWSアップデートが発表されました。本記事ではその中でもAmazon S3 Tablesにフォーカスして検証してみましたので、記録として書いていきます。ざっくりどんなことをする
- aws
Meta、「Llama」を「国家防衛のために米政府機関に提供している」
- 9 users
- www.itmedia.co.jp
- テクノロジー
- 2024/11/05
米Metaは11月4日（現地時間）、“オープンな”LLM「Llama」シリーズを「防衛および国家安全保障アプリケーションに取り組んでいる機関を含む米国政府機関」に提供していると発表した。 Llamaを政府機関に提供するために、Accenture、AWS、Anduril、Booz Allen、Databricks、Deloitte、IBM、Leidos、Lockheed Martin、Microsoft、Oracle、Palantir、Scale AI、Snowflakeなどの企業と提携している。例えば、Lockheed Martinは、コードの生成などのユースケースで防衛分野の顧客にLlamaを提供しているという。 Llama 3の利用規約では、「軍事、戦争、核産業または応用、スパイ活動、米国国務省が管理する国際武器取引規則（ITAR）の対象となる材料または活動での使用」を禁じている。
- AI
Introducing Llama 3.1: Our most capable models to date
- 9 users
- ai.meta.com
- テクノロジー
- 2024/07/24
Meta is committed to openly accessible AI. Read Mark Zuckerberg’s letter detailing why open source is good for developers, good for Meta, and good for the world.Bringing open intelligence to all, our latest models expand context length to 128K, add support across eight languages, and include Llama 3.1 405B—the first frontier-level open source AI model.Llama 3.1 405B is in a class of its own, with
The Young, Inexperienced Engineers Aiding Elon Musk’s Government Takeover
- 8 users
- www.wired.com
- テクノロジー
- 2025/02/03
The Young, Inexperienced Engineers Aiding Elon Musk’s Government Takeover Engineers between 19 and 24, most linked to Musk’s companies, are playing a key role as he seizes control of federal infrastructure. Elon Musk’s takeover of federal government infrastructure is ongoing, and at the center of things is a coterie of engineers who are barely out of—and in at least one case, purportedly still in—
2025年にDataformを使うことへの葛藤などなど
- 7 users
- zenn.dev/mybest_dev
- テクノロジー
- 2025/02/04
どうも。マイベストのデータエンジニア snhryt です。[1] 今回の記事の主役はこちら↓ なんやかんやDataformと4年来の付き合いな私。コミッターをしているとか、そんな立派な貢献ができているわけではないのですが、ミドルユーザーの端くれとして、今のDataformについて思うことや昔話を書いてみます。 TL;DR DataformでTransformationに求められる大体のことは実現できる。ただし、もどかしい部分は結構あるこれからデータ基盤を構築しようとしている人で、もし導入のしやすさだけで安直にDataformを採用しようとしているなら、一度立ち止まって考えてみてほしい私はDataformを使う。今はまだ Data Transformationツール情勢世界のModern Data Stackをまとめている The Modern Data Stack Reposito
- データ
- ツール
SaaStr CEO Jason Lemkinに聞く。AI時代のSaaS戦略と、市場で勝ち残るための「新SaaSプレイブック」
- 7 users
- blog.allstarsaas.com
- テクノロジー
- 2025/02/26
ALL STAR SAAS FUNDのメールマガジン「ALL STAR SAAS NEWSLETTER」購読登録受付中ALL STAR SAAS FUNDがお届けする最新SaaSニュース、ブログ記事情報を配信するSaaS業界にいる方は必見のメールマガジン！今、SaaS業界は大きな転換点を迎えています。従来型のビジネスソフトウェアが苦戦を強いられる一方で、AI機能の実装により30〜40%の成長を実現する企業も現れています。巷では「SaaS is Dead」とささやく人もおり、AIネイティブ企業へ注目をシフトする投資家も。しかし、アメリカのSaaS市場は2,000億ドル規模で20%の成長を続けており、2025年には新たに600億ドルの市場が生まれることが予想されていると言います。この相反する状況をどう読み解くべきでしょうか？ SaaSの世界で起業家や投資家として、そして毎年1万人以上が参
- あとで読む
データ分析・基盤企業が占う2025年　命運を分ける要素は何なのか　Databricks、Snowflake、Qlikに聞いた
- 7 users
- www.itmedia.co.jp
- テクノロジー
- 2025/01/06
2024年には生成AIのビジネスでの活用が本格化し、その可能性と課題、生成AIを支えるデータ基盤の整備などの重要性が徐々に認識されるようになった。 2025年においてデータ分析分野ではどのようなムーブメントが起きるだろうか。データブリックス・ジャパンの笹俊文社長、Snowflake日本法人の東條英俊社長、クリックテック・ジャパン今井浩氏（カントリーマネージャー）に、2025年の見通しを聞いた。 2025年、データ分析に“必要なもの”とは笹俊文氏（データブリックス・ジャパン　代表取締役社長）生成AIがデータ分析へのアクセスを民主化したのは間違いありません。しかし、商用大規模言語モデル（LLM）は一般公開情報だけで学習するため、企業が必要とする品質を提供することが困難な場合が多くあります。そこで各企業は、LLMに自社データとガバナンスを統合した「データ・インテリジェンス」の構築を始め
- あとで読む
GGUFって結局どのサイズ選んだらいいの？？
- 7 users
- zenn.dev/yuki127
- テクノロジー
- 2024/08/03
検証内容 llama.cppのGGUFフォーマットについて量子化サイズ、手法での精度の変化を確認する変換、量子化にはb3369のReleaseを使用変換するモデルはtokyotech-llm/Llama-3-Swallow-8B-Instruct-v0.1 評価対象は次の84種類 Model CardのUsageに沿ってvllmで実行したfloat32(そのままをoriginal、system promptに日本語で回答する指示を加えたものをoriginal_ja) safetensors -> GGUFに変換したF32とF16のGGUF Q8_0からQ2_Kまでのimatrixを必要としない14種類の量子化GGUF Q6_KからIQ1_Sまでのimatrixを使用できるor必要とする22種類の量子化GGUF (4についてはimatrix作成のためのデータを3種類用意しそれぞれに22種
- llm
- 機械学習
LLMは「複合AIシステム」へ進化する、データブリックスCTOの主張を読み解く
- 6 users
- xtech.nikkei.com
- テクノロジー
- 2024/04/19
LLM（大規模言語モデル）単体ではなく、複数のLLMに検索システムなどを組み合わせた「複合AI（人工知能）システム」がこれからの主流になる――。そう指摘するのは、データ分析基盤を提供する米Databricks（データブリックス）の共同創業者、Matei Zaharia（マテイ・ザハリア）CTO（最高技術責任者）だ。ザハリアCTOはカリフォルニア大学バークレー校（UCバークレー）の博士課程に在籍していた2009年に、ビッグデータ分析のオープンソースソフトウエア（OSS）である「Apache Spark」の開発プロジェクトを始めたことで知られる。データブリックスはSparkをベースにしたデータ分析基盤を提供するスタートアップで、ザハリアCTOは今もUCバークレーの准教授を務める。複合AIシステム（Compound AI Systems）とは2024年2月に、ザハリアCTOがUCバークレーの
Meta、“オープンソースの”LLM「Llama」ダウンロードが3億5000万に
- 6 users
- www.itmedia.co.jp
- テクノロジー
- 2024/08/30
米Metaは8月29日（現地時間）、“オープンソース”を謳うLLM「Llama」のHugging Faceでの累計ダウンロード数が3億5000万回に迫っていると発表した。前年同時期の10倍以上であり、Llama 3.1をリリースした7月だけでも2000万回ダウンロードされたとしている。今年の1月から7月にかけて、大手クラウドサービスプロバイダー（AWS、Microsoft Azure、Databricks、Dell、Google Cloud、NVIDIA、IBM、Groq、Snowflakeなど）の一部では、Llamaの月間使用量が10倍に増加し、5月から7月にかけては、ホストされているLlamaの使用トークン量が2倍以上に増加した。 Metaは、「Llamaの成功は、オープンソースの力によって実現された」と語る。同社はLlamaに独自のライセンスを付しており、例えば月間アクティブユーザ
- Meta
- AI
LLMでSnowflakeのSQLを最適化、クラウド費用を最大8割削減するEspresso AIが登場——シードで1,100万米ドル調達も - BRIDGE（ブリッジ）テクノロジー＆スタートアップ情報
- 6 users
- thebridge.jp
- テクノロジー
- 2024/05/12
LLMでSnowflakeのSQLを最適化、クラウド費用を最大8割削減するEspresso AIが登場——シードで1,100万米ドル調達も Image credit: Espresso AI シリコンバレーの AI スタートアップ Espresso AI は、現在企業コンピューティングにおけるおそらく最大の課題であるクラウドコストの高騰抑制に AI の力を導入するため、1,100万米ドル以上のシード資金を調達した。この資金調達には、Daniel Gross（ダニエル・グロス）氏と Nat Friedman（ナット・フリードマン）氏がリードしたシードラウンドと、FirstMark の Matt Turck 氏がリードしたプレシードラウンドがあり、業界のリーダーたちも参加している。 7日にステルス状態から抜け出した同社は、高度な言語モデルと機械学習を使ってコードを自動的に最適化し、クラウドの計