並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 122件

新着順 人気順

Databricksの検索結果41 - 80 件 / 122件

  • PythonのData Appsフレームワーク Streamlit, Dash, Panel を比較(With ChatGPT) - Qiita

    PythonのData Appsフレームワーク Streamlit, Dash, Panel を比較(With ChatGPT)PythonDashPanelStreamlitChatGPT 皆さん、こんにちは!Python Advent Calender2023の6日目担当の小川英幸(X: ogawahideyuki)です。 データから洞察を得る過程で、その発見を他の人と共有し、さらなるインサイトを得ることは非常に価値があります。そのような役割を検討した際に、既存のツールでは物足りない一方、「アプリを一から作るのは大変だな…」と感じたことはありませんか? ここで登場するのがData Appsです。Pythonだけで手軽にデータアプリを作成できるこれらのツールは、データ分析者にとって強力な味方。特にStreamlit、Dash、Panelを、簡単に使えるフレームワークとして、私は注目し、活

      PythonのData Appsフレームワーク Streamlit, Dash, Panel を比較(With ChatGPT) - Qiita
    • Developer eXperience Day 2024【参加無料・アーカイブ配信あり】|EventRegist(イベントレジスト)

      2024年7月16日(月)と17日(火)の2日間にわたり「Developer eXperience Day 2024」(一般社団法人 日本CTO協会主催)を、オフライン・オンラインのハイブリッド形式で開催いたします。 【参加無料・アーカイブ配信あり】です。ぜひご参加ください! 開催概要 名称:Developer eXperience Day 2024 開催日:2024年7月16日(火)・17日(水) 開催形式:オフライン(現地参加)・オンライン配信 会場:浅草橋ヒューリックホール&カンファレンス アクセス:https://hulic-hall.com/access/ JR総武線「浅草橋駅(西口)」より徒歩1分 参加方法:事前申込制(参加費:無料) 申込サイト:本イベントサイトよりお申込みください 参加対象: ソフトウェア開発の第一線で挑戦するエンジニアをはじめ、テックリード、エンジニアリン

        Developer eXperience Day 2024【参加無料・アーカイブ配信あり】|EventRegist(イベントレジスト)
      • Open Source AI Is the Path Forward | Meta

        In the early days of high-performance computing, the major tech companies of the day each invested heavily in developing their own closed source versions of Unix. It was hard to imagine at the time that any other approach could develop such advanced software. Eventually though, open source Linux gained popularity – initially because it allowed developers to modify its code however they wanted and

          Open Source AI Is the Path Forward | Meta
        • Meta、「Llama」を「国家防衛のために米政府機関に提供している」

          米Metaは11月4日(現地時間)、“オープンな”LLM「Llama」シリーズを「防衛および国家安全保障アプリケーションに取り組んでいる機関を含む米国政府機関」に提供していると発表した。 Llamaを政府機関に提供するために、Accenture、AWS、Anduril、Booz Allen、Databricks、Deloitte、IBM、Leidos、Lockheed Martin、Microsoft、Oracle、Palantir、Scale AI、Snowflakeなどの企業と提携している。 例えば、Lockheed Martinは、コードの生成などのユースケースで防衛分野の顧客にLlamaを提供しているという。 Llama 3の利用規約では、「軍事、戦争、核産業または応用、スパイ活動、米国国務省が管理する国際武器取引規則(ITAR)の対象となる材料または活動での使用」を禁じている。

            Meta、「Llama」を「国家防衛のために米政府機関に提供している」
          • CS大学生のアメリカ就活失敗体験記|Yuki

            はじめに留学前に目指していたアメリカ・シリコンバレーでのSoftware Engineer就活は失敗に終わりました。しかしながら、もう一度大学1年生に戻ることができるなら、そこそこ上手くいく自信があるので、私の経験を反面教師としていただければ幸いです。 また、当初の目標は達成できなかったものの、アメリカの日系企業の内定、日本の外資系企業から内定を獲得し、納得のいく結果となったので、海外就活時の併願先選びの参考になればと思います。 追記: 私はOPT3年有、GC/国籍は無です。一般的なCS専攻留学生です。 自己紹介私はカリフォルニア州立大学でComputer Scienceを専攻していました。高校時代はプログラミングも英語もできませんでしたが、自分を変えたいという思いと、シリコンバレーで働きたいという夢を持ち、海外の大学を目指しました。 コミュニティカレッジから4年制大学への編入ルートを選び

              CS大学生のアメリカ就活失敗体験記|Yuki
            • Introducing Llama 3.1: Our most capable models to date

              Meta is committed to openly accessible AI. Read Mark Zuckerberg’s letter detailing why open source is good for developers, good for Meta, and good for the world.Bringing open intelligence to all, our latest models expand context length to 128K, add support across eight languages, and include Llama 3.1 405B—the first frontier-level open source AI model.Llama 3.1 405B is in a class of its own, with

                Introducing Llama 3.1: Our most capable models to date
              • S3+Athena構成の弊社データ基盤の限界が近い - Qiita

                こちらのアドベントカレンダーの記事です。 近々書くような気がするので、先駆けてアドベントカレンダー駆動で書いていきます。 スタートアップのデータ基盤に興味がある人には刺さるかもしれません。 TL;DR 2020年に構築した弊社のS3+Athena構成のデータ基盤の限界が近い 構築当時に比べてデータ基盤の選択肢色々増えて嬉しい 2024/1~3にかけてSnowflake or Redshift Serverlessの検証をします 現在のデータ基盤の構成 タイトルの通りS3 + Athenaを中心にAWSの細かいサービスを使っています 使用技術 S3 Athena Glue GlueETLは費用の面で使わず他のサービスを組み合わせる形で内製 Firehose Lambda(Python) Codebuild Step Functions / EventBridge ECS on Embulk

                  S3+Athena構成の弊社データ基盤の限界が近い - Qiita
                • Introducing DBRX: A New State-of-the-Art Open LLM

                  Unified governance for all data, analytics and AI assets

                    Introducing DBRX: A New State-of-the-Art Open LLM
                  • RAG (Retrieval Augmented Generation) を活用!LLMで外部データを参照する方法を解説 | 株式会社ARISE analytics(アライズ アナリティクス)

                    Tweet RAG (Retrieval Augmented Generation) を活用!LLMで外部データを参照する方法を解説 はじめに はじめまして、DX Technology Unitの芹澤です。普段はAI関連技術を用いた研究開発に携わっています。 昨今、ChatGPTを初めとした大規模言語モデル (Large Language Model; 以下LLM) が話題になっており、様々な質問に対して非常に優れたアウトプットが得られるようになりました。一方、LLMを企業で使用する場合、社内特有のデータを参照する必要があるため、社内特化LLMシステムを構築することが必須となります。 弊社では、社内の業務効率化を目的とした生成AIの活用を促進する「生成AIプロジェクト」が立ち上がり、ChatGPTをはじめとしたLLMの検証作業を進めています。その中で生成AIが社内情報を参照できるようにする

                      RAG (Retrieval Augmented Generation) を活用!LLMで外部データを参照する方法を解説 | 株式会社ARISE analytics(アライズ アナリティクス)
                    • 革新的ソフトウェアの初期投資家に聞く、これからのSaaS企業──Kleiner Perkins・Mamoon Hamidインタビュー

                      ALL STAR SAAS FUNDのメールマガジン「ALL STAR SAAS NEWSLETTER」購読登録受付中ALL STAR SAAS FUNDがお届けする 最新SaaSニュース、ブログ記事情報を配信するSaaS業界にいる方は必見のメールマガジン! この2年間、株式市場でSaaS企業の株価は大きく変動し、高いマルチプルを維持しているSaaSと、マルチプルが低下するSaaSが混在するようになりました。利益を優先するSaaSもあれば、大型調達を実施するSaaSもあり、マーケットは激しく変化し続けています。 米国の投資領域において第一線で活動を続けるベンチャーキャピタルは、この状況をどう見ているのでしょうか。今回、Box、Rippling、Figmaなど著名なSaaS企業への投資実績をもつ「Kleiner Perkins」のPartner Mamoon Hamidさんに『減速するSaa

                        革新的ソフトウェアの初期投資家に聞く、これからのSaaS企業──Kleiner Perkins・Mamoon Hamidインタビュー
                      • Adobe Summit 2024において画像生成AI「Firefly」のアップデートや新たなイノベーションの発表が行われる

                        Adobeが2024年3月26日から27日にかけて開催しているデジタルエクスペリエンスカンファレンス「Adobe Summit 2024」において「Adobe Experience Platform AI Assistant」「Federated Audience Composition」「Adobe Real-Time Customer Data Platform (CDP) Collaboration」という3つのイノベーションを発表しました。また、画像生成AIの「Firefly」でもアップデートが行われています。 Adobe Summit 2024: Unveiling the future of Customer Experience Management (CXM) in the age of Gen AI | Adobe Blog https://blog.adobe.com/

                          Adobe Summit 2024において画像生成AI「Firefly」のアップデートや新たなイノベーションの発表が行われる
                        • 48個の LLM を用いた Instruction データセットの品質スコアリング - Qiita

                          LLM Advent Calendar 2023について こんにちは、LLM Advent Calendar 2023を企画しましたkunishouです。今年も気づけばあっという間に12月ですが皆さんいかがお過ごしでしょうか?ちょうど1年と1日前の2022年11月30日にChatGPTが世界に公開されたのは記憶に新しいですが、それを皮切りに世の中の機械学習/自然言語処理周りの技術トレンドも大きく変化した1年だったと感じました。私はちょうど1年ほど前に「オープンソースAIを用いた音声対話ロボットの作成」というBERTと音声対話する内容の記事を投稿しましたが1年経ち改めて読み返すとかなり陳腐な内容に見えてしまい、技術の進歩の速さに非常に驚いています。実際、技術の進歩は早く、この1年はLLM(Large Language Model)に関連する新しい技術や日本語対応したLLMが日々公開され、常に

                            48個の LLM を用いた Instruction データセットの品質スコアリング - Qiita
                          • 2024年におけるソフトウェアエンジニアの就職戦略|gaijineers

                            2023年は転職したい方にとって大変な一年でしたが、全く無理なわけではなかったです。私の周りでは、メルカリやSmartNewsのような国内の企業はもちろん、IndeedやGoogleやAppleなどの外国の大手テクノロジー企業からもオファーを受けた人もいました。さらに、GitHubやDatabricksなどの企業も、日本でソフトウェアエンジニアを募集しており、そこで内定をもらった人もいました。 2023年に続いて、2024年も転職は厳しい状況が続くと考えられますが人生は前に進めないといけないので2024は絶対転職を考えている方のためにトレンド(予測)、面接対策や応募戦略をまとめました。 これだけ読んでも転職は成功しないのでなるべくどうするか(アクションアイテム)を書いておきます。 外資ビックテック外資系企業への転職は、以下のような理由から難易度が高くなるでしょう。 レイオフが続いており、安

                              2024年におけるソフトウェアエンジニアの就職戦略|gaijineers
                            • LLMは「複合AIシステム」へ進化する、データブリックスCTOの主張を読み解く

                              LLM(大規模言語モデル)単体ではなく、複数のLLMに検索システムなどを組み合わせた「複合AI(人工知能)システム」がこれからの主流になる――。そう指摘するのは、データ分析基盤を提供する米Databricks(データブリックス)の共同創業者、Matei Zaharia(マテイ・ザハリア)CTO(最高技術責任者)だ。 ザハリアCTOはカリフォルニア大学バークレー校(UCバークレー)の博士課程に在籍していた2009年に、ビッグデータ分析のオープンソースソフトウエア(OSS)である「Apache Spark」の開発プロジェクトを始めたことで知られる。データブリックスはSparkをベースにしたデータ分析基盤を提供するスタートアップで、ザハリアCTOは今もUCバークレーの准教授を務める。 複合AIシステム(Compound AI Systems)とは2024年2月に、ザハリアCTOがUCバークレーの

                                LLMは「複合AIシステム」へ進化する、データブリックスCTOの主張を読み解く
                              • Introducing GPT-4o: OpenAI’s new flagship multimodal model now in preview on Azure | Microsoft Azure Blog

                                Products Popular View all products (200+) Azure Virtual Machines Azure Virtual Desktop Azure SQL Microsoft Copilot in Azure PREVIEW Azure AI Services Azure AI Studio Azure Cosmos DB Azure Kubernetes Service (AKS) Azure Arc​ Azure Migrate AI + machine learning Azure Machine Learning Azure AI Services Microsoft Copilot in Azure PREVIEW Azure OpenAI Service Azure AI Studio Azure AI Vision Azure AI Se

                                  Introducing GPT-4o: OpenAI’s new flagship multimodal model now in preview on Azure | Microsoft Azure Blog
                                • 強化学習でポケモンをプレイする - Qiita

                                  久しぶりのQiita投稿です.現在,三菱UFJフィナンシャル・グループの戦略子会社であるJapan Digital Design株式会社でリサーチャーをしています.こちらは,Japan Digital Design Advent Calendar 2023 の7日目の記事になります! 本記事では,「強化学習を使ってポケモンをプレイする動画」についてご紹介させていただきます! ※ 動画内容の切り抜き利用につきましては,Peter Whidden氏の許可を頂いております. ※ 本記事では,ポケモンをプレイするための技術を解説していきますが,動画で見た方が面白いので,ご興味のある方はぜひご覧になってみてください! 導入 みなさま強化学習(reinforcement learning)をご存知でしょうか? 強化学習とは,機械学習の手法1つで,エージェント(AI)が環境とのやり取りを通じながら,累積

                                    強化学習でポケモンをプレイする - Qiita
                                  • LLMでSnowflakeのSQLを最適化、クラウド費用を最大8割削減するEspresso AIが登場——シードで1,100万米ドル調達も - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                                    Image credit: Espresso AI シリコンバレーの AI スタートアップ Espresso AI は、現在企業コンピューティングにおけるおそらく最大の課題であるクラウドコストの高騰抑制に AI の力を導入するため、1,100万米ドル以上のシード資金を調達した。この資金調達には、Daniel Gross(ダニエル・グロス)氏と Nat Friedman(ナット・フリードマン)氏がリードしたシードラウンドと、FirstMark の Matt Turck 氏がリードしたプレシードラウンドがあり、業界のリーダーたちも参加している。 7日にステルス状態から抜け出した同社は、高度な言語モデルと機械学習を使ってコードを自動的に最適化し、クラウドの計算コストを最大80%削減する技術を開発した。最初の製品は、人気のクラウド・データウェアハウス・プラットフォーム「Snowflake」の SQ

                                      LLMでSnowflakeのSQLを最適化、クラウド費用を最大8割削減するEspresso AIが登場——シードで1,100万米ドル調達も - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                                    • バイセルのテックカンパニーへの変遷、CTOとしての取り組みを振り返る|kyuns /キュン 今村雅幸

                                      約3年ぶりの投稿になります、株式会社BuySell Technologies(以下バイセル)で取締役CTOをしている @kyunsです。 バイセルでのCTO歴も2年半が経ちましたので、この記事ではバイセルのテックカンパニーへの変遷に向けたこれまでの取り組みの紹介をしていきたいと思います。 本記事はバイセルテクノロジーズ Advent Calendar 2023の 25日目の記事となります。 バイセルについてバイセルはグループ各社がそれぞれの強みを活かして、買取から販売まで、幅広い商材を取り扱う総合リユースビジネスを展開しています。 特に出張訪問買取事業は業界最大級の規模で全国展開するバイセルの強みです。出張訪問以外にもバイセルグループ全体で全国200店舗以上を運営しています。 売上規模は400億円を超え、グループ全体の従業員は1400名以上になります。 バイセルグループの事業概要全国200

                                        バイセルのテックカンパニーへの変遷、CTOとしての取り組みを振り返る|kyuns /キュン 今村雅幸
                                      • Software Design 2024年10月号

                                        第1特集 再考 設計ドキュメントの課題 二重管理しない,陳腐化させない ITエンジニアにとってドキュメントは悩ましい問題です。関係者との合意形成や情報共有のために必要なものの,コードができあがってくると,コードと同期をとって保守しなければならない気が重い存在となります。世の中には,「ドキュメントはなくせない」とする現場がある一方で,「エンジニアならコードを読めばいい」とする現場もあります。ドキュメントを作る/作らないどちらにも利点と欠点がありますが,それぞれの現場ではどのように利点を活かし,欠点を補っているのでしょう? 本特集では,いくつかの開発現場におけるドキュメントとの付き合い方を紹介します。ご自身の現場に合ったドキュメントとの付き合い方を見つけられるかもしれません。 ※IT業界にはさまざまなドキュメントがありますが,今回の特集では,主にソフトウェアの開発者が作る/見る設計ドキュメント

                                          Software Design 2024年10月号
                                        • 『みんなの考えた最強のデータアーキテクチャ’24新春-最新版SP!』レポートを参加者の皆さんのX投稿でまとめてみた #datatechjp | DevelopersIO

                                          『みんなの考えた最強のデータアーキテクチャ’24新春-最新版SP!』レポートを参加者の皆さんのX投稿でまとめてみた #datatechjp アライアンス事業部 エンジニアグループ モダンデータスタック(MDS)チームの しんや です。 前回開催されて非常に大きな評判だった「みんなの考えた最強のデータアーキテクチャ」の2024年版イベント『』が2024年01月16日、開催されました。 2023年開催のイベント内容はこちらをご参照ください。 イベント全体としては非常に聴き応えのある内容だったのですが、イベントのアーカイブ(録画)なし/前半のLTのメモを取り切る体力と瞬発力が無かった(体力の衰えが...)/後半のパネルディスカッションも内容が濃すぎて名言連発しており、それら名言を取り上げるだけでもイベントの良さや内容が伝わるかな、とも思い参加者の皆様のX投稿で気になったものをピックアップする形で

                                            『みんなの考えた最強のデータアーキテクチャ’24新春-最新版SP!』レポートを参加者の皆さんのX投稿でまとめてみた #datatechjp | DevelopersIO
                                          • オールインワンAI/機械学習プラットフォーム「Dataiku」のSaaS版「Dataiku Cloud」の取り扱いを開始 | NTTデータ先端技術株式会社

                                            NTTデータ先端技術株式会社(本社:東京都中央区、代表取締役社長:藤原 遠、以下:NTTデータ先端技術)は2024年2月13日より、オールインワンAI/機械学習プラットフォーム「Dataiku」のSaaS版である「Dataiku Cloud」の取り扱いを開始しました。 これまでNTTデータ先端技術は、「Dataiku」のクラウドインストール版、オンプレミスインストール版を提供してきました。今回、新たなラインナップとしてSaaS版の「Dataiku Cloud」の取り扱いを開始し、お客様の初期構築期間をこれまでよりも大幅に短縮し、最新のデータを迅速に活用開始いただけるようになります。AI/機械学習のフルマネージド・AIプラットフォームサービスとして、お客様のAI活用、アナリティクスによる洞察を加速させます。今後は、「Dataiku Cloud」も含めた3つのプランから、お客様のビジネス状況に

                                              オールインワンAI/機械学習プラットフォーム「Dataiku」のSaaS版「Dataiku Cloud」の取り扱いを開始 | NTTデータ先端技術株式会社
                                            • New models added to the Phi-3 family, available on Microsoft Azure | Microsoft Azure Blog

                                              Products Popular View all products (200+) Azure Virtual Machines Azure Virtual Desktop Azure SQL Microsoft Copilot in Azure PREVIEW Azure AI Services Azure AI Studio Azure Cosmos DB Azure Kubernetes Service (AKS) Azure Arc​ Azure Migrate AI + machine learning Azure Machine Learning Azure AI Services Microsoft Copilot in Azure PREVIEW Azure OpenAI Service Azure AI Studio Azure AI Vision Azure AI Se

                                                New models added to the Phi-3 family, available on Microsoft Azure | Microsoft Azure Blog
                                              • GGUFって結局どのサイズ選んだらいいの??

                                                検証内容 llama.cppのGGUFフォーマットについて量子化サイズ、手法での精度の変化を確認する 変換、量子化にはb3369のReleaseを使用 変換するモデルはtokyotech-llm/Llama-3-Swallow-8B-Instruct-v0.1 評価対象は次の84種類 Model CardのUsageに沿ってvllmで実行したfloat32(そのままをoriginal、system promptに日本語で回答する指示を加えたものをoriginal_ja) safetensors -> GGUFに変換したF32とF16のGGUF Q8_0からQ2_Kまでのimatrixを必要としない14種類の量子化GGUF Q6_KからIQ1_Sまでのimatrixを使用できるor必要とする22種類の量子化GGUF (4についてはimatrix作成のためのデータを3種類用意しそれぞれに22種

                                                  GGUFって結局どのサイズ選んだらいいの??
                                                • ベストプラクティス: AWS によるオブザーバビリティの実装 | Amazon Web Services

                                                  Amazon Web Services ブログ ベストプラクティス: AWS によるオブザーバビリティの実装 お客様は、クラウドベースのソリューションを導入する際に、システムが円滑に稼働していることを確認し、問題が発生したときに迅速に修正できるようにする必要があります。しかし、オブザーバビリティを特に企業間をまたがって数十から数百のサービスが関わるような大規模に展開することは、簡単にはいかない場合があります。そのため、お客様はベストプラクティスの推奨事項、ツールの選択に関するガイダンス、そして最も重要な、オブザーバビリティを開始するための段階的なプロセスを求めています。AWS での堅牢なオブザーバビリティ戦略を実装するプロセスを簡素化するために、ベストプラクティスガイドをまとめました。この記事では、ガイドで取り上げられているトピック、ガイドの活用方法、およびガイドへ貢献する方法について説明

                                                    ベストプラクティス: AWS によるオブザーバビリティの実装 | Amazon Web Services
                                                  • The Shift from Models to Compound AI Systems

                                                    AI caught everyone’s attention in 2023 with Large Language Models (LLMs) that can be instructed to perform general tasks, such as translation or coding, just by prompting. This naturally led to an intense focus on models as the primary ingredient in AI application development, with everyone wondering what capabilities new LLMs will bring. As more developers begin to build using LLMs, however, we b

                                                      The Shift from Models to Compound AI Systems
                                                    • LLMOpsを推進!Azure Log Analyticsを活用したLLMの継続的な監視と改善 - AITC - ISID | AI トランスフォーメンションセンター コラム

                                                      こんにちは!AIソリューショングループの太田です。 このコラムでは、Azure Log Analyticsを使ったLLMOpsの実現方法について紹介します。 昨年から大規模言語モデル(LLM)を製品やサービスに組み込む企業が増えています。 しかし、LLMサービスの品質を維持するには、その運用にも注意を払う必要があります。 具体的には、LLMの出力の品質管理や、ユーザーからのフィードバックを元にしたプロンプトの最適化など、継続的な監視と改善が求められています。 これらの運用上の活動にAzure Log Analyticsが役立ちます。 LLMOps(LLM(Large Language Model)+ Ops(Operations))とは LLMOpsは製品に組み込まれたLLMの運用に必要なベストプラクティスの概念を指します。 例えば、LLMの運用ではLLMの出力の監視と評価とプロンプト管理

                                                        LLMOpsを推進!Azure Log Analyticsを活用したLLMの継続的な監視と改善 - AITC - ISID | AI トランスフォーメンションセンター コラム
                                                      • AWS Glue × Apache Iceberg で構築する更新可能なデータレイクテーブル

                                                        こんにちは。シンプルフォーム株式会社 にてインフラエンジニアをしています、山岸です。 社内向けに運用しているデータ分析基盤について現状抱えているいくつかの課題を克服すべく、最近は更改に向けた検証に取り組んでいます。今回は取り組みの一つである「AWS Glue と Apache Iceberg によるデータレイクテーブル構築」についてご紹介したいと思います。 概要 当社ではデータ分析基盤の ETL 処理に AWS Glue を使用しています。社内のデータ分析業務等のため、RDS データベース等のデータソースから日次で S3 上に構築された DWH に連携しています。 現行のデータ分析基盤では、DB テーブル上のデータを毎日全件洗い替えています。このような処理方法は ETL 実装や問題発生時の復旧が簡単である一方、ETL 処理のコスト効率が悪く、データ量の増加に伴って処理時間も長くなっていきま

                                                          AWS Glue × Apache Iceberg で構築する更新可能なデータレイクテーブル
                                                        • Meta、“オープンソースの”LLM「Llama」ダウンロードが3億5000万に

                                                          米Metaは8月29日(現地時間)、“オープンソース”を謳うLLM「Llama」のHugging Faceでの累計ダウンロード数が3億5000万回に迫っていると発表した。前年同時期の10倍以上であり、Llama 3.1をリリースした7月だけでも2000万回ダウンロードされたとしている。 今年の1月から7月にかけて、大手クラウドサービスプロバイダー(AWS、Microsoft Azure、Databricks、Dell、Google Cloud、NVIDIA、IBM、Groq、Snowflakeなど)の一部では、Llamaの月間使用量が10倍に増加し、5月から7月にかけては、ホストされているLlamaの使用トークン量が2倍以上に増加した。 Metaは、「Llamaの成功は、オープンソースの力によって実現された」と語る。同社はLlamaに独自のライセンスを付しており、例えば月間アクティブユーザ

                                                            Meta、“オープンソースの”LLM「Llama」ダウンロードが3億5000万に
                                                          • メダリオンアーキテクチャ

                                                            メダリオンアーキテクチャとはメダリオンアーキテクチャとは、レイクハウスのデータを論理的に整理するために用いられるデータ設計を意味します。データがアーキテクチャの 3 つのレイヤー(ブロンズ → シルバー → ゴールドのテーブル)を流れる際に、データの構造と品質を増分的かつ漸次的に向上させることを目的としています。メダリオンアーキテクチャは、「マルチホップ」アーキテクチャとも呼ばれます。 レイクハウスアーキテクチャのメリットシンプルなデータモデルわかりやすく、導入が容易増分 ETL が可能未加工データからのテーブル再作成がいつでも可能ACID トランザクション、タイムトラベルレイクハウスとはレイクハウスは、データレイクとデータウェアハウスの優れた要素を取り入れた新しいデータプラットフォームアーキテクチャです。モダンレイクハウスは、拡張性と性能に優れたデータプラットフォームです。未加工データと

                                                              メダリオンアーキテクチャ
                                                            • NVIDIAのGPUはコモディティー化するか、快進撃の裏でよみがえる「Ciscoの悪夢」

                                                              時価総額が2.6兆ドル(約410兆円)を超え、2.9兆ドルで世界2位の米Apple(アップル)の背中が見えてきた米NVIDIA(エヌビディア)。エヌビディアの専売特許であるGPU(画像処理半導体)の今後を占う連載の第2回は、2つめの死角「コモディティー化」の可能性を検討する。 GPUにとって2つめの死角は低価格化だ。コモディティー化ともいえる。市場参入時には高付加価値を持っていた製品が、市場の活性化や競合の出現などによって他の製品との機能・サービスの差がなくなり、価格競争を余儀なくされる状態を指す。 例えば2010年代に日系電機メーカーが苦しんだ薄型テレビはその典型だろう。当時、売れ筋だった40インチの薄型テレビの店頭実売価格は2009年には14万円程度だったが、3年後の2012年には6万円台と半額以下になった。「3年で半額」という法則はDVDやブルーレイディスクのレコーダーにも当てはまっ

                                                                NVIDIAのGPUはコモディティー化するか、快進撃の裏でよみがえる「Ciscoの悪夢」
                                                              • [レポート] クラスメソッドxメソドロジック共催:イチから始めるデータ活用!『データメッシュによるデータガバナンス編』を開催しました。 | DevelopersIO

                                                                [レポート] クラスメソッドxメソドロジック共催:イチから始めるデータ活用!『データメッシュによるデータガバナンス編』を開催しました。 アライアンス事業部 エンジニアグループ モダンデータスタック(MDS)チームのしんやです。 先日2024年02月20日(火)、クラスメソッド株式会社と株式会社メソドロジックの共催イベント『【毎週開催】メソドロジック社共催!イチから始めるデータ活用!8週連続ウェビナー』の第1回開催回である『データメッシュによるデータガバナンス編』を開催しました。 当エントリではその内容についてレポート致します。 目次 イベント概要 イベントレポート データ活用支援サービスのご紹介 イチから学ぶデータメッシュによるデータガバナンス 全体質疑応答 まとめ イベント概要 第1回目となる今回取り扱うテーマは『データメッシュによるデータガバナンス』です。 イベントレポート データ活用

                                                                  [レポート] クラスメソッドxメソドロジック共催:イチから始めるデータ活用!『データメッシュによるデータガバナンス編』を開催しました。 | DevelopersIO
                                                                • Introduction to Zig: a project-based book

                                                                  Welcome Welcome! This is the initial page for the “Open Access” HTML version of the book “Introduction to Zig: a project-based book”, written by Pedro Duarte Faria. This is an open book that provides an introduction to the Zig programming language, which is a new general-purpose, and low-level language for building robust and optimal software. About this book This an open book, meaning that, it is

                                                                  • IT部門の「パンク寸前」問題 さらに拍車を掛ける“あのブーム”

                                                                    従業員のスキル格差やコンプライアンス問題、データのサイロ化問題が企業のモダナイゼーションを遅らせている。さらに最近起きたあるブームによって、IT部門の悩みはさらに深刻化している。 Salesforce傘下の統合ソフトウェアベンダーであるMulesoftによると、2023年におけるIT部門によるプロジェクトリクエストは前年比で39%増加したという。これは同社が2024年1月23日に発表した、年次接続性ベンチマークレポートのための調査(技術系意思決定者1050人が対象)に基づいている(注1)。 「データ統合」「人材不足」問題をさらに悪化させる“あのブーム” 従業員のスキル格差とコンプライアンスへの懸念によって、モダイナイゼーションの進捗(しんちょく)が遅れていることが調査で明らかになった。5人のうち4人の回答者が「サイロ化したデータがDX(デジタルトランスフォーメーション)の妨げになっている」

                                                                      IT部門の「パンク寸前」問題 さらに拍車を掛ける“あのブーム”
                                                                    • Software Design 2024年5月号

                                                                      2024年4月18日紙版発売 2024年4月18日電子版発売 B5判/192ページ 定価1,562円(本体1,420円+税10%) Amazon 楽天ブックス ヨドバシ.com Fujisan(定期購読のみ) 電子版 Gihyo Digital Publishing Amazon Kindle 本書のサポートページサンプルファイルのダウンロードや正誤表など 第1特集 型を制する者はTypeScriptを制す もっとTypeScriptの力を引き出そう TypeScriptは大規模開発を目的として,静的型付けの機能を中心にJavaScriptを拡張した言語だと言われています。ですが,TypeScriptの型システムが秘めている力はそれにとどまりません。 本特集では,TypeScriptにおける型の扱い方を基礎から解説し,TypeScriptを本格的に使ううえで避けて通れないUnion型,構造

                                                                        Software Design 2024年5月号
                                                                      • 海外進学→現地就職→転職帰国→転職→レイオフ

                                                                        Findy社が2024/3/6に主催したイベント「元CircleCI Databricks PagerDutyのエンジニアに聞く外資系への挑戦とリアル」https://findy.connpass.com/event/310652/ における登壇者 宇佐美ゆう のLT資料です。 タイトル: 海外進…

                                                                          海外進学→現地就職→転職帰国→転職→レイオフ
                                                                        • [速報]AWS Trainium 2が発表されました #AWSreinvent | DevelopersIO

                                                                          せーのでございます。 ただいま、AWS re:Invent 2023 keynoteをラスベガス現地にて聞いております。 AWSより新しい機械学習用のアクセラレータ「AWS Trainium 2」が発表されたので速報でお伝えいたします。 Trainiumとは AWS Trainiumは、AWSが100B以上のパラメータモデルのディープラーニングトレーニングのために構築した第二世代の機械学習(ML)アクセラレータです。 機械学習の学習用にカスタマイズされており、Trainiumを搭載したEC2インスタンスをデータのトレーニングに使うことで低コストでハイパフォーマンスを得ることができます。 AWSは学習用のTrainiumと推論用のInferenciaがあり、機械学習のトレーニング、推論ともに自由度の高いリソースを提供しています。 Trainium2 今回発表されたTrainium2は従来のT

                                                                            [速報]AWS Trainium 2が発表されました #AWSreinvent | DevelopersIO
                                                                          • AWS Unveils Next Generation AWS-Designed Chips

                                                                            AWS Graviton4 is the most powerful and energy-efficient AWS processor to date for a broad range of cloud workloads AWS Trainium2 will power the highest performance compute on AWS for training foundation models faster and at a lower cost, while using less energy Anthropic, Databricks, Datadog, Epic, Honeycomb, and SAP among customers using new AWS-designed chips LAS VEGAS--(BUSINESS WIRE)-- At AWS

                                                                              AWS Unveils Next Generation AWS-Designed Chips
                                                                            • ChatGPTがユーザーを“騙す”のはなぜ? 「プレッシャーに弱いから」説が登場

                                                                              2023年11~12月にかけて、SNSであるうわさが流れた。OpenAIが提供する生成AI「ChatGPT」は「早めの休暇を取った」というのだ。ユーザーが投げかける質問に簡略化された回答を生成したり、一部のタスクを拒否したりしているといった報告が相次ぐ中、その理由を探る試みが続いている。 OpenAIも認めた“怠惰”説 ChatGPTは「冬休み」に入ったのか? ペンシルバニア大学ウォートンスクールのイーサン・モリック准教授は2023年11月28日(現地時間、以下同じ)、「ChatGPTが怠惰になったといううわさは、私が個人的に実施した検証によると、本当である可能性がある」と「X」(旧「Twitter」)に投稿した(注1)。 モリック准教授はXに一連の検証結果を投稿した。同教授によると、ChatGPTはユーザーに指示されたタスクの内容は理解しているものの、ユーザー自身がその作業を実行するよう

                                                                                ChatGPTがユーザーを“騙す”のはなぜ? 「プレッシャーに弱いから」説が登場
                                                                              • 効率的なデータ運用の鍵、データオーケストレーションとは何か | gihyo.jp

                                                                                データオーケストレーションという言葉を聞いたことがあるでしょうか?データマネジメントにおいて重要な役割を担う概念であり、Future Market Insights社によれば、世界のデータオーケストレーションツール市場は2024年には13億米ドル、2034年までに43億米ドルに成長するとも予測されています(Future Market Insights発表⁠)⁠。 本記事では、データオーケストレーションという言葉にあまり馴染みがない人に向けて、データオーケストレーションとは何か、その意義、よく課題となることについて説明し、そして実践するためのツールやサービスとその導入事例を紹介できればと思います。 データオーケストレーションとは? オーケストレーションという単語はあまり日常では耳馴染みがないかもしれません。楽団を指すオーケストラという言葉の派生語であり、さまざまな要素を組織化、編成することを

                                                                                  効率的なデータ運用の鍵、データオーケストレーションとは何か | gihyo.jp
                                                                                • Llama 3.2: Revolutionizing edge AI and vision with open, customizable models

                                                                                  Llama 3.2: Revolutionizing edge AI and vision with open, customizable models Today, we’re releasing Llama 3.2, which includes small and medium-sized vision LLMs (11B and 90B), and lightweight, text-only models (1B and 3B) that fit onto edge and mobile devices, including pre-trained and instruction-tuned versions.The Llama 3.2 1B and 3B models support context length of 128K tokens and are state-of-

                                                                                    Llama 3.2: Revolutionizing edge AI and vision with open, customizable models