サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
GPT-4o
thebridge.jp
本日、OpenAIの最高技術責任者(CTO)であるMira Murati(ミラ・ムラティ)氏は、Spring Updatesイベントで、新しい強力なマルチモーダル基礎大規模言語モデル(LLM)であるGPT-4o(GPT-4 Omniの略)を発表した。これは今後数週間で全ての無料ChatGPTユーザーに提供され、MacOS用のChatGPTデスクトップアプリ(後にWindows向けも)も発表された。これにより、ユーザーはウェブやモバイルアプリ外でもアクセス可能になる。 「GPT-4oは音声、テキスト、ビジョンを統合して推論する」とMurati氏は述べた。これは、ChatGPTスマートフォンアプリでユーザーが撮影したリアルタイム動画を受け入れ分析する機能も含まれるが、この機能はまだ一般公開されていない。 「まるで魔法のよう。素晴らしいことですが、私たちはその神秘性を取り除き、みなさんにそれを試
Image credit: Espresso AI シリコンバレーの AI スタートアップ Espresso AI は、現在企業コンピューティングにおけるおそらく最大の課題であるクラウドコストの高騰抑制に AI の力を導入するため、1,100万米ドル以上のシード資金を調達した。この資金調達には、Daniel Gross(ダニエル・グロス)氏と Nat Friedman(ナット・フリードマン)氏がリードしたシードラウンドと、FirstMark の Matt Turck 氏がリードしたプレシードラウンドがあり、業界のリーダーたちも参加している。 7日にステルス状態から抜け出した同社は、高度な言語モデルと機械学習を使ってコードを自動的に最適化し、クラウドの計算コストを最大80%削減する技術を開発した。最初の製品は、人気のクラウド・データウェアハウス・プラットフォーム「Snowflake」の SQ
Credit: Washed Out/YouTube OpenAI は今年初め、リアルで高解像度の滑らかな動画を1クリップ60秒まで作成できる新 AI モデル「Sora」を披露し、テック界やメディア・アート界の多くの人々を驚かせた。 OpenAI は2月時点で、Soraを「危害やリスクのある重要なエリアを評価するレッドチーマー(セキュリティを検証する人々)」、ビジュアルアーティスト、デザイナー、映画制作者の選ばれた少人数に公開すると発表していた。しかし、だからといって、最初のユーザたちが Sora を使って新しいプロジェクトを作り、発表するのを止めることはできない。 現在、OpenAI の厳選された Sora アーリーアクセスユーザの一人で、脚本家兼ディレクターの Paul Trillo(ポール・トリロ)氏は、3月に世界で最初にこのモデルで作られたサードパーティの動画のデモを行ったが、「O
脳インプラントでうつ病を治療し、結果が iPhone に返される? Image Credit: Inner Cosmos 人間の脳に治療デバイスを埋め込む神経技術企業 Inner Cosmos は、同社の神経刺激技術がうつ病の治療に使用できると述べた。 Inner Cosmos の CEO Meron Gribetz 氏は、筆者のインタビューに答え、「ヒトを対象とした臨床試験の初期段階から有望な結果が得られており、治療抵抗性うつ病の治療において重要な一歩を踏み出した」と述べた。 ミズーリ州セントルイスにあるワシントン大学医学部と共同で実施されたこの試験では、Inner Cosmos の新しい神経デバイスの安全性と有効性に関して有望な結果が得られた、と Gribetz CEO は語った。今のところ、数人がこの装置を使用しており、一人はその恩恵を受けている。 この装置は頭蓋骨に埋め込む小さなチ
Credit: Mentee Robotics Mobileye と AI21 Labs の創設者 Amnon Shashua 氏が共同創業したイスラエル拠点の Mentee Robotics が17日、2年に渡る開発作業の成果を明らかにした。それは Menteebot と名付けられたヒューマノイドロボットである。 Menteebot はプロトタイプの段階ではあるが、家庭や倉庫での利用を想定して設計されており、OpenAI の ChatGPT などで普及した大規模言語モデル(LLM)に基づく Transformer を含む AI 技術が、全ての動作レイヤーに渡って活用されている。 同社はこれを、エンドツーエンドでの複雑なタスク遂行が可能な「AI ファースト」のロボットと位置付けている。業界の他プレイヤーは既存製品への AI 活用に取り組んできたのに対し、Mentee Robotics は当
Image credit: Flip ソーシャルコマース企業の Flip は最近、Streamlined Ventures がリードし、広告ソフト会社の AppLovin が参加したシリーズ C ラウンドで1億4,400万米ドルを調達した。 今回の資金調達完了後、Flip の評価額は10.5億米ドルに達し、新たなユニコーンとなった。Amazon や Tiktok の市場価値とはまだ大きな開きがあるが、Flip は消費者に愛され始めており、ソーシャルコミュニティと e コマースの世界を変革させつつある。 Flip のコアコンセプトは「正直」と「真実」である。e コマースは便利だが、地雷を踏みやすいし、ネット上の有名人のコメントは ステマばかりで、お墨付きはもはや品質の保証にはならない。Flip は、消費者が見るべきは、一般人が初めて商品を受け取った時に撮影した開封動画だと考えている。 Fli
テキストベースのチャットボットや「AI ガールフレンド」を作成できる生成 AI プラットフォームが1,600万ドル以上の価値があると考える投資家はいるだろうか。MyShell の投資家はそう考えているようだ。同社は、Dragonfly、Delphi Ventures、Bankless Ventures、Maven11 Capital、Nascent、Nomad Capital、OKX Ventures から1,100万ドルのプレシリーズ A ラウンドを発表したばかりだ。昨年の560万ドルのプレシードに続くもので、これまでの調達総額は1,660万ドルに達した。 シンガポールと東京にクリエイターを抱える MyShell は昨年ステルス状態から登場した。AI キャラクターとユーザー生成型ボット作成プラットフォームや、2024年初頭に発表されたオープンソースの音声クローンモデル OpenVoice
VentureBeat made with Midjourney V6 Amazon(アマゾン)は、人工知能スタートアップの Anthropic(アンスロピック)に追加で27億5000万ドル(訳註:現在の日本円レートで約4,150億円)を投資したことを発表した。これにより、昨年最初に約束した12億5000万ドルと合わせ、総額40億ドルの投資が確定した。 CNBC によると、これは Amazon にとって「最大のベンチャー投資」である。 Amazon Web Services(AWS)の Data and AI 担当バイスプレジデントである Dr. Swami Sivasubramanian(スワミ・シバスブラマニアン)博士は、 Amazon の企業ブログに掲載された声明の中で次のように述べている。 「Anthropic の生成 AI に関する先見の明のある取り組み、特に最近導入された最先端
Groq の LPU Image credit: Groq カリフォルニア州マウンテンビューを拠点とするスタートアップ Groq は、大規模言語モデル(LLM)を迅速かつ効率的に実行するために特別に設計された独自のマイクロチップで AI コミュニティの注目を集めたが、今週さらに波紋を広げている。 同社は1日、スタートアップの Definitive Intelligence の買収と、以前から継続中の両社の協力関係の上に構築された新製品「GroqCloud」を発表した。GroqCloud は、両社が「完全に統合されたドキュメント、コードサンプル、セルフサービスアクセスを備えた開発者の遊び場」と表現している。 大きな売りは AI 推論を実行するための LPU アクセス しかし、GroqCloud の大きな売りは、AI 開発者ユーザが Groq 言語処理ユニット(LPU)推論エンジンにアクセスで
Image credit: Starley <21日15時更新> アプリに搭載されている基本音声の数を修正。 マネーフォワード(東証:3994)出身の丸橋得真氏や内波生一氏らが生成 AI スタートアップ Starley を創業し、プレシードラウンドで古巣であるマネーフォワードから1億円を調達したことは、昨年6月にお伝えした。あれから8ヶ月を経過した21日、同社は AI アプリの「Cotomo」をローンチした。iOS 向けに提供され、アプリストアからダウンロードできる。 Cotomo はユーザとの会話を通じて成長する音声会話アプリだ。雑談や悩み相談など、人間が独りでいる時、誰かといるが会話が煩わしい時などに、気軽に言葉を交わせることでユーザに癒しをもたらすことを意図している。最近の生成 AI のように、インターネット経由で外部から情報取得して応えることはしないが、「一般常識寄りなことであれば
昨日(訳註:原文掲載日は現地時間で22日)、Nvidiaは2024年度第4四半期(2024年1月31日)の売上高を221億ドルと発表し、ウォール街の予想をあっさり上回った。生成AIの爆発的な成長により、収益は前年比265%増となった。 1993年にカリフォルニア州サンノゼのデニーズ・レストランで3人のエンジニアが始めた会社としては悪くない。 私がNvidiaに関する最初の記事を書いたのは1996年、同社がグラフィック・チップを「ウィンドウズ・アクセラレーター」として売り込んでいた頃だ。しかしこの物語はそれよりも早く、Huang(ファン)、Chris Malachowsky(クリス・マラコウスキー)、Curtis Priem(カーティス・プリーム)の3人が共有した「夢」から始まったのだ。 今日、同社の市場価値は1兆6,670億ドルを超え、Microsoft、Apple、Amazon、Goog
LayerX代表取締役の福島良典氏 企業活動のデジタル化を推進するLayerXは2月20日、都内で説明会を開催し、新たなプロダクト戦略を公表した。同社の主力製品である「バクラク」シリーズは請求書処理や経費精算、法人カードなど、企業の費用・支出管理に関するサービスを複数展開するクラウドサービス群。契約社数は1月時点で1万社を超えた。昨年11月時点での取材時に同社代表取締役の福島良典氏が説明した状況では7,000社なので、約2カ月で3,000社が積み上がった形だ。 売上については非公開ながら「T2D3(ARR1億円を超えた後の売上3倍成長を2年継続の上、倍成長を3年継続させるスタートアップ成長モデル)」を超える勢いを維持しているという。今回の説明会では昨年8月に公開した「バクラク請求書発行」に続く製品展開として、新たに独自の生成AIを組み込んだ取り組みが公表された。 生成AIでバクラクは
Image credit: LlamaIndex 大規模言語モデル(LLM)の人気が高まるにつれ、さまざまなデータタイプの特徴を数値表現に圧縮する深層学習システム「エンベディングモデル」にも関心が集まっている。 エンベディングモデルは、企業向けの LLM の重要なアプリケーションの1つである検索拡張世代(RAG)の重要なコンポーネントの1つである。しかし、エンベディングモデルの可能性は、現在の RAG アプリケーションにとどまらない。この1年、エンベディングアプリケーションは目覚ましい進歩を遂げた。 エンベディングの仕組み エンベディングの基本的な考え方は、画像やテキスト文書などのデータの一部を、その最も重要な特徴を表す数値のリストに変換することだ。エンベディングモデルは、異なるタイプのデータを見分けることができる最も関連性の高い特徴を学習するために、大規模なデータセットで学習される。 例
Image credit: Instagram Meta の Mark Zuckerberg(マーク・ザッカーバーグ)CEO は18日、Instagram のサプライズ・リールで、同社がオープンソースの汎用 AI(AGI)を開発していると述べた。 完全な一般知能を構築し、可能な限りオープンソース化することを目標に、FAIR と GenAI という2つの AI 研究チームをより緊密に連携させている。 「私たちの長期的なビジョンは、一般的な知能を構築し、責任を持ってオープンソース化し、誰もが恩恵を受けられるように広く利用できるようにすることです」と Zuckerberg 氏はキャプションに書いている。彼はビデオの中で、「次世代のサービスに必要なのは、完全な一般知能の構築、最高の AI アシスタントの構築、クリエイターのための AI、ビジネスのための AI など、推論から計画、コーディング、記憶
本稿は、フランス・パリを拠点に世界各地のスタートアップへの投資を行っているベンチャー・キャピタリスト Mark Bivens 氏によるものだ。彼は、日本で Shizen Capital(旧 Tachi.ai Ventures)のマネージングディレクターを務める。英語によるオリジナル原稿は、BRIDGE 英語版に掲載している。(過去の寄稿) This guest post is authored by Mark Bivens. Mark is a Paris- / Tokyo-based venture capitalist. He is the Managing Partner of Shizen Capital (formerly known as Tachi.ai Ventures) in Japan. The original English article is available
Image credit: Slack Slack のワークフロー自動化機能がさらに強化された。Salesforce 傘下のワークコミュニケーションプラットフォーム「Slack」は18日、ノーコードの自動化プロセス構築ツール「Workflow Builder」用に数々の新しいサードパーティーコネクタを発表した。 これにより、企業は反復的なタスクやプロセスを自動化する際に、ワークフローに接続する合計65のアプリケーションを利用できるようになる。これには、Dropbox、PagerDuty、Notion、Miro、Asana のような人気のあるエンタープライズツールや、Microsoft Teams Calls、Cisco Webex、Google Meet、Zoom のようなコミュニケーションサービスからの提供も含まれる。 Slack の製品担当 SVP である Rob Seaman 氏は
Accenture の「Technology Vision 2024」とその前身 Image Credit: Accenture Accenture は8日、CES 2024で「Technology Vision 2024」を公開したが、その中で AI が大きな役割を果たしていることは驚くことではない。 このビジョンは、人類とテクノロジーの関係が変曲点を迎える変革的な未来を予測している。テーマは「ヒューマン・バイ・デザイン:AI は人間の可能性をどのように引き出すのか」だ。このビジョンは、テクノロジーが人類に悪影響を及ぼすというディストピア的な描写とは一線を画す、楽観的なものである。Accenture は、今週ラスベガスで開催される「CES 2024」でこの報告書を発表した。 千年後の人間のディストピア写真を見たことがあるだろうか?猫背、浅黒い肌、大きく繊細な目——物理的な世界から切り離さ
Image created by DALL-E / BRIDGE カリフォルニアを拠点とするPerplexity AI は本日(訳註:原文掲載日は現地時間で1月4日)、シリーズ B ラウンドで7,360万ドルを調達したことを明らかにした。同社はAIネイティブの検索エンジンによる知識発見の再発明を目指す創業1年のスタートアップだ。この投資はIVPが実施し、NEA、Databricks、Nvidia、Bessemer Venture Partners、Kindred Venturesが参加している。 注目すべき点はAmazon創設者で元CEOのジェフ・ベゾス氏、元X副社長のElad Gil(エラド・ギル)氏、GitHub CEOのNat Friedman(ナット・フリードマン)氏、Shopify CEOのTobi Lutke(トビ・ルトケ)氏、Vercel 創設者のGuillermo Rauc
Layla の創業者 Jeremy Jauncey(ジェレミー・ジャンシー)氏は、次のように述べている。 Instagram で美しい滝を見て、旅に出たくなる。しかし、その後、旅行プランを完成させるために、さまざまな web サイトでチケットやフライト、宿泊施設を予約しなければならず、それはとても複雑なプロセスだ。 ドイツのスタートアップ Layla は、ソーシャル検索と旅程計画という現在の旅行プランナーの行動を、ジェネレーティブ AI チャットボットと組み合わせることで、ユーザがアプリや公式 Instagram アカウントで、観光スポットの検索から旅程の予約までを一度に行えるようにする。例えば、チャットボットにバルセロナ海岸の観光スポットに関する情報を提供するよう依頼すると、Layla は関連するソーシャル動画を提供し、気に入ったものがあれば、その動画から直接旅行を予約することができる。
Image credit: Relevance AI AI ツールがあっても、明確なプロンプトが出せなければ意味がない。2020年、オーストラリアのスタートアップ Relevance AI は、プロンプトなしで使える AI ツールの解決策を見つけた。 Relevance AI は、文章の要約や動画の文字起こしといった一般的なプロンプトをモジュール化し、中小企業向けにパッケージ化することで、指示を与えたりチームを作ったりといった他のことに気を取られることなく、その場で使用できるようにし、必要なシナリオに AI を適用することに集中できるようにしている。 プロンプトをツールキット化 2023年に開始されたハーバード・ビジネス・スクールの研究によると、ワークフローにジェネレーティブ AI ツールを導入した従業員は、平均的な従業員よりも生産性が40%向上したという。 AI ツールの導入が作業効率を
Image made by DALL-E / BRIDGE 2023年は生成AIと基盤モデルの話題がすべてだった。しかし企業がワークフローにおいて生成AIを真剣に使おうとすればするほど、データ管理を整えることがいかに重要であるかに気付き出したのだ。 企業は常にビジネスの成功における高品質データの役割を理解していたが、生成AIの台頭によってその価値はさらに高まり、誰もがデータに注目するようになった。2024年はさらに大きな生成AIのストーリーが生まれると予想されている。そこで本稿では業界をリードする専門家やベンダーたちに、データ・エコシステムが今後の数カ月でどのように進化するかについて、それぞれの予測を語ってもらった。 1.リレーショナルはSQLから脱却する 最新のエッジ、IoT、または生成AIアプリケーションを活用してビジネスを成長させるにせよ、2024年の企業の大胆な計画には事欠かない。
Image made by DALL-E / BRIDGE・谷に落ちた龍は復活するのでしょうか 新年あけましておめでとうございます!編集部の平野です。旧年中は本誌BRIDGEを読んでいただいてありがとうございました。一昨年より開始しているMembersの方も登録いただいている方の数が8,000名を超えまして、近く1万人の読者コミュニティになる見込みです。Discordの方も3,300名の方にご参加いただいておりまして、いよいよ2024年からは新たな取り組みを開始すべく準備を進めております。 読んでいて楽しい、参加もできるBRIDGEを目指しますのでぜひご期待いただければ幸いです。 さて、タイトルにも記した通り、今年は改めてスタートアップとは何かを考え直す方が増えるのではないかなと考えております。昨年の年始にも、スタートアップの出口戦略の本命でもあるIPOについて次のようにおさらいをしており
Image made by DALL-E / BRIDGE 2023年10月、AppleとColumbia大学の研究者が「Ferret」と呼ばれるオープンソースのマルチモーダルLLMを公開した。 当時、このリリースはコードとパラメーターを含んでいたが、商用ライセンスではなく研究利用のみであったため、あまり注目されなかった。 しかし今、その状況は変わりつつある。 というのもMistralのオープンソースモデルが最近話題に上がり、GoogleのGeminiモデルがPixel Proに搭載され、最終的にはAndroidに搭載される予定であることから、小型デバイスに搭載されるローカルLLMの可能性について期待が高まっているからだ。 そして、だ。 AppleがLLMをiPhoneに搭載する上で重要なブレークスルーを起こしたと発表したため、この話題はさらに大きくなっている。同社は3Dアバターと効率的な
Image Credit : ChatGPT made by BRIDGE Googleがまたやってくれた。検索大手のGoogleは13日、MusicFXを開始した。MusicFXは、ユーザーがAIを使って独自の音楽を生成できる画期的な実験ツールである。このイノベーションは、GoogleのMusicLMとDeepMindの電子透かし技術SynthIDを使用して、出力にユニークなデジタル透かしを作成し、創作の信憑性とソースを保証する。 MusicFXはミュージシャン、プロデューサー、愛好家が音楽を試したり作曲するための新たな可能性を開くもので、AI領域における重要なマイルストーンとなる。しかし、このツールには重要な制限がある。オリジナルのアーティストの声やスタイルを保護する動きとして、特定のアーティストに言及したり、ボーカルを含む特定のクエリに対しては音楽を生成しない。 Image cred
Google の VideoPoet web サイト Image credit: Google Research つい昨日、私は Google が AI 製品のリリースを最初のトライで成功させることはあるのかと尋ねた。少なくとも、Google の最新の研究の様子からすると、そう尋ねたくもなる。 今週、Google は「VideoPoet」を披露した。VideoPoet は、Google Research の31人の研究者からなるチームが開発した、さまざまな動画生成タスク用に設計された新しい大規模言語モデル(LLM)である。 Google Research チームがこれらのタスクのために LLM を構築したという事実自体が注目に値する。彼らはプレレビューの研究論文にこう書いている。 既存のモデルのほとんどは、拡散(diffusion)ベースの手法を採用している。これらの動画モデルは、通常、個
12月12日、OpenAIの競合であるCohereは企業向けの大規模言語モデル(LLM)に焦点を当て、企業がSlackやGoogle Drive、Service NowやWordPressのようなサードパーティのアプリケーションにある企業データをCohereのCommand LLMに安全に接続できるようにするための「Build-your-ownコネクタ」のサービスを発表した。 同社の担当者は、「我々が知る限りでは」この種のサービスは初めてであり、Cohereが最近「4つのクラウドプロバイダーすべてにわたってファイン・チューニングを提供する最初で唯一のAI企業」になったことに続く発表だと伝えている。Cohereのブログによると、このオープンβリリースにより、企業はCohereのアップグレードされたAIプラットフォーム上でAIアシスタントを構築することが可能になり、日常業務で使用される数百のツ
Meta AI の研究者らは11月30日、AI モデルの新しいスイート「Seamless Communication」を開発したと発表した。このモデルは先週、研究論文や付随データとともに公開された。 フラッグシップモデル「Seamless」は、他の3つのモデル(SeamlessExpressive、SeamlessStreaming、SeamlessM4T v2)の機能を1つの統一されたシステムに統合したものである。研究論文によると、Seamless は「リアルタイムで表現力豊かなクロスリンガル(言語横断)コミュニケーションを可能にする、一般に利用可能な最初のシステム」である。 世界共通のリアルタイム翻訳技術としての Seamless の仕組み Seamless は、ブログを介したコミュニケーションのための AI 利用における新境地を示すものだ。3つの洗練されたニューラルネットワークモデル
Image credit: Craft Craft は「Notionに取って代わることができる」と謳うデジタルノートアプリで、2020年のローンチ後、2年足らずで100万ダウンロードを突破し、Notion を上回る速さの成長を見せている。 Craft はどのように他のデジタルノートアプリと差別化し、Notion に挑戦しているのだろうか? Craft は Notion のポジションにどう挑むのだろうか? コンテンツ制作に特化した機能性と多様なテンプレートをユーザに提供 Craft のロジックは Web ページの作成に似ており、各プロジェクトやノートを独立したページにすることができる。例えば、「特集記事」を企画する場合、内側のページに「取材先」「調査データ」などのサブページを挿入することができ、サブページのサイズや背景も自由に設定することができる。 Notion と Craft のファンクシ
OpenAI DevDay 2023 の冒頭で基調講演する共同創業者でCEOのサム・アルトマン氏 Image credit: OpenAI OpenAIの開発者会議「Dev Day」での最新リリースで、カスタムが可能になったGPTs、新しいGPT-4 Turbo、アシスタントAPIが発表された。もちろん、私のようなAI全般のオブザーバーは先週の津波のようなAIの発表に疲れ果てている。 ホワイトハウスのAI大統領令、G7の自主行動規範、英国の安全サミット、AIの「ゴッドファーザー」たちによるXリスク論争の激化、著名なAI著作権裁判の縮小判決、そしてMidjourney、Runway、Stability AIからの最新情報があった。 まだある。Scarlett Johannson氏がAIアプリに法的措置を取ったし、Googleが広告主の商品画像にGenAIツールを導入、 AMDがAIチップの販
次のページ
このページを最初にブックマークしてみませんか?
『BRIDGE(ブリッジ)テクノロジー&スタートアップ情報 - 「起業家と投資家を繋ぐ」...』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く