deejayrokaのブックマーク - はてなブックマーク

世界モデル研究で注目浴びる新手法　「TD-MPC」はなぜ高性能か

ディープラーニング研究では国内トップレベルの東京大学の松尾豊研究室のメンバーが開催する最新論文の輪読会から、話題の論文を紹介する本連載。今回は、世界モデル研究において注目が集まっている「TD-MPC」について取り上げる。本記事では、モデルベース強化学習において、近年高い性能を示している「Temporal Difference Learning for Model Predictive Control（TD-MPC）」という手法について紹介し、近年の動画生成AIと比較して世界モデル研究の方向性について述べる。強化学習は、報酬の（割引）累積和を最大化するような方策を学習することを目的とする。中でもモデルベース強化学習は、環境の状態が行動によって次の時刻にどのように変わるかという状態遷移モデルを用いて、方策を学習したり、プランニング（現在の状態から将来の複数のステップを予測し、その予測に基づ

deejayroka 2024/08/24

リンク

画像生成AI「Midjourney」、誰でも25枚まで無料で描画可能に

サインアップに必要なのはアカウントのみで、カード情報などは不要だ。生成したコンテンツについてはMidjourneyに「複製、派生作品の作成、公開表示、公開実行、サブライセンス、および配布するための、永続的、全世界的、非独占的、サブライセンス可能、無償、ロイヤリティフリー、取消不能の著作権ライセンスを付与」することになる。（利用規約より） Webアプリ版はまだテスト中で、編集機能も最近利用可能になったばかりだが、立ち上げ段階ではDiscordのアカウントが必要だったものが不要になった分、かなり敷居が低くなった。関連記事米著作権当局、生成AI「Midjourney」で制作した優勝作品の著作権保護を拒否米著作権局審査委員会は、生成AI「Midjourney」で制作した作品の著作権保護を拒否した。対象は、昨年9月にコンテストで優勝した「Theatre D'opera Spatial」。 AI

deejayroka 2024/08/24

リンク

企業で生成AIを導入するための施策と生成AI全社研修の全体設計を公開します｜TOYOTA Connected AI統括部

今回は、2024年7月25日に行われたイベント「Azure OpenAI Service Dev Day」の内容を紹介します！ 700名以上が参加した本イベントには、AI統括部リスキリングチームリーダーの西山泰仙さんとAI 技術室の山本玄人さんが登壇しました。本記事を読むことで、トヨタコネクティッドが現在実施している生成AI研修の設計や企業で生成AIを導入するために必要なことを知ることができます。企業の生成AI推進担当者やこれから生成AIを導入したい方は、ぜひ参考にしてみてください！アウトライン以下のアウトラインで講演を行いました。 ※講演の内容は複数回に分けて公開します。本記事では、リスキリングチームリーダーの西山泰仙さんの講演内容である、Chapter01「生成AI導入の理想状態仮説と現状分析」とChapter02「生成AIネイティブになるための戦略と取り組み」を紹介します

deejayroka 2024/08/24

リンク

ゲームプレイを含むシステム機能テストを自動化するAI技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート［CEDEC 2024］

ゲームプレイを含むシステム機能テストを自動化するAI 技術とは。PS5のシステムソフトウェアQAチームの取り組みを紹介したセッションをレポート［CEDEC 2024］ライター：大陸新秩序 2024年8月21日，ゲーム開発者向けカンファレンス「CEDEC 2024」にて，セッション「PlayStation 5上で人間のプレイヤーと同条件でのゲームプレイ自動化を実現するAI 技術」が行われた。このセッションでは，PS5のシステムソフトウェアのQA（品質保証）における一部の機能テストで活用しているという，ゲームプレイ自動化を実現するAI 技術が紹介された。スピーカーは，以下の3名である。ソニー・インタラクティブエンタテインメントゲームサービスR&D部 Machine Learning Researcher 矢部博之氏ソニー・インタラクティブエンタテインメント　ゲームサービスR&D部　Mach

deejayroka 2024/08/24

リンク

AppleのApp Store担当幹部が退社、EU規制への対応でApp Store分割へ

ビッグテックに対してオープンで公正な行動を義務付ける「デジタル市場法(DMA)」がEUで施行されたことで、AppleはEU圏内においてのみ、サードパーティー製の代替アプリストアとサイドローディングを認めるなどの対応を迫られています。App Store担当部門の幹部が、「チームを再編成している今がタイミング」という理由でAppleからの退社を発表し、AppleのApp Store担当部門が分割されるというウワサが現実のものとなっていると報じられています。 LinkedInのMatt Fischer: I have some professional news to share and sent out this message to Apple… | 98件のコメント https://www.linkedin.com/feed/update/urn:li:activity:723212820

deejayroka 2024/08/24

iOS
techfeed

リンク

都市BIMと生成AI活用で石見銀山地区の「デジタルツインバース」構築、大成建設

大成建設は2024年6月26日、現実空間とデジタルツイン（現実空間を模した仮想空間）とをリアルタイムに相互連携できる次世代型メタバースのデジタルツインバースシステム「T-TwinVerse」を開発したと発表した。さまざまなステークホルダーが持つ位置、音声、映像などの情報を統合管理することで、リアルタイムで高度な情報共有が可能になる。今回、島根県大田市の石見銀山地区をモデルに、都市のインフラ情報を統合管理する都市BIMを組み込み、生成AIを利用して、どこからでも自由に情報を登録、参照できるシステムを構築した。地方創生に向けた、産官学民協働による実証実験に取り組む。今後、関係機関と連携し、石見銀山街道主要部の約1キロの範囲をデジタルツインバースとして展開し、より広域かつ包括的な地方創生のためのDXとして、技術、効果を検証していく。デジタルツインバースをスピーディかつ高精度に構築 T-Tw

deejayroka 2024/08/23

リンク

Googleの機械学習アーキテクチャ「Transformer」を使用してユーザーに音楽をオススメする仕組みとは？

2017年にGoogleの研究者が発表した機械学習アーキテクチャ「Transf ormer」は、GPT-4やLlamaといった大規模言語モデルの構築に重要な役割を果たしています。そんなTransf ormerを使い、「ユーザーの行動に基づいたより高精度な音楽のレコメンドシステム」を構築できるとGoogleが述べています。 Transf ormers in music recommendation https://research.google/blog/transf ormers-in-music-recommendation/ Transf ormerは「Tokenization(トークン化)」「Embedding(埋め込み)」「Positional encoding(位置エンコーディング)」「Transf ormer block(Transf ormerブロック)」「Softmax(ソフトマックス)

deejayroka 2024/08/23

“すでにGoogleは、YouTube MusicのレコメンドシステムにTransformerを利用しています。GoogleはTransformerと既存のランキングシステムを以下のように組み合わせ、ユーザーのアクションとリスニング履歴を最適に組み合わせたランキ

リンク

グーグルAI、1000ページのPDFを読んで質問に答えられるように　白書レベルなら余裕

グーグルは8月21日、生成AI「Gemini」を使用するための「Google AI Studio」「Gemini API」でアップロード可能なPDFの最大容量を、これまでの300ページから1000ページまたは2GBまでに拡大したと発表した。同社でAI Studioなどを担当するLogan Kilpatrick氏によると、テキスト理解と画像理解の両方を利用して、1ページにつき1画像として処理しているという。 We just increased the max PDF page upload size to 1,000 pages or 2GB (up from 300 pages) in Google AI Studio and the Gemini API. 🗒️ We use both text understanding and the native multi-modal cap

deejayroka 2024/08/23

“生成AI「Gemini」を使用するための「Google AI Studio」「Gemini API」でアップロード可能なPDFの最大容量を、これまでの300ページから1000ページまたは2GBまでに拡大したと発表した。”

リンク

グーグルの生成AI検索、日本で開始　「AI Overviews」

deejayroka 2024/08/23

“Webの検索結果を活用しながら独自の“まとめ”を自動で生成して表示するAI検索機能「AI Overviews(AIによる概要)」を日本で導入すると発表した。今後数週間で順次試験導入していく。”

リンク

Appleがオープンソースの画像生成AIモデル「MDM」をGitHubで公開／Windowsに深刻な脆弱性　ゼロクリック攻撃で

Appleがオープンソースの画像生成AIモデル「MDM」をGitHubで公開米Appleは8月9日（現地時間）、画像生成AIモデル「Matryoshka Diffusion Models（MDM）」および、モデルをトレーニングするためのPythonパッケージ「ml_mdm」をオープンソースとしてGitHubで公開した。 MDMは、2月に研究論文として発表されていたもの。従来の方法では、低解像度モデルと複数のアップスケーリングモジュールを組み合わせた段階的なモデルを使用しており、高次元空間での拡散モデルの学習は計算上あるいは最適化をする上での課題を抱えていた。これに対して、MDMは異なる解像度モデルを並行して生成し、その情報を相互に共有する。こうした情報を利用しつつ、低解像度から高解像度へと段階的に学習を進めることで、高解像度モデルの学習がより安定するという。最大1024×1024ピク

deejayroka 2024/08/23

リンク

サブスクがいつの間にか増えていたので、断捨離のための整理をかねて... Go..

サブスクがいつの間にか増えていたので、断捨離のための整理をかねて... Google Drive 月額250円 (年額3,000円)100GBで月額250円。 Google Photo で半分ほどの容量を占めているが残りは、GmailとDriveが10GBずつ程度。 iCloud 月額130円 (年額1,560円)50GBで月額130円。 iPhoneのバックアップが主な理由。写真のシンクはしていない。 Google Cloud 従量制月額170円くらい (年額2,000円くらい)無償分がはみ出るリソースで、円安前は110円で済んでいたんだけどな。 AWS 従量制月額290円くらい (年額3,500円くらい)ほぼ Route 53 のゾーン利用料。 ChatGPT Plus 月額20ドル (年額240ドル)20ドルかぁー、20ドルなぁーって思いながら使っている。Notionはちょっとダ

deejayroka 2024/08/23

リンク

機械学習とビジネスゴールのはざまで - LayerX エンジニアブログ

機械学習をプロダクトに取り入れて磨き上げているいるみなさん。機械学習モデルのオフライン評価とビジネス上のKPIとを近づける難しさを感じてませんか？はじめに深澤 (@qluto) です。 LayerXという会社で、経理業務をはじめとした業務支援を行うバクラクシリーズの開発に携わっています。私はその中でも、非定型の書類から的確に情報を読み取るAI-OCR機能の開発を担当しています。私は、機械学習を根幹に据えつつ、ビジネス上や直接的なユーザーの課題解決のために複合的な問題に対処してきたソフトウェアエンジニアです。今回は、機械学習とビジネスゴールの狭間で生じがちな問題を俯瞰し、バクラクのAI-OCR機能において直面した問題とその解決方法についてご紹介します。機械学習とビジネスゴールとの間にギャップが生まれてしまうのはどういう時か？まずは、機械学習とビジネスゴールとの結び付けが難しくなり

deejayroka 2024/08/23

リンク

米国の主要レコード会社がAI作曲サービスSunoとUdioを提訴。訴訟の根拠となったヒット曲再現プロンプトを検証してみる（CloseBox） | テクノエッジ TechnoEdge

いずれ起きるかなと思っていた、米音楽業界団体からAI作曲サービスへの訴訟がついに来ました。 RIAA（全米レコード協会）が発表したもので、原告はSony Music Entertainment、UMG Recordings、Warner Recordsというレコード会社の大手3社を含む多数の音楽出版会社。訴えられたのはSunoとUdioの2社。アーティスト名や楽曲名をプロンプトに入れ放題なSonautoなどは対象となっていません。 Sunoへの訴状をGoogle NotebookLMにまとめてもらうとこんな感じです。この訴訟は、UMGレコーディングス、キャピタルレコーディングス、ソニーミュージックエンタテインメント、アトランティックレコーディングコーポレーション、およびその他の原告として挙げられているレコード会社によって提起されました。原告は、Sunoとその生成AIサービスが原告の著

deejayroka 2024/08/23

リンク

米ガートナー「先進テクノロジーのハイプサイクル2024年」を発表。6Gや汎用人工知能は黎明期、プロンプトエンジニアリング、WebAssemblyは過度な期待のピーク

米ガートナー「先進テクノロジーのハイプサイクル2024年」を発表。6Gや汎用人工知能は黎明期、プロンプトエンジニアリング、WebAssemblyは過度な期待のピーク米調査会社のガートナーは、「先進テクノロジーのハイプサイクル2024年」（2024 Hype Cycle for Emerging Techno logies）を発表しました。ガートナーのハイプサイクルは、技術の登場から安定までを5つのステージに分けて説明したものです。5つのステージは、「黎明期」から始まり、「『過度な期待』のピーク期」「幻滅期」「啓発期」「生産性の安定期」まで。この途中で消えていく技術もあります。ガートナーは、このハイプサイクルに示した先進テクノロジーは今後2年から10年の間に変革をもたらす可能性を秘めているとしています。また、ガートナージャパンがほぼ同時に「日本における未来志向型インフラ・テクノロジのハ

deejayroka 2024/08/23

”マルチエージェントシステムや大規模行動モデルなどを含む「Autonomous AI」（自律型AI"

リンク

「AIと著作権」について解説　文化庁のセミナー、アーカイブ動画が公開に

文化庁は8月21日、生成AIと著作権の関係について解説するセミナー「AIと著作権II」のアーカイブ動画をYouTube上で公開した。セミナーは9日に実施したもので、3月に公開した資料「AIと著作権に関する考え方について」を解説している。 AIと著作権IIでは、AIと著作権に関する考え方についてを2部構成で解説。第1部では著作権制度の基礎知識や生成AIとの関係性を、第2部では実務での扱いを解説している。 AIと著作権に関する考え方については、生成AIと著作権の折り合いはどこで付けるべきかなどを解説した資料で、1月から2月半ばにかけて集めた計2万4938件のパブリックコメントの声も反映している。文化庁の文化審議会著作権分科会法制度小委員会の考え方を示したもので、法的拘束力はないが、生成AIと著作権を巡る裁判所の判断が出ていないため、当面はこの資料内容の把握が実務上では重要になるといわれている。

deejayroka 2024/08/23

リンク

MIRU2024参加レポート～アダコテックの技術と外観検査のインターンを紹介しました～ - アダコテック技術ブログ

画像に関する国内会議であるMIRU2024にシルバースポンサーとして参加しましたので、ご報告します。われわれの技術紹介を行うとともに、画像の研究を行っている学生に向けてアダコテックでのインターンのご紹介をしました。 MIRUとは MIRUは、情報処理学会コンピュータビジョンとイメージメディア(CVIM)研究会が主催する画像の認識・理解シンポジウムです。毎年夏に開催されており、画像に関する技術研究の国内最大の会議です。今年は熊本城ホールにて8月6日から8月9日の日程で行われました。年々参加者数が増加しており、今年も1,500名以上の方が参加し、600件以上の発表が行われました。来年は京都国際会館で2025年7月29日から8月1日に開催されます。展示内容今回の展示内容は、人工知能学会の展示と同様に、HLACを用いた外観検査プロダクトに関するものでした。アダコテックでは、工場のような制約の

deejayroka 2024/08/23

技術

リンク

RAGを専門用語に強くする手法「Golden-Retriever」

株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。本記事では、RAGの性能を高めるための「Golden-Retriever」という手法について、ざっくり理解します。この記事は何この記事は、RAGシステムを専門用語に強くするための手法「Golden-Retriever」の論文[1]について、日本語で簡単にまとめたものです。今回も「そもそもRAGとは？」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。本題ざっくりサマリー Golden-Retrieverは、RAG（Retrieval Augmented Generation）を、業界特有の用語・社内用語を含むような質問に強くするための手法です。カリフォルニア大学の研究者らによって2024年8月に提案されました。従来のRAGシステム

deejayroka 2024/08/23

リンク

エンジニアが今日から始める英語学習の継続方法 - Uzabase for Engineers

1. はじめにこんにちは。ソーシャル経済メディア「NewsPicks」でエンジニアをしております小林です！皆さんは英語学習に取り組んでいらっしゃいますか？エンジニアとして技術ドキュメントや国際カンファレンスの動画等で英語に触れる機会があると思います。また、技術的なスキルはあるが、英語を話すことが苦手な場合、将来的に市場でどう評価されているかの動向も気になるところです。最新の2023年度の報告によると、世界的にIT エンジニアの給与が上昇している一方、日本では前年比USドルベースで5.9%減少、現地通貨（円）ベースでもわずか0.4%増加に留まっています。残念ながら、世界と比較した時に日本の給与の優位性がなかった一年となりました。今後もこの差が開く一方であれば、個人や企業が国際市場で競争力を保つために、英語能力の向上も必要になる機会が高まっていくことを示唆しています。しかし、「英語力を伸

deejayroka 2024/08/23

リンク

アクセンチュア流「プロンプトの書き方5つ×Copilot活用7カ条」、生産性が爆上げするワケ（ビジネス＋IT） - Yahoo!ニュース

Copilot活用のためのテクニックや心得とは？（Photo：Tada Images / Shutterstock.com）前回は「Microsoft Copilot for Microsoft 365（以下、Copilot）」の位置づけや効果、仕組みといった概要について紹介した。今回は、実際にアクセンチュアの従業員が実践する各アプリに共通する知っておくべきプロンプトの書き方のテクニック5つと、Copilotを賢く使うための心得7カ条を解説する。【詳細な図や写真】例の出し方（悪い例）（出典：アクセンチュア）ベーステクニック：プロンプトの作り方　Copilotを動かすために必要となるのは「プロンプト（指示文）」だ。人間の指示の仕方がCopilotのアウトプットの質を左右するため、いかに精度の高い回答を引き出せるプロンプトを書けるかが、ビジネスパーソンに求められる新たな重要スキルの1つに

deejayroka 2024/08/23

リンク

お絵描きアプリ「Procreate」が生成AI反対の立場を明確に表明

iPadのデザインアプリ「Procreate」が生成AIに反対の立場を表明し、自社製品に生成AI機能を導入しないことを宣言しました。創造性を生み出すのは人々。– Procreate® https://procreate.com/jp/ai Procreateは「NO 生成AI」「あなたの作品は、あなたのもの」「個人情報を守ることに誇りを持っている」という3つのスタンスを示しました。また、Procreateのジェームズ・クーダCEOは以下のムービーで、「個人的に生成AIは本当に不愉快です。今この業界で起こっていることも、アーティストに与えている様々な痛みも納得いかないです」と述べ、Procreateの製品に生成AIを取り入れないことを表明。「私たちの製品は常に人間が何かを生み出すという考えのもとに設計され、開発されています。この物語がどこへ向かうのか、どのように終わるのかは正確にはわかり

deejayroka 2024/08/23

リンク

はてなブックマーク

タグ

deejayrokaのブックマーク (9,097)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス