米Microsoftは5月21日(現地時間)、開発者向け年次開発者会議「Microsoft Build 2024」で、RPA・ローコードツール「Power Automate」の新機能「AIレコーダー」を発表した。AIに話しかけながら画面操作を記録させることで、PC操作の自動化をこれまでより柔軟に実現する機能という。 Power Automateではこれまで、実際にマウスやキーボードでの操作を行い、それを記録することでPC操作の自動化を実現していた。一方、新機能では画面操作に加えて声での説明を踏まえ、AIが手順を構築可能に。AIは声での説明を基に、操作の意図を解釈して作業の手順を組み立てるため、例えばRPAの対象としていた画面のUIが変わったとき、新しい手順を再提案してくれるようになるという。 関連記事 Microsoft、RPA機能を搭載した「Power Automate」発表 ユーザーの
注意: ポエム成分多めです、自社のデータ基盤チームの話です。 今日はチームの振り返り会で「ユーザー問い合わせは宝の宝庫」的な話題*1が出て、めっちゃ分かる〜となった。データ基盤チームへの問い合わせなので XXXデータセットにYYYの権限を付与してください ZZZが動かないのですが、どうしたらよいですか VVVを分析したいんですが、目的に合うデータセットありませんか といった内容が多い。特に意識しないと一個一個は淡々と処理してしまいそうになるんだけど、何件も見ていると、色々情報が透けて見えてくる。 これまで問い合わせがあまりなかった部署からの問い合わせだ。何か新しいデータ活用始めようとしているんだろうか? いかにも重いクエリが飛んできそうだけど、そもそも問い合わせで解決したいことって何なんでしたっけ? この問い合わせ、最近多いな。ユーザーサイドから情報調べるときの動線、この解決方法はちゃんと
We are excited to introduce the AI Toolkit for Visual Studio Code, a powerful VS Code extension available today in the Visual Studio Marketplace. AI Toolkit enables developers to explore, try, fine-tune, and integrate state-of-the-art models from Azure AI Studio and HuggingFace into applications. The AI Toolkit is an evolution of the Windows AI Studio extension that was released in November 2023.
Windows AI Studio simplifies generative AI app development by bringing together cutting-edge AI development tools and models from Azure AI Studio Catalog and other catalogs like Hugging Face. You will be able browse the AI models catalog powered by Azure ML and Hugging Face for public models that yo
2022/03/15 アニメ「リトルウィッチアカデミア」の絵コンテ等を研究に活用へ ~TRIGGER制作のアニメ作品素材データをアカデミア研究者向けに提供開始~ アニメーションスタジオTRIGGER(本社:東京都杉並区、代表取締役:大塚 雅彦、以下 TRIGGER)と大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(所長:喜連川 優、東京都千代田区、以下 NII)は研究コミュニティへの研究用データの提供で提携し、劇場アニメ作品「リトルウィッチアカデミア」の絵コンテ等のアニメ素材データを「トリガーデータセット」(図1)として3月15日(火)から提供を開始しました。実際に劇場公開された商業アニメ作品の素材データを学術研究に提供することで、画像自動生成技術の開発や制作進行の効率化など、アニメーション技術に関する学術的研究の促進に貢献します。 このトリガーデータセットは、NIIのデー
国立情報学研究所が株式会社トリガーから提供を受けて研究者に提供しているデータセットです。 2022/08/17 更新 データ概要 アニメ作品素材データ 文化庁若手アニメーター育成プロジェクト『アニメミライ2013』の参加作品として劇場公開されたアニメーション作品『リトルウィッチアカデミア』の制作で使用した素材一式をデジタル化したデータです。 具体的には以下のスキャン画像データが含まれています。(動画データの提供はありません) シナリオ 絵コンテ(197ファイル) 美術(392ファイル) 設定(89ファイル) 色彩(67ファイル) カット袋・タイムシート・レイアウト・原画(383カット分) 仕上げ(397カット分) スキャン画像はTIFF形式やTGA形式で,サイズはデータセット全体で約550GBとなります。(画像ファイルの取り扱いにあたって必要となる編集ソフトウェアは各自ご準備ください) 本
アプリとそのデータの管理と保護は、エンドポイント管理戦略とソリューションの重要な部分です。 ほとんどの環境では、ユーザーはパブリック リテール アプリをインストールし、これらのアプリからorganizationデータにアクセスできます。 また、多くの組織には、管理 & 展開する必要がある独自のプライベート アプリと基幹業務アプリもあります。 このアプリ データがorganization内に留まるようにする必要があります。 アプリ管理は困難な場合があり、Intuneが役立ちます。 Microsoft Intuneは、多くのアプリの種類を管理できるクラウドベースのサービスです。 管理者は、Intuneを使用して、organization リソースにアクセスするアプリをデプロイ、構成、保護、更新できます。 Intuneとその利点の詳細については、「Microsoft Intuneとは」を参照して
✅アプリ管理を簡素化する Intuneには、アプリのデプロイ、更新、削除など、アプリ エクスペリエンスが組み込まれています。 次の操作を行うことができます: プライベート アプリ ストアに接続して、アプリを配布します。 Microsoft Teams を含む Microsoft 365 アプリを有効にします。 Win32 アプリと基幹業務 (LOB) アプリをデプロイします。 アプリ内のデータを保護するアプリ保護ポリシーをCreateします。 データ & アプリへのアクセスを管理します。 詳細については、「Microsoft Intuneを使用してアプリを管理する」を参照してください。 ✅ポリシーのデプロイを自動化する アプリ、セキュリティ、デバイス構成、コンプライアンス、条件付きアクセスなどのポリシーを作成できます。 ポリシーの準備ができたら、これらのポリシーをユーザー グループとデバイ
Recallは、かつてWindows 10に搭載されていた『タイムライン』の拡張版といった機能。アクティブな画面のスナップショットを数秒ごとに常時取得し、スライダーで遡ったり、Copilotを通じて内容を検索できる機能です。 記録したスナップショットはCopilot によるAI検索が可能。たとえば数日前にWEBで検索して見たページが思い出せないような場合、覚えている要素、たとえば「赤い車」や「白いスニーカー」などと検索すると、撮影されたスナップショットの中から該当するものを見つけてくれます。 単に過去の画像を表示するだけではなく、その時に使用していたアプリを開くこともできるようになるとのことです。 (▲画像:Recall機能のデモ。スライダーで過去に遡って画面を見られる) スナップショットはPCのローカルストレージ内に保存し、デバイス上の暗号化とBitLockerで保護します。特定のユーザ
Windows 11、デフォルトでTarファイルの作成が可能に。これでWindowsはTarファイルの解凍と作成の両方に対応へ 次のWindows 11の大型アップデートで、Tarファイルの作成にデフォルトで対応予定であることが明らかになりました。 現在開発中のWindows 11β版で、ファイルエクスプローラーのコンテキストメニューにTarファイルに圧縮するメニューが追加されると、同社のブログ「Announcing Windows 11 Insider Preview Build 22635.3640 (Beta Channel)」で発表されました。 Tarファイルは複数のファイルを1つにまとめることができるファイル形式です。Tarという名称は磁気テープにデータを保存する「テープアーカイブ」(Tape Archive)から由来することからも分かるとおり、古くからUNIXでよく使われてきま
現地時間の2024年5月20日、MicrosoftがAIのために設計されたWindows PC向けの新しいカテゴリ「Copilot+ PC」を発表しました。このCopilot+ PCで利用可能となるWindows 11向けの新しいAI機能が「Recall」で、PC上で見たものや行ったことをすべて記録して検索できるようになるという、AI時代に相応しいパワフルな検索機能になっています。 Accelerating innovation: A new era of AI at work begins | Windows Experience Blog https://blogs.windows.com/windowsexperience/2024/05/20/accelerating-innovation-a-new-era-of-ai-at-work-begins/ Recall is Micr
Today, we’re introducing GitHub Copilot Extensions to bring the world’s knowledge into the most widely adopted AI developer tool. Through a growing partner ecosystem, Copilot Extensions enables developers to build and deploy to the cloud in their natural language with their preferred tools and services, all without leaving the IDE or GitHub.com. With Copilot and now Copilot Extensions, developers
マイクロソフトは、日本時間5月22日未明から開催中のイベント「Microsoft Build 2024」で、GitHub Copilotの新機能「GitHub Copilot extensions」を発表しました。 GitHub Copilot extensionsは専門知識を持つCopilot GitHub Copilotは、プログラマはVisual Studio Codeなどのコードエディタ上やチャット欄でAIと対話し、プログラミングに関する質問への回答やコードの生成などをAIが行ってくれる機能です。 GitHub Copilot extensionsは、このCopilotの能力をサードパーティなどがそれぞれのソフトウェアやサービスの専門家へと拡張できるようにし、プラグインとしてCopilotに組み込み可能にしたものです。 拡張されたCopilotの例として、マイクロソフトが提供する「
マイクロソフトは、日本時間5月22日未明から開催中のイベント「Microsoft Build 2024」で、自律型AIソフトウェアエンジニアの「Devin」を開発しているスタートアップ「Cognition AI」との提携を発表しました。 Devinは、自律的にシステム開発を実現する能力を持つAIによるソフトウェアエンジニアだと説明されています。 具体的には、人間が課題を与えるとそれを基に開発計画を立て、GitHubリポジトリにあるReadmeなどの情報を参照して得られた情報を基に自動的に環境構築、ドキュメントからAPIの仕様も参照し、それを基にコーディングを行い、デバッグでは必要に応じてprint文などでエラーの箇所を特定しつつ問題を解決、動作するようになったらデプロイを行うなどの能力を備えているとされています。 参考:自律型AIソフトウェアエンジニア「Devin」登場。Readmeを読ん
マイクロソフトは、日本時間5月22日未明から開催中のイベント「Microsoft Build 2024」で、Copilotを一連のタスクを自律的に実行できる「エージェント」へと拡張するCopilot Studioの新機能を発表しました。 Copilot StudioはMicrosoft Copilotの拡張やカスタマイズを可能にする開発環境です。今回の新機能では、Copilotがエージェントとして機能するように、以下の拡張が可能になります。 一定期間実行が継続されるビジネスプロセスの自動化 ユーザーからの入力とアクションについての推論 過去の記録からコンテキストを理解する ユーザーからのフィードバックによって学習を行う 具体的には、Copilotに対して処理の内容と手順を「インストラクション」で具体的に説明し、「トリガー」となるプロセスを指定。さらに参照すべき「ナレッジ」を指定し、どのよう
通信を行ううえでは、雑音のある環境下でも正しくメッセージ(情報)を伝える必要があります。これを実現する技術は「通信路符号」あるいは「誤り訂正符号」と呼ばれており、光通信や無線通信に限らず、計算機の内部やハードディスク・光ディスク等の記録装置、スマートフォン等で情報を読み取るための二次元コード等に応用されています。あらゆる通信機器の中に入っているといっても過言ではありません。 雑音のある環境(通信路)が与えられたとき、正しくメッセージを伝えることができる効率には限界があります。このような通信効率の限界は、1948年にこれを発表した計算機科学者シャノンにちなんで「シャノン限界*1」と呼ばれています。しかしながら、シャノンが提案した符号は膨大な計算量を必要としていたため、その実行は困難でした。実行可能なシャノン限界を達成する符号の構成は、シャノンが創始した情報理論の70年にわたる課題です。 その
[速報]マイクロソフト、PCに話しかけながら画面を操作するだけで生成AIがRPAフローを自動生成してくれる、Power Automate「AIレコーダー」発表 マイクロソフトは、日本時間5月22日未明から開催中のイベント「Microsoft Build 2024」で、PCに話しかけながら画面を操作するだけでRPAフローを自動生成してくれる、Power Automateの新機能「AIレコーダー」を発表しました。 人間に操作を教えるように、AIに話しながら操作 これまでRPAフローを作成する方法として、マウスやキーボードなどの操作を記録することで基本的なRPAフローを作成することが可能でした。 今回発表された新機能「AIレコーダー」は、まるで人間に言葉で説明しながら業務アプリケーションの操作を教えるように、マウスとキーボードを操作しつつ音声で説明することで、どのような意図で操作しているのかを詳
2002年にノーベル経済学賞を共同受賞した心理学者で米プリンストン大学名誉教授だったダニエル・カーネマン氏が3月27日、90歳で亡くなった。行動経済学を切り開いたことで世界的に著名な研究者だった。 米ジャーナリストのマイケル・ルイス氏は、カーネマン氏を世界的な「人間の間違いについての権威」と表現する(1)。米国で行動経済学のコンサルティングに携わる研究者、相良奈美香氏がたたえるように、その研究は人の意思決定に対する社会の理解を根本から大きく変えた(2)。 ルイス氏によると、ユダヤ人であるカーネマン氏は、第2次世界大戦時の壮絶なホロコーストを命からがら生き延び、幼い頃から誰も信じてはいけないと教えられていた。自分の記憶さえ信じなかった。「14歳という年齢にして、ダニエルは少年というよりも、少年の体に閉じ込められた知識人だった」。ルイス氏は、カーネマン氏の友人のこんなコメントを紹介している。
まさか、こんな時代が来るとは思いませんでした。 悪い意味で、日本中が注目するようになってしまった「つばさの党」を今日の今日までお金にもならないのに取材し続けてしまった男、選挙ウォッチャーちだい。 世間の皆さんが、今になって「『つばさの党』って何?」となり、知れば知るほど「気持ち悪っ!」となっているのですが、いかんせん朝霞市に1議席を持つだけの超マイナー政治団体ゆえ、追いかけている人間なんぞ他にいるはずがなく、ひょんなことから「つばさの党に最も詳しい人間」となってしまい、おかげさまで、僕もまた少しずつ注目されるようになりました。 僕が最も専門としているのは、反社会的カルト集団「NHKから国民を守る党」ですが、立花孝志が提唱した「諸派党構想」という弱小政党を集めてN国党の支配下に置き、衆院選に挑戦するための300万円の供託金を払えば、受け取れる政党助成金を分配してもらえるプロジェクトに「オリー
Mark Seemann 著、吉羽 龍太郎、原田 騎郎 訳、Robert C. Martin まえがき TOPICS 発行年月日 2024年06月 PRINT LENGTH 312 ISBN 978-4-8144-0079-9 原書 Code That Fits in Your Head FORMAT Print PDF EPUB ソフトウェアは複雑さを増すばかりですが、人間の脳は限られた複雑さしか扱えません。ソフトウェアが思い通りに動くようするには、脳に収まり、人間が理解できるコードを書く必要があります。 本書は、拡張を続けても行き詰ることなくコードを書き、複雑さを回避するための実践的な方法を解説します。最初のコードを書き始めるところから機能を追加していくところまでを解説し、効率的で持続可能なペースを保ちながら、横断的な問題への対処やトラブルシューティング、最適化を行なう方法を説明します
TL;DR WhisperはOpenAIによって開発された音声認識システムで、多言語対応の高精度なテキスト変換機能を提供します。 whisper.cppはWhisperモデルのC++実装であり、マイク入力からのリアルタイム文字起こしや、音声ベースのアプリケーション開発を容易に行うことができます。 修正されたwhisper.cppとllama.cppを組み合わせることで、マイクからの日本語音声入力を基にLLMと日本語で対話するシステムを構築できます。 使用環境 MacBook Pro CPU : Apple M2 Pro, 12core MEM : 32 GB OS : Sonoma 14.2.1 whisper と whisper.cpp WhisperはOpenAIによって開発された最先端の音声認識システムであり、様々な言語の音声をテキストに変換する能力を持っています。このシステムは、公
はじめまして、ますみです! 株式会社Galirage(ガリレージ)という「生成AIのシステム開発会社」で、代表をしております^^ この記事では「Microsoft Build 2024」における発表内容を解説します! 私自身、実際に現地のシアトルから聴いていたのですが、感動する発表がいくつかありました😢 1. CopilotにおけるGPT-4oの利用 Copilot上で、GPT-4oが使えるようになります! (正確には、利用イメージがデモされました!) 発表内では、マインクラフトの例が取り上げられました。 画面内で、どのようなことが起きているかをAIが理解して、どのように剣を作れるかなどを教えてくれたりしました。 ここでは、先日のOpenAIによるGPT-4oのデモのように、音声によるインタラクションがされていました。 2. Azure AIにおけるGPT-4oのGA化 Azure Op
Intended Uses Primary use cases The model is intended for broad commercial and research use in English. The model provides uses for general purpose AI systems and applications with visual and text input capabilities which require memory/compute constrained environments; latency bound scenarios; general image understanding; OCR; chart and table understanding. Our model is designed to accelerate res
米Microsoftは5月21日(現地時間)、開発者向け年次開発者会議「Microsoft Build 2024」の基調講演で、SLM(小規模言語モデル)「Phi-3」ファミリーの新メンバー「Phi-3-vision」(以下「vision」)を発表した。画像を解析するマルチモーダルなSLMだ。プレビュー版を利用可能。 SLMは単純なタスクで適切に実行できるように設計されており、リソースが限られる組織や端末上でローカルに実行する必要があるアプリに適した言語モデルだ。 visionは、描画はできないが、モバイル端末で利用可能なコンパクトさだ。42億パラメータモデルで、グラフや画像に関して質問すると、それについて説明してくれる。 Microsoftは「visionは画像とテキストを一緒に検討する必要があるタスクに最適だ」としている。多様なハードウェアで実行できるように最適化されており、開発者はモ
Crawl, Capture, CleanWe crawl all accessible subpages and give you clean markdown for each. No sitemap required. [ { "url": "https://www.mendable.ai/", "markdown": "## Welcome to Mendable Mendable empowers teams with AI-driven solutions - streamlining sales and support." }, { "url": "https://www.mendable.ai/features", "markdown": "## Features Discover how Mendable's cutting-edge features can trans
Micro-benchmark of the multi-head attention, run-time in us. Flash-Decoding achieves almost constant run-time as the sequence length scales to up to 64k. The up to 8x speedup end-to-end measured earlier is made possible because the attention itself is up to 50x faster than FlashAttention. Up until sequence length 32k, the attention time is roughly constant, because Flash-Decoding manages to fully
science Beta: Firebase Genkit is in Beta, which means that it is not subject to any SLA or deprecation policy and could change in backwards-incompatible ways. Throughout the Beta period, Firebase Genkit and its documentation will be updated and improved. Ollama プラグインは、Ollama でサポートされているローカル LLM へのインターフェースを提供します。 インストール npm i --save genkitx-ollama 設定 このプラグインでは、最初に ollama サーバーをインストールして実行する必要があります。手順に
Firebase Genkit の使用を開始するには、Genkit CLI をインストールし、Node.js プロジェクトで genkit init を実行します。このページの残りの部分では、その方法について説明します。 要件 Node.js 20 以降。 手順 次のコマンドを実行して、Genkit CLI をインストールします。 npm i -g genkit 新しい Node プロジェクトを作成します。 mkdir genkit-intro && cd genkit-intro npm init -y package.json で、main フィールドが lib/index.js に設定されていることを確認します。 Genkit プロジェクトを初期化します。 genkit init デプロイ プラットフォームのオプションとして Node.js を選択します(Firebase Cloud
Google Japanにおじゃましてきました ご縁あって、Googleに行ってきました!Googleさんには、5年前に六本木のオフィスの勉強会に呼んでいただいて以来の訪問でした。渋谷のオフィスは初めての訪問になります。 色々お話をしました。なんとGeminiグッズをいただきました! やったー そして、噂のGoogleランチを楽しみました! Googleランチ ここは撮影大丈夫らしいです。 めちゃくちゃ眺めが良い場所にある食堂 景色がよいときは富士山が見えるらしいです おしゃれな壁 和室がある!茶道部があるらしいです ぜんぶ無料! カフェも楽しめます。 Geminiについて ちょうどGoogle I/O 2024直後ということもあり、LLM、Geminiの話で盛り上がりました。 Geminiといえば、発音が「ジェミニ」なのか「ジェミナイ」なのか問題があるのですが、中の人いわく、日本では「ジ
It is estimated that 180,000 Americans live with quadriplegia, and each year, an additional ~18,000 suffer a paralyzing spinal cord injury. We live in a digital society where much of our work, entertainment, and social lives rely heavily on our use of computers and smart devices. People with quadriplegia often find that their needs to engage seamlessly with the digital world go unmet, leading
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く