こんにちは、note AI creative(以下、nAc)の田中です。 nAcとして今までさまざまな社内の業務改善に取り組んできましたが、中でも「議事録作成業務」は負担の大きい業務の1つでした。 セールス・カスタマーサクセスなど顧客と対面する部署では特に議事録作成は重要な業務として頻繁に発生しますが、1回あたり最大60分かかっており改善の余地がありました。 nAcが作成した生成AIのソリューションを使うことで、作業量が96%も削減され、60分の作業が2分で終わるようになりました。 議事録を生成するデモgifnote proチームの社内発表資料から抜粋この記事では、議事録作成を自動化するために作成したソリューションとその効果について紹介します。 議事録作成効率化の歴史議事録作成業務の効率化を目指し、まずは「tl;dv」というツールを導入してテストを行いました。 tl;dvは非常に機能が豊富
わずか3日で配信中止になった話題作が復活! 「ドキドキAI尋問ゲーム 完全版」,Steamで配信開始 編集部:荒井陽介 インディーゲームクリエイターのヤマダ氏は本日(2024年5月25日),PC向けアドベンチャーゲーム「ドキドキAI尋問ゲーム 完全版」をSteamでリリースした。価格は389円で,リリースから1週間は10%オフの350円で購入できる(価格はいずれも税込み)。 この発表は,本日配信された「Indie Live Expo」で行われたもの。 本作は,ChatGPTの利用によって,プレイヤー自身の言葉で容疑者(AI)を尋問できるアドベンチャーゲーム。7回以内の尋問でAIを自白させることが目的となるが,そこから本当の「AIとの対話」が始まるという。 タイトル名に「完全版」とあるが,オリジナルの「ドキドキAI尋問ゲーム」は,2023年3月に1度リリースされたものの,想定を遥かに上回る利
[速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 Googleは同社の最新生成AIであるGeminiをベースとした新しいWeb IDE「Project IDX」をオープンベータとして公開しました。 Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。 これまでその存在は発表されていましたが、招待されたユーザーのみが利用可能でした。 We want to make generative AI accessible to every developer on the planet. That’s why we’re making Gemini
kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます.人生を楽しく生きよう(New!) kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41
すがやみつる @msugaya 私も試してみました。プロンプトは、以下のとおりです。 ***** 『ゲームセンターあらし』というタイトルのマンガがありますが、このマンガに関係なく、タイトルだけのイメージから、美少女がゲームセンターで激しくゲームをプレイする絵を、マンガタッチで描いてください。 ***** こちらの方が年齢が高そうですね(^_^)。 ChatGPT経由でDALL-E3に描いてもらいました。 2024-04-30 22:26:48 ジロー @i9r82k こんこんばんばん 本日夜便は、ゲームセンターあらしより「ゲームセンターあらし」です ゲーセンというか、カラオケじゃないか? 黒髪ショートカットって意外に珍しい気がする なんか悪友というか、腹を割って話せる関係っぽい感じがします #画像生成AI #美少女 pic.twitter.com/8SF9NJb1QR 2024-04-30
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 米国空軍テストパイロットスクールと国防高等研究計画局は(DARPA)、昨年2月にAIによる自律飛行を実現したX-62A可変飛行安定性試験機(VISTA)を用い、有人のF-16戦闘機との模擬空中戦に成功したと発表しました。 DARPAの空中戦革新(Air Combat Evolution:ACE)プログラムの一環として、人工知能アルゴリズムを搭載したX-62A VISTAは、2023年9月に行われた飛行試験で「大規模な機首対機交戦」による防御と攻撃の両方の機動を試し、有人パイロットが操るF-16に対し時速1200マイル(約1900km)で2000フィート(約610m)の距離にまで接近したと説明。X-62A VI
4月に入り、X や kindle インディーズで AI で漫画を見かける機会が増えてきました。最近のイラスト系画像生成 AI では、漫画が流行の兆しを見せてきているようです。 参考:SD黄色本 そこで AICU media では、「AI で漫画を作ってみたいけど、どのモデルを使えばいいんだろう…」という方向けに、白黒漫画制作に適した Stable Diffusion のモデルを調査しました! Animagine 3.1まずはアニメ系 SDXL の主流モデルとなっている「Animagine」の最新バージョンである Animagine 3.1 でモノクロイラストを生成してみましょう。 プロンプト「best quality , monochrome , lineart,1girl, bob cut, flat chest , short hair , school uniform, round_
カナダのAIスタートアップCohereは4月4日(現地時間)、ビジネス向けに最適化された最新の大規模言語モデル(LLM)「Command R+」を発表した。 高度なRAG技術を採用 Cohereは、AI業界に変革をもたらしたTransformerモデルを提唱した論文「Attention is All You Need」の共同執筆者として知られるトロント大学の研究者Aidan Gomez氏らによって2019年に設立されたカナダのAIスタートアップ。 OpenAIと同様、LLMの開発に特化しており、企業向けにチャットボット、検索エンジンの最適化、要約サービス、自社AIモデルのAPIなどを提供している。 Command R+は、同社が3月に発表した「Command R」の後継となるモデルであり、Cohereが得意とする高い効率性と精度のバランスを重視したRシリーズの一部となる。 128K(12万
GitHub、Copilotでより高い精度のコードを生成させる方法を指南。関連ファイルを開く、トップレベルのコメントを書くなど 記事の中で、プログラマが意図したコードを高い精度で生成AIに生成させるためのテクニックがいくつも紹介されています。これらのテクニックはCopilotに限らず、生成AIを用いてコードを生成させる際の参考になると思われます。 この記事では、紹介されているテクニックのポイントをまとめてみました。 GitHub Copilotでよりよいコードを生成するためのポイント 生成AI活用の基本として説明されたのは、大規模言語モデルを用いた生成AIでは、コンテキスト(文脈)に基づいて予測を行うように設計されているため、生成AIに対する入力やプロンプトがコンテキストに富んでいるほど良い出力が得られる、という原則です。 それゆえ、GitHub CopilotおよびGitHub Copi
ControlNetの開発者として知られるLvmin Zhang氏が、背景透過画像を生成できる「Layer Diffusion」を開発しました。すでにLayer Diffusionを簡単に使えるツールが公開されていたので、実際にPC上にインストールして透過画像を生成してみました。 [2402.17113] Transparent Image Layer Diffusion using Latent Transparency https://arxiv.org/abs/2402.17113 GitHub - layerdiffusion/LayerDiffuse: Transparent Image Layer Diffusion using Latent Transparency https://github.com/layerdiffusion/LayerDiffuse GitHub -
Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ 画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel(イリヤスベル)さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL(SDXL)が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStablity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな
みなさんプログラムは書いていますでしょうか。この一年でChatGPTができ、CopilotにCopilot Chatなど色々なAIツールが出ていますが今回お勧めするのはPhindというAIアシスタントです。 Phindとは Phind(Phind.com)とは端的にいえばGPT-4を超えるコーディング能力に特化した言語AIです 参考リンク:大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回る リンク内で言われているように、WebからChatGPTやGoogleのように簡単に使うことができますが、Phindの真髄はここでは味わえません。 Phindの真の実力 Phindの本当の実力はVScode拡張を使うことによって体感することができます。 PhindのベースモデルはPhind-CodeLlamaというものを使っています。これはMeta社が作ったCodellamaというプロ
こんにちは。職業「戸倉彩」です。 Visual Studio Code(以下、VS Code)は、その拡張性の高さで世界中の開発者から支持されています。特に、「コード生成」を行なってくれる拡張機能は、プログラミング作業の効率化に大きく貢献しています。今回は、VS Codeで利用できるコード生成拡張機能を3つ選定し、紹介していきます。 ※本記事は、2023年12月1日時点で公開されている情報に基づいています。 1. GitHub Copilot / GitHub Copilot Chat GitHub Copilot - Visual Studio Marketplace GitHub Copilot Chat - Visual Studio Marketplace *プレビュー版 GitHubが公開している拡張機能。すでに1,000万以上もの数がダウンロードされています。 2023年に試す
「Google Colab」で「Stable Cascade」を試したので、まとめました。 【注意】Google Colab Pro/Pro+のA100で動作確認しています。 1. Stable Cascade「Stable Cascade」は、「Würstchen」ーキテクチャをベースにした新しいテキスト画像変換モデルです。3段階のアプローチにより、一般消費者向けハードウェアでの学習とファインチューニングが簡単にできます。非商用利用のみを許可する非商用ライセンスの下でリリースされます。 ファインチューニング、ControlNet、LoRA学習用のスクリプトを Stability AI の GitHub で公開しています。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) Colabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」の「A1
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第33回目は、生成AI最新論文の概要5つを紹介します。 生成AI論文ピックアップ 訓練なしで複数キャラを同時に異なるプロンプトで量産できる画像生成AI「ConsiStory」、NVIDIAなどが技術開発 “あいまいな言葉”で画像を合理的に編集できるモデル「MGIE」、Appleなどが開発 Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」 Google、探索アルゴリズムを使わずチェスのグランドマスターレベルを達成するAIモデルを発表 テキストや写真から高解像度の3Dモデルを数秒で生成するモデル「LGM」 訓練な
高品質音声合成エンジン「AITalk」を開発するエーアイが、新世代DNN音声合成エンジン「AITalk6」を活用したNeuralボイスライブラリを搭載した「A.I.VOICE2」を2023年12月22日にリリースしました。A.I.VOICE2は自然で人間らしい声を目指した「Neuralボイスライブラリ」に対応し、アクセント句ごとにスタイル変更をしたり、より直感的で簡単な操作で音声合成ができたりするとのこと。A.I.VOICE2を操作する機会が得られたので、実際に触ってみました。 A.I.VOICE https://aivoice.jp/ A.I.VOICE2の体験版はユーザーサポートサイトでダウンロード可能。今回は「琴葉茜/葵」をクリック。 A.I.VOICE2はWindows版とMac版が用意されています。今回はWindows版をクリックしてインストーラーをダウンロードします。インストー
Stable Diffusionのおすすめモデルを紹介!ダウンロード方法から著作権まで徹底解説 2024 2/20 「Stable Diffusion」を使うと写真のようにリアルな画像や、高画質なアニメ調の画像を作れますが、これは使用するモデルによって異なることをご存知でしたか? 今回は、画像生成に大きく影響するstable diffusionのモデルに焦点を当てて、おすすめのモデル、ダウンロード方法、使用方法、さらに商用利用時の注意点について詳しくご紹介します。 この記事を最後までお読みいただければ、お好みの画像を自由に作れるようになるかもしれません。 ぜひ、最後までご覧ください! なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Stable Diffusionとは Stable Diffusionは、画像
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く