[B! ai] kathewのブックマーク

「Stable Diffusion 3 Medium」がついに解禁、一般的なGPUでも効率よく動作する2Bモデル／フォトリアリズムを実現、NVIDIAとの提携によりパフォーマンス50％向上

kathew 2024/06/19

リンク

生成AIで議事録が60分→2分。96%工数削減した自動生成ツールの紹介｜noteエンジニアチームの技術記事

こんにちは、note AI creative（以下、nAc）の田中です。 nAcとして今までさまざまな社内の業務改善に取り組んできましたが、中でも「議事録作成業務」は負担の大きい業務の１つでした。セールス・カスタマーサクセスなど顧客と対面する部署では特に議事録作成は重要な業務として頻繁に発生しますが、1回あたり最大60分かかっており改善の余地がありました。 nAcが作成した生成AIのソリューションを使うことで、作業量が96%も削減され、60分の作業が2分で終わるようになりました。議事録を生成するデモgifnote proチームの社内発表資料から抜粋この記事では、議事録作成を自動化するために作成したソリューションとその効果について紹介します。議事録作成効率化の歴史議事録作成業務の効率化を目指し、まずは「tl;dv」というツールを導入してテストを行いました。 tl;dvは非常に機能が豊富

kathew 2024/06/18

AI

リンク

わずか3日で配信中止になった話題作が復活！「ドキドキAI尋問ゲーム完全版」，Steamで配信開始

わずか3日で配信中止になった話題作が復活！「ドキドキAI尋問ゲーム完全版」，Steamで配信開始編集部：荒井陽介インディーゲームクリエイターのヤマダ氏は本日（2024年5月25日），PC向けアドベンチャーゲーム「ドキドキAI尋問ゲーム完全版」をSteamでリリースした。価格は389円で，リリースから1週間は10％オフの350円で購入できる（価格はいずれも税込み）。この発表は，本日配信された「Indie Live Expo」で行われたもの。本作は，ChatGPTの利用によって，プレイヤー自身の言葉で容疑者（AI）を尋問できるアドベンチャーゲーム。7回以内の尋問でAIを自白させることが目的となるが，そこから本当の「AIとの対話」が始まるという。タイトル名に「完全版」とあるが，オリジナルの「ドキドキAI尋問ゲーム」は，2023年3月に1度リリースされたものの，想定を遥かに上回る利

kathew 2024/05/26

game
AI

リンク

［速報］Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開

［速報］Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 Googleは同社の最新生成AIであるGeminiをベースとした新しいWeb IDE「Project IDX」をオープンベータとして公開しました。 Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。これまでその存在は発表されていましたが、招待されたユーザーのみが利用可能でした。 We want to make generative AI accessible to every developer on the planet. That’s why we’re making Gemini

kathew 2024/05/15

リンク

GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→｢ついにコーダーが恐怖を感じる時が来たか｣

kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません．思いついたことをつぶやきます．人生を楽しく生きよう（New!） kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

kathew 2024/05/15

ほお。これは賢い

AI

リンク

すがやみつる先生が生成AIを使ったことでAIを憂う人たちから大量の質問が殺到する→質問に丁寧に返答、ベテラン漫画家が話す「模倣について」の考え方がためになる

すがやみつる @msugaya 私も試してみました。プロンプトは、以下のとおりです。＊＊＊＊＊『ゲームセンターあらし』というタイトルのマンガがありますが、このマンガに関係なく、タイトルだけのイメージから、美少女がゲームセンターで激しくゲームをプレイする絵を、マンガタッチで描いてください。＊＊＊＊＊こちらの方が年齢が高そうですね(^_^)。 ChatGPT経由でDALL-E3に描いてもらいました。 2024-04-30 22:26:48 ジロー @i9r82k こんこんばんばん本日夜便は、ゲームセンターあらしより「ゲームセンターあらし」ですゲーセンというか、カラオケじゃないか？黒髪ショートカットって意外に珍しい気がするなんか悪友というか、腹を割って話せる関係っぽい感じがします＃画像生成AI ＃美少女 pic.twitter.com/8SF9NJb1QR 2024-04-30

kathew 2024/05/05

誠実な使い方だ

リンク

米軍、AIドッグファイトに成功。AI自律飛行のX-62A VISTA試験機が有人のF-16との模擬空中戦で防御と攻撃 | テクノエッジ TechnoEdge

ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他米国空軍テストパイロットスクールと国防高等研究計画局は（DARPA）、昨年2月にAIによる自律飛行を実現したX-62A可変飛行安定性試験機（VISTA）を用い、有人のF-16戦闘機との模擬空中戦に成功したと発表しました。 DARPAの空中戦革新（Air Combat Evolution：ACE）プログラムの一環として、人工知能アルゴリズムを搭載したX-62A VISTAは、2023年9月に行われた飛行試験で「大規模な機首対機交戦」による防御と攻撃の両方の機動を試し、有人パイロットが操るF-16に対し時速1200マイル（約1900km）で2000フィート（約610m）の距離にまで接近したと説明。X-62A VI

kathew 2024/04/23

リンク

漫画制作に適したモデルは？Animagine 3.1 vs Animagine 3.0 徹底比較！｜AICU media

4月に入り、X や kindle インディーズで AI で漫画を見かける機会が増えてきました。最近のイラスト系画像生成 AI では、漫画が流行の兆しを見せてきているようです。参考：SD黄色本そこで AICU media では、「AI で漫画を作ってみたいけど、どのモデルを使えばいいんだろう…」という方向けに、白黒漫画制作に適した Stable Diffusion のモデルを調査しました！ Animagine 3.1まずはアニメ系 SDXL の主流モデルとなっている「Animagine」の最新バージョンである Animagine 3.1 でモノクロイラストを生成してみましょう。プロンプト「best quality , monochrome , lineart,1girl, bob cut, flat chest , short hair , school uniform, round_

kathew 2024/04/16

AI
comic

リンク

GPT-4レベルの衝撃 PC内で使えるオープンLLM「Command R+」

カナダのAIスタートアップCohereは4月4日（現地時間）、ビジネス向けに最適化された最新の大規模言語モデル（LLM）「Command R+」を発表した。高度なRAG技術を採用 Cohereは、AI業界に変革をもたらしたTransf ormerモデルを提唱した論文「Attention is All You Need」の共同執筆者として知られるトロント大学の研究者Aidan Gomez氏らによって2019年に設立されたカナダのAIスタートアップ。 OpenAIと同様、LLMの開発に特化しており、企業向けにチャットボット、検索エンジンの最適化、要約サービス、自社AIモデルのAPIなどを提供している。 Command R+は、同社が3月に発表した「Command R」の後継となるモデルであり、Cohereが得意とする高い効率性と精度のバランスを重視したRシリーズの一部となる。 128K（12万

kathew 2024/04/09

AI

リンク

GitHub、Copilotでより高い精度のコードを生成させる方法を指南。関連ファイルを開く、トップレベルのコメントを書くなど

GitHub、Copilotでより高い精度のコードを生成させる方法を指南。関連ファイルを開く、トップレベルのコメントを書くなど記事の中で、プログラマが意図したコードを高い精度で生成AIに生成させるためのテクニックがいくつも紹介されています。これらのテクニックはCopilotに限らず、生成AIを用いてコードを生成させる際の参考になると思われます。この記事では、紹介されているテクニックのポイントをまとめてみました。 GitHub Copilotでよりよいコードを生成するためのポイント生成AI活用の基本として説明されたのは、大規模言語モデルを用いた生成AIでは、コンテキスト（文脈）に基づいて予測を行うように設計されているため、生成AIに対する入力やプロンプトがコンテキストに富んでいるほど良い出力が得られる、という原則です。それゆえ、GitHub CopilotおよびGitHub Copi

kathew 2024/03/28

リンク

立ち絵や合成素材に使える背景透過PNG画像を簡単に生成できる画像生成AI「Layer Diffusion」をローカルにインストールして使ってみた

ControlNetの開発者として知られるLvmin Zhang氏が、背景透過画像を生成できる「Layer Diffusion」を開発しました。すでにLayer Diffusionを簡単に使えるツールが公開されていたので、実際にPC上にインストールして透過画像を生成してみました。 [2402.17113] Transparent Image Layer Diffusion using Latent Transparency https://arxiv.org/abs/2402.17113 GitHub - layerdiffusion/LayerDiffuse: Transparent Image Layer Diffusion using Latent Transparency https://github.com/layerdiffusion/LayerDiffuse GitHub -

kathew 2024/03/08

AI
image

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

kathew 2024/02/26

AI

リンク

本当は教えたくない、VScode拡張の最強プログラミングアシスタントAI Phind(導入・使い方) - Qiita

みなさんプログラムは書いていますでしょうか。この一年でChatGPTができ、CopilotにCopilot Chatなど色々なAIツールが出ていますが今回お勧めするのはPhindというAIアシスタントです。 Phindとは Phind(Phind.com)とは端的にいえばGPT-4を超えるコーディング能力に特化した言語AIです参考リンク：大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回るリンク内で言われているように、WebからChatGPTやGoogleのように簡単に使うことができますが、Phindの真髄はここでは味わえません。 Phindの真の実力 Phindの本当の実力はVScode拡張を使うことによって体感することができます。 PhindのベースモデルはPhind-CodeLlamaというものを使っています。これはMeta社が作ったCodellamaというプロ

kathew 2024/02/21

リンク

コード生成を実現するVS Codeの拡張機能 - Qiita

こんにちは。職業「戸倉彩」です。 Visual Studio Code(以下、VS Code)は、その拡張性の高さで世界中の開発者から支持されています。特に、「コード生成」を行なってくれる拡張機能は、プログラミング作業の効率化に大きく貢献しています。今回は、VS Codeで利用できるコード生成拡張機能を3つ選定し、紹介していきます。 ※本記事は、2023年12月1日時点で公開されている情報に基づいています。 1. GitHub Copilot / GitHub Copilot Chat GitHub Copilot - Visual Studio Marketplace GitHub Copilot Chat - Visual Studio Marketplace *プレビュー版 GitHubが公開している拡張機能。すでに1,000万以上もの数がダウンロードされています。 2023年に試す

kathew 2024/02/21

リンク

Google Colab で Stable Cascade を試す｜npaka

「Google Colab」で「Stable Cascade」を試したので、まとめました。【注意】Google Colab Pro/Pro+のA100で動作確認しています。 1. Stable Cascade「Stable Cascade」は、「Würstchen」ーキテクチャをベースにした新しいテキスト画像変換モデルです。3段階のアプローチにより、一般消費者向けハードウェアでの学習とファインチューニングが簡単にできます。非商用利用のみを許可する非商用ライセンスの下でリリースされます。ファインチューニング、ControlNet、LoRA学習用のスクリプトを Stability AI の GitHub で公開しています。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) Colabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」の「A1

kathew 2024/02/17

AI
illust

リンク

複数の同一人物を同時に量産できるNVIDIAの画像生成AI「ConsiStory」、Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第33回目は、生成AI最新論文の概要5つを紹介します。生成AI論文ピックアップ訓練なしで複数キャラを同時に異なるプロンプトで量産できる画像生成AI「ConsiStory」、NVIDIAなどが技術開発 “あいまいな言葉”で画像を合理的に編集できるモデル「MGIE」、Appleなどが開発 Gemini UltraやGPT-4に匹敵する数学特化のオープンソース言語モデル「DeepSeekMath」 Google、探索アルゴリズムを使わずチェスのグランドマスターレベルを達成するAIモデルを発表テキストや写真から高解像度の3Dモデルを数秒で生成するモデル「LGM」訓練な

kathew 2024/02/15

AI

リンク

GPT-4無料使い放題「リートン」で画像生成AI「Japanese stable Diffusion XL」が利用可能に／Amazonギフト券が当たるバレンタインキャンペーンも実施中

kathew 2024/02/14

リンク

誰でも簡単に琴葉茜や結月ゆかりの自然な読み上げ音声を生成できる「A.I.VOICE2」レビュー

高品質音声合成エンジン「AITalk」を開発するエーアイが、新世代DNN音声合成エンジン「AITalk6」を活用したNeuralボイスライブラリを搭載した「A.I.VOICE2」を2023年12月22日にリリースしました。A.I.VOICE2は自然で人間らしい声を目指した「Neuralボイスライブラリ」に対応し、アクセント句ごとにスタイル変更をしたり、より直感的で簡単な操作で音声合成ができたりするとのこと。A.I.VOICE2を操作する機会が得られたので、実際に触ってみました。 A.I.VOICE https://aivoice.jp/ A.I.VOICE2の体験版はユーザーサポートサイトでダウンロード可能。今回は「琴葉茜／葵」をクリック。 A.I.VOICE2はWindows版とMac版が用意されています。今回はWindows版をクリックしてインストーラーをダウンロードします。インストー

kathew 2024/02/13

voice
AI

リンク

Galileo AI

kathew 2024/02/08

AI

リンク

Stable Diffusionのおすすめモデルを紹介！ダウンロード方法から著作権まで徹底解説 | WEEL

Stable Diffusionのおすすめモデルを紹介！ダウンロード方法から著作権まで徹底解説 2024 2/20 「Stable Diffusion」を使うと写真のようにリアルな画像や、高画質なアニメ調の画像を作れますが、これは使用するモデルによって異なることをご存知でしたか？今回は、画像生成に大きく影響するstable diffusionのモデルに焦点を当てて、おすすめのモデル、ダウンロード方法、使用方法、さらに商用利用時の注意点について詳しくご紹介します。この記事を最後までお読みいただければ、お好みの画像を自由に作れるようになるかもしれません。ぜひ、最後までご覧ください！なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Stable Diffusionとは Stable Diffusionは、画像

kathew 2024/02/05

リンク

はてなブックマーク

タグ

関連タグで絞り込む (70)

aiに関するkathewのブックマーク (134)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス