![生成AIとエディタが密連携して「最強」に、手が止まらない「AI連携エディタ」の世界[Sponsored]](https://cdn-ak-scissors.b.st-hatena.com/image/square/502161c5b8e81a7fce2aeee1b2c997fbc702a4aa/height=288;version=1;width=512/https%3A%2F%2Fforest.watch.impress.co.jp%2Fimg%2Fwf%2Flist%2F1624%2F360%2Femeditor-chatgpt-top.png)
オープンソースで開発される「audapolis」は書き起こし機能を備えたメディアエディターで、音声を自動的にテキストに書き起こすだけでなく、書き起こしたテキストを編集することで同時に音声も編集できるツールで、無料で使うことができます。 GitHub - bugbakery/audapolis: an editor for spoken-word audio with automatic transcription https://github.com/bugbakery/audapolis audapolisはオープンソースで開発されるフリーアプリで、AGPL-3.0ライセンスの下で配布されています。GitHubのページにアクセスし、「Release」にある最新バージョンをクリック。記事作成時点での最新バージョンはv0.3.0です。 audapolisはmacOS・Linux・Window
最新のアプリやサービスのニュースを書くのが仕事の筆者にとって情報の整理は永遠の課題だ。 もちろん書くことを仕事にしている人に限らず、氾濫する大量の情報を必要な時に取り出して利用したいという欲求は多くの人が持っているはずだ。 以前は手書きノートやファイルのような紙媒体に保存していた情報も、時代とともに完全にデジタルに移行し、Evernote、Microsoft OneNote、Notionといったメモを作成することに特化したクラウドアプリを利用している人も多いだろう。 筆者はおそらく普通の人よりは多くのサービスに触れているはずだが、どれも帯に短したすきに長しに感じてしまい、複数のメモアプリに情報が散乱してしまっているのが実情だ。 そこで6月6日に日本でも提供が開始されたグーグルの「NotebookLM」だ。 「AI駆動型のリサーチ、執筆アシスタント」と説明されているように、参照文献(ソース)
※本ページは、アフィリエイト広告を利用しています。 「はじめてでもここまでできる」の本書タイトル通り、読んで3時間ほどでStable Diffusionの画像生成を思い通りにできるようになりました! Stable Diffusionでどんなことができるのかは知っていましたが、実際に自分のPCにセットアップし、プロンプトによる画像生成をはじめ、色塗り指定や画風指定、キャラをAIに学習させての画像生成までできました。Stable Diffusion初心者の人にお勧めの解説書を紹介します。 また、少しやってみたけどTextual InversionやControlNetやLoRAなどがうまく使えない、そんな人にもかなりお勧めです。 本書は「はじめてでもここまでできる」というタイトル通り、初心者向けの解説書です。そして「本格活用」とあるように、ただ使えるようになるだけでなく、塗りの書き込み感、色塗
AIスタートアップの米Anthropicが、同社のチャットAI「Claude 3」向けに公式プロンプト集を公開している。3月11日までに64種類の使用例を公開中。専用のWebサイト「プロンプトライブラリ」で公開しており、英語と日本語表示に対応している。 例えば、入力した材料や好みに応じた料理レシピを提案する「料理クリエイター」などのプロンプトを公開している。プロンプトは「システム」と「ユーザー」の2つに分かれ、まず前者でAIに指示し、次に後者でユーザー個別の条件や要件を伝える仕組み。料理クリエイターの場合は以下のような具合だ(原文ママ)。 システム:あなたの仕事は、利用可能な材料や食事の好みに関するユーザーの入力に基づいて、パーソナライズされたレシピのアイデアを生成することです。この情報を使用して、ユーザーの食事のニーズに対応しながら、指定された材料を使用して作ることができるさまざまな創造
Vibeはあらゆる言語に対応の、AIによる音声書き起こしが可能なオープンソースのデスクトップアプリです。音声文字起こしのAIモデルとしてwhisperが採用されています。各OS対応、Tauri(Rust)及びWhisper.cppなどで構成されています。 オフラインで動作し、データは送信されない仕様、SRT、VTTフォーマットのサポート、音声ファイルおよび動画の音声文字書き起こしが可能となっています。さらに今後の予定としてリアルタイム音声文字起こし対応、別言語に翻訳、文字起こしを行った文章の要約、他アプリの音声文字起こし対応、ポッドキャストの文字起こしサポートなどがロードマップに組み込まれています。 大事な授業を欠席した友人に頼まれて開発したそうです。個人的にはそう遠くない未来にキーボードが多くの方にとって不要になり、単純なテキスト入力なら音声が一般化するんじゃないかと思っています。並行し
※本ページは、アフィリエイト広告を利用しています。 今年は、Webサイトの制作やアプリの開発にAIを活用するシーンがさらに増えそうですね。「HTMLで入力フォームを作って、CSSはBootstrapで。」「MySQLで商品名・価格・在庫数を管理するデータベースを作って。」とお願いすれば、AIはすぐに適切なコードで作成してくれます。 Webサイト制作やアプリ開発の現場でChatGPTにしてもらうと便利なことをまとめた解説書を紹介します。 本書は、ブラウザ版のGPT-3.5をメインに導入方法をはじめ、ゼロからWebアプリを作ったり、在庫管理システムを作ったり、作業負担を軽減する小さなプログラムを作ったり、サイトの仕様書や規約などのドキュメントを書いたり、と実際に作りながらその使い方を学べる解説書です。最後の章ではGPT-4でのより完璧なコードで作る方法もあります。
OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ
「Midjourney」「Stable Diffusion」などの画像生成AIや、チャットAIボット「ChatGPT」をはじめ、様々なサービスが登場してきた生成AI(ジェネレーティブAI)。 現在SNSでは、「Suno AI」という新たな自動作曲AIサービスが話題です。 神前暁さんやtofubeatsさんといった第一線で活躍する音楽プロデューサーも、試しに「Suno AI」を使ってみた結果をXに投稿。 その自然な出来栄えに、神前暁さんは「アレンジやMixがそれっぽくなるのは想定内だったけどメロも70点くらいのを平気でポンポン出してくる。このサビなんて少し手を加えれば結構売れるのでは?ってレベル」と、驚きを露わにしています。 話題のSuno AIを試してみたけどヤバいですねコレは… アレンジやMixがそれっぽくなるのは想定内だったけどメロも70点くらいのを平気でポンポン出してくる。このサビな
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く