[B! AI] harutabiのブックマーク

https://platform.openai.com/docs/guides/structured-outputs

harutabi 2024/09/19

AI

リンク

ユーザー全員の記憶を忘れないAI Chat Bot「メモリアドラゴン」を作った話【Gemini 1.5 Flash】｜かりみや

遊べるDiscordコミュニティへの参加はこちらから！！メモリアドラゴンについてみんなの事を覚えるためにDiscordにやってきた赤ちゃんドラゴンユーザーが教えたことはすべて鵜呑みにしてしまう本人は何でも覚えていると思っているが、実際にはよく忘れている中身の話 Gemini1.5 Flashを用いて、チャット履歴をタグ付けした上で外部のjsonファイルに保存→読み込みし、擬似的な記憶を作り出すコミュニティ向けLLM botを作ってみましたセッションは常に全て新規に始まっています。上記の会話でシステムプロンプトの部分は一人称が「ぼく」である事ぐらいです。その他の、惣菜発表ドラゴン構文の部分や、ナルトが好きで、ユーザーが飛段が好きな事などは、チャットを続けたうえで新たに記憶した部分です。ユーザーがそれぞれ教えたことを大きな記憶として蓄積しつづけ、一個の人格となることを目的とし

harutabi 2024/09/19

AI

リンク

角刈りオジサンから美少女ボイス　「GPU不要で超低遅延」なリアルタイム音声変換ソフトを見てきた

ブースは、韓国の音声AI企業Supertoneが出展したもの。角刈りオジサンの美少女ボイスは、リアルタイム音声変換ソフト「SHIFT」のデモによるものだった。このSHIFT、少女だけでなく少年、成人女性、成人男性、渋いおじいさん、悪魔などさまざまな声がプリセットされており、リアルタイムかつ高精度に声を変換できるのが特徴。独自の音声合成基盤モデル「NANSY」（Neural Analysis & Synthesis）を採用しており、ユーザーの声の事前学習も、10秒程度のサンプルスクリプトを読み上げるだけで完了。ユーザーとキャラクターの音声の混合比率や感情の表現度合い、音の高低なども細かく調整可能だ。同様の技術として「RVC」（Realtime Voice Changer）などが有名だが、快適に利用するにはNVIDIAの高性能なGPUを必要とする。一方、SHIFTはCPUのみで47ミリ秒と

harutabi 2024/07/04

リンク

[翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜

この記事は "What We’ve Learned From A Year of Building with LLMs" という記事を著者の一人である Eugene Yan さんから許可を得て翻訳したものです。 https://applied-llms.org/ Thank you for giving me a permission to translate this wonderful article! 著者の方々 Eugene Yan Bryan Bischof Charles Frye Hamel Husain Jason Liu Shreya Shankar 原文の公開日 2024/６/8 今は大規模言語モデル（LLM）を使った開発がとってもエキサイティングな時期です。この1年間で、LLMは実世界のアプリケーションに対して「十分に良い」ものになりました。そして、年々良くなり、安く

harutabi 2024/06/25

AI
技術

リンク

画像生成AI、安いPCでも高速に　衝撃の「Stable Diffusion WebUI Forge」 (1/4)

Stable Diffusion Forgeを表示した様子。基本的な操作は既存のStable Diffusion WebUI AUTOMATIC1111とほぼ同じ画像生成AI「Stable Diffusion」用の新しいユーザーインターフェース「Forge」が2月6日に登場しました。開発したのは、これまで「Controlnet」や「Fooocus」などStable Diffusion関連の様々な重要技術を開発してきたillyasviel（イリヤスベル）さん。何よりインパクトが大きいのは、グラフィックボードのVRAM容量が小さい安価なPCでも最新版のStable Diffusion XL（SDXL）が動かせることです。 RTX 40シリーズが求められたSDXL SDXLは、2023年8月にStabl ity AIが発表した画像生成AI。高画質な出力ができる一方、コミュニティーサイトで話題にな

harutabi 2024/02/26

リンク

“世界生成AI”到来か　画像生成AIのゲームエンジン化が進む (1/5)

Midjourneyの生成画像。12月のアップデートのv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか（筆者作成）画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

harutabi 2024/01/22

ゲーム用途はまだ見えないけど、物質の流動性に人が慣れてくる時代が来そう

ゲーム
AI

リンク

ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料｜DTMステーション

自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolやCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC（パラキート・ブイシー）が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して

harutabi 2023/12/26

AI

リンク

「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する | AIDB

ホーム AI論文解説, LLM, プロンプト「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する「自分を信じて限界を超えてください」など感情をグッと込めた指示プロンプトが添えられると、ChatGPTなどのLLMのパフォーマンスは向上する 2023/11/3 AI論文解説 LLM プロンプト AI DB Research 感情を込めたプロンプトが大規模言語モデル（LLM）の性能を向上させることが示されました。「自分を信じて限界を超えてください」や「困難は成長のチャンスです。」といった自信や成長に関わる要素を含む指示が、モデルの出力品質に貢献するとの報告です。この発見は、人間の感情を取り入れたアプローチが、人工知能の分野においても重要な役割を果たす可能性を示唆しています。Microsoftなどの研究グル

harutabi 2023/11/05

ChatGPT
AI

リンク

ChatGPT で自分の仕事がどう楽しくなるのかを考えるネタ集 -2023年10月バージョン-

企業・組織に属している方向けの ChatGPT の社会・ビジネスへの影響を考えるお話です。人とComputerの在り方が大きく変わったこれらも交えて。それらが周囲にあふれ出すその日のために、今はしっかりと Prompt の仕方を学んでおきたいものです。そのためのサンプルも幾つか継続して提示しています - とある人の、変わってしまった日常の一部 - なぜ?何が? ChatGPT で変わるのか? - Plugin の可能性 - Code Interpreter の可能性 - Copilot の可能性

harutabi 2023/10/20

AI
ChatGPT

リンク

【「スゴ本」中の人が薦める】AIの限界をAIが超え始めていることを実感できる5冊

1. 『ヒトはなぜ笑うのか』マシュー・M. ハーレー、レジナルド・B・アダムズJr.、ダニエル・C・デネット著、片岡宏仁訳 2. 『言語の本質』今井むつみ、秋田喜美著 3. 『教養としてのAI講義』メラニー・ミッチェル著、尼丁千津子訳 4. 科学雑誌『Newton（ニュートン）』 2023年10月号、中野太郎、尾崎太一執筆、松尾豊監修 5. 『天然知能』郡司ペギオ幸夫著これは、ヘミングウェイが書いたとされる、たった6語の小説だ(※1)。この短い小説から、何が感じられるだろうか？売ります赤ちゃんの靴未使用おそらく、悲嘆だろう。我が子のために靴を買ったのだけれど、その靴を履く前に、亡くなってしまったのだろう。靴を見るたびに喪われた子のことを思い出し、悲しみに暮れてしまう。ならばいっそ手放してしまおう―――背後にそんなストーリーを想像させる。私が想像したこの感情

harutabi 2023/10/17

リンク

【全体公開】AIイラストが理解る！StableDiffusion超入門｜スタジオ真榊【AIイラスト術解説】｜pixivFANBOX

こちらの記事は2023年版のものです。特に理由がなければ、SDXLやForgeにも対応した2024年版の「AIイラストが理解る」をお読みくださいませ。こんにちは！2022年10月からAIイラストの技術解説記事を連載してます、サークル「スタジオ真榊」の賢木イオです。この記事は、これまで投稿してきた100本（約40万文字）を超える...

harutabi 2023/08/21

リンク

HakuImg（Extension）を使った効率的なi2i

chichi-pui様主催のAICollectionアドベントカレンダー4月2日の記事になります。何か絵も描ける人しか書けなそうな記事ないかなーってずっと考えていたんですが、i2iだったり画像加工の話だったり既にいろいろ出ちゃった！　今更何も書くことねぇってなりましたが、画像加工はWebUI上でもけっこう出来るんだよなって思ったので、Extension紹介にしました。 ※本体3/26以降の最新版でちょっとUI変わっているみたいです。すみません。基本はかわらないので見た目ちょっと違うなくらいに思っといてください🙏 どんなやつ？ Automatic1111のExtensionで使える、画像編集ソフトの機能を色々入れちゃいました。みたいなやつです。ちょっと編集したい！　みたいな時に毎回編集ソフトに送るのもダルい！そんな悩みをある程度解決してくれるのがこれです！手だけ直したい、目だけ直

harutabi 2023/04/03

リンク

画像生成AI　速いマシンは世界が違う (1/4)

「Stable Diffusion」のような画像生成AIは、ゲーム開発の場面で実際に使い物になるのでしょうか。マウスコンピューターのクリエイター向けPC「DAIV」のDAIV DD-I9G90（NVIDIA GeForce RTX 4090搭載）とDAIV DD-I7N60（NVIDIA RTX A6000搭載）を比較しながら、筆者が開発に関わるインディゲーム「Project-GENESIS」での背景のプロトタイプ制作を通じて、その可能性を探りました。画像の出力（生成）速度だけであればRTX 4090に圧倒的に軍配が上がりますが、複数のアプリをまたがった作業をする場合にはVRAM（ビデオメモリ）搭載量が48GBと多いRTX A6000が生産性を高めると考えて良さそうです。コンピュータの世界ではいつの時代も「速さは正義」であることを、画像生成AIを実践で使おうとして改めて痛感しました。 2機

harutabi 2023/04/03

リンク

【Stable Diffusion】女の子を描くのが得意なCarDos Anime

「かわいいアニメの女の子の画像を生成したい」「短いプロンプトで高画質な画像を生成したい」このような場合には、CarDos Animeがオススメです。この記事では、CarDos Animeについて解説しています。本記事の内容 CarDos Animeとは？CarDos Animeの利用方法CarDos Animeの動作確認それでは、上記に沿って解説していきます。 CarDos Animeとは？ CarDos Anime | Stable Diffusion Checkpoint | Civit ai https://civit ai.com/models/25399/cardos-anime CarDos Animeとは、アニメ画像の生成が得意なStable Diffusion用モデルです。多人数の表示を上手く表現できます。また、ちびキャラも簡単に生成可能です。このモデルの開発者

harutabi 2023/03/31

AI

リンク

【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) - Qiita

【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.)OpenAI ChatGPTlangchainGPT-4LlamaIndex 生成AIカンファレンス〜徹底解剖「トップランナーから見た日本が挑む生成AIの最前線」〜日時：5月8日(水) 10:00-18:30 形式：オフライン・オンラインのハイブリッド開催場所：東京大学伊藤謝恩ホール（オンライン参加の方は配信URLをお送りします）参加方法：下記イベントページより申込 ChatGPT に代表される今日の AI ブームを牽引しているのは大規模言語モデル（Large-scale Language Model, LLM）と言っても過言ではないでしょう。LLM とは大量のテキストデータを使ってトレーニングされた自然言語処理のモデルで、代表的なものに、GPT（OpenAI）

harutabi 2023/03/31

AI
ChatGPT

リンク

ChatGPTの使い方のコツをまとめる - BioErrorLog Tech Blog

面白いなと思った使い方、大事だなと思ったコツの個人的な備忘録です。はじめに前提 ChatGPTのTipsまとめ基本編鵜呑みにしない途中で文章が途切れた時は "続けて" 汎用Tips 文脈を伝える条件/制約や質問を明示する相手の立場を指定する回答の特性を指定する英語で入力する無茶振りするレビュアーや反論者を用意するおわりにはじめに ChatGPT、面白いですね。難しく考えず素朴にChatGPTと会話するのも十分面白いですが、コミュニケーションを工夫することでより良い体験が得られたりします。 (対人コミュニケーションと同じですね) 今回は、個人的にChatGPTを使ってる中での好みのコツをまとめます。 ChatGPTのコツを書いているはずが、いつの間にか対人コミュニケーションの話みたいになってしまった ChatGPTの使い方のコツをまとめる - BioErrorLo

harutabi 2023/03/27

AI

リンク

ChatGPTが新着論文を要約し毎朝メールしてくれる仕組みの作り方 | Antaa Slide

2024年3月13日追記・OpneAIのAPI課金システム変更に伴うエラーについて解説。 10月26日追記・メールが届かなくなった際に権限の再承認が必要な件。 5月11日追記・検索にかかった論文に抄録がない場合、AIが要約を創造(捏造)する件。 4月21日追記・作り方のサイトではなく公開されたLINE Botのリンクに切り替え。・エラ−429が出た場合4のスライドを追加。 4月10日追記・送信トリガーの変更方法のスライドを追加。・複数キーワードや雑誌を指定して検索する方法のスライドを追加。デモコードは、 const PUBMED_QUERY = '(aaa) AND (bbb) AND (("ccc"[Journal]) OR ("ddd"[Journal]))' ・エラー原因をChatGPTに聞くコツについても追記。 4月6日追記・エラー429が出た場合の対処法スライド

harutabi 2023/03/27

情報側から手元に来てくれる良い使い方だなぁ。参考にしよう。

リンク

【徹底解説】これからのエンジニアの必携スキル、プロンプトエンジニアリングの手引「Prompt Engineering Guide」を読んでまとめてみた | DevelopersIO

【徹底解説】これからのエンジニアの必携スキル、プロンプトエンジニアリングの手引「Prompt Engineering Guide」を読んでまとめてみたこんにちは。CX 事業本部 Delivery 部のきんじょーです。ここのところChatGPT と戯れてアプリを作ったり、様々なプロンプトの検証をしていましたが、言語モデルの性能を最大限に引き出すために、体系的にプロンプトエンジニアリングを学びたいと考えていました。 GitHub に「Prompt Engineering Guide」という素晴らしいリポジトリがあったので、読んで検証した内容をブログにまとめていきます。本記事は、執筆時点の上記リポジトリの内容を元にしていますが、意訳や独自に検証した日本語のプロンプトを含みます。上記リポジトリも絶賛開発中の段階のため、最新情報や原文が気になる方はリポジトリを直接参照してください。目次プ

harutabi 2023/03/20

リンク

はてなブックマーク

タグ

関連タグで絞り込む (8)

AIに関するharutabiのブックマーク (18)

お知らせ

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

今週のはてなブックマーク数ランキング（2024年9月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス