並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 294件

新着順 人気順

生成aiの検索結果121 - 160 件 / 294件

  • テキストから歌を生成「Suno AI」使い方 作曲家 神前暁もクオリティに驚愕

    「Midjourney」「Stable Diffusion」などの画像生成AIや、チャットAIボット「ChatGPT」をはじめ、様々なサービスが登場してきた生成AI(ジェネレーティブAI)。 現在SNSでは、「Suno AI」という新たな自動作曲AIサービスが話題です。 神前暁さんやtofubeatsさんといった第一線で活躍する音楽プロデューサーも、試しに「Suno AI」を使ってみた結果をXに投稿。 その自然な出来栄えに、神前暁さんは「アレンジやMixがそれっぽくなるのは想定内だったけどメロも70点くらいのを平気でポンポン出してくる。このサビなんて少し手を加えれば結構売れるのでは?ってレベル」と、驚きを露わにしています。 話題のSuno AIを試してみたけどヤバいですねコレは… アレンジやMixがそれっぽくなるのは想定内だったけどメロも70点くらいのを平気でポンポン出してくる。このサビな

      テキストから歌を生成「Suno AI」使い方 作曲家 神前暁もクオリティに驚愕
    • 氾濫する生成AIアニメ 9万枚調査で見えた権利侵害

      「人間かAIか、 どちらが描いたか 分からない」 都内の制作会社で働く アニメーターは 不安を口にした。 描いたのは生成AI(人工知能)。「ONE PIECE(ワンピース)」や「SPY×FAMILY(スパイファミリー)」……。AIにより既存アニメを模した画像が際限なく生み出されている。 生成AIは革新的な手法で文章や画像、映像、音声を生み出し、急速に進化する。著作権のルール整備は進むが、ユーザーによる悪用で日本のソフトパワーを代表するアニメを蝕(むしば)み始めた。ネットに氾濫するAIアニメの実相に迫る。 大量に生成されたアニメ画像は、世界中からアクセスを集める生成AI画像共有サイトで公開されている。誰でも好みの画像を生成でき、投稿が可能になっている。複数のサイトで世界的に人気のあるアニメ13タイトルのメインキャラクター名を検索すると、9万枚を超す画像が引っかかった。 日本経済新聞は専門家の

        氾濫する生成AIアニメ 9万枚調査で見えた権利侵害
      • アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

        原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基本となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術。画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万本の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基本原理です。生成できる時間は、16コマ/2秒

          アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)
        • Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能|shi3z

          Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能 Transformerの発明者らが起業したCohereAIがとんでもないモデルを出してきた。この業界では毎週のように「えーー!」ということが起きるのだが、その中でも年に1,2回起きる「えーーーっ」が起きたのでブログでも紹介しておきたい。 Command-R+(おそらくコマンダープラスと読むのが正しい)というモデルは、わずか100Bで、GPT-4,Claude-3並と言われるモデルだ。しかし、それを主張するだけのモデルなど腐るほどある。だが、実際に触ってみると期待外れということが多かった。 ところがCommand-R+は、その性能は桁違いである。というか、もはや僕という人間如きがちょっと触ったくらいでは「GPT-4よりいいね」とか「ここら辺甘いね」とか判断がつかなくなってきてる。しか

            Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能|shi3z
          • 美大生にとっての生成AIの話|砂大28

            ※当記事では生成AIの是非(適法性/違法性)について言及しない。 かつてはコップに入った猫を「猫である」と判断できなかったAIが、本格的に絵という分野に進出してから数年が経った。 初めこそよくわからない抽象画のような風景やラーメンを手づかみで啜る樋口円香を笑っていた私達に、現在の混沌とした状況は想像できただろうか。 よりにもよって、そんな絵という分野の過渡期に美術大学のデザイン科に進学を決めてしまった大馬鹿者がいる。私だ。 入試対策のデッサンをしながら、自分が目指す分野は果たして10年後に存在するのか、そんな事を考えていた。今やクリエイターにとって死活問題となった画像生成AIの普及は、確実に、それも急速にクリエイターの未来に暗い影を落としている。 ……と思っていた時期が私にもあった。 実際はどうだろう。未だに単語や文章から的確にそのコンテクストを表現した美少女を生成してくれるサービスなど存

              美大生にとっての生成AIの話|砂大28
            • アップル、EV開発計画を白紙に-10年がかりのプロジェクト断念

              The Apple Inc. logo at the new Apple store in Mumbai, India, on Tuesday, April 18, 2023. Photographer: Indranil Aditya/Bloomberg 米アップルは電気自動車(EV)を開発するという10年がかりの取り組みを中止する。事情に詳しい複数の関係者が明らかにした。同社史上最も野心的なプロジェクトの1つを断念することになる。 アップルは27日、社内でこの情報を共有し、同プロジェクトに携わる約2000人の従業員に驚きをもって迎えられたという。非公開情報であることを理由に匿名で語った関係者によると、今回の決定はジェフ・ウィリアムズ最高執行責任者(COO)と自動車プロジェクトを統括するバイスプレジデントのケビン・リンチ氏から従業員に伝えられた。

                アップル、EV開発計画を白紙に-10年がかりのプロジェクト断念
              • テキスト生成AI『Claude』が提供する60以上の「プロンプト集」が使える!すぐに苦手な仕事を自動化せよ | ライフハッカー・ジャパン

                「これ、マストだわ」モニター購入して気づいた、あったほうがいい周辺機器4選 #Amazon新生活セール

                  テキスト生成AI『Claude』が提供する60以上の「プロンプト集」が使える!すぐに苦手な仕事を自動化せよ | ライフハッカー・ジャパン
                • この本を読んだら、Stable Diffusionで画像生成を思い通りにできるようになった! かなりお勧めの解説書です -Stable Diffusion画像生成[本格]活用ガイド

                  ※本ページは、アフィリエイト広告を利用しています。 「はじめてでもここまでできる」の本書タイトル通り、読んで3時間ほどでStable Diffusionの画像生成を思い通りにできるようになりました! Stable Diffusionでどんなことができるのかは知っていましたが、実際に自分のPCにセットアップし、プロンプトによる画像生成をはじめ、色塗り指定や画風指定、キャラをAIに学習させての画像生成までできました。Stable Diffusion初心者の人にお勧めの解説書を紹介します。 また、少しやってみたけどTextual InversionやControlNetやLoRAなどがうまく使えない、そんな人にもかなりお勧めです。 本書は「はじめてでもここまでできる」というタイトル通り、初心者向けの解説書です。そして「本格活用」とあるように、ただ使えるようになるだけでなく、塗りの書き込み感、色塗

                    この本を読んだら、Stable Diffusionで画像生成を思い通りにできるようになった! かなりお勧めの解説書です -Stable Diffusion画像生成[本格]活用ガイド
                  • 無料でGPT4越え!?ついに来たXwin-LM|shi3z

                    今日のウィークリーAIニュースではnpaka大先生と一週間のニュースを振り返った。今週もいろいろあったが、なんといってもダークフォース、GPT-4越えと言われるXwin-LMである。中国製。 大先生もまだ試してないというので番組内で一緒に試してみた。 もちろんドスパラ製Memeplexマシン(A6000x2)を使用。 >>> from transformers import AutoTokenizer, AutoModelForCausalLM >>> model = AutoModelForCausalLM.from_pretrained("Xwin-LM/Xwin-LM-7B-V0.1") Downloading (…)lve/main/config.json: 100%|██████████████████| 626/626 [00:00<00:00, 56.2kB/s] [2023

                      無料でGPT4越え!?ついに来たXwin-LM|shi3z
                    • 音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成 プロの音楽家も「これはヤバい」と驚愕

                      音楽生成AI「Suno AI」がX(旧Twitter)上で話題になっている。歌詞や曲調を文章で指示するだけで音楽を自動生成するサービスで、PCやスマートフォンのWebブラウザ上から利用できる。生成した音楽の出来栄えには、プロの音楽家からも驚きの声が上がっている。 Suno AIは、米国を拠点とする音楽家とAIの専門家たちからなる米Sunoが運営するサービス。開発者の中には、米MetaやTikTokを運営する中国ByteDanceなどに所属していた人たちもいるという。利用にはGoogleやMicrosoft、Discordのアカウントが必要で、12月14日時点ではβ版を提供中。1日5回まで無料で音楽を生成できる他、有料プランもある。 早速使ってみた そのお手並みは? 記者も試しに利用してみた。メニューにある「Create」を押し、「記事を書くのがはかどる音楽を作成してください」と指示を入れた

                        音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成 プロの音楽家も「これはヤバい」と驚愕
                      • 24/1/28 「生成AIの『学習』は学術用語だ」ということをそろそろちゃんと説明した方がいい - LWのサイゼリヤ

                        お題箱から 797.生成aiについて無知なので質問です 下記のように学習元画像を合成したかのような元画像がでることから合成ツールと主張する人がいますが、実際に生成aiは合成ツールなのでしょうか? https://x.com/r18rensyu/status/1745959957990965624?s=61 これ去年の今ぐらいまでなら学習してるから合成ではない論はまだ通用したかもしれないけど、明らかに学習元となる画像がポンポン出るようになってきてしまって正体は引用合成ツールだったのがバレちゃったんだよね。 https://t.co/e367C2DqWl — リハビリ用 (@r18rensyu) 2024年1月13日 質問に対する答えは「依然として生成AIは合成ではなく学習を行っている」で、このツイートは100%誤りです。「塩水を沸騰させると砂糖水になる」と同じレベルの端的な誤りで、議論の余地

                          24/1/28 「生成AIの『学習』は学術用語だ」ということをそろそろちゃんと説明した方がいい - LWのサイゼリヤ
                        • RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO

                          はじめに 新規事業部 生成AIチーム 山本です。 ChatGPT(OpenAI API)をはじめとしたAIの言語モデル(Large Language Model:以下、LLM)を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が(当然ながら)得られてしまいます。 この問題を解決する方法として、Retrieval Augmented Generation(以下、RAG)という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力(プロンプト)に付け加えて渡すことで、ユーザが欲しい

                            RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
                          • NVIDIA、PC上で動くカスタムAI「Chat with RTX」を無償公開

                              NVIDIA、PC上で動くカスタムAI「Chat with RTX」を無償公開
                            • 36億パラメータの日本語言語モデルを公開しました

                              LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは。 LINEのNLP Foundation Devチームの清野舜と高瀬翔とoverlastです。 LINEでは2020年11月から日本語に特化した大規模言語モデル「HyperCLOVA」の構築と応用に関わる研究開発に取り組んできましたが、この「HyperCLOVA」と並行するかたちで複数の大規模言語モデルの研究開発プロジェクトが進行しています。 今回はそれらの研究開発プロジェクトのうち、我々を含むMassive LM開発ユニットから、日本語言語モデル「japanese-large-lm(ジャパニーズ ラージ エルエム)」をOSSとして公開できる状況になりましたので、本ブログを通じてお伝えすることにしました。 この記事

                                36億パラメータの日本語言語モデルを公開しました
                              • 生成AIを使った関東大震災「新証言」展示中止 | NHK

                                日本赤十字社東京都支部は関東大震災から100年になるのにあわせて当時を描いたとされる絵画を題材に生成AIを使って新たな「証言」を作り、展示する催しを25日から開く予定でしたが、中止すると発表しました。 AIが作り出した文章を「証言」と表現することに懸念する声が上がっていて、支部は「より慎重な検討が必要だったと深く反省している」としています。 日本赤十字社東京都支部では、100年前の関東大震災について関心をもってもらおうと当時の救護活動を描いたとされる大正時代の絵画を元に生成AIを使ったプロジェクトを始めました。 まず、絵に描かれた20人の被災者を写真のような肖像画にしました。 そして、被災者の体験談などの文献からあわせておよそ60万字をデータベースにしたうえで、肖像画の人物が語ったような「新証言」を作り、あすから支部などで展示を行う予定でした。 ところが、支部によりますと、AIが作り出した

                                  生成AIを使った関東大震災「新証言」展示中止 | NHK
                                • 英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama

                                  はじめに英語の論文をGPT4に執筆させた際の手順を記します。 普段からChatGPTを使っている人にとっては、当たり前のやり取りしかしていないのですが、意外と使えていない方がnon-AI分野では多いので、丁寧にプロンプトを示していきます。 (ワークショップで解説する必要が出てきたので、そのためのメモ書きです) GPT-4に論文は書けるのか?ゼロから書かせるのは難しいですが、日本語の下書きを英訳するのは得意で、少なくとも筆者が満足する品質のテキストが得られます。 GPTを使って執筆をするメリットDeepLやGoogle翻訳と違い、英文のスタイル(e.g., 論文調)を明示的に指示できるので、翻訳のクオリティが高い 日本語ネイティブにとっては、日本語で書いた方が圧倒的に楽※ スペルミスや文法ミスを犯さないので、校正の手間も減る。※ 基本的に翻訳タスクしか行っていないので、GPTが過去の類似文章

                                    英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama
                                  • 今の世界、とんでもない勢いで技術革新が起きてない?

                                    mRNAワクチンに代表されるバイオ工学の進化(人間の身体の工学的ハッキング) ChatGPT、StableDiffusionに代表される生成AIの進化 常温常圧超伝導(LK-99)の発見(※追試中) 人類の未来を明るくするか暗くするかは分からんが、次のステージには進みそうだな?

                                      今の世界、とんでもない勢いで技術革新が起きてない?
                                    • 音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan

                                      Stability AI は、音楽とサウンド生成のための初のAIモデルとなる Stable Audio を発表しました。 Stable Audio は、最新の生成 AI 技術を駆使し、使いやすい Web インターフェースを介して、より高速で高品質な音楽とサウンドエフェクトを提供する世界初の製品です。Stability AI は、45秒までのトラックを生成してダウンロードできる Stable Audio の基本無料版と、商用プロジェクト用にダウンロード可能な90秒のトラックを提供する「Pro」サブスクリプションを提供しています。 StabilityAI の CEO である Emad Mostaque は、「唯一の独立した、オープンでマルチモーダルな生成 AI の会社として、音楽クリエイターをサポートする製品を開発するために私たちの専門知識を活用できることを嬉しく思います。私たちの願いは、St

                                        音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan
                                      • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

                                        昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

                                          GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
                                        • 宿題もリポートも生成AIが作った「正解」丸写し、教諭は嘆く「これじゃ無料の代行業者だ」

                                          【読売新聞】「これじゃ、無料の宿題代行業者が現れたようなものだ」 東京都内の私立中高一貫校の英語科教諭(56)はため息をついた。昨年度の冬休み、中1の生徒に英語で日記を書く宿題を出したところ、現在完了形など教えていない英文法が使われ

                                            宿題もリポートも生成AIが作った「正解」丸写し、教諭は嘆く「これじゃ無料の代行業者だ」
                                          • GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita

                                            GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみたPythonAWSAzureOpenAIGoogleCloud はじめに GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra(Gemini Advanced)に同じ質問をして、回答結果を比較してみました。 Gemini Ultra以外のモデルはPythonコード上から実行し、Gemini UltraはGemini Advancedのチャット上で実行しています。 各モデルの詳細は以下のとおりです。 G

                                              GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita
                                            • Google Apps Script は、もはやエンジニアが書かない方がいいまである

                                              ラブグラフでエンジニアをしています横江 ( @yokoe24 ) です。 ラブグラフでは、エンジニア以外で Google Apps Script (GAS) を書く方も多く、 Slack通知の自動化など、業務の効率化がおこなわれています。 マジですごいと思います! GASをエンジニア以外が書く問題点 一方で、コードを見るとプログラマーからするとムズムズするところもあります。 変数名に snake_case が混ざっている インデントが揃っていない for文の中で getValue() を回している Google Apps Script の getValue() メソッドはコストが高く、何度も実行するとタイムアウトの可能性が高まる == で比較している double quotes " と single quotes ' が混ざっている こういうコードを見ると直したくてウズウズしてしまいます。

                                                Google Apps Script は、もはやエンジニアが書かない方がいいまである
                                              • GPT-4oをOCRとして使う - Re:ゼロから始めるML生活

                                                OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」って思っちゃったわけです。 ということで、今回はChatGPT-4oを使ってOCRを使うとどんなもんなのかやってみたいと思います。 やりたいこと やってみる とりあえずやってみる 請求書 名刺 参考文献 感想 やりたいこと 今回やりたいことはOCRです。早い話が画像ファイルを突っ込んでテキストを読み取りたいって感じです。 ただ、当たり前のようにOCRって言葉を使用していますがOCRって結構奥が深いです。 mediadrive.jp 単純に画像から文字を見つけて対応するテ

                                                  GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
                                                • 無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携

                                                  米Metaは7月18日(現地時間)、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの700億パラメーターモデルは「ChatGPT(の3月1日版)と互角」(同社)という。 ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を送信する。Metaが受理すると専用URLが送られてくるため、同社がGitHubで公開しているダウンロード用のスクリプトと合わせるとLlama 2の各モデルをダウンロードできるようになる。 モデルサイズは70億、130億、700億パラメーターの3種類があり、それぞれベースモデルとチャット向けに追加学習(ファインチューニング)したモデルを用意する。いずれも4096トークン(おおよそ単語数の意)まで文脈を読める。 性能は、Llama-2-70b-chat(700億のチャット

                                                    無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携
                                                  • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

                                                    Akuma.ai http://akuma.ai 2024年2月、日本発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日本発の画像生成AIサ

                                                      日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
                                                    • AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox) | テクノエッジ TechnoEdge

                                                      筆者も話題になった直後から試そうとしていたのですが、自分ではうまくいかず悶々としていたところ、Memeplexでできるようになったので、そのインプレッションをお届けします。 AnimateDiffの基本的な動作は、静止画を作成できるAI作画モデルを使って、一貫性のある短いアニメーションGIFを生成するというもの。Stable Diffusion 1.5、2.0といった標準的なものだけでなく、その上にカスタム学習(ファインチューニング)したモデルにも対応できるというのが特徴です。同様の技術としては「Tune-A-Video」があったのですが、一貫性が乏しかったために使いどころがなかなか難しいものでした。 筆者は現在、MemeplexとStable Diffusion WebUI上に、妻の写真を学習させたAIモデル(Checkpoint)を作成して使っていて「異世界とりちゃん」という名の下に日

                                                        AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox) | テクノエッジ TechnoEdge
                                                      • いちばんやさしいローカル LLM|ぬこぬこ

                                                        概要ローカル LLM 初めましての方でも動かせるチュートリアル 最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル(LLM)の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。 現状、様々な評価指標により LLM の性能が測定されていますが、

                                                          いちばんやさしいローカル LLM|ぬこぬこ
                                                        • RAGの実装戦略まとめ - Qiita

                                                          それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチ こちらは、性質の異なる複数の検索方式(例えばベクトル検索とキーワード検索)を組み合わせて検索精度を向上させる手法になります。 各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。 今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。 つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

                                                            RAGの実装戦略まとめ - Qiita
                                                          • ChatGPTを利用して画面モックを爆速で作成する - Taste of Tech Topics

                                                            こんにちは、最近スマホのChatGPTアプリで、音声入出力機能を使って会話を楽しんでいる安部です。 皆さんWebアプリ開発などで、画面モックを作成しなければいけない場面は多いですよね? 適当なHTMLを作ったり、ツールで図示したりしますが、正直面倒です。 そこで今回は、ChatGPTに最初から画面モックを作ってもらいます。 最近はChatGPTに画像を添付できるようになったので手書き画像からHTMLを出力することもできますが、 この記事では画面要素を言葉で指定し、HTMLを出力してもらいます(配置などのデザインは、ひとまずChatGPTにお任せしてみます)。 では早速始めましょう。使用モデルはGPT-4です。 簡単な入力フォームを出力させる まずは、よく使いそうな簡単な入力フォームを出力してもらいます。 ここでは、「書籍を登録する画面」という設定で指示を出します。 次の画面構成の案を、HT

                                                              ChatGPTを利用して画面モックを爆速で作成する - Taste of Tech Topics
                                                            • 生成AIとみられる女性の「扇情動画」乱立 再生回数稼ぎ、収益目的も背景か

                                                              ユーチューブに公開された生成AIで作成・加工されたとみられる女性の動画。投稿したアカウントは現在停止されている 生成人工知能(AI)によって作成・加工されたとみられる若い女性の扇情的な動画が、交流サイト(SNS)上などで拡散されている。一見しただけでは生身に見えるほど精緻で、再生回数が数百万回に達するものも。より性的に過激な動画へ誘導するものもあり、専門家は「アクセスを稼いで収益をあげる仕組みが確立されていることが背景にある」と指摘する。 「ミス東大」モデルのような容姿の若い女性が、画面を向きながら公園や屋外を1人で歩く数分の動画。SNSのインスタグラムや動画投稿サイトのユーチューブなどに昨年から登場した、あるアカウントから投稿されたものだ。 「ノーブラ散歩」などの刺激的なタイトルがつけられ、プロフィル欄には東京大学の理系学生をうたい「ミス東大」を目指すなどと記載。他にも、服を着た状態で下

                                                                生成AIとみられる女性の「扇情動画」乱立 再生回数稼ぎ、収益目的も背景か
                                                              • 自分だけの信頼できるAIへ グーグル「NotebookLM」公開

                                                                  自分だけの信頼できるAIへ グーグル「NotebookLM」公開
                                                                • ITエンジニアなのにまだ投資やってないの?ChatGPTでクオンツシステム作って儲けようぜpart3 - Qiita

                                                                  前回まで ITエンジニアなのにまだ投資やってないの?ITエンジニアならChatGPTでクオンツシステム作って儲けようぜ ITエンジニアなのにまだ投資やってないの?ITエンジニアならChatGPTでクオンツシステム作って儲けようぜpart2 ネトフリは面白い 僕はネトフリのヘビーユーザーなんですが、投資系にも リーマンショックまでの経緯と仕組みを実録インタビューで振り返る「インサイドジョブ」や AIテック系の話で、チェスは機械には勝てないと言われてAIが勝ち、「人間の高度な知的能力でしか勝てない」と言った囲碁の世界王者に勝ち、今では7、8年も訓練を積んでようやくなる戦闘機のエースパイロットにも勝ち、AIの実用速度の高さをドキュメントした「アンノウン」なんかも面白いし勉強になります。 投資思考では技術力UPは悪手 投資思考って事業でも人生でもとても大事です。 例えば、収入に不満を持ってるエンジ

                                                                    ITエンジニアなのにまだ投資やってないの?ChatGPTでクオンツシステム作って儲けようぜpart3 - Qiita
                                                                  • 音楽の作り方が決定的に変わる。架空のロックバンドのコンセプトアルバムを丸ごとAIで作れてしまいました(CloseBox) | テクノエッジ TechnoEdge

                                                                    では、一人の音楽素人がAIの力を借りたら、どの程度までコンセプトアルバムが作れるか、試してみました。思いついたのは、今日(2月27日)の11時30分ごろ。まず、ChatGPTにこう指令することから始めました。 ロックのコンセプトアルバムを作りたいので、12曲のタイトルと歌詞、そしてその曲調をそれぞれ英語で記述して そうすると、ChatGPTは12曲の概要を作ってくれました。 1. "Echoes of Eternity"曲調: エピックなインストゥルメンタルイントロ。壮大なストリングスとパワフルなドラムス。 歌詞の一部: (インストゥルメンタル) 2. "Shadows in the Moonlight"曲調: ミステリアスなヴァースとクライマックスへ向けて構築されるコーラス。 歌詞の一部: "In the silver glow, secrets come to dance, / Sha

                                                                      音楽の作り方が決定的に変わる。架空のロックバンドのコンセプトアルバムを丸ごとAIで作れてしまいました(CloseBox) | テクノエッジ TechnoEdge
                                                                    • GPT-4o の概要|npaka

                                                                      以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5

                                                                        GPT-4o の概要|npaka
                                                                      • Amazon、生成AIスキルを習得できる無料講座を「AI Ready」で提供へ

                                                                        Amazonは、生成AIスキルを習得できる無料の8つの講座をAWSで提供すると発表した。2025年までに世界中の200万人にAIスキルのトレーニングを無料で提供するとしている。 米Amazon.comは11月20日(現地時間)、新たな取り組み「AI Ready」を発表した。2025年までに世界中の200万人にAIスキルのトレーニングと教育を無料で提供することを目指す。まずはAIのスキルアップを支援する8つの無料コースを開設した。 新コースは基礎から上級まであり、企業幹部や技術者向けのコースをAWS EducateとAWS Skill Builderで受講できる。コースの詳細についてはプレスリリースを参照のこと。コースは英語だが日本からも受講可能のようだ。 Amazonによると、AWSのプログラムでは、既に2100万人がクラウドコンピューティングのスキルを学んだという。 また、AI Read

                                                                          Amazon、生成AIスキルを習得できる無料講座を「AI Ready」で提供へ
                                                                        • NVIDIAのCEOが「AIがコードを書くのでもうプログラミングを学ぶ必要はない」と発言して議論を巻き起こす

                                                                          by Hillel Steinberg ハイテク企業やベンチャー企業のトップが、「これからの若者はプログラミングを身につけるべき」とアドバイスするのを見聞きしたことがある人は多いはず。こうした潮流とは裏腹に、NVIDIAのジェンスン・フアンCEOが「プログラミングはもはや不可欠なスキルではない」と提唱しました。 NVIDIA CEO: Every Country Needs Sovereign AI | NVIDIA Blog https://blogs.nvidia.com/blog/world-governments-summit/ Jensen Huang says kids shouldn't learn to code — they should leave it up to AI | Tom's Hardware https://www.tomshardware.com/tec

                                                                            NVIDIAのCEOが「AIがコードを書くのでもうプログラミングを学ぶ必要はない」と発言して議論を巻き起こす
                                                                          • 「生成AI」画像使用が理由…著名歌手がアニメイベント出演辞退 運営が謝罪/全文(日刊スポーツ) - Yahoo!ニュース

                                                                            歌手高橋洋子(57)が、7月10日に出演予定だった、東京・池袋を拠点とするアニメ音楽専門オーケストラ「池袋アニメーションフィルハーモニー」の「第一回演奏会」(渋谷・さくらホール)の参加を辞退することを19日、公式X(旧ツイッター)で発表した。 【写真】リニューアルされた池袋アニメフィルのチラシ 同オーケストラの実行委員会のXも同日更新され、イベントのチラシやホームページに「生成AI」で作成した画像を使用したとの指摘があったと説明。高橋側から「アニメ音楽に関わる立場として、こうした状況での出演は好ましくないというご意見を預かりました」との連絡があり、出演辞退となったことが明かされた。 同実行委は「アニメを愛する楽団を名乗っているのにもかかわらず、昨今の生成AIを取り巻く問題について自覚が足りなかったことを恥じております。また、作品に対する配慮、アニメやそれに関わるクリエイティブを愛する皆様の

                                                                              「生成AI」画像使用が理由…著名歌手がアニメイベント出演辞退 運営が謝罪/全文(日刊スポーツ) - Yahoo!ニュース
                                                                            • 「AI利用者をコミケに参加させないためにはコミケ運営に要望を出そう」という提案に賛成が集まる。一方、コミケ理念の点から難しいのではないかの声も

                                                                              かんざきひろ @kanzakihiro 「俺の妹がこんなに可愛いわけがない」「エロマンガ先生」原作挿絵&アニメキャラデザイン。VTuber「姫森ルーナ」デザイン。Hiroyuki ODA/HSP(鼻そうめんP)名義での楽曲制作、Remixなど youtube.com/channel/UCLww4… かんざきひろ @kanzakihiro コミケにサークル参加する人は毎回イベントの感想や要望を書く欄があるのでイラスト生成AIなどを使ったサークルが参加するのをやめて欲しかったら理由と共にそこに書きましょう、書く人が多ければ検討課題にはなるんじゃないですかね…🤔 2023-11-23 08:50:53 かんざきひろ @kanzakihiro 厳密に取り締まりなんて不可能なのはみんな分かる事だけど、堂々と大手を振ってそういうサークルが闊歩することの抑止力、イベントとして歓迎しない方針を打ち出して

                                                                                「AI利用者をコミケに参加させないためにはコミケ運営に要望を出そう」という提案に賛成が集まる。一方、コミケ理念の点から難しいのではないかの声も
                                                                              • 「GPT-4o」の声、スカーレット・ヨハンソン激似に本人激怒 「アルトマン氏のオファー断った」ため似た声優で再現か

                                                                                「ショックを受け、怒り、信じられない思いだった」 米OpenAIの生成AI「GPT-4o(フォーオー)」に使われている声の一つ「Sky」が、俳優のスカーレット・ヨハンソン氏にそっくりだと話題になった件をめぐり、同氏が代理人を通じて声明を発表した。 声明によると同氏は、OpenAIのサム・アルトマンCEOから「声を提供してほしい」というオファーを受け、断ったにも関わらず、そっくりな声がAIに採用され怒りを覚えたという。 ヨハンソン氏は対応のため弁護士を雇わざるを得なかったとし、「透明性の高い解決と、個人の権利を保護するための適切な法律の制定」への期待も述べている。

                                                                                  「GPT-4o」の声、スカーレット・ヨハンソン激似に本人激怒 「アルトマン氏のオファー断った」ため似た声優で再現か
                                                                                • イラストAIだめならそもそも二次創作で金を取るのをやめろ

                                                                                  2024/2/14 タイトル一部変更 自分の意見は「二次創作が伝統的に許されてるのにイラストAIになった途端許容しないのはダブルスタンダードだろ」という意見が核になってます。 なんなら自分も二次創作は好きなんですが、「俺の作品!」みたいな面されると反感持つだけです。 とはいえ今から追記するとゴチャゴチャにしそうなので波線以下文章は手入れてません。 ・論点ボロボロ 本当にすみません ・お前のお気持ちだろ 仰る通りです 〜〜〜 「二次創作を有料に描いてる人が文句を言うなってのはお門違い過ぎないかなってね。今回のAIの問題点は「『人様の絵』を使うなって感じじゃないの?」とかのたまってるアホがいてイライラして書き始めた。 自分の立場として、 ・AIが話題になるずっと前からfanboxやFantiaのガイドラインに許可されていない二次創作で金取ることを批判していた。 ・イラスト生成AIは肯定派だが、

                                                                                    イラストAIだめならそもそも二次創作で金を取るのをやめろ