並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 1629件

新着順 人気順

生成aiの検索結果201 - 240 件 / 1629件

  • この本を読んだら、Stable Diffusionで画像生成を思い通りにできるようになった! かなりお勧めの解説書です -Stable Diffusion画像生成[本格]活用ガイド

    ※本ページは、アフィリエイト広告を利用しています。 「はじめてでもここまでできる」の本書タイトル通り、読んで3時間ほどでStable Diffusionの画像生成を思い通りにできるようになりました! Stable Diffusionでどんなことができるのかは知っていましたが、実際に自分のPCにセットアップし、プロンプトによる画像生成をはじめ、色塗り指定や画風指定、キャラをAIに学習させての画像生成までできました。Stable Diffusion初心者の人にお勧めの解説書を紹介します。 また、少しやってみたけどTextual InversionやControlNetやLoRAなどがうまく使えない、そんな人にもかなりお勧めです。 本書は「はじめてでもここまでできる」というタイトル通り、初心者向けの解説書です。そして「本格活用」とあるように、ただ使えるようになるだけでなく、塗りの書き込み感、色塗

      この本を読んだら、Stable Diffusionで画像生成を思い通りにできるようになった! かなりお勧めの解説書です -Stable Diffusion画像生成[本格]活用ガイド
    • ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える(CloseBox) | テクノエッジ TechnoEdge

        ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える(CloseBox) | テクノエッジ TechnoEdge
      • アップル、EV開発計画を白紙に-10年がかりのプロジェクト断念

        The Apple Inc. logo at the new Apple store in Mumbai, India, on Tuesday, April 18, 2023. Photographer: Indranil Aditya/Bloomberg 米アップルは電気自動車(EV)を開発するという10年がかりの取り組みを中止する。事情に詳しい複数の関係者が明らかにした。同社史上最も野心的なプロジェクトの1つを断念することになる。 アップルは27日、社内でこの情報を共有し、同プロジェクトに携わる約2000人の従業員に驚きをもって迎えられたという。非公開情報であることを理由に匿名で語った関係者によると、今回の決定はジェフ・ウィリアムズ最高執行責任者(COO)と自動車プロジェクトを統括するバイスプレジデントのケビン・リンチ氏から従業員に伝えられた。

          アップル、EV開発計画を白紙に-10年がかりのプロジェクト断念
        • AI動画の品質が仕事に使えるレベルになってきた (1/4)

          Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

            AI動画の品質が仕事に使えるレベルになってきた (1/4)
          • 無料でGPT4越え!?ついに来たXwin-LM|shi3z

            今日のウィークリーAIニュースではnpaka大先生と一週間のニュースを振り返った。今週もいろいろあったが、なんといってもダークフォース、GPT-4越えと言われるXwin-LMである。中国製。 大先生もまだ試してないというので番組内で一緒に試してみた。 もちろんドスパラ製Memeplexマシン(A6000x2)を使用。 >>> from transformers import AutoTokenizer, AutoModelForCausalLM >>> model = AutoModelForCausalLM.from_pretrained("Xwin-LM/Xwin-LM-7B-V0.1") Downloading (…)lve/main/config.json: 100%|██████████████████| 626/626 [00:00<00:00, 56.2kB/s] [2023

              無料でGPT4越え!?ついに来たXwin-LM|shi3z
            • AWS、開発スキルがなくても生成AIへのプロンプトで業務アプリが作れる「AWS App Studio」プレビュー公開

              Amazon Web Services(AWS)は、生成AIに自然言語で作りたい業務アプリを説明すると、自動的に業務アプリの開発が行われる新サービス「AWS App Studio」をプレビュー公開しました。 7月11日に開催されたAWS Summit New York City 2024でAWS App Studioが発表された AWS App Studioはソフトウェア開発のスキルがなくとも、業務アプリケーションを数分で開発できるとしています。 生成AIにアプリを説明、要件……

                AWS、開発スキルがなくても生成AIへのプロンプトで業務アプリが作れる「AWS App Studio」プレビュー公開
              • 音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成 プロの音楽家も「これはヤバい」と驚愕

                音楽生成AI「Suno AI」がX(旧Twitter)上で話題になっている。歌詞や曲調を文章で指示するだけで音楽を自動生成するサービスで、PCやスマートフォンのWebブラウザ上から利用できる。生成した音楽の出来栄えには、プロの音楽家からも驚きの声が上がっている。 Suno AIは、米国を拠点とする音楽家とAIの専門家たちからなる米Sunoが運営するサービス。開発者の中には、米MetaやTikTokを運営する中国ByteDanceなどに所属していた人たちもいるという。利用にはGoogleやMicrosoft、Discordのアカウントが必要で、12月14日時点ではβ版を提供中。1日5回まで無料で音楽を生成できる他、有料プランもある。 早速使ってみた そのお手並みは? 記者も試しに利用してみた。メニューにある「Create」を押し、「記事を書くのがはかどる音楽を作成してください」と指示を入れた

                  音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成 プロの音楽家も「これはヤバい」と驚愕
                • キャラを自分で描ける人によって「Midjourney」にマンガやイラストの背景を描かせる研究が着々と進んでいる模様

                  まとめ 【新世代コミPo】「Midjouney」にマンガを描かせてみるテストで出来上がった超美麗フルカラー漫画「サイバーパン.. 「作れるかも」といっている暇があったら「作ってしまってから考えればいい」という精神、実にクリエイターらしくて良い 130101 pv 510 631 users 324 中本アイアール@水平思考ユニットうみがめ部 @air_nakamoto Midjourneyさんに、 TRPGセッションの背景画像をご担当いただきました。 17世紀大航海時代シナリオということで、 背景の用意をどうしたものかと思っておりましたが、 短納期にもかかわらず、快く引き受けてくださいました。 ほんと、女神様やで。 pic.twitter.com/SlCBnEgprA リンク TRPG JAPAN Midjourneyの使い方|TRPGの背景や挿絵に使える画像をAIが自動生成サービスの解説

                    キャラを自分で描ける人によって「Midjourney」にマンガやイラストの背景を描かせる研究が着々と進んでいる模様
                  • もし、あなたの卒業アルバムが裸にされたら | NHK

                    何気なくSNSに上げた思い出の写真や卒業アルバムが、AI技術の悪用で裸の画像に加工され、ばらまかれていた。 いま、そんな事例が世界各地で明らかになり、社会を揺るがせています。 日本でも、水面下で広がり続けている実態がわかってきました。 (ロサンゼルス支局 佐伯敏、ソウル支局 山下涼太、機動展開プロジェクト 柳澤あゆみ) 目次

                      もし、あなたの卒業アルバムが裸にされたら | NHK
                    • AI画家「DALL・E 2」一般公開へ 商用利用も可能に 悪用、差別防止機能を搭載

                      米AI研究企業OpenAIは7月20日(現地時間)、文章から画像を生成するAI「DALL・E 2」のβ版を公開し、事前登録していたユーザーの招待を始めた。招待人数は100万人。利用は基本無料で、生成した画像は商用利用も許可する。 利用は毎月ユーザーに配布するクレジットを消費する形で回数を調整。クレジットは販売も行うため、多く利用したいユーザーは追加購入できる。画像の生成の他に、生成画像やユーザーがアップロードした画像を自然言語による指示で編集できる機能や、1枚の画像から複数のバリエーションを生成する機能などを備える。 悪用防止のため、有名人や政治家の似顔絵、実在の人物の写実的な画像の他、暴力的、性的、政治的な画像は生成できないようブロックする。差別防止に向けては「CEO」「教師」など、人種や性別を特定しない指示で画像を生成すると、さまざまな属性の人の画像を生成するようにした。 関連記事 最

                        AI画家「DALL・E 2」一般公開へ 商用利用も可能に 悪用、差別防止機能を搭載
                      • RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO

                        はじめに 新規事業部 生成AIチーム 山本です。 ChatGPT(OpenAI API)をはじめとしたAIの言語モデル(Large Language Model:以下、LLM)を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が(当然ながら)得られてしまいます。 この問題を解決する方法として、Retrieval Augmented Generation(以下、RAG)という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力(プロンプト)に付け加えて渡すことで、ユーザが欲しい

                          RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
                        • 24/1/28 「生成AIの『学習』は学術用語だ」ということをそろそろちゃんと説明した方がいい - LWのサイゼリヤ

                          お題箱から 797.生成aiについて無知なので質問です 下記のように学習元画像を合成したかのような元画像がでることから合成ツールと主張する人がいますが、実際に生成aiは合成ツールなのでしょうか? https://x.com/r18rensyu/status/1745959957990965624?s=61 これ去年の今ぐらいまでなら学習してるから合成ではない論はまだ通用したかもしれないけど、明らかに学習元となる画像がポンポン出るようになってきてしまって正体は引用合成ツールだったのがバレちゃったんだよね。 https://t.co/e367C2DqWl — リハビリ用 (@r18rensyu) 2024年1月13日 質問に対する答えは「依然として生成AIは合成ではなく学習を行っている」で、このツイートは100%誤りです。「塩水を沸騰させると砂糖水になる」と同じレベルの端的な誤りで、議論の余地

                            24/1/28 「生成AIの『学習』は学術用語だ」ということをそろそろちゃんと説明した方がいい - LWのサイゼリヤ
                          • 36億パラメータの日本語言語モデルを公開しました

                            LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは。 LINEのNLP Foundation Devチームの清野舜と高瀬翔とoverlastです。 LINEでは2020年11月から日本語に特化した大規模言語モデル「HyperCLOVA」の構築と応用に関わる研究開発に取り組んできましたが、この「HyperCLOVA」と並行するかたちで複数の大規模言語モデルの研究開発プロジェクトが進行しています。 今回はそれらの研究開発プロジェクトのうち、我々を含むMassive LM開発ユニットから、日本語言語モデル「japanese-large-lm(ジャパニーズ ラージ エルエム)」をOSSとして公開できる状況になりましたので、本ブログを通じてお伝えすることにしました。 この記事

                              36億パラメータの日本語言語モデルを公開しました
                            • 英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama

                              はじめに英語の論文をGPT4に執筆させた際の手順を記します。 普段からChatGPTを使っている人にとっては、当たり前のやり取りしかしていないのですが、意外と使えていない方がnon-AI分野では多いので、丁寧にプロンプトを示していきます。 (ワークショップで解説する必要が出てきたので、そのためのメモ書きです) GPT-4に論文は書けるのか?ゼロから書かせるのは難しいですが、日本語の下書きを英訳するのは得意で、少なくとも筆者が満足する品質のテキストが得られます。 GPTを使って執筆をするメリットDeepLやGoogle翻訳と違い、英文のスタイル(e.g., 論文調)を明示的に指示できるので、翻訳のクオリティが高い 日本語ネイティブにとっては、日本語で書いた方が圧倒的に楽※ スペルミスや文法ミスを犯さないので、校正の手間も減る。※ 基本的に翻訳タスクしか行っていないので、GPTが過去の類似文章

                                英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama
                              • NVIDIA、PC上で動くカスタムAI「Chat with RTX」を無償公開

                                  NVIDIA、PC上で動くカスタムAI「Chat with RTX」を無償公開
                                • エヌビディア株急落、2789億ドル吹き飛ぶ-米1銘柄として過去最大

                                  世界的なリスク資産離れの波に米株価が急落してから約4週間後、半導体メーカー株売却の動きが新たな株安をもたらした。業界アナリスト2人が人工知能(AI)を取り巻く熱狂は行き過ぎだと懸念を再び提起した。 レーバーデー連休明け3日の米株式市場で、AI向け半導体メーカー大手エヌビディア株は9.5%下落し、2789億ドル(約40兆5460億円)が吹き飛んだ。米1銘柄として過去最大となる。 エヌビディアが先月28日に発表した売上高見通しが投資家の高い期待に届かず、同社株のその後の3営業日の下落幅は計14%に達している。フィラデルフィア半導体株指数(SOX)を構成する30銘柄は3日にいずれも少なくとも5.4%の下落となり、SOXは2020年3月以来の大幅下落を記録した。 オン・セミコンダクターとKLA、モノリシック・パワー・システムズは9%強下げて、ナスダック100指数の下げ幅は3.2%近くに達した。 エ

                                    エヌビディア株急落、2789億ドル吹き飛ぶ-米1銘柄として過去最大
                                  • 生成AIを使った関東大震災「新証言」展示中止 | NHK

                                    日本赤十字社東京都支部は関東大震災から100年になるのにあわせて当時を描いたとされる絵画を題材に生成AIを使って新たな「証言」を作り、展示する催しを25日から開く予定でしたが、中止すると発表しました。 AIが作り出した文章を「証言」と表現することに懸念する声が上がっていて、支部は「より慎重な検討が必要だったと深く反省している」としています。 日本赤十字社東京都支部では、100年前の関東大震災について関心をもってもらおうと当時の救護活動を描いたとされる大正時代の絵画を元に生成AIを使ったプロジェクトを始めました。 まず、絵に描かれた20人の被災者を写真のような肖像画にしました。 そして、被災者の体験談などの文献からあわせておよそ60万字をデータベースにしたうえで、肖像画の人物が語ったような「新証言」を作り、あすから支部などで展示を行う予定でした。 ところが、支部によりますと、AIが作り出した

                                      生成AIを使った関東大震災「新証言」展示中止 | NHK
                                    • 音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan

                                      Stability AI は、音楽とサウンド生成のための初のAIモデルとなる Stable Audio を発表しました。 Stable Audio は、最新の生成 AI 技術を駆使し、使いやすい Web インターフェースを介して、より高速で高品質な音楽とサウンドエフェクトを提供する世界初の製品です。Stability AI は、45秒までのトラックを生成してダウンロードできる Stable Audio の基本無料版と、商用プロジェクト用にダウンロード可能な90秒のトラックを提供する「Pro」サブスクリプションを提供しています。 StabilityAI の CEO である Emad Mostaque は、「唯一の独立した、オープンでマルチモーダルな生成 AI の会社として、音楽クリエイターをサポートする製品を開発するために私たちの専門知識を活用できることを嬉しく思います。私たちの願いは、St

                                        音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan
                                      • 今の世界、とんでもない勢いで技術革新が起きてない?

                                        mRNAワクチンに代表されるバイオ工学の進化(人間の身体の工学的ハッキング) ChatGPT、StableDiffusionに代表される生成AIの進化 常温常圧超伝導(LK-99)の発見(※追試中) 人類の未来を明るくするか暗くするかは分からんが、次のステージには進みそうだな?

                                          今の世界、とんでもない勢いで技術革新が起きてない?
                                        • 文章から画像を生成するAI「DALL・E2」を使ってみた|柞刈湯葉

                                          文章から画像を自動生成する DALL・E2 が先日一般公開された。画像の商用利用も可能とのことなので、うまくすれば note 記事のアイキャッチ作成に使えるかもしれない。 使用は基本無料だが申請制である。かなり待ち行列が長いらしく、僕は7月6日に申請したら7月30日に通った。住所や職業や使用目的などの面倒な入力欄はなかった。SMS 認証があるので電話番号を取られる点だけ注意されたし。 テキスト(英文)を入力すると、15秒ほどで1024×1024の画像を4枚生成してくれる。初月は無料で50回、それ以後は毎月15回分のクレジットが発行される。もっと使うには課金が必要で、15ドル115回なので1回17円。OpenAI とか名乗っていながらずいぶん商業的なフリーミアム形態だが、ちょっと遊んでみる分にはちょうどいい。 とりあえず触ってみるてっきり Python 等から API を叩くのだと思っていた

                                            文章から画像を生成するAI「DALL・E2」を使ってみた|柞刈湯葉
                                          • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

                                            昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

                                              GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
                                            • GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra、Command R+に同じ質問をして、回答結果を比較してみた - Qiita

                                              GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra、Command R+に同じ質問をして、回答結果を比較してみたPythonAWSAzureOpenAIGoogleCloud はじめに GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra(Gemini Advanced)、Command R+に同じ質問をして、回答結果を比較してみました。 Gemini Ultra以外のモデルはPythonコード上から実行し、Gemini UltraはGemini Advancedのチャット上で実行していま

                                                GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra、Command R+に同じ質問をして、回答結果を比較してみた - Qiita
                                              • GPT-4oをOCRとして使う - Re:ゼロから始めるML生活

                                                OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」って思っちゃったわけです。 ということで、今回はChatGPT-4oを使ってOCRを使うとどんなもんなのかやってみたいと思います。 やりたいこと やってみる とりあえずやってみる 請求書 名刺 参考文献 感想 やりたいこと 今回やりたいことはOCRです。早い話が画像ファイルを突っ込んでテキストを読み取りたいって感じです。 ただ、当たり前のようにOCRって言葉を使用していますがOCRって結構奥が深いです。 mediadrive.jp 単純に画像から文字を見つけて対応するテ

                                                  GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
                                                • 宿題もリポートも生成AIが作った「正解」丸写し、教諭は嘆く「これじゃ無料の代行業者だ」

                                                  【読売新聞】「これじゃ、無料の宿題代行業者が現れたようなものだ」 東京都内の私立中高一貫校の英語科教諭(56)はため息をついた。昨年度の冬休み、中1の生徒に英語で日記を書く宿題を出したところ、現在完了形など教えていない英文法が使われ

                                                    宿題もリポートも生成AIが作った「正解」丸写し、教諭は嘆く「これじゃ無料の代行業者だ」
                                                  • Google Apps Script は、もはやエンジニアが書かない方がいいまである

                                                    ラブグラフでエンジニアをしています横江 ( @yokoe24 ) です。 ラブグラフでは、エンジニア以外で Google Apps Script (GAS) を書く方も多く、 Slack通知の自動化など、業務の効率化がおこなわれています。 マジですごいと思います! GASをエンジニア以外が書く問題点 一方で、コードを見るとプログラマーからするとムズムズするところもあります。 変数名に snake_case が混ざっている インデントが揃っていない for文の中で getValue() を回している Google Apps Script の getValue() メソッドはコストが高く、何度も実行するとタイムアウトの可能性が高まる == で比較している double quotes " と single quotes ' が混ざっている こういうコードを見ると直したくてウズウズしてしまいます。

                                                      Google Apps Script は、もはやエンジニアが書かない方がいいまである
                                                    • ティム・オライリーとシリコンバレーの贖罪

                                                      ティム・オライリーとシリコンバレーの贖罪 2024.07.10 Updated by yomoyomo on July 10, 2024, 11:00 am JST きっかけは、『ブログ 世界を変える個人メディア』や『あなたがメディア! ソーシャル新時代の情報術』の著書で知られるジャーナリストのダン・ギルモアが、16年務めた教職を辞すという「引退」について書いているのを4月に読んだことでした。 調べてみると、彼は1951年生まれの73歳らしいのですが、ふと、自分が20年以上前からその言説を参考にしてきたベテランたちの何人かも70歳前後なのに気付きました。それは例えば、ブログやポッドキャストの発展に大きく関わったデイヴ・ワイナーや、やはりベテランブロガーにして『グーグル的思考』、『パブリック 開かれたネットの価値を最大化せよ』、『デジタル・ジャーナリズムは稼げるか』の著書で知られるジェフ・ジ

                                                        ティム・オライリーとシリコンバレーの贖罪
                                                      • 無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携

                                                        米Metaは7月18日(現地時間)、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの700億パラメーターモデルは「ChatGPT(の3月1日版)と互角」(同社)という。 ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を送信する。Metaが受理すると専用URLが送られてくるため、同社がGitHubで公開しているダウンロード用のスクリプトと合わせるとLlama 2の各モデルをダウンロードできるようになる。 モデルサイズは70億、130億、700億パラメーターの3種類があり、それぞれベースモデルとチャット向けに追加学習(ファインチューニング)したモデルを用意する。いずれも4096トークン(おおよそ単語数の意)まで文脈を読める。 性能は、Llama-2-70b-chat(700億のチャット

                                                          無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携
                                                        • RAGの実装戦略まとめ - Qiita

                                                          それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチ こちらは、性質の異なる複数の検索方式(例えばベクトル検索とキーワード検索)を組み合わせて検索精度を向上させる手法になります。 各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。 今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。 つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

                                                            RAGの実装戦略まとめ - Qiita
                                                          • 「AIに仕事を奪われた絵師」とかいうnote、なんか変じゃね?

                                                            https://note.com/tokume_kibo/n/n05017591b28b 違和感すごいのよ。 例えば、「コミッションサイトに出しているキャラ立ち絵が売れなくなった」とあるんだけど コミッションがなんなのかこの人わかってなくない? 依頼を受けて絵を描くことであって、立ち絵を売るわけじゃないんだけど。 「キャラ立ち絵を描いて欲しいという依頼が減った」とかならまあ分からんでもないけど、そもそもコミッションで立ち絵限定ってのも奇妙だし。(まだアイコン限定とかのほうがありうる。) あとさぁ…そこそこの立ち絵を1日で描いて、年間200弱の依頼をこなしてたって? これって、めちゃくちゃ筆早いことになるんだが…依頼って、ポンと一枚描けば終わりじゃないからね? 依頼者とのやりとりや、ラフを提出とか直しとかあるはずなのにそういうこと一切考えてなくない? 「底辺絵師ならこんなもんだろ」っていう、

                                                              「AIに仕事を奪われた絵師」とかいうnote、なんか変じゃね?
                                                            • いちばんやさしいローカル LLM|ぬこぬこ

                                                              概要ローカル LLM 初めましての方でも動かせるチュートリアル 最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル(LLM)の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。 現状、様々な評価指標により LLM の性能が測定されていますが、

                                                                いちばんやさしいローカル LLM|ぬこぬこ
                                                              • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

                                                                Akuma.ai http://akuma.ai 2024年2月、日本発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日本発の画像生成AIサ

                                                                  日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
                                                                • AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox) | テクノエッジ TechnoEdge

                                                                  筆者も話題になった直後から試そうとしていたのですが、自分ではうまくいかず悶々としていたところ、Memeplexでできるようになったので、そのインプレッションをお届けします。 AnimateDiffの基本的な動作は、静止画を作成できるAI作画モデルを使って、一貫性のある短いアニメーションGIFを生成するというもの。Stable Diffusion 1.5、2.0といった標準的なものだけでなく、その上にカスタム学習(ファインチューニング)したモデルにも対応できるというのが特徴です。同様の技術としては「Tune-A-Video」があったのですが、一貫性が乏しかったために使いどころがなかなか難しいものでした。 筆者は現在、MemeplexとStable Diffusion WebUI上に、妻の写真を学習させたAIモデル(Checkpoint)を作成して使っていて「異世界とりちゃん」という名の下に日

                                                                    AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox) | テクノエッジ TechnoEdge
                                                                  • ChatGPTを利用して画面モックを爆速で作成する - Taste of Tech Topics

                                                                    こんにちは、最近スマホのChatGPTアプリで、音声入出力機能を使って会話を楽しんでいる安部です。 皆さんWebアプリ開発などで、画面モックを作成しなければいけない場面は多いですよね? 適当なHTMLを作ったり、ツールで図示したりしますが、正直面倒です。 そこで今回は、ChatGPTに最初から画面モックを作ってもらいます。 最近はChatGPTに画像を添付できるようになったので手書き画像からHTMLを出力することもできますが、 この記事では画面要素を言葉で指定し、HTMLを出力してもらいます(配置などのデザインは、ひとまずChatGPTにお任せしてみます)。 では早速始めましょう。使用モデルはGPT-4です。 簡単な入力フォームを出力させる まずは、よく使いそうな簡単な入力フォームを出力してもらいます。 ここでは、「書籍を登録する画面」という設定で指示を出します。 次の画面構成の案を、HT

                                                                      ChatGPTを利用して画面モックを爆速で作成する - Taste of Tech Topics
                                                                    • AI生成作品に対する、FANBOXにおける今後の対応|pixivFANBOX公式|pixivFANBOX

                                                                      いつもFANBOXをご利用いただきありがとうございます。 現在、FANBOXにおけるAI生成作品の取り扱いに関して多くのご意見をいただいております。急激に発展している技術への対応が追いついておらず、皆さまにご迷惑をおかけしていることを深くお詫び申し上げます。 皆さまからのご意見や現状を考慮し、私たちFANBOX運営の...

                                                                        AI生成作品に対する、FANBOXにおける今後の対応|pixivFANBOX公式|pixivFANBOX
                                                                      • 「誓って言うんですが、AIに要約させるのは本当に怖い現象」…情報の汚染が酷すぎて、結局原典を読むしかないみたいな世界 _(:3 」∠)_

                                                                        同志カルロ・ゼン@〆切が苦手 @sonzaix 誓って言うんですが、AIに要約させるのは本当に怖い現象です_(:3 」∠)_ 自分の専門領域なら『ああ、こんな雑な間違いを』ってため息で済みますけど、自分がわからない領域だと『何から確認すればいいの?』みたいに辛い_(:3 」∠)_

                                                                          「誓って言うんですが、AIに要約させるのは本当に怖い現象」…情報の汚染が酷すぎて、結局原典を読むしかないみたいな世界 _(:3 」∠)_
                                                                        • 自分だけの信頼できるAIへ グーグル「NotebookLM」公開

                                                                            自分だけの信頼できるAIへ グーグル「NotebookLM」公開
                                                                          • 生成AIとみられる女性の「扇情動画」乱立 再生回数稼ぎ、収益目的も背景か

                                                                            ユーチューブに公開された生成AIで作成・加工されたとみられる女性の動画。投稿したアカウントは現在停止されている 生成人工知能(AI)によって作成・加工されたとみられる若い女性の扇情的な動画が、交流サイト(SNS)上などで拡散されている。一見しただけでは生身に見えるほど精緻で、再生回数が数百万回に達するものも。より性的に過激な動画へ誘導するものもあり、専門家は「アクセスを稼いで収益をあげる仕組みが確立されていることが背景にある」と指摘する。 「ミス東大」モデルのような容姿の若い女性が、画面を向きながら公園や屋外を1人で歩く数分の動画。SNSのインスタグラムや動画投稿サイトのユーチューブなどに昨年から登場した、あるアカウントから投稿されたものだ。 「ノーブラ散歩」などの刺激的なタイトルがつけられ、プロフィル欄には東京大学の理系学生をうたい「ミス東大」を目指すなどと記載。他にも、服を着た状態で下

                                                                              生成AIとみられる女性の「扇情動画」乱立 再生回数稼ぎ、収益目的も背景か
                                                                            • ITエンジニアなのにまだ投資やってないの?ChatGPTでクオンツシステム作って儲けようぜpart3 - Qiita

                                                                              前回まで ITエンジニアなのにまだ投資やってないの?ITエンジニアならChatGPTでクオンツシステム作って儲けようぜ ITエンジニアなのにまだ投資やってないの?ITエンジニアならChatGPTでクオンツシステム作って儲けようぜpart2 ネトフリは面白い 僕はネトフリのヘビーユーザーなんですが、投資系にも リーマンショックまでの経緯と仕組みを実録インタビューで振り返る「インサイドジョブ」や AIテック系の話で、チェスは機械には勝てないと言われてAIが勝ち、「人間の高度な知的能力でしか勝てない」と言った囲碁の世界王者に勝ち、今では7、8年も訓練を積んでようやくなる戦闘機のエースパイロットにも勝ち、AIの実用速度の高さをドキュメントした「アンノウン」なんかも面白いし勉強になります。 投資思考では技術力UPは悪手 投資思考って事業でも人生でもとても大事です。 例えば、収入に不満を持ってるエンジ

                                                                                ITエンジニアなのにまだ投資やってないの?ChatGPTでクオンツシステム作って儲けようぜpart3 - Qiita
                                                                              • 匿名ダイアリーのワイヤレスイヤホン記事でチューリングテストが行われていた - ARTIFACT@はてブロ

                                                                                anond.hatelabo.jp 最近、ワイヤレスイヤホンのレビュー記事を見てると、どうもAIに書かせたと思われる文章にたびたび遭遇していたのだが、匿名ダイアリーに、これはAIだと断定できる記事が上がっていた。しかも、それに対して、AIだと指摘する人は非常に少なくて驚いた。AIが書いた文章でもAIだと思う人が少ないのなら、そりゃAIに文章書かせるよね。AIの書いた製品紹介の文章の特徴として、書き手の主観の少なさがあるのだが、逆にそれを客観性と感じて、良いと感じる人が多いのかもしれない。 そして、花見川さんが指摘しているように、紹介している機種があまりに少ない。秋に出た新型TWSならB&W Pi6 / Pi8は必須のはずだが、紹介されていない。YouTubeでのレビュー動画はカジェログの人ぐらいだったので、おそらく学習元がなかったのだろう。 今秋のワイヤレスイヤホン収穫について[はてな匿名

                                                                                  匿名ダイアリーのワイヤレスイヤホン記事でチューリングテストが行われていた - ARTIFACT@はてブロ
                                                                                • Amazon、生成AIスキルを習得できる無料講座を「AI Ready」で提供へ

                                                                                  Amazonは、生成AIスキルを習得できる無料の8つの講座をAWSで提供すると発表した。2025年までに世界中の200万人にAIスキルのトレーニングを無料で提供するとしている。 米Amazon.comは11月20日(現地時間)、新たな取り組み「AI Ready」を発表した。2025年までに世界中の200万人にAIスキルのトレーニングと教育を無料で提供することを目指す。まずはAIのスキルアップを支援する8つの無料コースを開設した。 新コースは基礎から上級まであり、企業幹部や技術者向けのコースをAWS EducateとAWS Skill Builderで受講できる。コースの詳細についてはプレスリリースを参照のこと。コースは英語だが日本からも受講可能のようだ。 Amazonによると、AWSのプログラムでは、既に2100万人がクラウドコンピューティングのスキルを学んだという。 また、AI Read

                                                                                    Amazon、生成AIスキルを習得できる無料講座を「AI Ready」で提供へ