並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 322件

新着順 人気順

生成aiの検索結果121 - 160 件 / 322件

  • 「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】

    米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。 同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す

      「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
    • 「このカップル、絵面が濃い」──オタ恋の“AI広告”が話題 運営「女性入会者数が3~7倍増えた」 そのワケは

      肥満体形の男性と、可愛らしい女性のツーショット写真──そんな画像広告をX(Twitter)上で見かけたことはないだろうか。これは「オタ恋」というオタク同士の出会いを支援する恋愛マッチングアプリが展開するAI画像を使った広告だ。「このオタクカップル、絵面が濃い」と思わずツッコミを入れてしまいそうな内容で、じわじわと話題になっている。 オタ恋は2022年11月にサービスを開始し、23年5月から画像生成AIを使った広告を展開している。この広告の効果について、運営会社であるエイチエムシステムズ(東京都新宿区)は「男性は1.5~2倍程度、女性は3~7倍程度、入会者が増加した」と反響を話す。入会者数が増加した理由について、同社は「AI広告素材がバズる事により認知度が上がり信用が増した可能性がある」と分析する。 「マッチングアプリで女性が利用する際、安全性や信頼性、知名度などを重視する声が上位にきており

        「このカップル、絵面が濃い」──オタ恋の“AI広告”が話題 運営「女性入会者数が3~7倍増えた」 そのワケは
      • テキストから歌を生成「Suno AI」使い方 作曲家 神前暁もクオリティに驚愕

        「Midjourney」「Stable Diffusion」などの画像生成AIや、チャットAIボット「ChatGPT」をはじめ、様々なサービスが登場してきた生成AI(ジェネレーティブAI)。 現在SNSでは、「Suno AI」という新たな自動作曲AIサービスが話題です。 神前暁さんやtofubeatsさんといった第一線で活躍する音楽プロデューサーも、試しに「Suno AI」を使ってみた結果をXに投稿。 その自然な出来栄えに、神前暁さんは「アレンジやMixがそれっぽくなるのは想定内だったけどメロも70点くらいのを平気でポンポン出してくる。このサビなんて少し手を加えれば結構売れるのでは?ってレベル」と、驚きを露わにしています。 話題のSuno AIを試してみたけどヤバいですねコレは… アレンジやMixがそれっぽくなるのは想定内だったけどメロも70点くらいのを平気でポンポン出してくる。このサビな

          テキストから歌を生成「Suno AI」使い方 作曲家 神前暁もクオリティに驚愕
        • Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能|shi3z

          Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能 Transformerの発明者らが起業したCohereAIがとんでもないモデルを出してきた。この業界では毎週のように「えーー!」ということが起きるのだが、その中でも年に1,2回起きる「えーーーっ」が起きたのでブログでも紹介しておきたい。 Command-R+(おそらくコマンダープラスと読むのが正しい)というモデルは、わずか100Bで、GPT-4,Claude-3並と言われるモデルだ。しかし、それを主張するだけのモデルなど腐るほどある。だが、実際に触ってみると期待外れということが多かった。 ところがCommand-R+は、その性能は桁違いである。というか、もはや僕という人間如きがちょっと触ったくらいでは「GPT-4よりいいね」とか「ここら辺甘いね」とか判断がつかなくなってきてる。しか

            Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能|shi3z
          • 美大生にとっての生成AIの話|砂大28

            ※当記事では生成AIの是非(適法性/違法性)について言及しない。 かつてはコップに入った猫を「猫である」と判断できなかったAIが、本格的に絵という分野に進出してから数年が経った。 初めこそよくわからない抽象画のような風景やラーメンを手づかみで啜る樋口円香を笑っていた私達に、現在の混沌とした状況は想像できただろうか。 よりにもよって、そんな絵という分野の過渡期に美術大学のデザイン科に進学を決めてしまった大馬鹿者がいる。私だ。 入試対策のデッサンをしながら、自分が目指す分野は果たして10年後に存在するのか、そんな事を考えていた。今やクリエイターにとって死活問題となった画像生成AIの普及は、確実に、それも急速にクリエイターの未来に暗い影を落としている。 ……と思っていた時期が私にもあった。 実際はどうだろう。未だに単語や文章から的確にそのコンテクストを表現した美少女を生成してくれるサービスなど存

              美大生にとっての生成AIの話|砂大28
            • アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)

              原画と原画の間にあたる画像を複数枚入れることで、自然な連続性のある動きを作る。アニメの基本となる「中割」作業を画像生成AIが実現する可能性が出てきました。鍵になっているのは「AnimateDiff」という技術。8月に入って、様々なユーザーのアップデートによって機能拡張が進められています。それは完全な画像生成AIで作られるアニメの可能性を垣間見せるほどのものです。 16コマ/2秒の短い動画が生成できる AnimateDiffは7月10日に発表された、上海AIラボ、香港中文大学、スタンフォード大学の共同研究による技術。画像生成AI「Stable Diffusion」の仕組みとデータセットを利用しつつ、数百万本の動画を学習させた「モーションモジュール」と呼ばれるデータセットを別途に参照させることで、連続するキャラクターの動きを生成可能にするというのが基本原理です。生成できる時間は、16コマ/2秒

                アニメの常識、画像生成AIが変える可能性「AnimateDiff」のすごい進化 (1/3)
              • 氾濫する生成AIアニメ 9万枚調査で見えた権利侵害

                「人間かAIか、 どちらが描いたか 分からない」 都内の制作会社で働く アニメーターは 不安を口にした。 描いたのは生成AI(人工知能)。「ONE PIECE(ワンピース)」や「SPY×FAMILY(スパイファミリー)」……。AIにより既存アニメを模した画像が際限なく生み出されている。 生成AIは革新的な手法で文章や画像、映像、音声を生み出し、急速に進化する。著作権のルール整備は進むが、ユーザーによる悪用で日本のソフトパワーを代表するアニメを蝕(むしば)み始めた。ネットに氾濫するAIアニメの実相に迫る。 大量に生成されたアニメ画像は、世界中からアクセスを集める生成AI画像共有サイトで公開されている。誰でも好みの画像を生成でき、投稿が可能になっている。複数のサイトで世界的に人気のあるアニメ13タイトルのメインキャラクター名を検索すると、9万枚を超す画像が引っかかった。 日本経済新聞は専門家の

                  氾濫する生成AIアニメ 9万枚調査で見えた権利侵害
                • テキスト生成AI『Claude』が提供する60以上の「プロンプト集」が使える!すぐに苦手な仕事を自動化せよ | ライフハッカー・ジャパン

                  「これ、マストだわ」モニター購入して気づいた、あったほうがいい周辺機器4選 #Amazon新生活セール

                    テキスト生成AI『Claude』が提供する60以上の「プロンプト集」が使える!すぐに苦手な仕事を自動化せよ | ライフハッカー・ジャパン
                  • この本を読んだら、Stable Diffusionで画像生成を思い通りにできるようになった! かなりお勧めの解説書です -Stable Diffusion画像生成[本格]活用ガイド

                    ※本ページは、アフィリエイト広告を利用しています。 「はじめてでもここまでできる」の本書タイトル通り、読んで3時間ほどでStable Diffusionの画像生成を思い通りにできるようになりました! Stable Diffusionでどんなことができるのかは知っていましたが、実際に自分のPCにセットアップし、プロンプトによる画像生成をはじめ、色塗り指定や画風指定、キャラをAIに学習させての画像生成までできました。Stable Diffusion初心者の人にお勧めの解説書を紹介します。 また、少しやってみたけどTextual InversionやControlNetやLoRAなどがうまく使えない、そんな人にもかなりお勧めです。 本書は「はじめてでもここまでできる」というタイトル通り、初心者向けの解説書です。そして「本格活用」とあるように、ただ使えるようになるだけでなく、塗りの書き込み感、色塗

                      この本を読んだら、Stable Diffusionで画像生成を思い通りにできるようになった! かなりお勧めの解説書です -Stable Diffusion画像生成[本格]活用ガイド
                    • アップル、EV開発計画を白紙に-10年がかりのプロジェクト断念

                      The Apple Inc. logo at the new Apple store in Mumbai, India, on Tuesday, April 18, 2023. Photographer: Indranil Aditya/Bloomberg 米アップルは電気自動車(EV)を開発するという10年がかりの取り組みを中止する。事情に詳しい複数の関係者が明らかにした。同社史上最も野心的なプロジェクトの1つを断念することになる。 アップルは27日、社内でこの情報を共有し、同プロジェクトに携わる約2000人の従業員に驚きをもって迎えられたという。非公開情報であることを理由に匿名で語った関係者によると、今回の決定はジェフ・ウィリアムズ最高執行責任者(COO)と自動車プロジェクトを統括するバイスプレジデントのケビン・リンチ氏から従業員に伝えられた。

                        アップル、EV開発計画を白紙に-10年がかりのプロジェクト断念
                      • ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える(CloseBox) | テクノエッジ TechnoEdge

                        ノンプログラマーな自分が、大規模言語モデル(LLM)の助力で、初めてまともに動くプログラムを完成させることができました。

                          ドラムマシン、シンセ、サンプラーがわずか数分で完成。非プログラマーなのにClaude + Artifactsのプロンプト開発が楽しすぎて限度超える(CloseBox) | テクノエッジ TechnoEdge
                        • 無料でGPT4越え!?ついに来たXwin-LM|shi3z

                          今日のウィークリーAIニュースではnpaka大先生と一週間のニュースを振り返った。今週もいろいろあったが、なんといってもダークフォース、GPT-4越えと言われるXwin-LMである。中国製。 大先生もまだ試してないというので番組内で一緒に試してみた。 もちろんドスパラ製Memeplexマシン(A6000x2)を使用。 >>> from transformers import AutoTokenizer, AutoModelForCausalLM >>> model = AutoModelForCausalLM.from_pretrained("Xwin-LM/Xwin-LM-7B-V0.1") Downloading (…)lve/main/config.json: 100%|██████████████████| 626/626 [00:00<00:00, 56.2kB/s] [2023

                            無料でGPT4越え!?ついに来たXwin-LM|shi3z
                          • AWS、開発スキルがなくても生成AIへのプロンプトで業務アプリが作れる「AWS App Studio」プレビュー公開

                            Amazon Web Services(AWS)は、生成AIに自然言語で作りたい業務アプリを説明すると、自動的に業務アプリの開発が行われる新サービス「AWS App Studio」をプレビュー公開しました。 7月11日に開催されたAWS Summit New York City 2024でAWS App Studioが発表された AWS App Studioはソフトウェア開発のスキルがなくとも、業務アプリケーションを数分で開発できるとしています。 生成AIにアプリを説明、要件……

                              AWS、開発スキルがなくても生成AIへのプロンプトで業務アプリが作れる「AWS App Studio」プレビュー公開
                            • 音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成 プロの音楽家も「これはヤバい」と驚愕

                              音楽生成AI「Suno AI」がX(旧Twitter)上で話題になっている。歌詞や曲調を文章で指示するだけで音楽を自動生成するサービスで、PCやスマートフォンのWebブラウザ上から利用できる。生成した音楽の出来栄えには、プロの音楽家からも驚きの声が上がっている。 Suno AIは、米国を拠点とする音楽家とAIの専門家たちからなる米Sunoが運営するサービス。開発者の中には、米MetaやTikTokを運営する中国ByteDanceなどに所属していた人たちもいるという。利用にはGoogleやMicrosoft、Discordのアカウントが必要で、12月14日時点ではβ版を提供中。1日5回まで無料で音楽を生成できる他、有料プランもある。 早速使ってみた そのお手並みは? 記者も試しに利用してみた。メニューにある「Create」を押し、「記事を書くのがはかどる音楽を作成してください」と指示を入れた

                                音楽生成AI「Suno AI」が話題、文章から楽曲を瞬時に作成 プロの音楽家も「これはヤバい」と驚愕
                              • AI動画の品質が仕事に使えるレベルになってきた (1/4)

                                Luma AIが6月12日に公開した動画生成AIサービス「Dream Machine」が、月に無料で30回まで試せることもあって、大きな話題となっています(「ついに来た! 無料で試せる動画生成AI『Luma Dream Machine』」参照)。ただ、技術情報は出ておらず、どういう関係や経緯で出しているかは一切不明です。 ※記事の配信先によっては動画や図版がうまく表示されないことがあります。その場合はASCII.jp掲載の記事をご覧ください 手軽に高品質な動画が生成できる「Luma AI」のサービス Luma AIはこの連載でも何回か紹介してきたように、大量の写真から3Dモデルを生成するサービスからスタートし、昨年12月には3Dモデル生成サービス「Genie」で参入しているAIスタートアップ企業です(連載第41回「3Dスキャンの進化がすごい」参照)。生成AIの3D化技術で先行していることか

                                  AI動画の品質が仕事に使えるレベルになってきた (1/4)
                                • RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO

                                  はじめに 新規事業部 生成AIチーム 山本です。 ChatGPT(OpenAI API)をはじめとしたAIの言語モデル(Large Language Model:以下、LLM)を使用して、チャットボットを構築するケースが増えています。通常、LLMが学習したときのデータに含まれている内容以外に関する質問には回答ができません。そのため、例えば社内システムに関するチャットボットを作成しようとしても、素のLLMでは質問に対してわからないという回答や異なる知識に基づいた回答が(当然ながら)得られてしまいます。 この問題を解決する方法として、Retrieval Augmented Generation(以下、RAG)という手法がよく使用されます。RAGでは、ユーザからの質問に回答するために必要そうな内容が書かれた文章を検索し、その文章をLLMへの入力(プロンプト)に付け加えて渡すことで、ユーザが欲しい

                                    RAGの実案件に取り組んできた今までの知見をまとめてみた | DevelopersIO
                                  • 24/1/28 「生成AIの『学習』は学術用語だ」ということをそろそろちゃんと説明した方がいい - LWのサイゼリヤ

                                    お題箱から 797.生成aiについて無知なので質問です 下記のように学習元画像を合成したかのような元画像がでることから合成ツールと主張する人がいますが、実際に生成aiは合成ツールなのでしょうか? https://x.com/r18rensyu/status/1745959957990965624?s=61 これ去年の今ぐらいまでなら学習してるから合成ではない論はまだ通用したかもしれないけど、明らかに学習元となる画像がポンポン出るようになってきてしまって正体は引用合成ツールだったのがバレちゃったんだよね。 https://t.co/e367C2DqWl — リハビリ用 (@r18rensyu) 2024年1月13日 質問に対する答えは「依然として生成AIは合成ではなく学習を行っている」で、このツイートは100%誤りです。「塩水を沸騰させると砂糖水になる」と同じレベルの端的な誤りで、議論の余地

                                      24/1/28 「生成AIの『学習』は学術用語だ」ということをそろそろちゃんと説明した方がいい - LWのサイゼリヤ
                                    • NVIDIA、PC上で動くカスタムAI「Chat with RTX」を無償公開

                                        NVIDIA、PC上で動くカスタムAI「Chat with RTX」を無償公開
                                      • 36億パラメータの日本語言語モデルを公開しました

                                        LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは。 LINEのNLP Foundation Devチームの清野舜と高瀬翔とoverlastです。 LINEでは2020年11月から日本語に特化した大規模言語モデル「HyperCLOVA」の構築と応用に関わる研究開発に取り組んできましたが、この「HyperCLOVA」と並行するかたちで複数の大規模言語モデルの研究開発プロジェクトが進行しています。 今回はそれらの研究開発プロジェクトのうち、我々を含むMassive LM開発ユニットから、日本語言語モデル「japanese-large-lm(ジャパニーズ ラージ エルエム)」をOSSとして公開できる状況になりましたので、本ブログを通じてお伝えすることにしました。 この記事

                                          36億パラメータの日本語言語モデルを公開しました
                                        • 英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama

                                          はじめに英語の論文をGPT4に執筆させた際の手順を記します。 普段からChatGPTを使っている人にとっては、当たり前のやり取りしかしていないのですが、意外と使えていない方がnon-AI分野では多いので、丁寧にプロンプトを示していきます。 (ワークショップで解説する必要が出てきたので、そのためのメモ書きです) GPT-4に論文は書けるのか?ゼロから書かせるのは難しいですが、日本語の下書きを英訳するのは得意で、少なくとも筆者が満足する品質のテキストが得られます。 GPTを使って執筆をするメリットDeepLやGoogle翻訳と違い、英文のスタイル(e.g., 論文調)を明示的に指示できるので、翻訳のクオリティが高い 日本語ネイティブにとっては、日本語で書いた方が圧倒的に楽※ スペルミスや文法ミスを犯さないので、校正の手間も減る。※ 基本的に翻訳タスクしか行っていないので、GPTが過去の類似文章

                                            英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama
                                          • 生成AIを使った関東大震災「新証言」展示中止 | NHK

                                            日本赤十字社東京都支部は関東大震災から100年になるのにあわせて当時を描いたとされる絵画を題材に生成AIを使って新たな「証言」を作り、展示する催しを25日から開く予定でしたが、中止すると発表しました。 AIが作り出した文章を「証言」と表現することに懸念する声が上がっていて、支部は「より慎重な検討が必要だったと深く反省している」としています。 日本赤十字社東京都支部では、100年前の関東大震災について関心をもってもらおうと当時の救護活動を描いたとされる大正時代の絵画を元に生成AIを使ったプロジェクトを始めました。 まず、絵に描かれた20人の被災者を写真のような肖像画にしました。 そして、被災者の体験談などの文献からあわせておよそ60万字をデータベースにしたうえで、肖像画の人物が語ったような「新証言」を作り、あすから支部などで展示を行う予定でした。 ところが、支部によりますと、AIが作り出した

                                              生成AIを使った関東大震災「新証言」展示中止 | NHK
                                            • 今の世界、とんでもない勢いで技術革新が起きてない?

                                              mRNAワクチンに代表されるバイオ工学の進化(人間の身体の工学的ハッキング) ChatGPT、StableDiffusionに代表される生成AIの進化 常温常圧超伝導(LK-99)の発見(※追試中) 人類の未来を明るくするか暗くするかは分からんが、次のステージには進みそうだな?

                                                今の世界、とんでもない勢いで技術革新が起きてない?
                                              • [翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜

                                                この記事は "What We’ve Learned From A Year of Building with LLMs" という記事を著者の一人である Eugene Yan さんから許可を得て翻訳したものです。 https://applied-llms.org/ Thank you for giving me a permission to translate this wonderful article! 著者の方々 Eugene Yan Bryan Bischof Charles Frye Hamel Husain Jason Liu Shreya Shankar 原文の公開日 2024/6/8 今は大規模言語モデル(LLM)を使った開発がとってもエキサイティングな時期です。この1年間で、LLMは実世界のアプリケーションに対して「十分に良い」ものになりました。そして、年々良くなり、安く

                                                  [翻訳]LLMで1年間開発して学んだこと〜LLMプロダクト開発を成功に導くための実践的ガイド〜
                                                • 音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan

                                                  Stability AI は、音楽とサウンド生成のための初のAIモデルとなる Stable Audio を発表しました。 Stable Audio は、最新の生成 AI 技術を駆使し、使いやすい Web インターフェースを介して、より高速で高品質な音楽とサウンドエフェクトを提供する世界初の製品です。Stability AI は、45秒までのトラックを生成してダウンロードできる Stable Audio の基本無料版と、商用プロジェクト用にダウンロード可能な90秒のトラックを提供する「Pro」サブスクリプションを提供しています。 StabilityAI の CEO である Emad Mostaque は、「唯一の独立した、オープンでマルチモーダルな生成 AI の会社として、音楽クリエイターをサポートする製品を開発するために私たちの専門知識を活用できることを嬉しく思います。私たちの願いは、St

                                                    音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan
                                                  • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

                                                    昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

                                                      GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
                                                    • 宿題もリポートも生成AIが作った「正解」丸写し、教諭は嘆く「これじゃ無料の代行業者だ」

                                                      【読売新聞】「これじゃ、無料の宿題代行業者が現れたようなものだ」 東京都内の私立中高一貫校の英語科教諭(56)はため息をついた。昨年度の冬休み、中1の生徒に英語で日記を書く宿題を出したところ、現在完了形など教えていない英文法が使われ

                                                        宿題もリポートも生成AIが作った「正解」丸写し、教諭は嘆く「これじゃ無料の代行業者だ」
                                                      • GPT-4oをOCRとして使う - Re:ゼロから始めるML生活

                                                        OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」って思っちゃったわけです。 ということで、今回はChatGPT-4oを使ってOCRを使うとどんなもんなのかやってみたいと思います。 やりたいこと やってみる とりあえずやってみる 請求書 名刺 参考文献 感想 やりたいこと 今回やりたいことはOCRです。早い話が画像ファイルを突っ込んでテキストを読み取りたいって感じです。 ただ、当たり前のようにOCRって言葉を使用していますがOCRって結構奥が深いです。 mediadrive.jp 単純に画像から文字を見つけて対応するテ

                                                          GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
                                                        • GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita

                                                          GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみたPythonAWSAzureOpenAIGoogleCloud はじめに GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultra(Gemini Advanced)に同じ質問をして、回答結果を比較してみました。 Gemini Ultra以外のモデルはPythonコード上から実行し、Gemini UltraはGemini Advancedのチャット上で実行しています。 各モデルの詳細は以下のとおりです。 G

                                                            GPT-3.5-TurboとGPT-4-Turbo、Claude2、Claude3(Haiku)、Claude3(Sonnet)、Claude3(Opus)、Gemini Pro、Gemini Ultraに同じ質問をして、回答結果を比較してみた - Qiita
                                                          • Google Apps Script は、もはやエンジニアが書かない方がいいまである

                                                            ラブグラフでエンジニアをしています横江 ( @yokoe24 ) です。 ラブグラフでは、エンジニア以外で Google Apps Script (GAS) を書く方も多く、 Slack通知の自動化など、業務の効率化がおこなわれています。 マジですごいと思います! GASをエンジニア以外が書く問題点 一方で、コードを見るとプログラマーからするとムズムズするところもあります。 変数名に snake_case が混ざっている インデントが揃っていない for文の中で getValue() を回している Google Apps Script の getValue() メソッドはコストが高く、何度も実行するとタイムアウトの可能性が高まる == で比較している double quotes " と single quotes ' が混ざっている こういうコードを見ると直したくてウズウズしてしまいます。

                                                              Google Apps Script は、もはやエンジニアが書かない方がいいまである
                                                            • 「AIに仕事を奪われた絵師」とかいうnote、なんか変じゃね?

                                                              https://note.com/tokume_kibo/n/n05017591b28b 違和感すごいのよ。 例えば、「コミッションサイトに出しているキャラ立ち絵が売れなくなった」とあるんだけど コミッションがなんなのかこの人わかってなくない? 依頼を受けて絵を描くことであって、立ち絵を売るわけじゃないんだけど。 「キャラ立ち絵を描いて欲しいという依頼が減った」とかならまあ分からんでもないけど、そもそもコミッションで立ち絵限定ってのも奇妙だし。(まだアイコン限定とかのほうがありうる。) あとさぁ…そこそこの立ち絵を1日で描いて、年間200弱の依頼をこなしてたって? これって、めちゃくちゃ筆早いことになるんだが…依頼って、ポンと一枚描けば終わりじゃないからね? 依頼者とのやりとりや、ラフを提出とか直しとかあるはずなのにそういうこと一切考えてなくない? 「底辺絵師ならこんなもんだろ」っていう、

                                                                「AIに仕事を奪われた絵師」とかいうnote、なんか変じゃね?
                                                              • AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox) | テクノエッジ TechnoEdge

                                                                筆者も話題になった直後から試そうとしていたのですが、自分ではうまくいかず悶々としていたところ、Memeplexでできるようになったので、そのインプレッションをお届けします。 AnimateDiffの基本的な動作は、静止画を作成できるAI作画モデルを使って、一貫性のある短いアニメーションGIFを生成するというもの。Stable Diffusion 1.5、2.0といった標準的なものだけでなく、その上にカスタム学習(ファインチューニング)したモデルにも対応できるというのが特徴です。同様の技術としては「Tune-A-Video」があったのですが、一貫性が乏しかったために使いどころがなかなか難しいものでした。 筆者は現在、MemeplexとStable Diffusion WebUI上に、妻の写真を学習させたAIモデル(Checkpoint)を作成して使っていて「異世界とりちゃん」という名の下に日

                                                                  AI動画が簡単に作れる「AnimateDiff」を試したらやりがい爆上がり。カスタム学習したあの子が自然に動いてるよ(CloseBox) | テクノエッジ TechnoEdge
                                                                • 日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)

                                                                  Akuma.ai http://akuma.ai 2024年2月、日本発のクラウド型画像生成サービスAkuma.aiが、リアルタイム画像生成機能「AIキャンバス」を搭載したことが話題になりました。3月1日には生成枚数が延べ1200万枚に達したと発表。リアルタイム画像生成技術「LCM」を組み入れたサービスですが、高度なPC環境が不要で、タブレットなどからでも簡単に使えるため、国内外の幅広い層にウケたという経緯です。 🎉生成画像1200万枚突破🎉 リアルタイム「AIキャンバス」生成枚数が1200万枚を突破しました! たくさんご利用いただきありがとうございます。 今後とも #AkumaAI の応援よろしくお願いします🦑 プレスリリースはこちら:https://t.co/Yf3tjxjCsS — Akuma.ai (@AkumaAI_JP) March 1, 2024 日本発の画像生成AIサ

                                                                    日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に (1/3)
                                                                  • いちばんやさしいローカル LLM|ぬこぬこ

                                                                    概要ローカル LLM 初めましての方でも動かせるチュートリアル 最近の公開されている大規模言語モデルの性能向上がすごい Ollama を使えば簡単に LLM をローカル環境で動かせる Enchanted や Open WebUI を使えばローカル LLM を ChatGPT を使う感覚で使うことができる quantkit を使えば簡単に LLM を量子化でき、ローカルでも実行可能なサイズに小さくできる 1. はじめに大規模言語モデル(LLM)の数は数年前と比べてたくさん増えました。有名な LLM を使ったチャットサービスとして、OpenAI の ChatGPT や Anthropic の Claude、Google の Gemini などがありますが、これらのサービスの中で利用されている大規模言語モデルは公開されていません。 現状、様々な評価指標により LLM の性能が測定されていますが、

                                                                      いちばんやさしいローカル LLM|ぬこぬこ
                                                                    • RAGの実装戦略まとめ - Qiita

                                                                      それでは以下、簡単なデモを含めながら個別に説明していきます。 1. ハイブリッドサーチ こちらは、性質の異なる複数の検索方式(例えばベクトル検索とキーワード検索)を組み合わせて検索精度を向上させる手法になります。 各検索方式単体の場合に比べ、性質の異なる検索方式を組み合わせ、ある種いいとこ取りをする事で、検索性能の向上が期待できます。 今回はBM25でのキーワードベースの類似度検索と通常のベクトル検索を組み合わせていきます。 BM25について簡単に説明しておくと、文脈や文章構造は完全に無視した上で、文書内の単語を全てバラバラに分割し、文書内の各単語の出現頻度と文書間におけるレア度を加味した特徴量を算出します。 つまり、特定の文書内の各単語の数をカウントしてヒストグラムを作れば、似たような文書には同じような単語がよく出るはずなので(同じようなヒストグラムの形になるので)、類似度が高くなる性質

                                                                        RAGの実装戦略まとめ - Qiita
                                                                      • ChatGPTを利用して画面モックを爆速で作成する - Taste of Tech Topics

                                                                        こんにちは、最近スマホのChatGPTアプリで、音声入出力機能を使って会話を楽しんでいる安部です。 皆さんWebアプリ開発などで、画面モックを作成しなければいけない場面は多いですよね? 適当なHTMLを作ったり、ツールで図示したりしますが、正直面倒です。 そこで今回は、ChatGPTに最初から画面モックを作ってもらいます。 最近はChatGPTに画像を添付できるようになったので手書き画像からHTMLを出力することもできますが、 この記事では画面要素を言葉で指定し、HTMLを出力してもらいます(配置などのデザインは、ひとまずChatGPTにお任せしてみます)。 では早速始めましょう。使用モデルはGPT-4です。 簡単な入力フォームを出力させる まずは、よく使いそうな簡単な入力フォームを出力してもらいます。 ここでは、「書籍を登録する画面」という設定で指示を出します。 次の画面構成の案を、HT

                                                                          ChatGPTを利用して画面モックを爆速で作成する - Taste of Tech Topics
                                                                        • ティム・オライリーとシリコンバレーの贖罪

                                                                          ティム・オライリーとシリコンバレーの贖罪 2024.07.10 Updated by yomoyomo on July 10, 2024, 11:00 am JST きっかけは、『ブログ 世界を変える個人メディア』や『あなたがメディア! ソーシャル新時代の情報術』の著書で知られるジャーナリストのダン・ギルモアが、16年務めた教職を辞すという「引退」について書いているのを4月に読んだことでした。 調べてみると、彼は1951年生まれの73歳らしいのですが、ふと、自分が20年以上前からその言説を参考にしてきたベテランたちの何人かも70歳前後なのに気付きました。それは例えば、ブログやポッドキャストの発展に大きく関わったデイヴ・ワイナーや、やはりベテランブロガーにして『グーグル的思考』、『パブリック 開かれたネットの価値を最大化せよ』、『デジタル・ジャーナリズムは稼げるか』の著書で知られるジェフ・ジ

                                                                            ティム・オライリーとシリコンバレーの贖罪
                                                                          • 生成AIとみられる女性の「扇情動画」乱立 再生回数稼ぎ、収益目的も背景か

                                                                            ユーチューブに公開された生成AIで作成・加工されたとみられる女性の動画。投稿したアカウントは現在停止されている 生成人工知能(AI)によって作成・加工されたとみられる若い女性の扇情的な動画が、交流サイト(SNS)上などで拡散されている。一見しただけでは生身に見えるほど精緻で、再生回数が数百万回に達するものも。より性的に過激な動画へ誘導するものもあり、専門家は「アクセスを稼いで収益をあげる仕組みが確立されていることが背景にある」と指摘する。 「ミス東大」モデルのような容姿の若い女性が、画面を向きながら公園や屋外を1人で歩く数分の動画。SNSのインスタグラムや動画投稿サイトのユーチューブなどに昨年から登場した、あるアカウントから投稿されたものだ。 「ノーブラ散歩」などの刺激的なタイトルがつけられ、プロフィル欄には東京大学の理系学生をうたい「ミス東大」を目指すなどと記載。他にも、服を着た状態で下

                                                                              生成AIとみられる女性の「扇情動画」乱立 再生回数稼ぎ、収益目的も背景か
                                                                            • 自分だけの信頼できるAIへ グーグル「NotebookLM」公開

                                                                                自分だけの信頼できるAIへ グーグル「NotebookLM」公開
                                                                              • ITエンジニアなのにまだ投資やってないの?ChatGPTでクオンツシステム作って儲けようぜpart3 - Qiita

                                                                                前回まで ITエンジニアなのにまだ投資やってないの?ITエンジニアならChatGPTでクオンツシステム作って儲けようぜ ITエンジニアなのにまだ投資やってないの?ITエンジニアならChatGPTでクオンツシステム作って儲けようぜpart2 ネトフリは面白い 僕はネトフリのヘビーユーザーなんですが、投資系にも リーマンショックまでの経緯と仕組みを実録インタビューで振り返る「インサイドジョブ」や AIテック系の話で、チェスは機械には勝てないと言われてAIが勝ち、「人間の高度な知的能力でしか勝てない」と言った囲碁の世界王者に勝ち、今では7、8年も訓練を積んでようやくなる戦闘機のエースパイロットにも勝ち、AIの実用速度の高さをドキュメントした「アンノウン」なんかも面白いし勉強になります。 投資思考では技術力UPは悪手 投資思考って事業でも人生でもとても大事です。 例えば、収入に不満を持ってるエンジ

                                                                                  ITエンジニアなのにまだ投資やってないの?ChatGPTでクオンツシステム作って儲けようぜpart3 - Qiita
                                                                                • イラストの手書き証明が不可能に? “絵の制作過程”動画を生成するAI 米スタンフォード大の研究者が発表

                                                                                  PaintsUndoを作成したのは米スタンフォード大学に在籍する研究者のルーミン・チャンさんで、GitHub上でこのプログラムも公開している。チャンさんは「lllyasviel」のハンドルネームで活動しており、自由なポーズをとったキャラクターのAIイラストを生成できる技術「ControlNet」の開発者としても知られている。 チャンさんは「このプロジェクトは、人間の描画行動の基本モデルを開発することを目的としている」と説明。「これにより、将来のAIが人間のアーティストの真のニーズにより良く応えることが可能になる」と続けている。 「ユーザーは、このツールを使用して自由にコンテンツを作成できるが、現地の法律を順守し、責任を持って使用することが求められる。ユーザーは、このツールを使用して虚偽の情報を生成したり、対立をあおったりしてはならない。開発者は、ユーザーによる誤用について一切の責任を負わな

                                                                                    イラストの手書き証明が不可能に? “絵の制作過程”動画を生成するAI 米スタンフォード大の研究者が発表