並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 293件

新着順 人気順

"AI(Artificial Intelligence)"の検索結果81 - 120 件 / 293件

  • Appleが画像生成AI「Stable Diffusion」にまさかの正式対応、開発者いわく「画像を1秒以内に生成可能」

    文章(プロンプト)を入力するだけで画像を生成してくれるAI「Stable Diffusion」は、2022年8月に一般公開されて以降、有志によって簡単に動かせるUIや各種拡張機能が続々と生み出されています。そんなStable Diffusionについて、Appleが機械学習フレームワーク「Core ML」への最適化を発表しました。同時にMacBookやiPhoneなどのAppleシリコン搭載デバイス向けのコードもオープンソースで公開されています。 Stable Diffusion with Core ML on Apple Silicon - Apple Machine Learning Research https://machinelearning.apple.com/research/stable-diffusion-coreml-apple-silicon GitHub - app

      Appleが画像生成AI「Stable Diffusion」にまさかの正式対応、開発者いわく「画像を1秒以内に生成可能」
    • Microsoftがたった13億のパラメーターでGPT-3.5超えのHumanEval50.6%をたたき出す「phi-1」を発表

      LLaMaやFalconといった小型の大規模言語モデル(LLM)が矢継ぎ早にリリースされる中、Microsoft ResearchのAI研究チームが、プレプリントサーバーのarXivで、Transformerベースのモデル「phi-1」を発表しました。このモデルは、パラメーター数がGPT-3.5の100分の1以下の13億しかないにもかかわらず、テスト用データセット・HumanEvalでGPT-3.5を上回る成績を収めたことが報告されています。 [2306.11644] Textbooks Are All You Need https://doi.org/10.48550/arXiv.2306.11644 Microsoft Releases 1.3 Bn Parameter Language Model, Outperforms LLaMa https://analyticsindiama

        Microsoftがたった13億のパラメーターでGPT-3.5超えのHumanEval50.6%をたたき出す「phi-1」を発表
      • プログラミングせずAIをDIY! Webブラウザで動くGoogleの機械学習サービスを試す AIの出来栄えは?

        プログラミングせずAIをDIY! Webブラウザで動くGoogleの機械学習サービスを試す AIの出来栄えは?:遊んで学べる「Experiments with Google」(第19回)(1/3 ページ) 「Experiments with Google」は、Googleが人工知能(AI)や拡張現実(AR)といった最新技術の可能性を示すために、実験的な応用例を紹介するショーケースだ。膨大なコンテンツを公開しており、その多くはスマートフォンやPCで試せる。 この連載では、多種多様な応用例の中から興味深いものをピックアップ。実際に遊んだ体験レポートを通して、裏側にあるテクノロジーや、技術の活用方法とその目的を解説する。 読者の皆さんも、ぜひ自分の手で試しながらその仕組みを学んでもらえたらうれしい。きっと、最新技術の魅力に気付くはずだ。 プログラミングできなくてもAIを作れる「Teachable

          プログラミングせずAIをDIY! Webブラウザで動くGoogleの機械学習サービスを試す AIの出来栄えは?
        • OpenAI APIのファインチューニングの学習データのガイドライン|npaka

          以下の記事を元に、「OpenAI API」のファインチューニングの学習データのガイドラインをまとめました。 1. 学習データの書式ファインチューニングするには、単一の入力「プロンプト」とそれに関連する出力 「コンプリーション」 のペアで構成される学習データが必要です。これは、1回のプロンプトで詳細な手順や複数の例を入力するような、ベースモデルの使用方法とは大きく異なります。 「学習データの書式」のガイドラインは、次のとおりです。 ・プロンプトが終了してコンプリーションが開始することをモデルに知らせるため、区切り記号 ("\n\n###\n\n"など) でプロンプトを終了する必要があります。区切り記号は、プロンプトの他の場所で使用されない文字列を指定します。 ・コンプリーションが終了することをモデルに知らせるため、停止記号 ("\n"、"###"など)でコンプリーションを終了する必要がありま

            OpenAI APIのファインチューニングの学習データのガイドライン|npaka
          • マイクロソフト、Copilotを活用した生成AI機能を一挙紹介

              マイクロソフト、Copilotを活用した生成AI機能を一挙紹介
            • 大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回る

              生成AIを用いた開発者向けの検索エンジン「Phind」が、コーディング能力でOpenAIのGPT-4を上回ったことが明らかになりました。 Phind - AI Search Engine and Pair Programmer https://www.phind.com/blog/phind-model-beats-gpt4-fast Our GPT-4-beating coding model is now the default on https://t.co/epkoFW8Ozz. It's also 5x faster than GPT-4. Learn more in our blog post: https://t.co/PrOFETEbvd— Phind (@phindsearch) PhindはもともとHello Cognition(beta.sayhello.so)として

                大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回る
              • 【ChatGPT】データサイエンティストが読むべきChatGPT関連の記事・動画まとめ - Qiita

                データサイエンティストにとって、ChatGPTはうまく利用することで非常に強力なツールになることは間違いありません。 近い将来、データサイエンティストの中でもChatGPTをうまく使いこなせる人とそうでない人の間には、大きな差が生まれるでしょう。 そこで、今後ChatGPTを上手に活用できるようにデータサイエンティストが必ず読むべき記事を紹介します! ChatGPTの公式プラグイン「code interpreter」 データサイエンティストの業務を大きく変える可能性のある、ChatGPT公式プラグイン「code interpreter」について解説している記事です。 ファイルのアップロード機能を使うことで、チャット上にデータをアップロードし、そのデータに対してコードを実行することができるようになります。 また、作業の結果をcsvなどでダウンロードすることが可能です。 つまり、code in

                  【ChatGPT】データサイエンティストが読むべきChatGPT関連の記事・動画まとめ - Qiita
                • ビル・ゲイツが「18カ月以内にチャットAIが子どもたちに読み書きを教育するようになる」と提唱

                  by OnInnovation Micorosoftの創業者であり慈善団体のビル&メリンダ・ゲイツ財団の活動に携わるビル・ゲイツ氏が、2023年4月18日にアメリカのサンディエゴで開催されたASU+GSVサミットで講演を行い、「AIは最終的に人間と同じくらい優れた家庭教師になることができます」と述べ、教育分野におけるAIの今後の展望を予測しました。 A fireside chat on education, technology, and almost everything in between | Bill Gates https://www.gatesnotes.com/ASU-and-GSV?WT.mc_id=20230419100000_ASU-GSV-2023_BG-EM Bill Gates: A.I. chatbots will teach kids how to read

                    ビル・ゲイツが「18カ月以内にチャットAIが子どもたちに読み書きを教育するようになる」と提唱
                  • 超高精度なイラストを生成できると話題の「NovelAI」は本家Stable Diffusionにどんな改善を加えたのか?

                    Stable Diffusionよりもはるかに高い精度でイラストを生成できる画像生成AIサービス「NovelAI」のAIモデルについて、NovelAIの開発チームが自身のブログで解説しています。 NovelAI Improvements on Stable Diffusion | by NovelAI | Oct, 2022 | Medium https://blog.novelai.net/novelai-improvements-on-stable-diffusion-e10d38db82ac NovelAIは2021年6月15日にベータ版が公開されたSaaSモデルの有料サブスクリプションサービスで、アメリカのAnlatanによって運営されています。もともとはその名の通りに小説を自動生成するAIでしたが、2022年10月3日に画像生成機能を実装しました。 NovelAI's Image

                      超高精度なイラストを生成できると話題の「NovelAI」は本家Stable Diffusionにどんな改善を加えたのか?
                    • 好きな人の声で歌える、破壊的でヤバい「Diff-SVC」はAI歌声合成を民主化するのか(CloseBox) | テクノエッジ TechnoEdge

                      それを、完全とは言えないまでも、かなり元の人に肉薄する品質で再現できる技術がDiff-SVCです。元になる音声データが1時間くらいあれば、与えた音声を、希望する声質に変換することが可能になるのです。 しかも、基本的にお金はかかりません。AI歌声合成が、ちょっとハードルは高いものの、無料で使えて、データさえ集めてくれば誰でも手が出せる。AI歌声合成の民主化と言っていいでしょう。 筆者は10年近く前に旅立った妻の歌声を、UTAU-Synthという、短く切り出した音素をピッチや長さを合わせながら組み合わせていくソフトウェアで再構成しています。1フレーズずつ音素を繋いで、できるだけ不自然にならないように調整していくため、短くて数日、長いと数カ月も時間をかけて完成させていきますが、もうその作業をしなくてもよくなります。 ただ、自分で歌って、もしくは他のボーカルシンセソフトでボーカルトラックをDiff

                        好きな人の声で歌える、破壊的でヤバい「Diff-SVC」はAI歌声合成を民主化するのか(CloseBox) | テクノエッジ TechnoEdge
                      • 自然な日本語で注文するとソースコードを作ってくれるサービス「AI Programmer」が登場/プロトタイプとして無償公開【やじうまの杜】

                          自然な日本語で注文するとソースコードを作ってくれるサービス「AI Programmer」が登場/プロトタイプとして無償公開【やじうまの杜】
                        • NEC、「標準的GPU 1基で動く」世界トップクラスの日本語LLM

                            NEC、「標準的GPU 1基で動く」世界トップクラスの日本語LLM
                          • グーグル「Bard」ついに日本公開 「ChatGPT」対抗のAIチャット

                            グーグルが開発するAIチャット「Bard」。2月6日に発表され、3月21日より米国と英国のみで公開されていたが、4月18日午後(日本時間)あたりから、日本でもベータテストに参加できるようになった。 さっそく使ってみる 「Bard」は大規模言語モデル(LLM)「GPT-4」を使用したOpenAIの「ChatGPT」同様、Googleが開発するLLM「LaMDA(Language Model for Dialogue Applications)」の「軽量で最適化されたバージョン」を利用している。 ベータテストに参加するには、サイトの右下に表示されている「Join Waitlist」ボタンをクリックし、ニュースメールの購読にチェックを入れるだけでよい。

                              グーグル「Bard」ついに日本公開 「ChatGPT」対抗のAIチャット
                            • DeepMindの研究者が「AIが人類を滅ぼす可能性は高い」との論文を発表

                              by Dick Thomas Johnson 画像生成AIが人間を差し置いて絵画コンテストで優勝するなどAIが近年目覚ましい進歩を遂げる中、査読付の専門誌であるAI Magazineに、将来的に超知能AIが現れて人類に対する脅威となる可能性は高いと結論付ける論文が掲載されました。 Advanced artificial agents intervene in the provision of reward - Cohen - 2022 - AI Magazine - Wiley Online Library https://doi.org/10.1002/aaai.12064 Google Deepmind Scientist Warns AI Existential Catastrophe "Not Just Possible, But Likely" | IFLScience http

                                DeepMindの研究者が「AIが人類を滅ぼす可能性は高い」との論文を発表
                              • ChatGPTの新機能「GPTs」「Assistants」を試す。特別なツール不要でカスタムChatGPTを開発可能に!【イニシャルB】

                                  ChatGPTの新機能「GPTs」「Assistants」を試す。特別なツール不要でカスタムChatGPTを開発可能に!【イニシャルB】
                                • 「画像生成AI」驚きの実力と使い方、写真素材サイトもイラストレーターも不要に?

                                  やなぎや・とものり/1972年12月生まれ。1998年からITライターとして活動しており、ガジェットからエンタープライズ向けのプロダクトまで幅広い領域で執筆する。2018年から、NPO法人デジタルリテラシー向上機構(DLIS)を設立し、ネット詐欺の被害をなくすために活動している。 https://prof.yanagiya.biz/ https://peraichi.com/landing_pages/view/dlis/ 仕事を256倍速くするツールを探せ! ITの世界は日進月歩。一昔前ならとても無理だったことや、人間がやらなくてはならなかったことをどんどんコンピュータに任せられるようになっています。連載「仕事を256倍速くするツールを探せ!」では、最近出てきたサービスの中から、特にビジネスや勉強に役立つサービスやソフトウエア、ハードウエアをピックアップ。ライターが実際に使用し、使い方や

                                    「画像生成AI」驚きの実力と使い方、写真素材サイトもイラストレーターも不要に?
                                  • 百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】

                                    昨年末から急激に話題を呼んだChatGPT、その内部的なバージョンアップであるGPT-3.5とGPT-4はいずれもMicrosoftから強力な支援を受けた米OpenAIという企業が独占的に提供する大規模言語モデル(LLM)だ。 それに呼応するかのように、Meta社からはLLaMA(ラマ)がリリースされ、LLaMAをChatGPTとの1万3千回の会話データで微調整したAlpaca(アルパカ)、AlpacaをShareGPT(GPTとの会話を有志がオープンにしたもの)のデータで微調整したVicuna(ビクーニャ)といった派生モデルが次々と登場した。 しかし、LLaMAはMeta社の意向により「アカデミック用途限定」という縛りがある。またGPTの出力にはOpenAIの利用規定で「GPTの出力結果を元にGPTに対抗できる強力なAIを作ってはいけない」という制約があるため、AlpacaもVicuna

                                      百花繚乱の大規模言語モデル その現状まとめ【2023年4月末版】
                                    • ジェネレーティブAIが抱える問題を浮き彫りにする「1本のバナナ問題」とは?

                                      Stable DiffusionやChatGPTなどのジェネレーティブAIが登場したことによって、誰でも簡単に文章や画像を作成できるようになりました。IT系ニュースサイト・Digital Scienceのダニエル・フックCEOが、画像生成AIを使用した時に遭遇した「1本のバナナ問題」から、ジェネレーティブAIが抱える問題に言及しています。 The Lone Banana Problem. Or, the new programming: “speaking” AI - TL;DR - Digital Science https://www.digital-science.com/tldr/article/the-lone-banana-problem-or-the-new-programming-speaking-ai/ バナナが好物だというフック氏は、以前から友人と「バナナのブランディン

                                        ジェネレーティブAIが抱える問題を浮き彫りにする「1本のバナナ問題」とは?
                                      • Engadget | Technology News & Reviews

                                        Parrots in captivity seem to enjoy video-chatting with their friends on Messenger

                                          Engadget | Technology News & Reviews
                                        • 2800ページ超え!ChatGPT/生成AI本14冊を読み比べてみた

                                          生成AI(ジェネレーティブAI)が話題だ。日本経済新聞社や日本 芸能従事者協会など、生成AIに関するアンケートがあちこちで実施され、デジタル庁、経済産業省、農林水産省は生成AIを業務に利用することを決めた。AIは大きく機械学習とそれ以外のAI技術に分けられ、深層学習(ディープラーニング)は機械学習に属していると言われるが、もはや世間的には、AI=生成AIの様相を呈している。 ネットにも情報があふれているが、ChatGPTをはじめとする生成AI本や、生成AIを特集した雑誌も多数出版されている。 それらの本の帯や表紙には次のような宣伝文が書かれている。 「あなたの欲しい回答を導き出すベストプロンプトを大公開‼」 「誰でも使えるAIがやってきた!」 「可能性は無限大!」 「すべきことが1/1000になる異次元のスキル」 「実生活・ビジネスで即使える」 生成AIは仕事でどのように役立つのか。思い通

                                            2800ページ超え!ChatGPT/生成AI本14冊を読み比べてみた
                                          • GPT-4で新しいプログラミング言語「TenetLang」を生み出す、チャットAIは既にプログラミングの何たるかをかなり理解している模様

                                            OpenAIが作成したチャットAIの「GPT-4」を利用して、新しいプログラミング言語の「TenetLang」をコーダーのルークさんが作成しています。 GPT-4 Designed a Programming Language https://lukebechtel.com/blog/gpt4-generating-code GPT-4のような大規模言語モデル(LLM)は、世界中に存在するあらゆるプログラミング言語を何十億回も読み込んでいます。LLMはプログラミングも可能であることは知られていますが、ルークさんは「私の知る限り、GPT-4で独自のプログラミング言語を作成するといった事例はこれまでありません」と記しています。そこで、ルークさんはGPT-4を使って新しいプログラミング言語を創造することに決めた模様。 ルークさんは最初にGPT-4に対して「ソフトウェア開発における大まかな統一理論

                                              GPT-4で新しいプログラミング言語「TenetLang」を生み出す、チャットAIは既にプログラミングの何たるかをかなり理解している模様
                                            • 「大規模言語モデル(LLM)カオスマップ」2023年度6月版が公開

                                              株式会社ANOBAKAは、直近の大規模言語モデル(LLM:Large Language Models)の開発競争の激化を受け、Generative AI領域で起業を考えている人への参考情報として「大規模言語モデル(LLM)カオスマップ」2023年度6月版を公開したと発表した。 大規模言語モデル(LLM:Large Language Models)とは、大量のテキストデータを使ってトレーニングされた自然言語処理のモデルだ。2022年11月に発表され大きな話題となったChatGPTも、2022年初頭にトレーニングした「GPT-3.5シリーズ」を対話向けにファインチューニングしたものであり、大規模言語モデルの応用例の一つだ。 米国同様、日本でも今後アプリケーションレイヤーのGenerative AIスタートアップが多数勃興することが予測されるという。アプリケーションレイヤーのGenerative

                                                「大規模言語モデル(LLM)カオスマップ」2023年度6月版が公開
                                              • 早くも中国でAIが生成した美人ブロガーが多数登場。その前例に学ぶことは | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

                                                中国でテクノロジーをマネーに変える速度は往々にして試行錯誤をしないので速い。最近流行りのAI画像生成もそのひとつ。Stable DiffusionやMidjourneyなどのアルゴリズムが更新され、実在のモデルやインフルエンサーのような人物と見紛う画像を生成できるようになり、これが早速ビジネスに適用され、AIで描かれた女性がSNS「小紅書(RED)」やECの「淘宝」や「天猫」などで見るようになった。 少なくとも現時点でAIが生成した美人画像は中国でウケがよく、小紅書では生成したAI画像を自撮り画像であるかのように投稿して数万のフォロワーを抱えるアカウント(ここでは便宜上「AI美人ブロガー」とする)が続々と登場している。AI美人ブロガーを作成した人はほぼ全員が男性でありAI関連分野に仕事や研究で携わっている。一方女性の作成者についてはアニメーターやデザイナーが参入していて、キャリアや感性を生

                                                  早くも中国でAIが生成した美人ブロガーが多数登場。その前例に学ぶことは | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
                                                • GPT-4の精度は悪化している? 3月に解けた数学の問題解けず GPT-3.5にも敗北──米国チームが検証

                                                  「GPT-4の精度は時間とともに変わっている」──そんな研究成果を米スタンフォード大学と米カリフォルニア大学バークレー校の研究チームが発表した。3月と6月時点のGPT-4の精度を比較したところ、一部タスクでは精度が大きく悪化していたという。ただし、この論文は査読前のもので第三者によるレビューは受けていない。 GPT-4は、米OpenAIが提供する大規模言語モデル(LLM)。3月の発表後、チャットAI「ChatGPT」にも搭載され、性能の高さが大きな話題を集めた。LLMは、データのフィードバックや設計変更などをすると性能が変化する。しかし、OpenAIはLLMの更新について発表しておらず、公開以後の性能変化も明らかにしていない。そこで研究チームは、3月と6月時点でのGPT-4、前モデルであるGPT-3.5に精度の違いがあるのか検証した。 実験ではChatGPTに対して「数学の問題の回答」「機

                                                    GPT-4の精度は悪化している? 3月に解けた数学の問題解けず GPT-3.5にも敗北──米国チームが検証
                                                  • 〝AIの父〟がGoogleを退社「人類の脅威になる」と危険性を暴露 | AppBank

                                                    深層学習(LLM)の第一人者であり、AIの父(ゴットファーザー)と呼ばれるジェフリー・ヒントン氏が、Googleを退社していたことを米メディア「The New York Times」に明かしました。同氏は退社した理由について「AIのリスクについて自由に発言するため」だとしています。 *Category:テクノロジー Technology *Source:The New York Times ,Wikipedia ,The Verge 「AIの父」ヒントン氏が語る現状の危険性 ヒントン氏は、現在のChatGPTなどのLMMにつながる基礎的な研究を行った人物で、2018年にはチューリング賞を受賞しています。 AIのゴッドファーザー」、ライフワークへの後悔と不安を胸にグーグルを退社 ヒントンと彼の学生2人(そのうちの1人はOpenAIのチーフサイエンティストとなった)が立ち上げた会社をGoogl

                                                      〝AIの父〟がGoogleを退社「人類の脅威になる」と危険性を暴露 | AppBank
                                                    • 画像生成AI「Stable Diffusion」「Adobe Firefly」「Midjourney」の特徴が一発で分かる「同じテキスト」から生成した画像たち

                                                      無料で使える「Stable Diffusion」やAdobeが提供する「Adobe Firefly」など手軽に使える画像生成AIが続々と登場しています。画像生成AIは基本的に「生成したい画像を説明するテキスト(プロンプト)を入力する」という形式で使用可能ですが、AIの種類やモデルデータが変化すると生成結果もまったく別物に変化します。テクノロジー関連ライターのMuhammad Usman氏は「Adobe Firefly」「DALL・E2」「OpenJourney」「Stable Diffusion」「Midjourney」といった主要な画像生成AIに同じプロンプトを入力した際の生成結果をまとめています。 Comparing Adobe Firefly, DALL・E2, OpenJourney, Stable Diffusion, and Midjourney https://blog.us

                                                        画像生成AI「Stable Diffusion」「Adobe Firefly」「Midjourney」の特徴が一発で分かる「同じテキスト」から生成した画像たち
                                                      • DeepMindのAI「AlphaCode」が人間のプログラマーと互角になってきた

                                                        DeepMindのAI「AlphaCode」が人間のプログラマーと互角になってきた2022.12.23 20:0020,014 Mack DeGeurin - Gizmodo US [原文] ( 禿頭帽子屋/Word Connection JAPAN ) 人工知能(AI)に秘められた能力の段階的な発達をたどるという話になると、なぜかチェスや囲碁といった昔ながらのボードゲームが持ち出されがちです。その例は挙げればきりがないほどで、つい最近にも、戦略ゲーム「ディプロマシー」をプレイできるAIが話題になりました。しかし、こうした事例で示されるのは、あくまでもAIが現実世界の問題を解く能力の範囲に限られます。 これよりずっといい「力試し」になりそうなのが、AIと人間をプログラミングのコンテストで競わせることです。Alphabet傘下のDeepMindが保有するAIモデルAlphaCodeが、実際に

                                                          DeepMindのAI「AlphaCode」が人間のプログラマーと互角になってきた
                                                        • テキストで命令するだけで画像や動画を自動で加工してくれる「Text2LIVE」

                                                          画像や動画のオブジェクトを違う色にしたり、特殊な効果を付けたりといった加工をする場合、通常は画像・動画編集ソフトを用いてオブジェクトを指定したり、加工するエフェクトをオブジェクトに合わせて調整したりと、面倒な操作が必要です。そのような画像や動画の加工を、機械学習を用いて「テキストで指定するだけ」で行うことができる「Text2LIVE」がGitHubで公開されています。 GitHub - omerbt/Text2LIVE: Official Pytorch Implementation for "Text2LIVE: Text-Driven Layered Image and Video Editing" (ECCV 2022 Oral) https://github.com/omerbt/Text2LIVE Text2LIVE: Text-Driven Layered Image and

                                                            テキストで命令するだけで画像や動画を自動で加工してくれる「Text2LIVE」
                                                          • 1600以上のAPIを適切に呼び出してAIに付き物の「幻覚」を大幅に減らす言語モデル「Gorilla」が公開される

                                                            近年はChatGPTやBardなどの対話型AIが相次いでリリースされ、人間の質問や呼びかけに対して非常に高精度な回答ができることで注目を浴びていますが、これらの対話型AIは時に真実ではないことを真実かのように話す「ハルシネーション(幻覚)」を起こすことがあります。そこで、膨大な数のAPIから適切なものを呼び出し、幻覚を大幅に減らすことができる言語モデル「Gorilla」を、アメリカ・カリフォルニア大学バークレー校とMicrosoft Researchの研究チームが公開しました。 Gorilla: Large Language Model Connected with Massive APIs https://arxiv.org/abs/2305.15334 Gorilla https://gorilla.cs.berkeley.edu/ GitHub - ShishirPatil/gori

                                                              1600以上のAPIを適切に呼び出してAIに付き物の「幻覚」を大幅に減らす言語モデル「Gorilla」が公開される
                                                            • 画像生成AI「Stable Diffusion」で美麗イラストとQRコードを融合させる試み

                                                              決済手段としても用いられるようになっている「QRコード」は、一部が破損・汚損していたり読み取り時に隠れていても大丈夫なように誤り訂正機能が盛り込まれています。これを活用して、QRコードと美麗なイラストを融合させる試みが行われています。 AI 生成可扫码图像 — 新 ControlNet 模型展示 https://mp.weixin.qq.com/s/i4WR5ULH1ZZYl8Watf3EPw AIGC All in One https://aigc.ioclab.com/index.html Redditor creates working anime QR codes using Stable Diffusion | Ars Technica https://arstechnica.com/information-technology/2023/06/redditor-creates-

                                                                画像生成AI「Stable Diffusion」で美麗イラストとQRコードを融合させる試み
                                                              • チャット形式でプログラミングが可能なローカルで動作するオープンソースなAIツール「Open Interpreter」を使ってみた

                                                                OpenAIが開発したプラグイン「Code Interpreter」を使用すると、ChatGPTにプログラミングのコードを生成してもらうことが可能ですが、インターネットに接続できないのに加え、使用できるパッケージやアップロードの容量、実行時間などに制限があります。「Open Interpreter」はローカルで動作することでそうした制限を突破し、柔軟にさまざまなプログラムを生成・実行してくれるオープンソースなAIツールとのことなので、実際に使って試してみました。 KillianLucas/open-interpreter: OpenAI's Code Interpreter in your terminal, running locally https://github.com/KillianLucas/open-interpreter/blob/main/docs/README_JA.m

                                                                  チャット形式でプログラミングが可能なローカルで動作するオープンソースなAIツール「Open Interpreter」を使ってみた
                                                                • GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ

                                                                  はじめに 結論 背景 課題 Fine-tuning とは? Data の準備 Fine-tuning を実施 結果 おわりに 参考 はじめに こんにちは、DROBE の都筑です。 みなさん LLM 使っていますか。今回は GPT-3.5-turbo の Fine-tuning の事例を紹介します。 結論 GPT-4 を利用して得られたデータを使って GPT-3.5-turbo を Fine-tuning する事で、特定のタスクに関しては GPT-4 相当の性能が出る事が確認できた GPT-4 利用時点で使っていたプロンプトをそのまま使った場合の性能が一番高く、token 節約のためにプロンプトの省略をすると性能が劣化した 背景 LLM を利用したサービスの開発において、OpenAI を利用する場合にはモデルの選択肢がいくつかあります。2023年9月現在では、GPT-4 と GPT-3.5-

                                                                    GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ
                                                                  • 生成AIの「RAG」とは? 知っておきたい重要キーワードを解説する【イニシャルB】

                                                                      生成AIの「RAG」とは? 知っておきたい重要キーワードを解説する【イニシャルB】
                                                                    • OpenAI、大規模言語モデルの数学能力を大きく向上させることに成功 | AIDB

                                                                      OpenAIは新しいフレームワーク「PRM」を発表しました。これは、大規模言語モデル(LLM)の数学能力を向上させるためのもので、AIが問題を解く際の誤りをプロセスベースで特定・修正する能力を強化します。このフレームワークで訓練した大規模言語モデルは、DeepMind社の作成した数学問題集(MTAHデータセット)において他のモデルを凌駕し最も優れたパフォーマンスを見せました。 また、この手法は数学だけでなく推論能力を必要とする広範な問題の解決にも応用できる可能性があり、注目を集めています。 参照論文情報 タイトル:Let’s Verify Step by Step 著者:Hunter Lightman, Vineet Kosaraju, Yura Burda, Harri Edwards, Bowen Baker, Teddy Lee, Jan Leike, John Schulman,

                                                                        OpenAI、大規模言語モデルの数学能力を大きく向上させることに成功 | AIDB
                                                                      • OpenAI「GPTs」がもたらす革命 誰でも「自分のコパイロット」時代へ【西田宗千佳のイマトミライ】

                                                                          OpenAI「GPTs」がもたらす革命 誰でも「自分のコパイロット」時代へ【西田宗千佳のイマトミライ】
                                                                        • これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales) | テクノエッジ TechnoEdge

                                                                          IT系海外速報を書いたり、翻訳を請け負ったりしています。初めてのスマートフォンはHTC Desire。その後はNexus 5からずっとGoogleさんオリジナルモデルを使っています。 AI一色だった5月のGoogle I/Oで発表された新サービスの中でも、一般ユーザーが手軽に使えそうだと期待したのが「Search Generative Experience」(以下「SGE」)でした。まずは米国でのみの提供でしたが、これが8月30日に日本とインドでも使えるようになりました。米国以外で使えるようになったのは、今のところこの2カ国のみだそうです。 SGEは、Microsoftの「新しいBing」のような、Web検索を生成AIチャットボットとのやりとりで行うというサービスです。全収入に占める広告収入の割合がごくわずかなMicrosoftと違い、GoogleにとってのGoogle検索(の広告)は重要

                                                                            これが新しいAIググる体験か。Googleの生成AI検索「SGE」、日本語実験の現在地(Google Tales) | テクノエッジ TechnoEdge
                                                                          • 高度に成熟したAIの「睡眠不足」が問題視されている - ナゾロジー

                                                                            人間に近づいた時、AIに起こる問題 現在の機械に睡眠は必要ありません。 パソコンにはスリープ機能がありますが、これは別に機械に睡眠が必要なわけではなく、単に電気代節約のための機能です。 では、省エネ目的以外に機械が眠る必要とは何なのでしょうか? その変化は、生体脳を模倣したAIシステムが、私達の生活を1日中支援している機械に組み込まれたとき起きると考えられています。 この可能性はある実験中に発覚しました。 ロスアラモス国立研究所では、人間の学習行動を厳密にシミュレーションした神経ネットワークを開発し、それがどのように動作するか調査していました。 このシミュレーションで確認していたのは、見たものを学習するという行為についてです。 たとえば、子どもに見た目の異なる動物をグループ化させるという作業をさせた場合、知らない動物であってもライオンとペンギンを別のグループに分類します。 こうした見たもの

                                                                              高度に成熟したAIの「睡眠不足」が問題視されている - ナゾロジー
                                                                            • 生成AIに“生成AIが作った文章”を学習させ続けるとどうなる? 「役立たずになる」と英国チームが報告

                                                                              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 英オックスフォード大学や英ケンブリッジ大学、英インペリアル・カレッジ・ロンドン、米トロント大学に所属する研究者らが発表した論文「The Curse of Recursion: Training on Generated Data Makes Models Forget」は、GPT-4などの大規模言語モデル(LLM)が別のLLMが生成したテキストを学習し続けるとどうなるかを調査した研究報告である。 今後、LLMモデルを使って生成した文章がネット上に溢れかえる未来、それらを多く含むデータをトレーニングする後続のLLMモデルはどうなるかを検証する。 LLMモ

                                                                                生成AIに“生成AIが作った文章”を学習させ続けるとどうなる? 「役立たずになる」と英国チームが報告
                                                                              • マイクロソフト、軽量かつ高性能な大規模言語モデル「phi-1」を発表

                                                                                Microsoft ResearchのAI研究チームは6月20日(現地時間)、わずか13億パラメーターと従来のものよりもサイズが小さいにも関わらず「GPT-3.5(1750億パラメーター)」を上回る成績を収めたTransformerベースの大規模言語モデル「phi-1」を発表した。このモデルは間もなく「Hugging Face」で公開される予定だといいう。 ベンチマークでGPT-3.5を凌駕 「Textbooks Are All You Need」と題された研究論文によると、このモデルは8台のA100(NVIDIAの高性能GPU)でわずか4日間かけて訓練され、インターネット上から取得した60億トークンの「教科書品質」データセットと、GPT-3.5で生成した10億トークンの微調整用「練習問題」データセットが使用された。 サイズが小さいにもかかわらず、phi-1はLLMの性能を測定するためのベ

                                                                                  マイクロソフト、軽量かつ高性能な大規模言語モデル「phi-1」を発表
                                                                                • マイクロソフト、もしもCopilotの利用者が著作権侵害で訴えられたら、賠償金を代わりに支払うと約束。「Copilot Copyright Commitment」を発表

                                                                                  マイクロソフトは、同社が提供する生成AIによるさまざまな支援機能を提供する「Copilot」製品群が、著作権侵害の心配なく使えると約束する「Copilot Copyright Commitment」を発表しました(英語、日本語) マイクロソフトは、生成AIがソースコードを生成してくれるGitHub Copilotや、プレゼン資料などを生成してくれる「Microsoft 365 Copilot」など、生成AIを活用した「Copilot」製品群を積極的に展開しています。 一方で、こうした生成的AIは既存のソースコード、画像、文書などを学習しているため、何らかの要因で既存のソースコードや画像、文書の複製に相当するものが生成され、それを知らずに利用した場合に利用者が著作権侵害により訴えられる可能性があるのではないか、と心配されています。 今回のマイクロソフトの発表した「Copilot Copyri

                                                                                    マイクロソフト、もしもCopilotの利用者が著作権侵害で訴えられたら、賠償金を代わりに支払うと約束。「Copilot Copyright Commitment」を発表