並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 702件

新着順 人気順

*_twの検索結果241 - 280 件 / 702件

  • 「自分好みの見た目のAIとおしゃべりしたい」 ChatdollKit×ChatGPTを使って、15分でできる音声会話AIBotの作り方

    「ChatGPT Meetup」は、プロンプティングからOpenAI API、さらには周辺のライブラリやHubのエコシステムまで広く活用の助けになる知見を共有し、みんなで手を動かして楽しむためのコミュニティです。1回目に登壇したのは、吉海将太氏。ChatdollKit×ChatGPTで開発した音声会話AIBotについて発表しました。 「AIと音声でおしゃべりしたい」という悩みはありませんか? 吉海将太氏:「ChatdollKit×ChatGPTで音声会話AIBotを作ろう!」というタイトルで、吉海が発表いたします。けっこう真面目な発表が多い中、僕のはすごくライトなものなので(笑)、リラックスして聞いてもらえればと思います。 自己紹介です。「Yoshikai」というのが本名で、ハンドルネーム「tinjyuu」で活動していますが、ハンドルネームであまり呼ばれたくないのでよろしくお願いします(笑

      「自分好みの見た目のAIとおしゃべりしたい」 ChatdollKit×ChatGPTを使って、15分でできる音声会話AIBotの作り方
    • Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表

      Googleが「AudioPaLM」を発表しました。AudioPaLMはテキストベースの言語モデルである「PaLM 2」と音声ベースの言語モデルである「AudioLM」を統合したマルチモーダルアーキテクチャであり、テキストと音声を処理・生成し、音声認識や音声翻訳などのアプリケーションに利用できるとのことです。 [2306.12925] AudioPaLM: A Large Language Model That Can Speak and Listen https://doi.org/10.48550/arXiv.2306.12925 AudioPaLM https://google-research.github.io/seanet/audiopalm/examples/ AudioPaLMは、AudioLMから話す速さ、声の強さ、高さ、沈黙、イントネーションなどのパラ言語情報を保持する

        Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表
      • LLMを効率的に再学習する手法(PEFT)を解説 - Platinum Data Blog by BrainPad

        本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 このたびブレインパッドは、LLM/Generative AIに関する研究プロジェクトを立ち上げ、この「Platinum Data Blog」を通じてLLM/Generative AIに関するさまざまな情報を発信をしています。今回は、効率的にLLMのような事前学習済みモデルを再学習する手法(PEFT)についてご紹介します。 問題意識 ビジネスで利用する際に乗り越えるべき壁 PEFTとは何か? PEFTのコンセプト分類 トークン追加型 Prefix Tuning P Tuning Prompt Tuning Adapter型 Adapter LoRA型 LoRA Ada LoRA まとめ 参考文献 こんにちは、アナリティクスサービス部の辻です。 今回は、LLMを効率的に再学習する手法として今後

          LLMを効率的に再学習する手法(PEFT)を解説 - Platinum Data Blog by BrainPad
        • 東大松尾教授に聞くChatGPT「マーケティングの周辺が最も変化」

          AI(人工知能)チャットボット「ChatGPT(チャットGPT)」が話題だ。その性能の高さから様々な用途で利用され、公開からわずか2カ月で1億ユーザーを突破した。こうした言語AIや画像生成AIの急速な普及によって、私たちの仕事や働き方はどのように変わるのか。AI研究の第一線を走る東京大学大学院工学系研究科教授の松尾豊氏に、IT批評家の尾原和啓氏が聞いた。 東京大学大学院工学系研究科教授であり、日本ディープラーニング協会理事長でもある松尾豊氏とIT批評家の尾原和啓氏が、話題のChatGPTなど生成AIについて対談した 2022年以降、生成AIへの注目が一挙に高まっている。象徴的なのは、米オープンAIが開発した対話型AI「チャットGPT」だろう。オープンAIには、米マイクロソフトが複数年にわたって数十億ドル規模の投資を行ってきた。 そもそもGPTとは、オープンAIが開発したテキスト生成AI「G

            東大松尾教授に聞くChatGPT「マーケティングの周辺が最も変化」
          • ChatGPTと音声で会話できるiOSアプリ「ボイスAI」リリース

            ChatGPTは、機械学習の大規模言語モデル(LLM: Large Language Model)と呼ばれる自然言語処理モデルを発展させたAIチャットボット。人とチャットをするような、自然な会話形式でのやりとりを可能としている。 関連記事 ChatGPTに「iPhoneとAndroidどちらがオススメなのか」聞いてみた OpenAIが開発した対話型サービス「ChatGPT」が話題を集めています。そこで、ITmedia Mobileでは、モバイルに関連する質問を投げかけてみることにしました。今回質問したのは「iPhoneとAndroid、どちらがオススメですか?」です。 ChatGPTはどこまで“使える”ツールなのか いろいろ質問してみて分かったこと OpenAIのAI言語モデルを活用したチャットサービス「ChatGPT」。簡単にいうと、膨大なデータを学習し、幅広い分野の質問に詳細な回答を即

              ChatGPTと音声で会話できるiOSアプリ「ボイスAI」リリース
            • 新規事業でジェネレーティブAI(GPT-4、ChatGPT)を活用する7つの具体例 | 新規事業とテックトレンドメディア | NEWMIX

              2023年4月5日:ビジネス評価の事例を追加 2023年3月12日:ペルソナ作りの事例を追加 2022年も終わろうとした12月にOpenAIからChatGPTがリリースされ、5日で100万人が利用するなど各業界で話題となりました。 ChatGPT launched on wednesday. today it crossed 1 million users! — Sam Altman (@sama) December 5, 2022 そこで新規事業分野で、AIの力を体験してみませんか? ChatGPTは、新規事業の立ち上げに革命を起こすかもしれません。ChatGPTやGPT-4を使用してタスクを自動化し、新規事業の初期調査の速度を上げることができます。 個人事業主であれ、大企業であれ、人工知能の力を活用することで、効率的かつ効果的に作業が可能になります。 今すぐChatGPTやGPT-4を

              • ChatGPT・GitHubCopilotを使用したAI時代のアプリケーション開発

                初めに ChatGPTの登場によって、ここ数カ月、生成系AIが非常に盛り上がっていますね。 連日新しいサービスやプラグインが生まれているイメージです。 さて、エンジニア界隈では、このChatGPTにプログラムを自動生成してもらい、ノーコードツールのように使用するようなユースケースが度々見受けられます。(日本語で書いた文章から自動でアプリケーションを構築するサービスなんかも出来てましたね) 今回は、そんなChatGPTとGitHubCopilot(以降Copilotと表記します)を使用してアプリケーション開発をしてみたので、その感想や上記ツールを使用するコツを書いていこうと思います。 アプリケーションアーキテクチャ 今回開発したアプリケーションのアーキテクチャは以下の構成になっています。(本記事に直接は関係ないので、読み飛ばしてもらって問題ないです) バックエンド AWS Chalice A

                  ChatGPT・GitHubCopilotを使用したAI時代のアプリケーション開発
                • ChatGPT Code Interpreter(コードインタープリター) の紹介:Code Interpreterの使い方と活用事例20選|ChatGPT研究所

                  AGIラボは、最高のAI情報をお届けするためのマガジン・コミュニティです。GPTsを筆頭にClaude 3やSoraなど注目のAIについても詳しく解説、今日から使えるAI活用情報を一番わかりやすくお伝えします。他に限定コミュニティへのアクセス、限定イベントへの参加権が含まれます。

                    ChatGPT Code Interpreter(コードインタープリター) の紹介:Code Interpreterの使い方と活用事例20選|ChatGPT研究所
                  • OpenAI「GPT Builder」で何が作れるのか? 早くも発表当日・翌日に作られた「オリジナルGPT」5例を見てみた - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報

                    Image credit: OpenAI OpenAI の CEO Sam Altman 氏は6日、同社初の開発者会議「DevDay」で多くの新機能を発表した。 このツールは、「ChatGPT Plus」と「ChatGPT for Enterprise」の加入者向けに徐々にリリースされ、ユーザは、OpenAI の新モデル「GPT-4 Turbo」の上に、独自の GPTs、基本的には AI エージェントを作成することができる。これにより、技術に明るくないユーザや正式な開発者トレーニングを受けていないユーザであっても、数分で独自の AI エージェントやアプリケーションを構築できるようになる。 このようなサードパーティの GPT は、ユーザがアップロードした文書や資料を参照し、他のアプリにアクセスして指定したアクションを繰り返し実行することができる。例えば、カレンダー上のスケジュールのダブりを検

                      OpenAI「GPT Builder」で何が作れるのか? 早くも発表当日・翌日に作られた「オリジナルGPT」5例を見てみた - BRIDGE(ブリッジ)テクノロジー&スタートアップ情報
                    • 「ChatGPT with voice」が無償ユーザーにも開放 ~まるで人間のように声でAIと対話/日本語での受け答えにも問題なし

                        「ChatGPT with voice」が無償ユーザーにも開放 ~まるで人間のように声でAIと対話/日本語での受け答えにも問題なし
                      • AWS上で生成AIを使用するためのツール「Amazon Bedrock」が正式リリースへ、日本語を話せるClaudeや画像生成のStable Diffusionを利用可能

                        2023年4月にアナウンスされていた生成AIをAWSで使えるようにするツール「Amazon Bedrock」が2023年9月28日に正式リリースされ、一般ユーザーへの提供が開始されました。 基盤モデル API サービス – Amazon Bedrock – AWS https://aws.amazon.com/jp/bedrock/ Amazon Bedrock Is Now Generally Available – Build and Scale Generative AI Applications with Foundation Models | AWS News Blog https://aws.amazon.com/jp/blogs/aws/amazon-bedrock-is-now-generally-available-build-and-scale-generative-a

                          AWS上で生成AIを使用するためのツール「Amazon Bedrock」が正式リリースへ、日本語を話せるClaudeや画像生成のStable Diffusionを利用可能
                        • 旅先も“AI任せ”な時代に? 経路検索「駅すぱあと」がChatGPT活用 “ざっくり要望”で行き先提案

                          ユーザーへのアンケートで過半数の人が「旅行の計画が面倒」「行先が単調」といった悩みを抱えていることから開発した。「自分で行き先を考えたり探したりする手間をなくし、選択肢が増えることで旅やお出かけのマンネリ化解消につなげ、より手軽で充実した移動体験を提供できる」(ヴァル研究所)としている。 今後はユーザーの意見や要望を反映して機能を改善する。 関連記事 IBMも生成AI「watsonx」 透明性とカスタマイズ性で“ビジネスに使えるAI”強調 米IBMが、生成AIを含むAIとデータのプラットフォーム「watsonx」を市場に7月から順次投入する。市場のホットワードとなっている生成AIに対し、透明性やカスタマイズ性を付加価値としてビジネス向けの展開を図る。 ChatGPTアプリ日本でも 類似アプリも多く要注意 AIチャットbot「ChatGPT」のiOSアプリが日本でも利用できるようになった。ア

                            旅先も“AI任せ”な時代に? 経路検索「駅すぱあと」がChatGPT活用 “ざっくり要望”で行き先提案
                          • OpenAIがコーディング不要でChatGPTをカスタムできる「GPTs」発表&自分のGPTsを公開できる「GPT Store」も展開予定

                            OpenAIがChatGPTをカスタムして「ボードゲームのルールを教えてくれるチャットAI」や「文章の書き方を教えてくれるチャットAI」といった自分好みのチャットAIを作成できる機能を発表しました。カスタムチャットAIは「GPTs」と呼ばれており、2023年11月中に自分で作成したGPTsを公開できる「GPT Store」も提供される予定です。 Introducing GPTs https://openai.com/blog/introducing-gpts ChatGPTには事前に情報や文脈を指示して応答内容をカスタムできる「Custom Instructions」と呼ばれる機能が存在しており、「すべての回答を箇条書きにする」「特定の年齢層に適した情報を返す」といったように用途に合わせてChatGPTをカスタムすることができます。しかし、Custom Instructionsを用いてCh

                              OpenAIがコーディング不要でChatGPTをカスタムできる「GPTs」発表&自分のGPTsを公開できる「GPT Store」も展開予定
                            • 生成AIに取り組む全事業者が見るべき「State of AI 2023レポート」解説|梶谷健人 / Kent Kajitani

                              AdeptやWayveなどに投資するAI特化のベンチャーキャピタル「Air Street Capital」が160ページ以上に渡って、AIの現状をまとめたレポート、「State of AI」の2023年版が、2023年10月12日に公開された。 このレポートには今押さえておくべき生成AI市場や技術の状況が豊富な事例やデータとともにまとまっており、生成AIに事業として取り組む関係者は一度は目を通すべき内容になっている。 とはいえボリューミーなレポートを読む時間をなかなか確保できないという方も多いだろう。本記事では、そんな方々向けに特に興味深いスライドをピックアップして紹介していく。 State of AIについてこのレポートは、英国のAIに特化したベンチャーキャピタル「Air Street Capital」が2018年から毎年発行している、AIの現状を、豊富な統計データとともに網羅的にまとめ

                                生成AIに取り組む全事業者が見るべき「State of AI 2023レポート」解説|梶谷健人 / Kent Kajitani
                              • 日本勢独走「内視鏡AI」、主戦場は胃に データ生かす - 日本経済新聞

                                内視鏡検査の課題「がん病変の見落とし」を防ぎ、早期発見にも役立つ「内視鏡AI(人工知能)」の開発競争が激しくなっている。AI開発が遅れているといわれる日本だが、実は内視鏡AI分野では日本の独走状態だ。日本勢は先行して実用化が進む大腸分野から、判別の難易度が高いとされる胃の分野へと足場を広げている。◇    ◇    ◇「現時点で、内視鏡専門医と同程度のレベルでがんが疑われる領域を発見できる」

                                  日本勢独走「内視鏡AI」、主戦場は胃に データ生かす - 日本経済新聞
                                • Azure OpenAI Service “on your data” でChatGPTに自社データを組み込む

                                  セキュリティチームの ぐっちー です。Azure OpenAI Service において新しくパブリックプレビューが開始された「on your data 機能」を使ってChatGPTに自社データを組み込む方法を紹介したいと思います。 3行サマリー 従来、ChatGPTに自社データを組み込むためには、APIを使った開発が必要であり、開発を専門としない人間が片手間で実施するには難易度の高いものでした。 新しく登場したAzure OpenAI Service「on your data 機能」を使うと、GUI上での簡単な操作で自社データをChatGPTに組み込むことができるようになりました。 精度を高めるには、データセットの整備やPrompt engineeringをキッチリ実施していく必要があり、依然としてそれらは難易度が高いですが、ChatGPTのビジネス活用に大きな前進をもたらしたアップデー

                                    Azure OpenAI Service “on your data” でChatGPTに自社データを組み込む
                                  • AppleがiPhoneで15分のトレーニングをするだけで「自分に似た合成音声」で他人と会話できる機能を発表

                                    Appleが視覚・聴覚・認知・モビリティのアクセシビリティを向上するためのソフトウェア機能をiPhoneやMacに導入すると、2023年5月16日に発表しました。その中でも特に目玉となる機能が、iPhoneやiPadに声を吹き込むだけで、自分の声を再現した音声を合成し、コミュニケーションに応用できるという「Live Speech」です。 Apple previews Live Speech, Personal Voice, and more new accessibility features - Apple https://www.apple.com/newsroom/2023/05/apple-previews-live-speech-personal-voice-and-more-new-accessibility-features/ Live SpeechはiPhone・iPad・

                                      AppleがiPhoneで15分のトレーニングをするだけで「自分に似た合成音声」で他人と会話できる機能を発表
                                    • 脳波から「聞いていた音楽」を再構成することに成功、再構成した音楽を聴けるムービーもあり

                                      カリフォルニア大学バークレー校の研究チームが脳波を分析して「聞いていた音楽」を再構成する技術を開発しました。開発された技術では音階の変化やフレーズの一部を判別可能なほど鮮明に音楽を再構成できます。 Music can be reconstructed from human auditory cortex activity using nonlinear decoding models | PLOS Biology https://doi.org/10.1371/journal.pbio.3002176 Brain recordings capture musicality of speech — with help from Pink Floyd | Berkeley https://news.berkeley.edu/2023/08/15/releases-20230811 研究チームは

                                        脳波から「聞いていた音楽」を再構成することに成功、再構成した音楽を聴けるムービーもあり
                                      • ChatGPTに書かせた過去の判例が嘘まみれと発覚。書類提出の弁護士に制裁の可能性 | テクノエッジ TechnoEdge

                                        ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 ニューヨークにあるLevidow, Levidow & Oberman法律事務所のスティーブン・シュワルツ弁護士は、先週木曜日、裁判所に提出した書類に記した引用判例の多くが人工知能のアルゴリズムによって出力されたもので、信用できない情報源からのものであったことを自ら明らかにしました。 この裁判は、アビアンカ航空の乗客ロベルト・マタ氏が、機内で給仕カートを膝にぶつけられて負傷したと主張し、航空会社を相手取って起こしたもの。アビアンカ航空側は当初、マンハッタンの連邦裁判所に裁判の棄却を求めたものの、シュワルツ弁護士はこれに反発して裁判の続行を要求、6つ以上の関連する裁判例を引用した、10ページに及ぶ準備書類を提出

                                          ChatGPTに書かせた過去の判例が嘘まみれと発覚。書類提出の弁護士に制裁の可能性 | テクノエッジ TechnoEdge
                                        • GPT-4を2倍高速かつ無制限に使える「ChatGPT Enterprise」発表

                                          OpenAIがChatGPTの企業向け有料プラン「ChatGPT Enterprise」を2023年8月28日(月)に発表しました。ChatGPT EnterpriseではGPT-4を無制限に利用可能で、動作速度は最大2倍になるとのこと。さらに、データ送受信時の暗号化機能も提供されるなど、セキュリティ面も重視されています。 ChatGPT Enterprise https://openai.com/enterprise Introducing ChatGPT Enterprise https://openai.com/blog/introducing-chatgpt-enterprise ChatGPTの有料プランである「ChatGPT Plus」では、機能強化版言語モデル「GPT-4」を用いて高精度な会話が可能です。しかし、記事作成時点ではChatGPT Plus加入者であってもメッセー

                                            GPT-4を2倍高速かつ無制限に使える「ChatGPT Enterprise」発表
                                          • ChatGPTに設定を記憶させる「Memory」、Plusで正式機能に

                                            「Memory updated」にカーソルを合わせると記録された内容と「Manage memories」ボタンが表示され、ここからMemory管理画面に移行できる。ここで記録されたくない項目を削除できる。 Memoryに記憶させた項目については、以降は指定しなくても自動的に反映される。例えば上記の例では「会議を要約して」と依頼するだけで、見出し、ポイントの箇条書き、最後のまとめを含む要約が提示される。 EnterpriseおよびTeamsプランでもMemoryが利用可能になる見込みだ。また、GPTの開発者は、自分のGPTのメモリを有効にできる。GPTのMemoryに記録した項目が開発者と共有されることはない。 関連記事 OpenAI、ChatGPTに会話を記憶させる「Memory」テスト開始 初期設定はオン OpenAIは、ChatGPTに会話を記憶させる「Memory」機能のテストを開始

                                              ChatGPTに設定を記憶させる「Memory」、Plusで正式機能に
                                            • 「OpenAI APIの安定稼働版のようなイメージを持ってもらえればいい」 Azure OpenAI Serviceの特徴と、プレイグラウンドのデモ

                                              ユーザーの立場ではAIネイティブな働き方が身近に迫っており、データサイエンティストやMLエンジニアにとってはGPTを活用した開発を意識する必要が出てくる中、マイクロソフトの取り組みやML開発のパラダイムシフトをご紹介する「ChatGPTによって描かれる未来とAI開発の変遷」。ここで日本マイクロソフト株式会社の蒲生氏が登壇。ここからはAzure OpenAI Serviceならではの特徴と、Azure OpenAI Serviceのプレイグラウンドについて話します。前回はこちらから。 マイクロソフトとOpenAI 蒲生弘郷氏:こういうことを言うと、「またマイクロソフトの人間が大きなことを言ってポジショントークをしている」みたいになりますが、GPTは正しい使い方と注意点を踏まえていかないといけない部分はやはりあると思うので、今日のこの講演の中でしっかりその内容について把握いただいた上で、活用方

                                                「OpenAI APIの安定稼働版のようなイメージを持ってもらえればいい」 Azure OpenAI Serviceの特徴と、プレイグラウンドのデモ
                                              • Chirper AI | AI Life Simulation

                                                Step into the realm of Chirper, our vibrant world of AI characters. Here, they don't just exist – they create, learn, discover, and evolve. This is Chirper, where AI Live

                                                • 【Python】OpenAIのWhisperで音声文字起こしアプリを作成! - Qiita

                                                  はじめに OpanAI社の音声文字認識エンジンのWhisperを使って、音声文字起こしするプログラムを作成しました。 プログラムはPythonからAPIでWhisperを使って、音声文字認識する形式です。 約2分の音声を試したところは、Whisperの音声文字認識の精度は99%とAmiVoiceCloudPlatform(96%)以上の精度でした。 2分の動画を約9秒で変換できるなど、非常に使い勝手の良いAPIです。 価格は1分あたり0.9円(0.006ドル)です。 ただし、Whisperのインプットの音声ファイルの容量は25Mバイトですので、それ以上のファイルは分割する必要があります。 環境 Windows10 Python3.8.8 VSCode 使用ライブラリー openai pydub tkinter openpyxl pandas 処理の流れ: 今回作成した処理は、音声ファイルを

                                                    【Python】OpenAIのWhisperで音声文字起こしアプリを作成! - Qiita
                                                  • アサヒ生ビール CM 「野球ファンのみなさん、おつかれ生です」篇 平田勝男

                                                    平田勝男さん出演「野球ファンのみなさん、おつかれ生です」篇 出演者:平田勝男 音楽:竹内まりや「元気を出して」 映像提供:ABCテレビ ▼アサヒ生ビール ブランドサイト https://www.asahibeer.co.jp/asahinamabeer/

                                                      アサヒ生ビール CM 「野球ファンのみなさん、おつかれ生です」篇 平田勝男
                                                    • OpenAI Embeddings APIとベクトル検索エンジンValdを使って類似文章検索をしてみよう

                                                      ベクトルの準備 次にタイトル文章をベクトル化していきます。 OpenAIのアカウントを作成し、こちらからAPIキーを取得し、それを環境変数OPENAI_API_KEYに設定した後、次のコードを実行するだけで、入力文章のベクトルを取得できます。 import os import openai openai.api_key = os.environ["OPENAI_API_KEY"] client = openai.OpenAI() def get_embedding(text, model="text-embedding-ada-002"): text = text.replace("\n", " ") return client.embeddings.create(input=[text], model=model).data[0].embedding get_embedding("入力し

                                                        OpenAI Embeddings APIとベクトル検索エンジンValdを使って類似文章検索をしてみよう
                                                      • 技術の鍵は「トランスフォーマー」と「自己教師あり学習」 松尾豊氏が、第3次AIブームからひもとく“AIの歴史”

                                                        日本CTO協会が主催の「Developer eXperience Day 2023」は、“開発者体験” をテーマに、その知見・経験の共有とそれに関わる方々のコミュニケーションを目的としたカンファレンスです。ここで登壇したのは、東京大学の教授である松尾豊氏。LLMの技術的な概要について解説するとともに、今後の技術的な進展について発表しました。全3回。1回目は、AIの技術について。 松尾豊氏の自己紹介 松尾豊氏:よろしくお願いします。45分ほど、お話をします。 (スライドを示して)私の自己紹介ですが、人工知能の研究をずっとやっています。もう26年ぐらい、ずっと人工知能の研究をやっています。 2017年に日本ディープラーニング協会を作って、2021年からは、「新しい資本主義実現会議」の有識者構成員をしています。 また、2023年5月からは、政府が立ち上げたAI戦略会議の座長も務めています。 AI

                                                          技術の鍵は「トランスフォーマー」と「自己教師あり学習」 松尾豊氏が、第3次AIブームからひもとく“AIの歴史”
                                                        • いまさら聞けないアドビの生成AI「Adobe Firefly」を解説しながら使ってみた!/ついに商用利用可能、誰でも簡単に使える身近な生成AIに【特集・集中企画】

                                                            いまさら聞けないアドビの生成AI「Adobe Firefly」を解説しながら使ってみた!/ついに商用利用可能、誰でも簡単に使える身近な生成AIに【特集・集中企画】
                                                          • ChatGPTではじめる新しいLINE Botの作り方 - Qiita

                                                            ChatGPT、LINE Botとの相性抜群ですよね。流暢におしゃべりできるし、プロンプトの工夫をすればキャラ設定もできます。 でも、今日はそういうお話ではありません。何を作るのかではなく、どうやって作るかについてお話します。かといってコードを自動生成してもらうという話でもなく、もう全然作り方が変わってしまったというお話です。 チャットボットの処理フロー LINE Botに限らずあらゆるチャットボットや対話システムは、ざっくりいうと以下のような仕組みになっています。 ユーザーの発話の意図や関連情報を読み取って(インテント判定・エンティティ抽出)、それを処理し(スキル実行)、処理結果をメッセージとして応答します。図の例だとインテントとして「天気予報」、エンティティとして「佐賀」を読み取って、天気予報APIなどで処理していることでしょう。 これまでのチャットボットの作り方 先の例をPython

                                                              ChatGPTではじめる新しいLINE Botの作り方 - Qiita
                                                            • “脳波”から映像を生成する技術「DreamDiffusion」登場 | AIDB

                                                              Tencentなどの研究者チームが開発した「DreamDiffusion」は、脳の視ている光景を脳波から視覚化する、まるでSF映画のような技術です。本記事では、この画期的な技術について紹介します。 参照論文情報 タイトル:DreamDiffusion: Generating High-Quality Images from Brain EEG Signals 著者:Yunpeng Bai, Xintao Wang, Yanpei Cao, Yixiao Ge, Chun Yuan, Ying Shan 所属:Tencent AI Labなど URL:https://doi.org/10.48550/arXiv.2306.16934 DreamDiffusionは、脳波(EEG)から映像を生成する技術です。具体的には、頭の外側に付ける非侵襲型の電極からEEG信号を読み取り、その信号を元に拡散

                                                                “脳波”から映像を生成する技術「DreamDiffusion」登場 | AIDB
                                                              • LLMの普及による機械学習の民主化とMLPdMの重要性 / democratization-of-ml-and-importance-of-mlpdm-by-llm

                                                                2023年5月30日 ChatGPT IN ACTION #2 大規模言語モデルがつくる新しい顧客体験(https://rector.connpass.com/event/282064/) における10分LTの資料です。 ChatGPTをはじめとする大規模言語モデル(LLM)の普及を、プロダクト作りに関わる機械学習エンジニアとしてどう考えているか、という内容のLTです。 ChatGPTをはじめとする大規模言語モデル(LLM)の普及により、誰でも容易に高性能な機械学習モデルを活用できるAI・機械学習の民主化が進んだ一方で、きちんとした顧客体験を提供する難易度は高まったように思います。そこで機械学習を活用したプロダクトを作るのに必要な能力・職種であるMachine Learning Product Management(MLPdM)の重要性が高まってきているように思います。

                                                                  LLMの普及による機械学習の民主化とMLPdMの重要性 / democratization-of-ml-and-importance-of-mlpdm-by-llm
                                                                • 従来のPythonよりも高速化が可能な新たなプログラミング言語「Mojo」が開発される

                                                                  Appleのプログラミング言語「Swift」を生み出したクリス・ラットナー氏がCEOを務めるソフトウェア開発スタートアップのModularが、新たなプログラミング言語の「Mojo」を2023年5月3日に発表しました。Mojoはこれまでのプログラミング言語であるPythonの使用感とC言語並みの性能を合わせ持つ言語だとされています。 Mojo 🔥: Programming language for all of AI https://www.modular.com/mojo Modular Docs - Mojo🔥 https://docs.modular.com/mojo/ fast.ai - Mojo may be the biggest programming language advance in decades https://www.fast.ai/posts/2023-05

                                                                    従来のPythonよりも高速化が可能な新たなプログラミング言語「Mojo」が開発される
                                                                  • 「国産」生成AIの開発本格化 NTT、年度内に提供予定:時事ドットコム

                                                                    「国産」生成AIの開発本格化 NTT、年度内に提供予定 2023年06月10日07時13分配信 【図解】生成AIの基盤技術「大規模言語モデル」の国内開発状況 文章などを自動で作成する生成人工知能(AI)の「国産」開発に向けた動きが本格化している。NTTは法人向けの生成AIサービスを年度内に提供する予定。生成AIの基盤技術である大規模言語モデルの無料公開や開発を表明する企業も相次ぐ。先行してサービスを展開する海外勢に遅れまいと各社は躍起となっている。 記者がChatGPTに「インタビュー」してみた【news深掘り】 NTTが提供を目指す生成AIは、金融や医療分野などで法人向けに提供する。現在基盤となる言語モデルを開発中で、モデルの規模を示す指標の「パラメーター」の数は70億~300億を見込む。米新興企業オープンAIが開発した言語モデル「GPT3」の1750億と大きな開きがあるが、専門性の高い

                                                                      「国産」生成AIの開発本格化 NTT、年度内に提供予定:時事ドットコム
                                                                    • ムービーとテキストからフレーム間の一貫性を維持して実用性の高いムービーを生成するAI「StableVideo」

                                                                      2022年8月にStability AIの「Stable Diffusion」が登場して以来、画像生成AIは急激な進歩を遂げ、画像だけではなくムービーも生成できるようになりました。しかし、生成AIによって作られるムービーに描かれるオブジェクトや背景は形を激しく変えたり色が変わったりするため、実用性には乏しいといえます。浙江大学とMicrosoftの研究チームが発表した「StableVideo」はテキスト駆動拡散モデルに時間の概念を導入することで、安定していて実用性が高いムービーを生成することが可能となっています。 rese1f.github.io/StableVideo/ https://rese1f.github.io/StableVideo/ GitHub - rese1f/StableVideo: [ICCV 2023] StableVideo: Text-driven Consis

                                                                        ムービーとテキストからフレーム間の一貫性を維持して実用性の高いムービーを生成するAI「StableVideo」
                                                                      • 3か月試してわかった、Copilot for Microsoft 365の実力とユースケース|富士通 広報note

                                                                        こんにちは、富士通で生成AI推進を担当している淺間です。 生成AIの業務利用において、非常に注目されているMicrosoft社の「Microsoft Copilot for Microsoft 365」(以下、Copilot for Microsoft 365)をご存じでしょうか。Teams、PowerPoint、 Outlookなど、おなじみのMicrosoftアプリケーションに生成AIを導入する強力なサービスとして話題です。 Copilot(コパイロット、飛行機の副操縦士の意味)と言えば、先日、Microsoftから発表のあった個人向けCopilot Proも記憶に新しいですね。 富士通は早期アクセスプログラムに参加し、2023年10月より本サービスのトライアルを実施してきました。 この記事では、トライアルの様子、ユーザー評価、厳選したユースケースなどを紹介したいと思います。 Copi

                                                                          3か月試してわかった、Copilot for Microsoft 365の実力とユースケース|富士通 広報note
                                                                        • 生成AIを使って海外AIニュースの要約を社内Teamsに投稿してみた - AITC - ISID | AI トランスフォーメンションセンター コラム

                                                                          こんにちは、AIソリューショングループの太田です。 昨年から引き続き生成AIブームが止まらない中、自主的に進めていた取り組みを紹介します。それは海外AIニュースの要約を、社内で使用しているTemasのチャネルに投稿する取り組みです。 投稿自体はPower AutomateやAzure Function、Azure OpenAI Serviceなどを活用することで自動的に投稿しており、数ヶ月運用した結果を踏まえて最近アルゴリズムの改善をおこなったので、改めて方法とノウハウをまとめたいと思います。 はじめに アーキテクチャ紹介 Power Automate Azure Functions Bing Search Azure OpenAI Service(AOAI) Log Analytics 海外ニュース要約 APIの処理フロー 検索ワードの翻訳 Bing 検索 HTMLの読み込み ニュース記

                                                                            生成AIを使って海外AIニュースの要約を社内Teamsに投稿してみた - AITC - ISID | AI トランスフォーメンションセンター コラム
                                                                          • RAGにおけるドキュメント検索精度向上について(実践編)

                                                                            損害保険ジャパン株式会社 DX推進部の眞方です。この記事では、RAG(Retrieval Augmented Generative)の構築時に、ドキュメント検索精度の向上を目指して検索モデルの改善を行った際の手法、および結果について解説させていただきます。 概要を知りたい、という方は以前書いた前回の記事を読んでください。 はじめに 今回はRAGにおける検索モデルの改善を目的として、独自のデータを使用してfine-tuneを行いました。 RAGにおける検索(赤枠)の部分を改善する取り組みを行いました。 検索モデル 学習のためのライブラリとしては、sentence transformersを使用しました。また、モデルは日本語BERTを使用しています。 データ 今回RAGの対象となるドキュメントは、大きく次の2つが存在しています。 規定集 保険商品の説明等が書かれているドキュメントです(詳細は前

                                                                              RAGにおけるドキュメント検索精度向上について(実践編)
                                                                            • 3人に1人が「生成AI」夏休みの宿題に活用、一番使われたツールは「ChatGPT」 学校や保護者も肯定意見が上回る

                                                                              3人に1人が「生成AI」夏休みの宿題に活用、一番使われたツールは「ChatGPT」 学校や保護者も肯定意見が上回る 学生の3人に1人が夏休みの宿題に生成AIを活用し、8割が「宿題がはかどった」と感じている──スマートフォンアプリ情報サイト「Appliv(アプリヴ)」を運営するナイル(品川区)がそんな調査結果を発表した。 調査によれば、夏休みの宿題があると答えた学生の男女533人のうち、34.1%(182人)が生成AIを活用したという。 使われた生成AIのツールは? 使われたツールは、多い順に「ChatGPT」(134人)、「Bard」(33人)、「Bing Chat」(31人)、「AIチャットくん」(26人)、「Perplexity AI」(25人)、「宿題ポケット」(25人)、「Stable Diffusion」(21人)、その他(7人)だった。

                                                                                3人に1人が「生成AI」夏休みの宿題に活用、一番使われたツールは「ChatGPT」 学校や保護者も肯定意見が上回る
                                                                              • Stability AIが高性能画像生成モデル「SDXL 1.0」をリリース&すぐに使えるウェブアプリも公開されたので使ってみた

                                                                                画像生成AI「Stable Diffusion」の開発元であるStability AIが画像生成モデル「Stable Diffusion XL 1.0(SDXL 1.0)」を公開しました。SDXL 1.0は2023年6月に研究目的で公開された「SDXL 0.9」をさらに強化したもので、すでにモデルデータが公開されている他、SDXL 1.0をサクッと使えるウェブアプリも用意されています。加えて、AmazonのAIサービス「Amazon Bedrock」でSDXL 1.0のAPIが利用可能になることも発表されています。 ANNOUNCING SDXL 1.0 — Stability AI https://stability.ai/blog/stable-diffusion-sdxl-1-announcement Stability AI Announces Stable Diffusion X

                                                                                  Stability AIが高性能画像生成モデル「SDXL 1.0」をリリース&すぐに使えるウェブアプリも公開されたので使ってみた
                                                                                • 生成AIが“AI生成コンテンツ”を学習し続けるとどうなる?→「モデル崩壊」が起こる 英国チームが発表

                                                                                  このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 英オックスフォード大学や英ケンブリッジ大学などに所属する研究者らが発表した論文「AI models collapse when trained on recursively generated data」は、AIモデルが自己生成したデータで繰り返し学習すると、モデルの性能が低下していく「モデル崩壊」という現象を発見した研究報告である。 研究チームは、大規模言語モデル(LLM)、変分オートエンコーダー(VAE)、ガウス混合モデル(GMM)など、幅広い生成AIモデルを対象に実験を行った。その結果、AIモデルが生成したデータを次世代のモデルの学習に

                                                                                    生成AIが“AI生成コンテンツ”を学習し続けるとどうなる?→「モデル崩壊」が起こる 英国チームが発表

                                                                                  新着記事