並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 291件

新着順 人気順

"AI(Artificial Intelligence)"の検索結果161 - 200 件 / 291件

  • 「行政のためのプロンプト・エンジニアリング入門」無償公開 note深津さんが作成

    塩崎彰久衆議院議員は6月23日、生成AIに関する資料「行政のためのプロンプト・エンジニアリング入門」(全24ページ)を公開した。自民党で行われた「AIの進化と実装に関するプロジェクトチーム」の第15回で使われたもの。生成AIの利用を検討する自治体・組織向けの資料で、生成AIの情報を発信しているnoteの深津貴之CXOが作成した。

      「行政のためのプロンプト・エンジニアリング入門」無償公開 note深津さんが作成
    • ChatGPTの嘘を克服できる?!Chrome拡張機能「WebChatGPT」を使ってみた | DevelopersIO

      こんにちは、つくぼし(tsukuboshi0755)です! みなさんChatGPTは使ってますか?(もちろん私も使ってます) そのまま使うだけでも相当便利なChatGPTですが、以前ChatGPTをもっと便利に使えるようにするGhrome拡張機能が、以下のブログで紹介されています。 上記のブログでも紹介がありますが、Chrome拡張機能「WebChatGPT」を実際に使ってみた所、ChatGPTの欠点である嘘の大半を克服できるすごい拡張機能だと感じました。 これはChatGPTを使っている方にはぜひ試して頂きたい!と思い、今回改めて詳細について紹介します。 ChatGPTが嘘をつくメカニズム 巷で良く言われるChatGPTの欠点として、平気で嘘をつく事が挙げられます。 ここで、なぜChatGPTは嘘をついてしまうのでしょうか。 上記の疑問に対して、OpenAIの公式Q&Aにヒントとなる文献

        ChatGPTの嘘を克服できる?!Chrome拡張機能「WebChatGPT」を使ってみた | DevelopersIO
      • グーグル、人間の指示でロボットがコードを記述できる言語モデルを発表

        Googleは、大規模言語モデル(LLM)利用に向けた新たな取り組みを発表した。ロボットが人間の指示に基づいて自分でコードを作成できる仕組みを示すものだという。 最新の取り組みは、ロボットが人間の曖昧な指示を理解して論理的に思考し、確実に反応できるようにする、Googleの「PaLM-SayCan」モデルをベースにしている。OpenAIの「GPT-3」 LLMや、GitHubの「Copilot」のような自動コード補完関連の機能もベースになっている。 「人間から指示が与えられた時に、ロボットが自分でコードを書いて世界とやりとりできたら、どうなるだろう」とGoogleの研究者は述べている。PaLMのような最新世代の言語モデルは、複雑な論理的思考が可能で、膨大なコードによって訓練されてきたという。「自然言語で指示を与えられると、最新の言語モデルは、汎用コードだけでなく、われわれが発見したように、

          グーグル、人間の指示でロボットがコードを記述できる言語モデルを発表
        • 騙されないよ! AI画像か否かを判断するWebサービス

          騙されないよ! AI画像か否かを判断するWebサービス2023.06.26 07:0023,261 岡本玄介 AI画像の判断はAIに任せよう。 日々進化し続け、今や本物と見分けがつかないほどリアルな画像を生成するAI。その動きをネットで見ていれば、AI生成画像は独特のマットな質感や背景をボカしたがる傾向、手指の描写がヘタクソといった特徴を知っていますが…そうでない人は、一発でダマされたっておかしくないほどのクオリティーです。 時にはネタで作られたフェイク画像が拡散されるうち、いつの間にか尾ひれがついて本物と勘違させられることもあるでしょうし、この先そういう事態が増える可能性は大いにあると思います。 AI画像を瞬時に解析そんなときに一度立ち止まって使ってみたいのが、画像がAIに作られたものなのかどうかを判定するOpticの「AI or Not」というサービス。 JPEGやPNGなどをドラッグ

            騙されないよ! AI画像か否かを判断するWebサービス
          • 10万件以上の物件データを学習したのにクソ失礼にも家賃69万の物件に対して28万だと査定した機械学習モデルは何を考えているのか。 - Qiita

            10万件以上の物件データを学習したのにクソ失礼にも家賃69万の物件に対して28万だと査定した機械学習モデルは何を考えているのか。Python機械学習lightgbmSHAP こちらの記事をご覧いただきありがとうございます。 ちゃんと内容が伝わるようなタイトルを考えたらラノベみたいになってしまい、かえってわかりにくい気がしてきました。 以前からいくらかSUUMO物件について機械学習を用いたデータ分析を行っています。 今回は、10万件以上の物件データを与えてなかなか高精度な家賃予測が可能となった機械学習モデルが、クソ失礼にも家賃が安いと査定した高額物件がいくらかあったので、何を考えてクソ失礼な査定となったのかを調べます。 もしかしたらボッタくりかもわかりませんからね。楽しみですね。 モデルの学習について 基本的には前回記事と同じです。 使用した機械学習モデル 以前から引き続き LightGBM

              10万件以上の物件データを学習したのにクソ失礼にも家賃69万の物件に対して28万だと査定した機械学習モデルは何を考えているのか。 - Qiita
            • 画像生成AI「Stable Diffusion」に「悪い例を集めたLoRA」を組み合わせて高品質な画像を生成する手法が登場、簡単に試せるデモも公開されたので試してみた

              2023年7月に公開された「Stable Diffusion XL 1.0(SDXL 1.0)」は既存のStability AI製モデルと比べて高品質な画像を生成できるだけでなく、LoRAによる生成画像の調整にも対応しています。データサイエンティストのマックス・ウルフ氏は「悪い例」を集めて作成したLoRAを用いてSDXL 1.0による生成画像の品質をさらに向上させる手法を考案し、LoRAファイルおよび誰でも試せるデモを公開しています。 I Made Stable Diffusion XL Smarter by Finetuning it on Bad AI-Generated Images | Max Woolf's Blog https://minimaxir.com/2023/08/stable-diffusion-xl-wrong/ LoRAは参考となる画像を集めて絵柄や服装などを追

                画像生成AI「Stable Diffusion」に「悪い例を集めたLoRA」を組み合わせて高品質な画像を生成する手法が登場、簡単に試せるデモも公開されたので試してみた
              • 東大松尾研、日英対応の大規模言語モデル公開 100億パラメータ、精度は「国内オープンソース最高水準」

                東京大学院工学系研究科・松尾研究室(主宰:松尾豊教授)は8月18日、日英の2カ国語に対応した100億パラメータサイズの大規模言語モデル(LLM)「Weblab-10B」を、事前学習と事後学習(ファインチューニング)により開発し、非商用ライセンスでモデルを無料公開した。 【修正履歴:2023年8月18日午後9時 当初、モデルの公開形式をオープンソースと記載していましたが、ソースコードが公開されていないなどオープンソースの定義に沿わないと思われる部分があるため記述を改めました。なお、引用部分についてはそのままにしています】 日本語だけでなく英語のデータセットも学習に用いることで学習データ量を拡張し、言語間の知識転移を行うことで日本語の精度を高めたのが特徴。 事前学習には、代表的な英語のデータセット「The Pile」と日本語のデータセット「Japanese-mC4」を使用。事後学習には、Alp

                  東大松尾研、日英対応の大規模言語モデル公開 100億パラメータ、精度は「国内オープンソース最高水準」
                • アドビが生成AI「Firefly」を一般公開 「Creative Cloud」に統合 コンテンツは商用利用可能

                  アドビは9月13日、コンテンツ生成AI「Adobe Firefly」のWeb版と、同社の一部デスクトップアプリに統合されたFireflyの機能を一般公開した。これにより、Fireflyによって生成されたコンテンツの商用利用が解禁される。 一般公開版の概要 Fireflyは2023年3月からβテストが行われてきた。当初はプロンプト(文章)によるコンテンツ生成は英語にのみ対応していたが、日本語を含む多言語対応を進めるなど、機能の拡充を進めてきた。「Adobe Photoshop」「Adobe Illustrator」などのデスクトップ向けβアプリにも、Fireflyの技術が順次搭載されている。 →初登場時の記事 →Photoshopアプリへの実装時の記事 →Illustratorアプリへの実装時の記事 Adobe(アドビの親会社)によると、これまでにFireflyを使って生成されたコンテンツは

                    アドビが生成AI「Firefly」を一般公開 「Creative Cloud」に統合 コンテンツは商用利用可能
                  • オープンソースで商用利用可能な大規模言語モデル「Falcon」が登場、オープンソースモデルの中では最高の性能に

                    アラブ首長国連邦の首都アブダビに拠点を置く研究機関「Technology Innovation Institute」がオープンソースの大規模言語モデル「Falcon」をリリースし、機械学習関連のデータ共有サイト「Hugging Face」にてモデルを公開しました。 Falcon LLM - Home https://falconllm.tii.ae/ The Falcon has landed in the Hugging Face ecosystem https://huggingface.co/blog/falcon tiiuae/falcon-40b · Hugging Face https://huggingface.co/tiiuae/falcon-40b Falconモデルは400億個のパラメーターをもつ「Falcon-40B」モデルと、70億個のパラメーターをもつ「Falco

                      オープンソースで商用利用可能な大規模言語モデル「Falcon」が登場、オープンソースモデルの中では最高の性能に
                    • GitHub Copilot はどのようにして空気を読むか? - ABEJA Tech Blog

                      "Everything is true," he said. "Everything anybody has ever thought." この記事は ABEJAアドベントカレンダー2023 の 17 日目の記事です。 こんにちは。システム開発部の石川 (@ishikawa) です。昨年のいまごろは Objective-C ばかり書いていましたが、今年は念願の Swift で QR コードリーダーを書き直したり、React Native の C++ コードをデバッガで追いかけて不思議なバグの修正をした年でした。 react-native で 196,607 回 fetch() すると通信できなくなるバグを直した https://t.co/lvNC3PL85b— takanori_is (@takanori_is) 2023年9月21日 普段の業務では TypeScript と Go、Pyt

                        GitHub Copilot はどのようにして空気を読むか? - ABEJA Tech Blog
                      • 高性能・高速・軽量な日本語言語モデル LINE DistilBERTを公開しました

                        LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは。LINEの小林滉河(@kajyuuen)です。NLPチームで固有表現抽出、有害表現の検知、LINEスタンプ推薦の改善など自然言語処理に関する仕事をしています。 この記事ではLINEが公開した言語モデル「LINE DistilBERT」について紹介します。 https://huggingface.co/line-corporation/line-distilbert-base-japanese https://github.com/line/LINE-DistilBERT-Japanese LINE DistilBERTは次のような特徴を持つ日本語言語モデルです。 高性能・高速・軽量 Hugging Faceのtra

                          高性能・高速・軽量な日本語言語モデル LINE DistilBERTを公開しました
                        • OpenAI、「ChatGPT API」と企業向け専用容量プランの提供開始 「gpt-3.5-turbo」も発表

                          会話型AIサービス「ChatGPT」などを手掛ける米OpenAIは3月1日(現地時間)、ChatGPTと音声テキスト変換AI「Whisper」のAPI提供を開始したと発表した。システム最適化で実現したコストの90%削減(2022年12月比)を価格に反映させたとしている。 ChatGPT APIのエンジンは「GPT-3.5」ではなく、ChatGPT製品で使われているものと同じ「gpt-3.5-turbo」(gptはなぜか小文字)。価格は1000トークン(1000トークンは英語の場合およそ750ワード相当)当たり0.002ドルで、これは既存のGPT-3.5モデルより10倍安い。 gpt-3.5-turboは、一連のトークンとして表される非構造化テキストをそのまま使う従来モデルと異なり、テキストを一連のメッセージとメタデータとしてChatGPT APIにフィードする「ChatML」(Chat M

                            OpenAI、「ChatGPT API」と企業向け専用容量プランの提供開始 「gpt-3.5-turbo」も発表
                          • 画像生成AI「Stable Diffusion」の公式有料アプリ「DreamStudio」の無料版「StableStudio」がオープンソースで公開される

                            画像生成AI「Stable Diffusion」の開発元であるStability AIは、直感的な操作でStable Diffusionによる画像生成を実行できる公式ウェブアプリ「DreamStudio」を提供しています。このDreamStudioは有料サービスとして展開されているのですが、新たにDreamStudioとほぼ同一の機能を備えた無料アプリ「StableStudio」が登場しました。StableStudioはオープンソースで開発されており、今後も機能を拡張する予定です。 Stability AI DreamStudioのオープンソースの未来、StableStudioをリリース -。Stability AI https://ja.stability.ai/blog/stablestudio-open-source-community-driven-future-dreamstud

                              画像生成AI「Stable Diffusion」の公式有料アプリ「DreamStudio」の無料版「StableStudio」がオープンソースで公開される
                            • ChatGPTのプロンプトエンジニアリングはとても「変なもの」。PKSHAと東大・松尾教授が語る

                                ChatGPTのプロンプトエンジニアリングはとても「変なもの」。PKSHAと東大・松尾教授が語る
                              • ChatGPTの“脱獄プロンプト”登場 文末に書くだけで「爆弾の作り方」「IDの盗み方」に回答

                                このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米カーネギーメロン大学などに所属する研究者らが発表した論文「Universal and Transferable Adversarial Attacks on Aligned Language Models」は、大規模言語モデル(LLM)が有害なコンテンツを生成しない仕組みを無効にする手法を提案した研究報告である。入力プロンプトの語彙に敵対的フレーズを入力するだけで解除可能だという。 ChatGPT、Bard、ClaudeなどのLLMは、ユーザーの質問に対する回答で有害なコンテンツ(例:爆弾の作り方やIDの盗み方、人種差別的なジョーク、詐欺

                                  ChatGPTの“脱獄プロンプト”登場 文末に書くだけで「爆弾の作り方」「IDの盗み方」に回答
                                • Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり

                                  Googleの研究チームが動画生成AI「Lumiere」を2024年1月24日(水)に発表しました。Lumiereではフレーム同士が自然につながった違和感の少ない動画を生成可能で、テキストや画像を入力して動画を生成できるほか、動画の一部分を指定して別の動画に置き換えたり、写真の一部分だけを動かしたりといった操作も可能です。 Lumiere https://lumiere-video.github.io/ テキストや画像を入力して動画を生成できるAIは数多く存在していますが、それらのAIの多くは「フレームを複数枚生成し、フレーム同士を補間する」という手法で動画を生成しているため、フレーム同士のつながりが不自然になりがちです。一方で、Lumiereは「動画全体のフレームを一度に生成する」という手法を採用しており、フレーム同士のつながりが自然で違和感の少ない動画を生成可能。生成可能な動画のフレー

                                    Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
                                  • いま、生成AIでNVIDIA GPUが引っ張りだこなワケ

                                      いま、生成AIでNVIDIA GPUが引っ張りだこなワケ
                                    • Mozillaが「秘密にまみれた大企業のAI」を打破するべくオープンなAI開発企業「Mozilla.ai」を設立

                                      Firefoxなどの開発で知られるMozillaが、オープンソースでのAIエコシステム構築を目指すスタートアップ「Mozilla.ai」の設立を発表しました。Mozillaからの投資額は3000万ドル(約39億円)に上る見込みです。 Mozilla.ai https://mozilla.ai/ Introducing Mozilla.ai: Investing in trustworthy AI https://blog.mozilla.org/en/mozilla/introducing-mozilla-ai-investing-in-trustworthy-ai/ AIに関する研究は長年にわたって続いてきましたが、2022年には「Stable Diffusion」「Midjourney」「DALL・E」などの画像生成AIやチャットAI「ChatGPT」、文字起こしAI「Whisper」

                                        Mozillaが「秘密にまみれた大企業のAI」を打破するべくオープンなAI開発企業「Mozilla.ai」を設立
                                      • ChatGPTが職務経歴書を作成するサービス続々 エンジニア向けから看護師まで

                                        同サービスは、ChatGPTがインタビュー形式でエンジニアと対話し、プロジェクトの概要や利用技術、乗り越えた壁や将来にどう生かしたいかなど回答すると、エンジニアの職歴が作成される。AIとチャットをしながら情報整理やプロフィール作成が簡単にでき、生成されたまとめはFindy内のプロフィールとしてもそのまま利用できる。 3月15日には、Chott(東京都渋谷区)がOpenAIのGPTを活用した職務経歴書作成サービス「RESUMY.AI」(レジュミーAI)をリリース。3週間でユーザー数が600人を突破した。 「RESUMY.AI」は、IT職や看護師などの専門職向けのテンプレートを提供している。ユーザーが自分の経歴やスキルなどのキーワードや短文を入力すると、AIが最適な自己PR文章や職務要約文を作成する。他にも、業界や職種に応じたキャリアアドバイス、志望動機の書き方のアシストも提供する。 関連記事

                                          ChatGPTが職務経歴書を作成するサービス続々 エンジニア向けから看護師まで
                                        • ChatGPTに「亡くなったおばあちゃんになりきってくれ」と頼んでWindows 10 Proで使用可能なインストール用キーを生成させることに成功

                                          ChatGPTのような対話型AIは、文章だけでなくコードや数式の生成にも対応しており、過去にはChatGPTに実際に使えるプロダクトキーを生成させることに成功した事例が報告されています。通常、AIはこうした指示には応じないようになっていますが、巧妙な方法を使うとChatGPTやGoogleのBardにWindows 10 ProやWindows 11 Proのインストールに使えるキーを出力させることが可能なことが判明しました。 ChatGPT, Google Bard Shares Generic Windows 11, Windows 10 Pro Keys (Updated) | Tom's Hardware https://www.tomshardware.com/news/chatgpt-generates-windows-11-pro-keys ChatGPT can now g

                                            ChatGPTに「亡くなったおばあちゃんになりきってくれ」と頼んでWindows 10 Proで使用可能なインストール用キーを生成させることに成功
                                          • Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能

                                            Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能 米Metaは6月16日(現地時間)、新たな音声生成AIモデル「Voicebox」を開発したと発表した。音声の編集、サンプリング、スタイルの設定などを行える。 音声とテキストを入力することで、以下のような音声を出力できる。 入力した声で入力したテキストを読み上げる音声クリップを作成する 録音した音声から犬の鳴き声やブザー音などのノイズを除去する 録音した音声の言い間違いを修正する 1つの言語のスピーチを同じ声のまま別の言語に変換する(英語の音声を仏語に、など) 1つのテキストを多様な声で読み上げる Metaは、Voiceboxで将来的にはメタバース内のバーチャルアシスタントやNPC(ノンプレイヤーキャラクター)が自然な声で話せるようになるとしている。また、自分の声のまま(本来は話せない)外

                                              Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能
                                            • Microsoftの中の人、「新しいBing」のAIモデル「プロメテウス」を解説

                                              米MicrosoftがOpenAIのLLM「ChatGPT」採用の「新しいBing」を公開して2週間以上が経過した。Microsoftで検索とAI担当のCVP(コーポレートバイスプレジデント)を務めるジョルディ・リバス氏が2月22日(現地時間)、Microsoft傘下のLinkedInに「Building the New Bing」というブログを投稿し、新しいBingについて解説した。 新しいBingでは、OpenAIが昨夏に共有した「GPT-3.5よりはるかに強力な、ChatGPTを強化するLLM」(「GPT-4」とはしていない)を採用している。この次世代GPTは強力ではあるが、他のLLMと同様にトレーニングデータが古い(GPT-3.5のトレーニングデータは2021年までのもの)ため、Bingのバックエンド機能と組み合わせることで最新データを利用できるように開発したのがAI技術「Prom

                                                Microsoftの中の人、「新しいBing」のAIモデル「プロメテウス」を解説
                                              • 大規模言語モデルの開発者が知っておくと役立つさまざまな数字

                                                Googleの人工知能部門の責任者を務めるスゴ腕エンジニアのジェフ・ディーンがかつて作成した「すべてのエンジニアが知っておくべき数字」に習って、「大規模言語モデル(LLM)の開発者が知っておくべき数字」が元Googleのエンジニアだったワリード・カドスさんによってまとめられています。 ray-project/llm-numbers: Numbers every LLM developer should know https://github.com/ray-project/llm-numbers ◆プロンプト編 40-90%:プロンプトに「簡潔に」を追加することで節約できる量 LLMの返答はトークン単位で課金されるため、LLMに簡潔に返答するよう要求すると大幅にコストを削減可能です。単にプロンプトに「簡潔に」を追加するだけでなく、例えば10個の案を出すというプロンプトを行う時に代わりに5個

                                                  大規模言語モデルの開発者が知っておくと役立つさまざまな数字
                                                • 数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB

                                                  科学的知識は主に書籍や科学誌に保存されていますが、PDF形式が一般的です。しかし、この形式は特に数学的表現においてセマンティック情報の損失を引き起こします。この問題に対処するために、Meta AIの研究チームは『Nougat(Neural Optical Understanding for Academic Documents)』という新しいOCR(光学式文字認識)技術を開発しました。 Nougatは、数式や文章が複雑に配置された画像であっても、それをマークアップ言語に高品質で変換する能力を持っています。この技術は、新しい論文だけでなく、電子データが存在しない古い書類などの解析にも非常に有用です。 参照論文情報 タイトル:Nougat: Neural Optical Understanding for Academic Documents 著者:Lukas Blecher, Guillem

                                                    数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』 | AIDB
                                                  • AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた

                                                    画像生成AIにイラストや写真を学習させることを防ぐため、「Mist」などを使って画像に敵対的サンプルと呼ばれるノイズを入れる方法があります。この敵対的サンプルによるノイズを画像から除去するためのツール「AdverseCleaner」が登場しています。 GitHub - lllyasviel/AdverseCleaner: Remove adversarial noise from images https://github.com/lllyasviel/AdverseCleaner AdverseCleanerはHugging Faceで公開されており、実際に試してみることができます。 AdverseCleaner - a Hugging Face Space by p1atdev https://huggingface.co/spaces/p1atdev/AdverseCleaner 今

                                                      AIによる学習を妨害する敵対的ノイズを画像から除去できる「AdverseCleaner」を使ってみた
                                                    • ChatGPTのプロンプトを自動改善するPrompt Perfectプラグインを使ってみた - Taste of Tech Topics

                                                      カメラ好き機械学習エンジニアの@yktm31です。 ChatGPTは便利ですが、プロンプトの内容でいかに質問・指示するかで、その精度はだいぶ変わってきます。 うまく質問・指示するのは、工夫が必要だったりしますが、そこで役立つのが、「Prompt Perfect」というプラグインです。 www.blog.promptperfect.xyz Prompt Perfectは、ChatGPTへのプロンプトの内容を自動で改善してくれるプラグインです。 本記事では、その使い方や効果について、試していきます。 プラグインを有効化 使い方 基本の使い方 日本語で回答させる もう一つ試してみる Prompt Perfectの補完内容 注意点 まとめ プラグインを有効化 1) プラグインを有効化するため、Plugin storeからインストールします。 2) インストール後、メールアドレスの登録か、Googl

                                                        ChatGPTのプロンプトを自動改善するPrompt Perfectプラグインを使ってみた - Taste of Tech Topics
                                                      • アマゾン、「Alexa」に3つの生成型AIスキルを搭載

                                                        ラスベガスで開催中の「CES 2024」では人工知能(AI)が主役となっており、AmazonもAIを大々的に活用した新たなスキルを3つ「Alexa」に搭載したと発表した。これらのスキルは現在、米国向けの「Alexa Skills」ウェブサイトなどから無料で利用できる。 1つ目のスキルは「Character.AI」と呼ばれるものだ。Character.AIウェブサイトの開発者らが作成したこのスキルを使うことで、ユーザーはさまざまなチャットボットとチャットできるようになる。ソクラテスやアルバート・アインシュタインといった歴史上の人物と対話し、哲学や物理学についての会話を交わすことができる。 またCharacter.AIを用いることで、トリッププランナーや、デートに関する相談相手、フィットネスコーチなどとチャットして支援や助言を受けられるようになる。また娯楽目的で、「もしも✕✕だったら?」という

                                                          アマゾン、「Alexa」に3つの生成型AIスキルを搭載
                                                        • AIの力だけでAngry Birdsのコピーゲームを作成したエンジニアが登場、作成時に使用したプロンプトも公開中

                                                          AIの実践的な使い方を研究しているジャヴィ・ロペズさんが、AIの力を最大限に活用してAngry Birdsのコピーゲーム「Angry Pumpkins」を作成する様子を投稿しています。 Midjourney, DALL•E 3 and GPT-4 have opened a world of endless possibilities. I just coded "Angry Pumpkins 🎃" (any resemblance is purely coincidental 😂) using GPT-4 for all the coding and Midjourney / DALLE for the graphics. Here are the prompts and the process I followed: pic.twitter.com/st3OEhVVtK— Javi

                                                            AIの力だけでAngry Birdsのコピーゲームを作成したエンジニアが登場、作成時に使用したプロンプトも公開中
                                                          • 「ChatGPT」と「Microsoft Bing」は何が違う? スマホでの使い方から回答内容までを徹底比較

                                                            「ChatGPT」と「Microsoft Bing」は何が違う? スマホでの使い方から回答内容までを徹底比較(1/4 ページ) 2022年11月にOpenAIが「ChatGPT」をリリースしてからというもの、毎日のように対話型AIに関する話題がネット上で見られるようになりました。対話型AIとは、ユーザーが投げかけた質問に対して、人が行うようにAI(人工知能)が自然な文章で回答してくれるというものです。 「検索と検索結果」に似ていますが、検索の場合、通常入力するのは検索ワード。複数の単語を区切りつつ入力する必要がある上、回答は関連Webサイトがリスト形式で表示されるだけです。それに対し、対話型AIでは、知りたいことを自然な文章で質問すれば、向こうも理解しやすい自然な文章で回答してくれる、という点が異なります。まるで、何でも知っている人と会話しているような感覚ですね。 ChatGPTには、言語

                                                              「ChatGPT」と「Microsoft Bing」は何が違う? スマホでの使い方から回答内容までを徹底比較
                                                            • 1枚の画像をテキストだけで編集できるAIの「Imagic」がすごすぎる

                                                              テキストプロンプトで画像を編集できるAI技術がよく話題になっていますが、それらは編集タイプが限定されていたり、複数の画像の入力が必要だったりするものがほとんどです。しかし、2022年10月17日にプレプリントサーバーのarXivで発表された「Imagic」は、画像の修正箇所を手動で指示したり別の画像を入力したりしなくても、1枚の画像とテキストプロンプトだけで複雑な画像の編集が可能とのことで、論文に掲載されている画像を見るだけでもそのすさまじさを実感することができます。 [2210.09276] Imagic: Text-Based Real Image Editing with Diffusion Models https://arxiv.org/abs/2210.09276 「Imagic」は、事前にトレーニングしたText to Image拡散モデルを利用しているため、複雑な非剛体(形

                                                                1枚の画像をテキストだけで編集できるAIの「Imagic」がすごすぎる
                                                              • ChatGPTに「ライターとしての仕事を奪われた」との報告、仕事内容は勝っていても無料には勝てず

                                                                海外掲示板のReddit上で、とあるユーザーが「ChatGPTのせいで最大かつ最高のクライアントを失ってしまった」と報告しています。 It happened to me today : freelanceWriters https://old.reddit.com/r/freelanceWriters/comments/12ff5mw/it_happened_to_me_today/ RedditユーザーのAshamed_Apricot6626さんが、「私の主な収入源であり、コピーやコンテンツライティングの大部分を私に委託しているマーケターが、ChatGPTの生成する文書が私の作成するものよりも優れたものではないと理解しつつも、利益率を無視することはできないとして私との契約を打ち切ってしまいました」と投稿し、ChatGPTに自身の仕事を奪われたと報告しています。 このAshamed_Apr

                                                                  ChatGPTに「ライターとしての仕事を奪われた」との報告、仕事内容は勝っていても無料には勝てず
                                                                • 【ChatGPTとは?】2024年最新!始め方と使い方を徹底解説 - 起業ログ

                                                                  アプリ版ChatGPTの使い方 ダウンロード後、画像左端のようなログイン画面が表示されるので、すでにアカウントを持っている場合は「log in」からログイン、アカウント開設がまだの方は「Sigh in」からアカウント開設を行ってください。 ログインが完了すると、以下の注意事項が表示されます。 「Continue」をタップするとChatGPTを利用し始めることができます。 ChatGPT Plusとは?有料版の料金や限定の新機能について ChatGPT Plusとは一言で言えばChatGPTのより先進的なモデルである「GPT-4」を使えるプランのことです。料金は20ドル/月(約3000円弱)です。 ChatGPT Plus(GPT-4)限定の新機能としては「音声出入力」、「画像やPDF、Wordファイルなどの入力」、WEBブラウジング機能や各種プラグインなどがあります。また、通常のチャットに

                                                                    【ChatGPTとは?】2024年最新!始め方と使い方を徹底解説 - 起業ログ
                                                                  • CyberAgent社の日本語LLM OpenCALMの対話モデル用途のfinetune検証 - ACES エンジニアブログ

                                                                    こんにちは、ACESでアルゴリズムエンジニアとして働いている檜口です。最近はChatGPTを始めとする言語モデルの研究開発やプロダクト改善に取り組んでいます。 昨年末のChatGPTのリリース以降、大規模言語モデル(large language model, LLM)の社会実装が急速に進んできています。弊社でも商談解析AIツールACES MeetにLLMを組み込むなど、LLMの活用を広げています。こちらに関してはLLMを活用したAIまとめ機能リリースの裏側について過去記事を書いてありますのでご興味ある方はぜひご覧ください。 tech.acesinc.co.jp LLMはOpenAIのChatGPTが最も有名ですが、最近はオープンソースでモデルを開発する流れも活発になっています。特に、英語で学習したオープンソースモデルはMeta社のリリースしたLlamaを始めとして非常に強力なものがリリース

                                                                      CyberAgent社の日本語LLM OpenCALMの対話モデル用途のfinetune検証 - ACES エンジニアブログ
                                                                    • 全米作家協会、生成AI大手に「トレーニングに著作を無断で使うな」公開書簡

                                                                      米国の作家の経済的地位向上を目的とするAuthors Guild(全米作家協会)は7月18日(現地時間)、米OpenAIなどの生成AIに取り組む企業のCEOに対し、AIのトレーニングに作家の作品を無断で使わないよう求める書簡を公開した。本稿執筆現在、8500人以上が署名している。 宛先は、以下の企業のCEOだ。 OpenAIのサム・アルトマンCEO AlphabetおよびGoogleのスンダー・ピチャイCEO Metaのマーク・ザッカーバーグCEO Stability AIのエマド・モスタークCEO IBMのアービンド・クリシュナCEO Microsoftのサティア・ナデラCEO 書簡には、「大規模言語モデル(LLM)で構築される生成AIは、われわれの著作物のおかげで存在する」「これらのテクノロジーは、われわれの言葉、物語、スタイル、アイデアを模倣し、逆流させている。著作権で保護された何百

                                                                        全米作家協会、生成AI大手に「トレーニングに著作を無断で使うな」公開書簡
                                                                      • 日本語が通る大規模言語モデルCerebras-GPTを動かす - きしだのHatena

                                                                        またなんか大規模言語モデルが公開されてましたね。 ということで、Cerebrasが公開したモデルを動かしてみます。日本語が通る感じ。 商用利用可能というライセンスなども含めて、一番使いやすい気がします。 https://huggingface.co/cerebras ここでいろいろやってるようだけど、モデルを動かすスクリプトはありません。 https://github.com/Cerebras/modelzoo なので、自分でモデルを動かすコードを書くということになるけど、VTS-Techさんがgistで公開しているスクリプトを使わせてもらいます。 https://gist.github.com/Veritas83/bb858a2039fe84cd35af4064c0aa44d8 -mでモデルサイズ、-cでコマンドラインモード、-pでプロンプトを指定します。 >python VTSTech

                                                                          日本語が通る大規模言語モデルCerebras-GPTを動かす - きしだのHatena
                                                                        • 顔認証の40%以上をたった9つの顔で突破するマスターキーならぬ「マスターフェイス」を作るAIが登場

                                                                          顔認証システムはスマートフォンやPCのロック解除など、日常生活のさまざまな場所に浸透しています。ところがイスラエル・テルアビブ大学の研究チームは、マスターキーならぬ「マスターフェイス」を生成するAIを開発したと発表。たった9つの顔で全体の40%以上の顔になりすまして、顔認証を突破可能だと報告しています。 [2108.01077] Generating Master Faces for Dictionary Attacks with a Network-Assisted Latent Space Evolution https://arxiv.org/abs/2108.01077 ‘Master Faces’ That Can Bypass Over 40% Of Facial ID Authentication Systems - Unite.AI https://www.unite.ai

                                                                            顔認証の40%以上をたった9つの顔で突破するマスターキーならぬ「マスターフェイス」を作るAIが登場
                                                                          • Microsoftがノーコードの「Lobe」を無料公開 機械学習モデルを作成してみた | Ledge.ai

                                                                            サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                                              Microsoftがノーコードの「Lobe」を無料公開 機械学習モデルを作成してみた | Ledge.ai
                                                                            • ChatGPTはインターネット上であまり用いられない「非主要言語」を扱うと翻訳ミス・単語をねつ造・非論理的な回答などかなり応答レベルを落とすという報告

                                                                              OpenAIの対話型AIであるChatGPTは、Googleのコーディング職の試験やロースクールの試験で合格点を記録したり、医師免許試験にも合格したりと、高い精度で回答できる実力がいくつも報告されています。一方で、ChatGPTと英語以外でやりとりしていると、意図がうまく伝わっていないと感じるケースも多くなっています。特に、オンラインで見ることが多くない一部の言語では、論理テストに失敗したり基本的な情報の検索もできなかったりとかなり精度が落ちることが報告されています。 ChatGPT fails in languages like Tamil and Bengali - Rest of World https://restofworld.org/2023/chatgpt-problems-global-language-testing/ ChatGPTは英語やスペイン語といった主要な言語で

                                                                                ChatGPTはインターネット上であまり用いられない「非主要言語」を扱うと翻訳ミス・単語をねつ造・非論理的な回答などかなり応答レベルを落とすという報告
                                                                              • AIが生成した“偽音声”を見抜く技術 99%以上の精度で検出

                                                                                Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米フロリダ大学の研究チームが発表した論文「Who Are You(I Really Wanna Know)? Detecting Audio DeepFakes Through Vocal Tract Reconstruction」は、音声生成モデルで作成された合成音声を見抜く検出器を開発し検証した研究報告だ。音声から声の通り道「声道」を作成して、その声道から人の音声か偽物の音声かを識別する。精度は99%以上だという。 人の声をまねた合成音声はロボットっぽい音で出力されていたが、近年では機械学習モデルの進歩により、合成音声の品質は劇的に向上して人間っぽい音で出力されるようになってきた。人間

                                                                                  AIが生成した“偽音声”を見抜く技術 99%以上の精度で検出
                                                                                • Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表

                                                                                  2023年4月18日にMicrosoft Research AsiaとMicrosoft Azureのカイ・シェン氏らの研究チームが拡散モデルを使用した小品質の音声合成システム(TTS)である「NaturalSpeech 2」を発表しました。NaturalSpeech 2では数秒の短い音声サンプルを利用する事で、人の声だけでなく歌声までも忠実にシミュレートすることが可能になっています。 [2304.09116] NaturalSpeech 2: Latent Diffusion Models are Natural and Zero-Shot Speech and Singing Synthesizers https://doi.org/10.48550/arXiv.2304.09116 NaturalSpeech 2 https://speechresearch.github.io/na

                                                                                    Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表