並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 291件

新着順 人気順

"AI(Artificial Intelligence)"の検索結果241 - 280 件 / 291件

  • GPT-4、Bard、Claude2などの異なるLLMが円卓を囲み議論した結果の回答は品質が高いとの検証報告。円卓ツールも公開 | AIDB

    異種LLM同士の議論 米ノースカロライナ大学の研究者らは、異なる種類の大規模言語モデル(LLM)同士に議論させるというアプローチを採りました。 このアイデアの背後には、異なるモデルがそれぞれの強みと弱みを持っているという認識があります。例えば、GPT-4は一般的なテキスト生成に優れている一方で、Bardは物語生成に特化しています。これらのモデルを組み合わせることで、より高度な推論が可能になると考えられています。 研究者らは、複数の異なるLLM(GPT-4、Bard、Claude2など)を円卓会議のような形で議論させるアイデアを形にしました。各モデルは独自の視点と推論能力を持ち寄り、最終的な回答や結論を出す過程が検証されました。 異種LLMs円卓会議ツール 研究者らはただ実験を行って報告するだけでなく、LLM同士に議論させて答えを提出させるプロセスを自動化するツールも提供しています。このツー

      GPT-4、Bard、Claude2などの異なるLLMが円卓を囲み議論した結果の回答は品質が高いとの検証報告。円卓ツールも公開 | AIDB
    • AIが匿名のチェスプレーヤーの正体を特定してプライバシーリスクをもたらす可能性

      複雑な領域で人間の意思決定能力を超えるAIの出現により、将棋や囲碁、チェス、ストラテジーゲームなどでAIが人間を凌駕するようになりました。そんな中、チェスの駒運びからプレイヤーが誰なのかを高い精度で特定できるAIが発表され、オンラインチェスにおけるプライバシーが脅かされているのではないかと危惧されています。 Detecting Individual Decision-Making Style:Exploring Behavioral Stylometry in Chess (PDFファイル)https://papers.nips.cc/paper/2021/file/ccf8111910291ba472b385e9c5f59099-Paper.pdf AI unmasks anonymous chess players, posing privacy risks | Science | A

        AIが匿名のチェスプレーヤーの正体を特定してプライバシーリスクをもたらす可能性
      • AI画像生成の最新トピックを“濃密”にカバー DeNAが230ページ超の資料公開

        DeNAは3月1日、AI生成に関する資料「DiffusionによるText2Imageの系譜と生成画像が動き出すまで」を公開した。238ページにわたる大規模なもので、テキストから画像を生成する「Text2Image」や動画生成「Text2Video」を中心に、最新トピックをカバーしている。 資料では、急速に技術発展しているDiffusionモデルの基礎解説から、Text2Image/Text2Videoに関するさまざまな最新手法、AI生成にまつわる権利関係などの問題点について網羅的にカバーしている。

          AI画像生成の最新トピックを“濃密”にカバー DeNAが230ページ超の資料公開
        • 要約をAIが自動生成してくれるサービス『QuillBot』と『ELYZA DIGEST』|これ買ってよかった | ライフハッカー・ジャパン

          デスク配線がスッキリ。Ankerの全部入り12 in 1モニタースタンドが突然8,250円OFFされてた #Amazonセール

            要約をAIが自動生成してくれるサービス『QuillBot』と『ELYZA DIGEST』|これ買ってよかった | ライフハッカー・ジャパン
          • BERTとは|Googleが誇る自然言語処理モデルの仕組み、特徴を解説 | Ledge.ai

            サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

              BERTとは|Googleが誇る自然言語処理モデルの仕組み、特徴を解説 | Ledge.ai
            • 5分で分かる機械学習(ML)

              1分 ―― 機械学習 (ML:Machine Learning)とは 人間が経験から学ぶように、機械がデータから学習することを機械学習(ML)と呼びます。例えば犬や猫の画像データから「あれが犬」「これが猫」と判断できるように学習することなどです。これは人間の子供に犬や猫を見せて「あれが犬」「これが猫」と覚えさせるのに似ていますね。 「5分で分かる人工知能(AI)」でも説明しましたが、機械学習には例えば、回帰分析や主成分分析、決定木、サポートベクタマシン、ディープラーニング(=ニューラルネットワークという仕組みを発展させたもの)など多くの手法(後述)があります(図1)。 統計学と機械学習の違い 回帰分析や主成分分析と聞いて、統計学の多変量解析を思い浮かべたかもしれません。実際に、一部の統計学の手法は機械学習でも使用します。しかし、統計学はデータを分析してインサイト(=内在する本質)を得ること

                5分で分かる機械学習(ML)
              • ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は?

                Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 スイスのチューリッヒ大学に所属する研究者らが発表した論文「ChatGPT Outperforms Crowd-Workers for Text-Annotation Tasks」は、機械学習向け大規模データセットを作成するためのラベル付け作業(アノテーション)において、ChatGPTと人ではどちらがパフォーマンスが良いかを検証した研究報告である。 多くの機械学習モデルでは、学習やテストを行うために高品質なラベル付きデータを必要とする。科学の進歩のため、研究者が特定分野の大規模なラベル付きデータセットを作成して公開する。あとの研究者らは、このデータセット

                  ChatGPTはクラウドワーカーより優秀か データのラベル付け作業で検証 結果は?
                • 脳が知覚した内容を「Stable Diffusion」が画像化 脳活動を解析 阪大などが技術開発

                  Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 大阪大学大学院生命機能研究科と情報通信研究機構CiNetに所属する研究者らが発表した論文「High-resolution image reconstruction with latent diffusion models from human brain activity」は、潜在拡散モデルを用い、磁気共鳴機能画像法(fMRI)により得られた人間の脳活動から画像を生成する手法を提案した研究報告である。実験参加者に画像を見せた際のfMRI信号から潜在拡散モデルで画像を生成する。 【修正履歴:3月8日午後6時40分更新:掲載当初のタイトルから一部内容を修正

                    脳が知覚した内容を「Stable Diffusion」が画像化 脳活動を解析 阪大などが技術開発
                  • ソフトウェア開発者、生成AIに警戒感も

                    人工知能(AI)、特に生成AIは、ソフトウェア開発者やその他のITプロフェッショナルの役割と仕事を変えると期待されている。しかし、そのすべてが比較的未成熟であり、専門家たちは熱意と警戒心の両方を持って取り組みを進めている。 エンジニアのためのQ&Aサイトを手がけるStack Overflowが開発者約9万人を対象に実施した最新の調査(6月公開)によると、回答者の44%は開発業務でAIツールを利用しており、さらに25%は近い将来AIを利用することに前向きであることが分かった。とはいえ、AIによって得られるものを信頼するかどうかについては、意見が分かれている。AIによるアウトプットを「非常に信頼している」のはわずか3%で、39%は「やや信頼している」と、慎重な姿勢を示した。4人に1人を超える28%は、AIを信頼していない。 つまり、AIは素晴らしいものかもしれないが、注意を要するということだ。

                      ソフトウェア開発者、生成AIに警戒感も
                    • 画像生成AIが“ロボットの動き”を生成 英ICL「DALL-E-Bot」開発

                      Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 英Imperial College London(ICL)の研究チームが発表した論文「DALL-E-Bot: Introducing Web-Scale Diffusion Models to Robotics」は、テキスト入力に応じて自動生成した画像を目標に、ロボットが動いて物体を再配置するシステムを提案した研究報告だ。 ロボットに搭載するカメラが現状を撮影し、その画像をもとに自然言語によるプロンプトを作成してText-to-imageモデルに入力すると人間のように配置、整列させた新しい画像を生成できる。ロボットはその画像をゴールにアームを動かし物体をつかんで移動させる。例えば、お皿、ナ

                        画像生成AIが“ロボットの動き”を生成 英ICL「DALL-E-Bot」開発
                      • OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化 | AIDB

                        関連研究 ChatGPTの”ふるまいの変化”を定量的に分析した結果 OpenAI、大規模言語モデルの数学能力を大きく向上させることに成功 GPT-4を使用した知的労働者のパフォーマンスは軒並み向上し、もとの成績が良くないほど顕著。※注意点あり 従来の課題 GPT-4Vは、従来のGPT-4が抱えていたいくつかの課題を解決する形で登場しました。 テキスト中心の処理能力 従来のGPT-4は、テキストデータの処理能力に特化しており、テキストベースの質問応答、文章生成、自然言語理解など、多くの用途で非常に有用でした。 しかし、裏を返せば画像や音声など他のメディア形式に対する対応が不足していました。テキストと画像が組み合わさったマルチモーダルなデータに対する処理能力が限定的でした。 画像入力とプライバシー GPT-4の画像データに対する安全な処理能力には限界がありました。例えばプライバシー保護の観点が

                          OpenAI、ChatGPTが画像を分析する『GPT-4V(ビジョン)』を発表。安全性、嗜好性、福祉機能を強化 | AIDB
                        • ユーザーの同意なしに訓練した可能性のあるChatGPTの「OpenAI」が厳格なプライバシー法を重視するEUで法的な問題に直面、「規則の準拠は不可能に近い」と専門家

                          人間レベルの文章を生成するChatGPTがEUのデータ保護規則に違反している疑いで、開発元のOpenAIがイタリアのデータ保護機関から調査を受けています。当局は2023年4月30日までにイタリア及びEUの法律を順守するよう呼びかけていますが、AIの専門家は「このタスクは不可能に近い」とし、ChatGPTおよびOpenAIが抱える問題について詳述しました。 OpenAI has until April 30 to comply with EU laws — ‘Next to impossible,’ say experts https://cointelegraph.com/news/openai-has-until-april-30-to-comply-with-eu-laws-next-to-impossible-say-experts EUの一般データ保護規則(GDPR)の下では、技術

                            ユーザーの同意なしに訓練した可能性のあるChatGPTの「OpenAI」が厳格なプライバシー法を重視するEUで法的な問題に直面、「規則の準拠は不可能に近い」と専門家
                          • 高木浩光@自宅の日記 - OECDガイドラインの8原則についてChatGPTに聞いてみた

                            ■ OECDガイドラインの8原則についてChatGPTに聞いてみた ChatGPTに色々聞いてみるテストは1月にTwitterに結果を報告していた*1が、GPT-4が使えるようになったということで、もう一度やってみた。ChatGPTは基本的に、質問者に迎合しようとする(質問者の期待に応えようとする)ので、ChatGPTが答えたといっても質問者の意図した答えになっているにすぎない(それゆえ、質問者の意図が明確にされず、ChatGPTも知らないことが問われると、全くの出鱈目を答えてしまうという現象が起きるようだ。)わけであるが、それでも、質問者が誘導しているわけでもないのに質問者が必要としていることを言葉の端々から察知して根拠を探してきてくれるような回答をする。以下は、できるだけ誘導しなように(といっても、後ろの方で明確に誘導しているところもあるがw)質問した例だが、最初のうちはChatGPT

                            • Meta、テキストプロンプトで作曲できる生成AIスイート「AudioCraft」をオープンソース化

                              米Metaは8月2日(現地時間)、テキストプロンプトから音楽や音声を生成する生成AIツールスイート「AudioCraft」をオープンソース化したと発表した。トレーニングに使うデータの多様化もオープンソース化のねらいの1つだ。 AudioCraftは、エフェクトやサウンドスケープを生成する「AudioGen」、テキストからメロディーを生成する「MusicGen」、ニューラルネットワークベースのオーディオ圧縮コーデックの「EnCodec」の3つのコンポーネントで構成されている。MusicGenは単体で6月にオープンソース化されている。EnCodecは昨年11月に公開済みだが、最近の改良でより高品質な音楽生成が可能になったという。 MusicGenは、Metaが所有する音楽と、「この目的のために特別にライセンスを取得した音楽」をあわせて2万時間分のデータでトレーニングしたとしている。 Metaは

                                Meta、テキストプロンプトで作曲できる生成AIスイート「AudioCraft」をオープンソース化
                              • GPT-4を無料で使えて画像の詳細も聞けるMicrosoftのチャットAI「Microsoft Copilot」のiOS版が公開されたので使ってみた

                                MicrosoftのチャットAI「Microsoft Copilot」のiOS向けアプリが2023年12月29日に登場しました。iOS版のMicrosoft Copilotでは文章だけでなく画像を使ったコミュニケーションも可能なほか、アカウント作成不要でGPT-4とのチャットも可能とのこと。実際にiPhoneにMicrosoft Copilotをインストールして使ってみました。 「Microsoft Copilot」をApp Storeで https://apps.apple.com/jp/app/microsoft-copilot/id6472538445 iPhoneにMicrosoft Copilotをインストールするには、まず配布ページにアクセスして「入手」をタップ。 Touch IDやFace IDで認証してインストールを進めます。 インストールが完了したら「開く」をタップ。 初

                                  GPT-4を無料で使えて画像の詳細も聞けるMicrosoftのチャットAI「Microsoft Copilot」のiOS版が公開されたので使ってみた
                                • NICT、日本語に特化した400億パラメーターの生成AIを開発

                                    NICT、日本語に特化した400億パラメーターの生成AIを開発 
                                  • ChatGPTでフィッシングサイトを自動検出する方法 NTTセキュリティが開発 精度は98%以上

                                    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 NTTセキュリティ・ジャパンに所属する研究者らが発表した論文「Detecting Phishing Sites Using ChatGPT」は、ChatGPTでフィッシングサイトを検出する手法を提案した研究報告である。 この手法では、Webサイトから情報を収集するためにWebクローラーを使用し、その収集したデータを元にプロンプトを作成する。プロンプトはChatGPTに提示され、ChatGPTは与えられたWebサイトがフィッシングサイトかどうかを判断する。 WebクローリングとChatGPTの組み合わせにより、Webサイトの正当性や怪しさに関する情報に基

                                      ChatGPTでフィッシングサイトを自動検出する方法 NTTセキュリティが開発 精度は98%以上
                                    • ChatGPTを3カ月使い倒してわかった! 仕事で活用する5つのコツと注意点 #TrendBuzz | ライフハッカー・ジャパン

                                      1.「作ってもらう」より「アイデアをもらう」文章をAIに丸ごと作成してもらうのも楽しい体験ですが、ビジネスでより実用性が高いと感じるのは、アイデア出しでの活用です。 筆者が実際に使っているのが、インタビューの質問内容を考えるとき。たとえば、リスキリングについての取材なら、こんな風に聞いてみます。 リスキリングをしたいと考えているけれど、行動を起こせずにいる35歳・営業職のビジネスパーソンがいます。彼が不安に感じているであろうことを箇条書きで教えてください。 「不安に感じること」の具体例が箇条書きで出てきました。AIに聞くまでもなく自分で想定できていた項目もありますが、見落としていたものに気づけたり、「その発想はなかった!」という新しい視点を得ることができたりします。 Screenshot: 酒井麻里子 via ChatGPTこれはブログ記事の内容を考えるときなどにも使えます。 その場合は、

                                        ChatGPTを3カ月使い倒してわかった! 仕事で活用する5つのコツと注意点 #TrendBuzz | ライフハッカー・ジャパン
                                      • ChatGPTのような高性能言語モデルを生み出した技術はどんな仕組みなのか?をAI企業のエンジニアが多数の図解でゼロから解説

                                        OpenAIが開発したChatGPTをはじめ、さまざまなAIが人間レベルの会話を行ってくれるようになりました。そうしたチャットAIがどのような技術で成り立っているのかをAssemblyAIのエンジニアであるマクロ・ランポニさんが知識ゼロでもわかる丁寧さで解説しています。 The Full Story of Large Language Models and RLHF https://www.assemblyai.com/blog/the-full-story-of-large-language-models-and-rlhf/ ChatGPTがリリースされてから1億人以上に利用されるまでにかかった月数はなんとたったの2カ月。とんでもないスピードで普及していきました。 ChatGPTのヒット以降、さまざまなチャットAIが登場していますが、それらのチャットAIは「言語モデル」という技術によって

                                          ChatGPTのような高性能言語モデルを生み出した技術はどんな仕組みなのか?をAI企業のエンジニアが多数の図解でゼロから解説
                                        • Microsoft Bingの画像生成AI機能では禁止ワードの「9.11」とカービィやスポンジ・ボブなどの人気キャラクターを組み合わせた画像が簡単に作成できてしまい人間の制御できる範疇を超えてしまっているとの指摘

                                          Microsoftの検索エンジンであるBingには、画像生成AIを用いた「Bing イメージクリエーター」という機能があります。この画像生成AI機能では暴力・テロリズム・ヘイトスピーチなどに関するプロンプトが利用できないようにブロックされており、Bing イメージクリエイターの使用に関するポリシーでもこれらのコンテンツの作成は明確に禁じられています。しかし、ユーザーはBing イメージクリエーターを使って禁止されているはずのコンテンツを簡単に作成することができており、もはや人間の制御できる範疇を逸脱してしまっていると、メディアが指摘しました。 Bing Is Generating Images of SpongeBob Doing 9/11 https://www.404media.co/bing-is-generating-images-of-spongebob-doing-9-11/

                                            Microsoft Bingの画像生成AI機能では禁止ワードの「9.11」とカービィやスポンジ・ボブなどの人気キャラクターを組み合わせた画像が簡単に作成できてしまい人間の制御できる範疇を超えてしまっているとの指摘
                                          • AIが5時間足らずでRISC-V CPUを設計。性能はi486SX程度 | テクノエッジ TechnoEdge

                                            ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 中国の研究グループが、「AIを用いて自動化したたCPU設計」(Pushing the Limits of Machine Design: Automated CPU Design with AI)と題した論文を発表しました。この論文では、わずか5時間足らずで産業グレードのRISC-V CPUを設計できたと報告しています。 この実験は、機械が人間と同じようにCPUチップの設計ができるのかを検証する目的で行われました。初期の実験ではわりと単純で小規模なチップを作らせていたものの、新しい実験では、AIによる設計の限界を調べるために、RISC-V CPUを自動的に設計させようとしました。 研究者らはモデルとする一連の

                                              AIが5時間足らずでRISC-V CPUを設計。性能はi486SX程度 | テクノエッジ TechnoEdge
                                            • Googleが人間のように普通に会話できるAI「Meena」を開発

                                              AppleのSiriやAmazonのAlexaといった人と会話できるAIは、人の質問に適切に答え、時には冗談を飛ばすこともあります。しかし、一問一答のやりとりではなく「会話」を行う場合、人がAIに配慮して言葉を選ばなければうまく会話できないことが多いのも事実です。そんな中、ディープラーニングを用いて「自然な会話」を行うことができるAIをGoogleが開発し、他のチャットボットとの比較結果や実際の会話例を公開しています [2001.09977] Towards a Human-like Open-Domain Chatbot https://arxiv.org/abs/2001.09977 Google AI Blog: Towards a Conversational Agent that Can Chat About…Anything https://ai.googleblog.com/

                                                Googleが人間のように普通に会話できるAI「Meena」を開発
                                              • Webページのデータを「Excel」に取り込むコネクターが刷新、AIで賢くテーブルを認識/人間がちょっと手助けするだけで従来は対応できなかったテーブルも抽出できる

                                                  Webページのデータを「Excel」に取り込むコネクターが刷新、AIで賢くテーブルを認識/人間がちょっと手助けするだけで従来は対応できなかったテーブルも抽出できる
                                                • ChatGPT はどのように使用されているのか、現時点でわかっていること | DIGIDAY[日本版]

                                                  ChatGPTを利用して仕事を早く済ませる方法は、誰でも何かしらある可能性が高い。オープンAI(OpenAI)が開発したこのAIチャットボットの活用は、マーケティングから教育まで、多種多様な業界で進んでいる。では実際にどの様に利用されているのか、ユーザーたちの具体事例を集めてみた。 ChatGPTを利用して仕事を早く済ませる方法は、誰でも何かしらある可能性が高い。オープンAI(OpenAI)が開発したこのAIチャットボットの活用は、マーケティングから教育まで、多種多様な業界で進んでいる。 ChatGPTはメール、台本、ソーシャルメディア用のコピーの作成など、さまざまな作業に使用できる。利用するためのアカウント作成も簡単で、メールアドレス、電話番号、氏名だけあればいい。 「うまく機能することに毎回驚かされる」 活用方法は次々と見つかっており、LinkedInやTwitterがその披露の場とな

                                                    ChatGPT はどのように使用されているのか、現時点でわかっていること | DIGIDAY[日本版]
                                                  • ChatGPTの言語モデル「GPT-3.5」、司法試験を受ける 結果は?

                                                    法律は言語の使用に大きく依存する分野だ。法令や規制、契約、特許、司法判断などの文書を継続的に作成し、膨大な量のテキストデータを生成している。 他方で、OpenAIのGPT(Generative Pre-trained Transformer)などの登場により大規模言語モデル(LLM)が注目されてきた。最近ではGPT-3.5と呼ばれる「text-davinci-003」モデルが開発されており、GPT-3.5シリーズのモデルを微調整したテキスト対話モデル「ChatGPT」が登場し、一部で話題となった。 法律用語の複雑な性質とGPT-3.5の一般的なタスクパフォーマンスに関する学習を考えると、GPT-3.5のような最先端のLLMが、法律タスクに成功できるかどうかは未知の問題である。 この問題を評価するために研究チームは、NCBE(National Conference of Bar Examin

                                                      ChatGPTの言語モデル「GPT-3.5」、司法試験を受ける 結果は?
                                                    • GPT-4とClaude 2は「16世紀に書かれたラテン語の魔術書」まで翻訳することが可能、学者が「人間のプロに匹敵する」と太鼓判

                                                      「ChatGPTで論文を読む手間が99%減った」と話す研究者がいるように、AIによる支援は学術研究に大きな変化をもたらそうとしています。カリフォルニア大学サンタクルーズ校の歴史学者であるベンジャミン・ブリーン氏が、OpenAIの大規模言語モデル(LLM)であるGPT-4とAnthropicのClaude 2を使用して16世紀のラテン語の書物を翻訳させたところ、驚くほど精度が高い結果が得られたことを報告しました。 Translating Latin demonology manuals with GPT-4 and Claude https://resobscura.substack.com/p/translating-latin-demonology-manuals LLMの支援を研究に生かす試みとして、ブリーン氏はGPT-4やClaude 2が持つ以下の3つの機能に注目しました。 ・前近

                                                        GPT-4とClaude 2は「16世紀に書かれたラテン語の魔術書」まで翻訳することが可能、学者が「人間のプロに匹敵する」と太鼓判
                                                      • iOS14純正翻訳アプリをDeepL、Googleと比べたら想像以上にアレだった

                                                        iOS14純正翻訳アプリをDeepL、Googleと比べたら想像以上にアレだった2020.09.18 18:0090,646 satomi むおおおおお…。 iOS 14ではApple純正アプリ「Translate」が初期アプリに加わって、よく使う言語をダウンロードすればオフライン翻訳も可能です。「もうほかの翻訳アプリは消しちゃってもいいっかなー」なんて思ってる人も多いんじゃ? 気になる翻訳精度をチェックしてみました。比較対象はGoogle翻訳、DeepL翻訳です。 DeepLって何?これを知らないとモグリな訳文検索エンジン「Linguee」を手掛けている、独ケルンのDeepL社が2017年夏リリースした翻訳ツールです。今年3月に日本語にも対応し、早くも翻訳精度がヤバいと評判。「AWSの日本語ドキュメントが何言ってるのか分からない場合、英語版をDeepLで翻訳すると分かる」とまで言われてい

                                                          iOS14純正翻訳アプリをDeepL、Googleと比べたら想像以上にアレだった
                                                        • チャットAIで画像入力が可能に。ChatGPTより一足早くやってきたGoogle Bardマルチモーダルの使い方(Google Tales) | テクノエッジ TechnoEdge

                                                          Googleレンズというのは、GoogleのAIが“見た”画像内の情報を検索するAI技術で、2017年のGoogle I/Oで発表された結構古いツールです。Pixelシリーズのスマートフォンユーザーにはおなじみの機能で、散歩中に花や鳥の種類を確認したり、ペルーレストランでメニューを翻訳したりするのに便利です。 ▲PixelではおなじみのGoogleレンズ Bardにこの機能が追加されたんですが、まだ英語版でしか使えません。 日本でも英語版は使えます。使うには、Bardを使うGoogleアカウントの言語設定を英語にするだけ。Googleアカウントのページを開いて、「個人情報」タブ→「ウェブ向けの全般設定」で言語を「英語」にします(そうするとBardだけじゃなく、ChromeブラウザやらGoogleマップやらも英語表記になっちゃいますが)。 ▲Googleアカウントの設定で言語を「英語」に 英

                                                            チャットAIで画像入力が可能に。ChatGPTより一足早くやってきたGoogle Bardマルチモーダルの使い方(Google Tales) | テクノエッジ TechnoEdge
                                                          • 生成AI、画像の特徴が似ていれば「著作権侵害」にあたる? 文化庁の最新見解を読み解く - 弁護士ドットコムニュース

                                                              生成AI、画像の特徴が似ていれば「著作権侵害」にあたる? 文化庁の最新見解を読み解く - 弁護士ドットコムニュース
                                                            • CNETがAIで記事生成を始めてわずか数週間後に大規模な人員削減を実施、主要メンバーの10%が解雇され編集長は辞任してAI担当に転身

                                                              老舗ニュースサイト「CNET」は、2022年11月頃からAIで生成した記事を公開していたことが発覚しており、AI製記事には競合他社の記事とそっくりな文面が含まれていたことも明らかになっています。そんなCNETで大規模な人員削減が実施されたことが明らかになりました。加えて、CNETの編集長を務めていたConnie Guglielmo氏がAIコンテンツ戦略部門の上級副社長に就任する予定であることも判明しています。 CNET is doing big layoffs just weeks after AI-generated stories came to light - The Verge https://www.theverge.com/2023/3/2/23622231/cnet-layoffs-ai-articles-seo-red-ventures CNET editor-in-chi

                                                                CNETがAIで記事生成を始めてわずか数週間後に大規模な人員削減を実施、主要メンバーの10%が解雇され編集長は辞任してAI担当に転身
                                                              • AWSの生成AIサービスである Amazon Bedrock がGAになったので早速使ってみた - Taste of Tech Topics

                                                                こんにちは、機械学習チーム YAMALEX の駿です。 YAMALEX は Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 (詳細はリンク先をご覧ください。) 今回は2023年9月28日に GA となった Amazon Bedrock の紹介と使ってみた感触をお伝えします。 1. Amazon Bedrock とは 2. 利用可能なモデル 3. Anthropic Claude V2 を使ってみた 3.1. Claude とは 3.2. Playground 3.3. 追加設定 4. まとめ 1. Amazon Bedrock とは Amazon Bedrock (以下、 Bedrock )は AWS 上で使える、大規模言語モデル( LLM )の基盤モデルを提供する完全マネージド型サービスです。 2023年9月28日に GA

                                                                  AWSの生成AIサービスである Amazon Bedrock がGAになったので早速使ってみた - Taste of Tech Topics
                                                                • GPT-4やPaLMなどの大規模言語モデルは規模が大きくなると突然予想外の能力を開花させることがある

                                                                  AIが予想外の能力を開花させることを「創発(emergent)」と言います。生物学の世界で「創発」とは、大量の物体が1つになって機能する自己組織化や集団行動を意味しますが、人工知能研究の世界では「突然これまで不可能だと思われていたタスクをこなせるようになること」を意味します。昨今の大規模言語モデルを研究する専門家の間で、大規模言語モデルの創発が話題となっています。 Characterizing Emergent Phenomena in Large Language Models – Google AI Blog https://ai.googleblog.com/2022/11/characterizing-emergent-phenomena-in.html The Unpredictable Abilities Emerging From Large AI Models | Quan

                                                                    GPT-4やPaLMなどの大規模言語モデルは規模が大きくなると突然予想外の能力を開花させることがある
                                                                  • アドビの生成AI「Firefly」正式リリース、商用利用OK 無料でも利用可能

                                                                    アドビは9月13日、同社の生成AI「Adobe Firefly」の一般提供を開始した。同社は6カ月間ほどβ版としてFireflyを提供してきたが、これまでは商用利用は不可となっていた。今回の正式提供により商用利用も可能となる。無料でも利用可能だが、後述の通り提供されるクレジットに差がある。 Adobe Fireflyは、画像生成、テキスト効果、ベクター用の生成AIモデルを基盤としており、日本語を含む100以上の言語のプロンプト入力をサポート。同社のストックフォト「Adobe Stock」にアップされている許諾済み写真や、一般に公開されているライセンスコンテンツ、著作権が執行しているパブリックドメインの画像などを中心に学習しており、同社では商用利用可能な点をアピールしている。 また、Fireflyで生成されるコンテンツには、コンテンツクレデンシャル機能が含まれている。コンテンツの名前、日付、

                                                                      アドビの生成AI「Firefly」正式リリース、商用利用OK 無料でも利用可能
                                                                    • 「AIが生成した作品は著作権で保護される余地がない」との判決が下る

                                                                      AIによって制作された作品が著作権で保護されるかをめぐる裁判で、「著作権の主張には著作者が人間であることが必要」だとして、AIの作品の著作権登録を求めた原告の訴えを退ける判決を下しました。一方裁判を担当した判事は、AIが人によって制作された作品でトレーニングされた場合における保護の範囲など、生成AIの登場により今後難しい課題が生じてくるだろうとの予想も示しています。 Artificial Intelligence Lawsuit: AI-Generated Art Not Copyrightable – The Hollywood Reporter https://www.hollywoodreporter.com/business/business-news/ai-works-not-copyrightable-studios-1235570316/ AI-generated art c

                                                                        「AIが生成した作品は著作権で保護される余地がない」との判決が下る
                                                                      • OpenAIの「ChatGPT」と元OpenAIエンジニアが開発した「Claude」の性能を比較した実験結果

                                                                        ChatGPTやWALL-E 2を開発したOpenAIの元社員によって設立されたAIスタートアップ・Anthropicは、ChatGPTと同じような対話型AI「Claude」を開発しました。AIデータプラットフォーム・Scale AIのエンジニアであるスペンサー・パペイ氏とリリー・グッドサイド氏が、ChatGPTとClaudeの性能を比較した結果を公開しています。 Meet Claude: Anthropic’s Rival to ChatGPT | Blog | Scale AI https://scale.com/blog/chatgpt-vs-claude ChatGPTもClaudeも、「文章を入力すると、その内容に対して文章を生成して回答する対話型AI」です。ChatGPTは自然言語処理モデルであるGPT-3から派生したInstructGPTをベースとしたモデルで、「より人間らし

                                                                          OpenAIの「ChatGPT」と元OpenAIエンジニアが開発した「Claude」の性能を比較した実験結果
                                                                        • GPT-4を使ったAIが「マインクラフト」を勝手に冒険して成長する「Voyager」が公開/自律型で人の手を介さずにワールドを探検し、スキルを習得、新しい発見ができる

                                                                            GPT-4を使ったAIが「マインクラフト」を勝手に冒険して成長する「Voyager」が公開/自律型で人の手を介さずにワールドを探検し、スキルを習得、新しい発見ができる
                                                                          • Google、100以上の言語を自動認識して字幕化できる音声AI

                                                                              Google、100以上の言語を自動認識して字幕化できる音声AI
                                                                            • 画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る(CloseBox) | テクノエッジ TechnoEdge

                                                                              Facebookでは「~年前の自分の投稿」を再度シェアするよう促してくるお節介な機能があります。これにより気づくことも多く、自分はけっこう重宝しています。さて、そのFacebookが思い出させてくれたのが、2022年12月17日の自分の画像投稿でした。 同日、生成AIを自分で使ってみた最初の記事をテクノエッジのこの連載コラムで公開。その後の生成AIブームに乗っかった形で新しい技術を試していくという流れができました。 というわけで、ここを起点に、2023年のちょっと前からの生成AIの動きを自分の取り組みを中心にまとめてみます。一般ユーザーが実践できるものとしてどのように進化してきたかを振り返る手掛かりになれば幸いです。 2022年12月:特定人物の画像生成でカスタム学習が可能にAI研究家の清水亮さんが運営しているAI画像生成サービス「Memeplex」が、画像生成エンジンであるStable

                                                                                画像・音声・文書・作曲、すべてが生成AIに頼れるようになった2023年を自分の記事で振り返る(CloseBox) | テクノエッジ TechnoEdge
                                                                              • 画像生成AI「Stable Diffusion」がどのような仕組みでテキストから画像を生成するのかを詳しく図解

                                                                                高精度な画像を生成できることで話題となっている「Stable Diffusion」が、どのように入力されたテキスト(プロンプト)からイラストを生成しているのかについて、機械学習関連のトピックについての解説動画などを投稿しているジェイ・アラマー氏が解説しています。 The Illustrated Stable Diffusion – Jay Alammar – Visualizing machine learning one concept at a time. https://jalammar.github.io/illustrated-stable-diffusion/ アラマー氏は、テキストから印象的な画像を生成するAIの登場が、人間がアートを作成する方法が変わることを示していると主張。Stable Diffusionのリリースにより、比較的安いリソースで使用で誰もが高性能なモデルを使

                                                                                  画像生成AI「Stable Diffusion」がどのような仕組みでテキストから画像を生成するのかを詳しく図解
                                                                                • 英語を母語としない人が書いた文章が「AIにより作成されたもの」と誤検知されている

                                                                                  ChatGPTやBardのような高度な文章作成能力を有するチャットAIの登場により、「AIが作成した文章」を判別するためのツールが求められるようになっており、日本の企業もChatGPTの文章を判別するためのソフトウェアを開発したことが報じられています。しかし、この種のツールは英語を母語としない人が書いた文章を「AIにより作成されたもの」と判別してしまうことが最新の研究により明らかになりました。 GPT detectors are biased against non-native English writers: Patterns https://www.cell.com/patterns/fulltext/S2666-3899(23)00130-7 Programs to detect AI discriminate against non-native English speakers

                                                                                    英語を母語としない人が書いた文章が「AIにより作成されたもの」と誤検知されている