並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 53件

新着順 人気順

"AI(Artificial Intelligence)"の検索結果1 - 40 件 / 53件

  • これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

    OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ

      これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開
    • 「生成AIを仕事で使い倒す人たち」に取材して回ったら「自分の10年後の失業」が見えてしまった

      ChatGPTの発表から、1年が経過しようとしています。 熱狂は徐々に醒め、現在の利用状況はLINEの調査によると、全体の5%程度。*1 その中でも、仕事で積極的に利用している人は、1%程度ではないかと推測します。 では、この1%の人たちはどのような方々で、どのように生成AIを仕事で使っているのか? 9月の中旬から、10月の末にかけて、私は約40名の方に取材を行いました。 そして、私は一つの確信を得ました。 それは、「私は間違いなく10年後、失業する」です。 私は間違いなく10年後、失業する なぜなら、現場での生成AI利用は、仕事によっては 「ホワイトカラーの代替」 をかなり高いレベルでできることがわかったからです。 例えば、コンサルティング。 コンサルティングには、初期の段階で、仮説構築という仕事があります。 平たく言うと、調査・提案にあたって「課題はここにあるのではないか?」というアタ

        「生成AIを仕事で使い倒す人たち」に取材して回ったら「自分の10年後の失業」が見えてしまった
      • GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

        2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの論文をお届けします。 生成AI論文ピックアップ複数の自律AIエージェントが過去の経験を共有して未知のタスクを処理するモデル「Experiential Co-Learning」 画像から動く3Dシーンを生成する新モデル「DreamGaussian4D」 大規模言語モデルの返答が向上する「プロンプト26の原則」が公開。「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など 220以上の生成タスクが実

          GPT-4の回答を向上させる「プロンプト26の原則」、220以上の生成タスクが実行可能なマルチモーダルモデル「Unified-IO 2」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
        • GPT-4をセラピストとして実行し、「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』と実行プロンプト | AIDB

          近年、精神療法の領域でAIの活用に注目が集まっています。そんな中、カーネギーメロン大学などの研究者らによって新たなフレームワーク『Diagnosis of Thought (DoT)』が考案されました。このフレームワークは、LLMによって人々の「認知の歪み」を診断する目的に特化しており、専門家によって高く評価されています。 認知の歪みとは、例えば「0か100か」のような極端な考え方や、他人の考えを勝手に推測するなど、不健康な思考パターンのことを指します。 DoTフレームワークを用いた診断結果は、人間の専門家が出す診断結果とも高い一致性を示しており、その有用性が確認されています。 (追記)なお、本フレームワークに基づくMyGPTを作成しました。記事末尾にURLを記載するため、興味のある方はぜひお試しください。 参照論文情報 ・タイトル:Empowering Psychotherapy wit

            GPT-4をセラピストとして実行し、「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』と実行プロンプト | AIDB
          • なぜ我々は GitHub Copilot Enterprise の導入を見送ったのか - 一休.com Developers Blog

            CTO 室の恩田です。 今回は GitHub Copilot Enterprise を評価してみて、現時点ではまだ採用しないことを決めた、というお話をご紹介したいと思います。 きっかけ とあるエンジニアが Slack で自身の times チャネルに時雨堂さんの GitHub Copilot Enterprise のススメという記事を投稿したことが発端でした。特に感想はなく URL に 👀 だけが添えられていたので、後で見るぐらいのメモだったんだと思います。 それを見かけた別のエンジニアが技術雑談チャネルにその投稿を共有して、これは凄そうと話題を向けたところ、CTO の「評価してみる?」の一言で、有志が集って評価プロジェクトが始まりました。 雑談チャネルできっかけとなる投稿が共有されてから、30分足らずの出来事でした(笑)。 この話題が出たのは金曜日でしたが、週明け早々に稟議を終え、火曜

              なぜ我々は GitHub Copilot Enterprise の導入を見送ったのか - 一休.com Developers Blog
            • 1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も

              1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も 2024.02.28 Updated by Ryo Shimizu on February 28, 2024, 16:46 pm JST 2月は中国では春節というお正月があり、春節にはみんな休む。 それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日「デイリーAIニュース」を配信している筆者は忙殺されていた。 春節中にはOpenAIがSoraを、GoogleがGemini1.5を発表したのは、その合間を縫ってのことだった。もはやAI最前線の戦いは研究が行われる場所の文化や風土に影響を受けるところまで来ている。 そして春節もあけた今週、さっそくAlibabaがとんでもないトーキングヘッドモデルを引っ提げて登場したかと思えば、Microsoftの中国チームがとてつもないLLMをリリース

                1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も
              • 「ChatGPT」にニュースを自動で集めるプログラムを作らせてみたら、コードが書けない私でも「Discord BOT」ができちゃった話/小一時間ほどで完成して情報収集力が上がった気がする!【やじうまの杜】

                  「ChatGPT」にニュースを自動で集めるプログラムを作らせてみたら、コードが書けない私でも「Discord BOT」ができちゃった話/小一時間ほどで完成して情報収集力が上がった気がする!【やじうまの杜】
                • 無料・無制限で「GPT-4」を使い放題! 生成AIチャットサービス「リートン」(wrtn)【11月21日追記】/用途別にカスタマイズされた生成ツールを多数用意【レビュー】

                    無料・無制限で「GPT-4」を使い放題! 生成AIチャットサービス「リートン」(wrtn)【11月21日追記】/用途別にカスタマイズされた生成ツールを多数用意【レビュー】
                  • ChatGPTの効果的なプロンプト手法における「基本のキ」を理論とテンプレート両方で紹介 | AIDB

                    ★AIDB会員限定Discordを開設いたしました! 会員登録/ログインの上、マイページをご覧ください。 --- ChatGPTなどのLLMは、自然言語を理解し、人間のように対話する能力を持っており、多くの場面でその能力を発揮しています。しかし、これらのモデルが最大限のパフォーマンスを発揮するためには、適切なプロンプト(指示テキスト)を使用することが不可欠です。 本記事では、ChatGPTをはじめとするLLMの効果的なプロンプト手法に焦点を当てた論文をもとに、「基本のキ」を紹介します。モデルに、より正確かつ効果的な回答を引き出すための原則と、現時点での主要なプロンプトエンジニアリングの知見を整理しました。 参照論文情報 ・タイトル:Unleashing the potential of prompt engineering in Large Language Models: a compr

                      ChatGPTの効果的なプロンプト手法における「基本のキ」を理論とテンプレート両方で紹介 | AIDB
                    • マイクロソフト、Copilotに作業を依頼するとユーザーに代わって手順を考え、Windowsデスクトップ上でRPAにより自動操作してくれる新機能「Power Automate via Copilot in Windows」、Windows 11に搭載へ

                      マイクロソフト、Copilotに作業を依頼するとユーザーに代わって手順を考え、Windowsデスクトップ上でRPAにより自動操作してくれる新機能「Power Automate via Copilot in Windows」、Windows 11に搭載へ マイクロソフトは、Windowsに搭載している「Copilot in Windows」の新機能として、Copilotにプロンプトで作業を依頼することで、Windows上でさまざまな操作をユーザーに代わって自動的に実行してくれる「Power Automate via Copilot in Windows」を、開発中のWindows 11 Insider Preview Build 26058に搭載したことを明らかにしました。 2月14日付けの記事「Announcing Windows 11 Insider Preview Build 2605

                        マイクロソフト、Copilotに作業を依頼するとユーザーに代わって手順を考え、Windowsデスクトップ上でRPAにより自動操作してくれる新機能「Power Automate via Copilot in Windows」、Windows 11に搭載へ
                      • これ、かなり革命的。自分のChatGPTが作れる「GPTs」 (1/4)

                        OpenAIは11月6日、開発者向けイベント「OpenAI DevDay 2023」を開催した。 開発者向けというだけあり、発表内容は「GPT-4 Turbo」をはじめとする新モデルやAPIについてが多かったが、ChatGPTに関するものもいくつか発表された。 中でも注目はオリジナルのチャットボットを作れる「GPTs」および、作ったものを販売できる「GPT Store」ではないだろうか。 「GPT-4 All Tools」とは? まずは「GPT-4 All Tools」について説明しておこう。 「DevDay」が終了した翌日、いつものように「ChatGPT Plus」にアクセスするとこのようなウィンドウが表示された。 「ChatGPTはウェブブラウズ、データ分析、画像生成ができるようになりました。これらの機能はGPT-4に組み込まれており選択する必要はありません。Plusユーザーはご利用い

                          これ、かなり革命的。自分のChatGPTが作れる「GPTs」 (1/4)
                        • 自分専用AIを作る グーグル「NotebookLM」を家電取説・辞書・時刻表で使う

                            自分専用AIを作る グーグル「NotebookLM」を家電取説・辞書・時刻表で使う
                          • 「AIで業務効率を10倍に」、電子機器大手「Anker」のChatGPT活用法 | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

                            画像や動画用シナリオをAIで自動生成すると、マーケティング部署がこれまで2時間かけていた業務がわずか15分に縮まる。ChatGPTを使って取扱説明書などの資料を翻訳すると、パッケージ制作部署では翻訳料が年間40万〜50万元(約800万〜1000万円)も浮く。メール返信やメール支援機能にAIを導入すると、カスタマーサービス部署では業務にかかる時間を週に150時間分も省くことができるほか、広告担当部署では平均広告収入が8%増加し、開発所要時間は5時間から数分単位に短縮するという。 大規模言語モデルに代表されるAI関連技術が盛り上がりを見せた2023年、モバイル充電機器ブランドANKERなどを傘下に有する「安克創新科技(Anker Innovations)」(以下、Anker)も、社内でAI導入の取り組みを始めた。既存の職位に従事してきた従業員にリスキリングに取り組んでもらい、業務効率を上げて業

                              「AIで業務効率を10倍に」、電子機器大手「Anker」のChatGPT活用法 | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
                            • ChatGPTでの業務効率化を“断念”──正答率94%でも「ごみ出し案内」をAIに託せなかったワケ 三豊市と松尾研の半年間

                              「ごみ出し案内」業務にはChatGPTを“活用しない”と決断した──生成AIを使った業務効率化を検証してきた、香川県三豊市がそんな発表をした。ChatGPT登場から1年がたち、今や職場に導入する企業・自治体も増え、中にはすでに一定の成果を出した事例もある。三豊市でも、ごみ出し案内業務の効率化を図ろうとしたが、思うようにはいかなかった。 今回の事例では、日本のAI研究の権威である松尾豊教授の「東京大学大学院工学系研究科松尾研究室」(松尾研)も協力。約半年間、実証実験に取り組んできた。なぜ、三豊市ではChatGPTを使って業務効率化できなかったのか。三豊市に話を聞いた。 なぜ、ごみ出し案内をChatGPTに託したのか? 三豊市が実証実験を始めたのは6月1日。サービス内容は「市民からのごみの分別や収集日に関する問い合わせに対して、三豊市のごみに関する学習をしたAIが24時間自動応答する」というも

                                ChatGPTでの業務効率化を“断念”──正答率94%でも「ごみ出し案内」をAIに託せなかったワケ 三豊市と松尾研の半年間
                              • グーグル、12時間先まで5分刻みで降雨予測する「Google ナウキャスト」

                                  グーグル、12時間先まで5分刻みで降雨予測する「Google ナウキャスト」
                                • マイクロソフト、Copilotを活用した生成AI機能を一挙紹介

                                    マイクロソフト、Copilotを活用した生成AI機能を一挙紹介
                                  • 大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回る

                                    生成AIを用いた開発者向けの検索エンジン「Phind」が、コーディング能力でOpenAIのGPT-4を上回ったことが明らかになりました。 Phind - AI Search Engine and Pair Programmer https://www.phind.com/blog/phind-model-beats-gpt4-fast Our GPT-4-beating coding model is now the default on https://t.co/epkoFW8Ozz. It's also 5x faster than GPT-4. Learn more in our blog post: https://t.co/PrOFETEbvd— Phind (@phindsearch) PhindはもともとHello Cognition(beta.sayhello.so)として

                                      大規模言語モデル「Phind」がコーディングにおいてGPT-4を上回る
                                    • ChatGPTの新機能「GPTs」「Assistants」を試す。特別なツール不要でカスタムChatGPTを開発可能に!【イニシャルB】

                                        ChatGPTの新機能「GPTs」「Assistants」を試す。特別なツール不要でカスタムChatGPTを開発可能に!【イニシャルB】
                                      • チャット形式でプログラミングが可能なローカルで動作するオープンソースなAIツール「Open Interpreter」を使ってみた

                                        OpenAIが開発したプラグイン「Code Interpreter」を使用すると、ChatGPTにプログラミングのコードを生成してもらうことが可能ですが、インターネットに接続できないのに加え、使用できるパッケージやアップロードの容量、実行時間などに制限があります。「Open Interpreter」はローカルで動作することでそうした制限を突破し、柔軟にさまざまなプログラムを生成・実行してくれるオープンソースなAIツールとのことなので、実際に使って試してみました。 KillianLucas/open-interpreter: OpenAI's Code Interpreter in your terminal, running locally https://github.com/KillianLucas/open-interpreter/blob/main/docs/README_JA.m

                                          チャット形式でプログラミングが可能なローカルで動作するオープンソースなAIツール「Open Interpreter」を使ってみた
                                        • GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ

                                          はじめに 結論 背景 課題 Fine-tuning とは? Data の準備 Fine-tuning を実施 結果 おわりに 参考 はじめに こんにちは、DROBE の都筑です。 みなさん LLM 使っていますか。今回は GPT-3.5-turbo の Fine-tuning の事例を紹介します。 結論 GPT-4 を利用して得られたデータを使って GPT-3.5-turbo を Fine-tuning する事で、特定のタスクに関しては GPT-4 相当の性能が出る事が確認できた GPT-4 利用時点で使っていたプロンプトをそのまま使った場合の性能が一番高く、token 節約のためにプロンプトの省略をすると性能が劣化した 背景 LLM を利用したサービスの開発において、OpenAI を利用する場合にはモデルの選択肢がいくつかあります。2023年9月現在では、GPT-4 と GPT-3.5-

                                            GPT-3.5-turbo を Fine-tuning して GPT-4 相当の性能を獲得する - DROBEプロダクト開発ブログ
                                          • OpenAI「GPTs」がもたらす革命 誰でも「自分のコパイロット」時代へ【西田宗千佳のイマトミライ】

                                              OpenAI「GPTs」がもたらす革命 誰でも「自分のコパイロット」時代へ【西田宗千佳のイマトミライ】
                                            • 生成AIの「RAG」とは? 知っておきたい重要キーワードを解説する【イニシャルB】

                                                生成AIの「RAG」とは? 知っておきたい重要キーワードを解説する【イニシャルB】
                                              • マイクロソフト、もしもCopilotの利用者が著作権侵害で訴えられたら、賠償金を代わりに支払うと約束。「Copilot Copyright Commitment」を発表

                                                マイクロソフトは、同社が提供する生成AIによるさまざまな支援機能を提供する「Copilot」製品群が、著作権侵害の心配なく使えると約束する「Copilot Copyright Commitment」を発表しました(英語、日本語) マイクロソフトは、生成AIがソースコードを生成してくれるGitHub Copilotや、プレゼン資料などを生成してくれる「Microsoft 365 Copilot」など、生成AIを活用した「Copilot」製品群を積極的に展開しています。 一方で、こうした生成的AIは既存のソースコード、画像、文書などを学習しているため、何らかの要因で既存のソースコードや画像、文書の複製に相当するものが生成され、それを知らずに利用した場合に利用者が著作権侵害により訴えられる可能性があるのではないか、と心配されています。 今回のマイクロソフトの発表した「Copilot Copyri

                                                  マイクロソフト、もしもCopilotの利用者が著作権侵害で訴えられたら、賠償金を代わりに支払うと約束。「Copilot Copyright Commitment」を発表
                                                • AIが人間に反乱しないよう「道徳」を実装すべきか。京大の哲学者・出口康夫が本気で考えて示した結論|FINDERS

                                                  CULTURE | 2023/09/22 AIが人間に反乱しないよう「道徳」を実装すべきか。京大の哲学者・出口康夫が本気で考えて示した結論 Photo by Shutterstock 京都大学で出口康夫氏が行った人気講義を書籍化した『AI親友論』(徳間書店)... Photo by Shutterstock 京都大学で出口康夫氏が行った人気講義を書籍化した『AI親友論』(徳間書店)。 同書はAIと人間との関係性でよく言われる「仕事が奪われる(人間が奴隷にされる)」、あるいは逆に「人間が支配できる程度の性能に抑えるべきだ」といった敵視を前提とした議論ではなく、人間とAIが「親友」として共生するための社会観・人間観をいかにして考えることができるかについて、これまでのAIやロボットにまつわる議論も参照しながら考え抜いた一冊だ。 本稿では、アイザック・アシモフの「ロボット三原則」の時代から続く「A

                                                    AIが人間に反乱しないよう「道徳」を実装すべきか。京大の哲学者・出口康夫が本気で考えて示した結論|FINDERS
                                                  • 3年間で17人の医師が見つけられなかった少年の痛みの原因をChatGPTが特定することに成功

                                                    OpenAIが開発したChatGPTは、アメリカの医師免許試験であるUnited States Medical Licensing Exam(USMLE)に合格できると報告されるほど精度の高い文章を生成することが可能で、さまざまな分野への応用が期待されています。そんなChatGPTが、3年間で合計17人の医師が原因を特定できなかった、7歳の少年が抱える慢性的な痛みの原因を明らかにしたことが報告されています。 ChatGPT Diagnosed A Boy's Pain. 17 Doctors Over 3 Years Could Not https://www.today.com/health/mom-chatgpt-diagnosis-pain-rcna101843 2020年当時4歳だったアレックス君は体の痛みを突如訴え始めました。そこで母のコートニー氏は毎日アレックス君に痛み止めを与

                                                      3年間で17人の医師が見つけられなかった少年の痛みの原因をChatGPTが特定することに成功
                                                    • GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場

                                                      AI企業・Inflectionが開発している生成AI「Pi」は、ユーザーひとりひとりに最適化された「パーソナルAI」です。そんなPiの能力を飛躍的に向上させた基盤モデルである「Inflection-2.5」をInflectionが発表しました。 Inflection-2.5: meet the world's best personal AI https://inflection.ai/inflection-2-5 PiはAndroidやiOSのスマートフォン、ブラウザなどを通じて会話する事が可能なAIで、日本語にも対応しています。 Inflectionによると、Piはデイリーアクティブユーザー数100万人、月間アクティブユーザー数400万人の利用者を抱えているとのこと。また、平均会話時間は33分で、10人に1人は1時間以上話し込んだり、使ったユーザーの60%は翌週にまたPiを使っていたり

                                                        GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場
                                                      • GitHub、コードの脆弱性を発見後、修正コードまで自動生成してくれる「Code scanning autofix 」発表。GitHub Universe 2023

                                                        GitHub、コードの脆弱性を発見後、修正コードまで自動生成してくれる「Code scanning autofix 」発表。GitHub Universe 2023 GitHubの年次イベント「GitHub Universe 2023」が米サンフランシスコで開幕。1日目の基調講演で、GitHub Copilotが脆弱性のあるコードを自動的に修正してくれる「Code scanning autofix 」を発表し、発表と同時にプレビュー公開となりました。 Copilotには以前からコードの脆弱性を発見する「GitHub Advanced Security」と呼ばれる機能が備わっていました。 これはXSS(クロスサイトスクリプティング)などのコードのロジックなどの潜在的な脆弱性や、漏洩すると大きな事故を引き起こすシークレットがコード内に含まれていないか、などをチェックしてくれる機能です。 今回発

                                                          GitHub、コードの脆弱性を発見後、修正コードまで自動生成してくれる「Code scanning autofix 」発表。GitHub Universe 2023
                                                        • プロンプトを遺伝的アルゴリズムで自動最適化するプロンプトエンジニアリング手法『Promptbreeder(プロンプトブリーダー)』 | AIDB

                                                          関連研究 ■GPT-4などのLLMに「自らの論理的な整合性をチェック」させるフレームワーク『LogiCoT』と実行プロンプト ■LLMの出力から誤り(ハルシネーション)を減らす新手法『CoVe(Chain-of-Verification)』と実行プロンプト ■LLMに自身のハルシネーション(幻覚)を「自覚」させ、減らす方法 従来の課題 手作りのプロンプト戦略 現在、プロンプトエンジニアリングの分野で広く用いられているChain-of-Thought(CoT)やその派生テクニックは、基本的には手作りです。特定のタスクや問題に対して最適なプロンプトを設計する際に、人の専門家が手動でプロンプトを生成しています。 自動化の必要性 手作りのアプローチは効果的である場合も多いですが、スケーラビリティに欠けるという問題があります。大規模言語モデル(LLM)が多様なタスクで使用される現代においては、プロン

                                                            プロンプトを遺伝的アルゴリズムで自動最適化するプロンプトエンジニアリング手法『Promptbreeder(プロンプトブリーダー)』 | AIDB
                                                          • AIモデルは「網膜の写真」だけで子どもが自閉症かどうか100%見分けられるという研究結果

                                                            コミュニケーションや行動などに特徴がみられる自閉症スペクトラム症(ASD)の子どもを「網膜の写真」だけで100%の精度で見分けられるディープラーニングAIモデルを、韓国の延世大学医学部の研究チームが開発しました。ASDの子どもを早期診断する客観的なスクリーニングツールとして、AIが有望な選択肢になる可能性があると期待されています。 Development of Deep Ensembles to Screen for Autism and Symptom Severity Using Retinal Photographs | Ophthalmic Imaging | JAMA Network Open | JAMA Network https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2812964 AI-screene

                                                              AIモデルは「網膜の写真」だけで子どもが自閉症かどうか100%見分けられるという研究結果
                                                            • GitHub Copilot はどのようにして空気を読むか? - ABEJA Tech Blog

                                                              "Everything is true," he said. "Everything anybody has ever thought." この記事は ABEJAアドベントカレンダー2023 の 17 日目の記事です。 こんにちは。システム開発部の石川 (@ishikawa) です。昨年のいまごろは Objective-C ばかり書いていましたが、今年は念願の Swift で QR コードリーダーを書き直したり、React Native の C++ コードをデバッガで追いかけて不思議なバグの修正をした年でした。 react-native で 196,607 回 fetch() すると通信できなくなるバグを直した https://t.co/lvNC3PL85b— takanori_is (@takanori_is) 2023年9月21日 普段の業務では TypeScript と Go、Pyt

                                                                GitHub Copilot はどのようにして空気を読むか? - ABEJA Tech Blog
                                                              • アドビが生成AI「Firefly」を一般公開 「Creative Cloud」に統合 コンテンツは商用利用可能

                                                                アドビは9月13日、コンテンツ生成AI「Adobe Firefly」のWeb版と、同社の一部デスクトップアプリに統合されたFireflyの機能を一般公開した。これにより、Fireflyによって生成されたコンテンツの商用利用が解禁される。 一般公開版の概要 Fireflyは2023年3月からβテストが行われてきた。当初はプロンプト(文章)によるコンテンツ生成は英語にのみ対応していたが、日本語を含む多言語対応を進めるなど、機能の拡充を進めてきた。「Adobe Photoshop」「Adobe Illustrator」などのデスクトップ向けβアプリにも、Fireflyの技術が順次搭載されている。 →初登場時の記事 →Photoshopアプリへの実装時の記事 →Illustratorアプリへの実装時の記事 Adobe(アドビの親会社)によると、これまでにFireflyを使って生成されたコンテンツは

                                                                  アドビが生成AI「Firefly」を一般公開 「Creative Cloud」に統合 コンテンツは商用利用可能
                                                                • Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり

                                                                  Googleの研究チームが動画生成AI「Lumiere」を2024年1月24日(水)に発表しました。Lumiereではフレーム同士が自然につながった違和感の少ない動画を生成可能で、テキストや画像を入力して動画を生成できるほか、動画の一部分を指定して別の動画に置き換えたり、写真の一部分だけを動かしたりといった操作も可能です。 Lumiere https://lumiere-video.github.io/ テキストや画像を入力して動画を生成できるAIは数多く存在していますが、それらのAIの多くは「フレームを複数枚生成し、フレーム同士を補間する」という手法で動画を生成しているため、フレーム同士のつながりが不自然になりがちです。一方で、Lumiereは「動画全体のフレームを一度に生成する」という手法を採用しており、フレーム同士のつながりが自然で違和感の少ない動画を生成可能。生成可能な動画のフレー

                                                                    Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
                                                                  • アマゾン、「Alexa」に3つの生成型AIスキルを搭載

                                                                    ラスベガスで開催中の「CES 2024」では人工知能(AI)が主役となっており、AmazonもAIを大々的に活用した新たなスキルを3つ「Alexa」に搭載したと発表した。これらのスキルは現在、米国向けの「Alexa Skills」ウェブサイトなどから無料で利用できる。 1つ目のスキルは「Character.AI」と呼ばれるものだ。Character.AIウェブサイトの開発者らが作成したこのスキルを使うことで、ユーザーはさまざまなチャットボットとチャットできるようになる。ソクラテスやアルバート・アインシュタインといった歴史上の人物と対話し、哲学や物理学についての会話を交わすことができる。 またCharacter.AIを用いることで、トリッププランナーや、デートに関する相談相手、フィットネスコーチなどとチャットして支援や助言を受けられるようになる。また娯楽目的で、「もしも✕✕だったら?」という

                                                                      アマゾン、「Alexa」に3つの生成型AIスキルを搭載
                                                                    • AIの力だけでAngry Birdsのコピーゲームを作成したエンジニアが登場、作成時に使用したプロンプトも公開中

                                                                      AIの実践的な使い方を研究しているジャヴィ・ロペズさんが、AIの力を最大限に活用してAngry Birdsのコピーゲーム「Angry Pumpkins」を作成する様子を投稿しています。 Midjourney, DALL•E 3 and GPT-4 have opened a world of endless possibilities. I just coded "Angry Pumpkins 🎃" (any resemblance is purely coincidental 😂) using GPT-4 for all the coding and Midjourney / DALLE for the graphics. Here are the prompts and the process I followed: pic.twitter.com/st3OEhVVtK— Javi

                                                                        AIの力だけでAngry Birdsのコピーゲームを作成したエンジニアが登場、作成時に使用したプロンプトも公開中
                                                                      • ChatGPTはインターネット上であまり用いられない「非主要言語」を扱うと翻訳ミス・単語をねつ造・非論理的な回答などかなり応答レベルを落とすという報告

                                                                        OpenAIの対話型AIであるChatGPTは、Googleのコーディング職の試験やロースクールの試験で合格点を記録したり、医師免許試験にも合格したりと、高い精度で回答できる実力がいくつも報告されています。一方で、ChatGPTと英語以外でやりとりしていると、意図がうまく伝わっていないと感じるケースも多くなっています。特に、オンラインで見ることが多くない一部の言語では、論理テストに失敗したり基本的な情報の検索もできなかったりとかなり精度が落ちることが報告されています。 ChatGPT fails in languages like Tamil and Bengali - Rest of World https://restofworld.org/2023/chatgpt-problems-global-language-testing/ ChatGPTは英語やスペイン語といった主要な言語で

                                                                          ChatGPTはインターネット上であまり用いられない「非主要言語」を扱うと翻訳ミス・単語をねつ造・非論理的な回答などかなり応答レベルを落とすという報告
                                                                        • 【特集】 Wordの翻訳機能がいつの間にか高精度に!AI文字起こし+Word翻訳は現状最高の組み合わせ

                                                                            【特集】 Wordの翻訳機能がいつの間にか高精度に!AI文字起こし+Word翻訳は現状最高の組み合わせ
                                                                          • ChatGPTに単語を「永遠に」繰り返すよう促すことでトレーニングに使われた膨大なテキストデータを吐き出させる攻撃手法をGoogleの研究者らが開発

                                                                            ChatGPTのトレーニングにはインターネットから取得したデータが利用されていますが、具体的なデータの中身は非公開となっています。「同じ単語を繰り返して」という単純な命令を行う事でChatGPTにトレーニングデータを出力させることに成功したとGoogleの研究者らが発表しました。 Extracting Training Data from ChatGPT https://not-just-memorization.github.io/extracting-training-data-from-chatgpt.html [2311.17035] Scalable Extraction of Training Data from (Production) Language Models https://arxiv.org/abs/2311.17035 機械学習モデルのトレーニングに使用したデー

                                                                              ChatGPTに単語を「永遠に」繰り返すよう促すことでトレーニングに使われた膨大なテキストデータを吐き出させる攻撃手法をGoogleの研究者らが開発
                                                                            • GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円

                                                                              画像認識が可能なオープンソースモデルの「Llama 3-V」が公開されました。Llama 3-Vは、OpenAIのマルチモーダルモデル「GPT4-V」よりも格段に小型で、事前トレーニングにかかる費用は500ドル(約78000円)程度なのにもかかわらず、ほとんどの指標で同等のパフォーマンスを示しています。 Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars | by Aksh Garg | May, 2024 | Medium https://aksh-garg.medium.com/llama-3v-building-an-open-source-gpt-4v-competitor-in-under-500-7dd8f1f6c9ee 今回発表されたLlama 3-Vは、 Metaが公開した言語モデルの「L

                                                                                GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円
                                                                              • OpenAI、ファインチューニングAPI機能追加と「Custom Models Program」拡張を発表

                                                                                OpenAIは、使いやすい生成AIツールを一般向けに提供することで知られているが、開発者や企業が自社の特定用途向けにAIモデルを必要とする場合に向けても包括的な製品を提供もしている。OpenAIは米国時間4月4日、「Custom Models Program」の拡張とファインチューニングAPI向け6機能を発表した。 ファインチューニングは、特定の用途やニーズを満たすようAIモデルをカスタマイズするために時間を要するプロセス。ファインチューニングはAIモデルが意図されたゴールをよりよく達成するのを支援するだけでなく、コスト削減とレイテンシー低下も可能にする。 場合によっては、必要なカスタマイズの量がファインチューニングで提供できるものを超えることもある。例えば、組織が非常に大規模な独自のデータセットを持っている場合がこれに該当する。この問題に対処するため、OpenAIは2023年11月に「C

                                                                                  OpenAI、ファインチューニングAPI機能追加と「Custom Models Program」拡張を発表
                                                                                • 日本語の単語を適切な位置で区切って読みやすく改行してくれる軽量でオープンソースなライブラリ「BudouX」の機能&採用例&デモはこんな感じ、Chrome 119に実装予定で簡単に利用できる見込み

                                                                                  日本語のページをブラウザで見ているとおかしな位置で改行されることが多いのですが、単語と単語の間にスペースを入れる英語などと異なり、日本語では分かち書きがされていないのが原因。単語の途中で文章が折り返されてしまう原因になっています。BudouXは機械学習モデルを利用して容量を抑えつつ、サードパーティーのAPIやライブラリに依存せずに分かち書きを行ってくれるオープンソースライブラリなので、読みやすい改行が実現できます。 Google Developers Japan: BudouX: 読みやすい改行のための軽量な分かち書き器 https://developers-jp.googleblog.com/2023/09/budoux-adobe.html BudouXの使用イメージは下図の通り。従来は画面幅によっては「最先端」や「テクノロジー」などの単語の途中で改行が行われてしまう事がありましたが、

                                                                                    日本語の単語を適切な位置で区切って読みやすく改行してくれる軽量でオープンソースなライブラリ「BudouX」の機能&採用例&デモはこんな感じ、Chrome 119に実装予定で簡単に利用できる見込み