並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 430件

新着順 人気順

language-modelの検索結果121 - 160 件 / 430件

  • 速報:話題の 1ビットLLMとは何か?|寺田英雄(㈱オープンストリームCTO)

    2024-02-27にarXiv公開され,昨日(2024-02-28)あたりから日本のAI・LLM界隈でも大きな話題になっている、マイクロソフトの研究チームが発表した 1ビットLLMであるが、これは、かつてB-DCGAN(https://link.springer.com/chapter/10.1007/978-3-030-36708-4_5; arXiv:https://arxiv.org/abs/1803.10930 )という「1ビットGANのFPGA実装」を研究していた私としては非常に興味をそそられる内容なので、論文を読んでみた。今回は速報として、その内容のポイントを概説したい。 論文情報 Ma, S. et al. (2024) ‘The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits’, arXiv [c

      速報:話題の 1ビットLLMとは何か?|寺田英雄(㈱オープンストリームCTO)
    • フリーで使える日本語の主な大規模言語モデル(LLM)まとめ

      ありがとうございます! 実は私本人がそのモデルの構築に関わっているのですが、詳細はまだ言えない状況です...。 来年3月の言語処理学会年次大会(NLP2023)での続報をお待ちください!このモデルに関する論文が公開される予定です(一応それを待ってからこの記事にも掲載します)。 (私が書いたものではありませんが、現段階で公開できる情報をまとめた記事があります: https://note.com/utokyo_itc/n/nb18b2a753f23 )

        フリーで使える日本語の主な大規模言語モデル(LLM)まとめ
      • メタファー空間でGPT4に発散と抽象化をさせてから具体化する - 西尾泰和のScrapbox

        あるメタファーの空間において二つのメタファーの対比(B)についてGPT4に列挙(1)させ、それからその対比を抽象化(2)させる。その後、抽象化した対比を異なるドメインに応用して具体化(3)させた

          メタファー空間でGPT4に発散と抽象化をさせてから具体化する - 西尾泰和のScrapbox
        • 最強のツール「LangSmith」が登場した話【Python / LangChain】

          【📩 仕事の相談はこちら 📩】 お仕事の相談のある方は、下記のフォームよりお気軽にご相談ください。 https://forms.gle/G5g1SJ7BBZw7oXYA7 もしもメールでの問い合わせの方がよろしければ、下記のメールアドレスへご連絡ください。 info*galirage.com(*を@に変えてご送付ください) 🎁 「生成AIの社内ガイドライン」PDFを『公式LINE』で配布中 🎁 「LINEで相談したい方」や「お問い合わせを検討中の方」は、公式LINEでご連絡いただけますと幸いです。 (期間限定で配信中なため、ご興味ある方は、今のうちに受け取りいただけたらと思います^^) https://lin.ee/3zRuqKe おまけ①:生成AIアカデミー より専門的な「生成AIエンジニア人材」を目指しませんか? そんな方々に向けて、「生成AIアカデミー(旧:生成AIエンジニア

            最強のツール「LangSmith」が登場した話【Python / LangChain】
          • ChatGPTに共通テストの英語を解かせてみたら77%取れた

            今日は 2023 年共通テスト 1 日目です。 ということで、ChatGPT に 2022 年および 2023 年(追記1)の共通テストの英語(リーディング)問題を解かせてみたところ、ともに100 点満点中 77 点を獲得したのでその結果をまとめます。 前提: ChatGPT とはChatGPT2 とは、2022 年の 11 月末 に OpenAI がリリースしたチャットボットです。従来の AI チャットボットに対する期待を大きく超える自然な会話や理解力の高さが世界中で話題となり、リリース以降話題に事欠かない存在になっています。 GPT-3.5 というモデルが基礎となっており、インターネット上の膨大なデータを学習した大規模言語モデルと呼ばれる技術がベースになっています。 本記事執筆時点で ChatGPT は Research Preview の段階で、制限はありながらも無料で利用することが

              ChatGPTに共通テストの英語を解かせてみたら77%取れた
            • 手軽にExcelへ「ChatGPT」を組み込めるMicrosoftの実験アドイン「Excel Labs」を使ってみた【残業を減らす!Officeテクニック】

                手軽にExcelへ「ChatGPT」を組み込めるMicrosoftの実験アドイン「Excel Labs」を使ってみた【残業を減らす!Officeテクニック】
              • チャット機能を搭載した新しいBingが使えるようになったので早速試してみた2|IT navi

                昨日(2023年2月10日)、「チャット機能を搭載した新しいBingが使えるようになったので早速試してみた」という記事を公開しましたが、ほかにも色々と試してみましたので、前回の続きとして報告します。 新しいBingの概要などが知りたい方は、以下の記事を参考にしてください。 1.ショートストーリーの作成 Bingにショートストーリーを作成してもらいました。1行指示するだけで、簡単にこんな物語を作成してくれます。 問 かわいいシーズーの子犬が活躍する物語を作って 答 こんにちは、こちらはBingです。かわいいシーズーの子犬が活躍する物語を作りますね。😊 以下が私が作った物語です。楽しんでください。 シーズーの子犬のモコは、いつも元気で好奇心旺盛な子でした。彼は飼い主のリカと一緒に暮らしていましたが、リカは仕事が忙しくてあまり遊んでくれませんでした。そこでモコは、リカが仕事に出かけた後に、家の

                  チャット機能を搭載した新しいBingが使えるようになったので早速試してみた2|IT navi
                • OpenAIがChatGPTなどのツールやサービスの利用規約を改定、従来よりも明確で具体的な禁止例が示される

                  OpenAIが開発した「ChatGPT」などのチャットAIは、研究論文の著者に名を連ねたり、経営学修士課程(MBA)の最終試験に合格したりと、まるで人間のような文章を生成することが可能です。しかし他者を傷付けるコンテンツなどを無制限に生成することは認められておらず、OpenAIはChatGPTをはじめとするツールやサービスの使用について2023年3月23日に利用規約を改定し、これまでよりも明確かつ具体的な利用規約を示しました。 Usage policies https://openai.com/policies/usage-policies OpenAIは「私たちは、誰もが私たちのツールを安全かつ責任を持って使用できるようにしたいと考えています。そのため、OpenAIのモデル、ツール、サービスのすべてのユーザーに適用される利用規約を作成しました」と述べ、以下の行為を禁止しています。 ◆使用

                    OpenAIがChatGPTなどのツールやサービスの利用規約を改定、従来よりも明確で具体的な禁止例が示される
                  • はじめに|ITエンジニアのためのプロンプトエンジニアリング

                      はじめに|ITエンジニアのためのプロンプトエンジニアリング
                    • 最強ローカルLLM実行環境としてのEmacs

                      みなさん、ローカルLLMで遊んでいますか? 昨年末に、Ollamaが登場してから誰でも簡単にローカルLLMで遊べる時代がやってきました。そこで、僕もローカルLLMでどんなことができるんだろうと思って触りはじめたのですが、ローカルLLMを最大限に活用するためには、まずはどうやったらEmacsからローカルLLMを使えるようになるのかと考えるのはあまりにも自然な流れでした。 この記事では、ローカルLLMに関する基本的な知識から、EmacsからローカルLLMを扱う方法までを解説していきたいと思います。 ローカルLLMの基礎知識 # ローカルLLMとは、LLM(大規模言語モデル)をローカル環境、つまり自分のパソコンで扱えるようにしたモデルです。Facebookが開発しているLlamaが業界のトップランナーで、それをベースにしたモデルを色々な組織(中には個人もいるのかも)が開発しています。 そのLla

                        最強ローカルLLM実行環境としてのEmacs
                      • [速報]マイクロソフト、ChatGPTベースの「Microsoft 365 Copilot」を発表。AIがExcelの数字を分析しグラフ化、PowerPointを自動生成、長いメールを要約など

                        [速報]マイクロソフト、ChatGPTベースの「Microsoft 365 Copilot」を発表。AIがExcelの数字を分析しグラフ化、PowerPointを自動生成、長いメールを要約など マイクロソフトはオンラインイベント「The Future of Work: Reinventing Productivity with AI」を開催し、Microsoft 365にChatGPTベースのAI機能を組み込んだ「Microsoft 365 Copilot」を発表しました。 Microsoft 365 Copilotは今後数カ月以内にWordやExcel、PowerPoint、Outlook、Teamsなどすべてのプロダクティビティ製品群に搭載される予定。利用料金やライセンス形態などは今後発表予定とのこと。 デモで紹介されたMicrosoft 365 Copilotの主なポイントをまとめま

                          [速報]マイクロソフト、ChatGPTベースの「Microsoft 365 Copilot」を発表。AIがExcelの数字を分析しグラフ化、PowerPointを自動生成、長いメールを要約など
                        • LLM時代のX情報収集術|べいえりあ

                          AI for Everyoneについては日本語版もあるのと、どちらのコースも日本語字幕付きで見られる(多分機械翻訳での英語字幕からの翻訳だが、翻訳の質は悪くない)ので、英語分からなくてある程度何とかなるんじゃないかと思います。 あと、余力のある人、最新のNLP研究を理解したい人はこちらの本を読むことをオススメします。アルゴリズムの詳細は必ずしも理解しなくても良いですが、どんなタスクがあるのかは理解しておいた方が良いかと思います。 NLPの知識がLLMを応用する上で実際にどう役に立つかですが、例えばで言うとNLP的には対話の中には「タスク指向型対話(task-oriented dialogue)」と「雑談(chit-chat dialogue)」があります。それぞれ対話の中で重要視されるものから評価の仕方まで全然違うのですが、NLPをやらずにLLMをやっている人と話しているとこれらをごっちゃ

                            LLM時代のX情報収集術|べいえりあ
                          • ニューヨーク・タイムズの訴訟でChatGPTが立往生の可能性(野口 悠紀雄) @gendai_biz

                            ChatGPTの事前学習データの使用料をめぐって、ニューヨーク・タイムズがOpenAIを訴えました。これは、情報の価値がどのようにして生じるかという問題の基本に関わるものであり、生成AIの将来に大きな影響を与えます。しかし、簡単に答えが出るものではありません。 裁判の結果次第ではChatGPTが成り立たない 米紙ニューヨーク・タイムズは、ChatGPTの開発者であるOpenAIに対して、事前学習のデータの利用に関して支払いを求める訴訟を起こしました。 この問題は、「情報や知識に関する社会的制度をどう構築するか?」という問題の本質に関わっており、大変重要です。 最初にこれまでの経緯を見ると、ニューヨーク・タイムズはその記事を無断でAIの訓練に用いることを禁止しています。したがって、OpenAIが事前学習でニューヨーク・タイムスの記事を使っていないと証明できない限り、罰金を言い渡されることにな

                              ニューヨーク・タイムズの訴訟でChatGPTが立往生の可能性(野口 悠紀雄) @gendai_biz
                            • LLMを使ったアプリケーション開発の基本とLangChain超入門

                              書籍はこちら:https://www.amazon.co.jp/dp/4297138395 === ChatGPTのAPIが公開されたころから、多くの組織が大規模言語モデル(LLM)を使ったアプリケーション開発に取り組むようになりました。LLMを使ったアプリケーション開発では、「LangChain」というフレームワークも大きく注目されています。 しかし、「LLMやLangChainが話題なのは知っているが、具体的なことは分からない」「この分野に興味を持っているが、勉強するきっかけを持てずにいる」といった方も少なくありません。 そこでこの講演では、LLMを使ったアプリケーション開発がなぜ盛り上がっているのか、どのように開発するのかといった基本から始めて、LangChainの基礎知識まで概説します。 === イベントページ:https://forkwell.connpass.com/event

                                LLMを使ったアプリケーション開発の基本とLangChain超入門
                              • 検索チャットボット狂想曲:ChatGPTに翻弄されるGoogleのご乱心 | p2ptk[.]org

                                検索チャットボット狂想曲:ChatGPTに翻弄されるGoogleのご乱心投稿者: heatwave_p2p 投稿日: 2023/2/262023/2/26 Pluralistic 真に驚くべきことは、検索の未来が関連資料へのリンクではないとMicrosoftが判断したことではない。検索の未来が虚言癖のあるチャットボットが吐き出した華美なパラグラフにあると判断したことだ。さらに注目すべきは、Googleもそれに同調していることである。 Bingに何十億ドルと費やしてきたのに、見向きもされてこなかった。その意味では、バカをやらかしたほうが成功の可能性はあるのかもしれない。だが、世界の検索シェアの90%以上を占める独占企業のGoogleが、なぜMicrosoftと同じ崖から飛び降りなきゃならないのか。 この件に関して、ダン・ホンのMastodonスレッドが実におもしろかった。彼はBingとGoo

                                  検索チャットボット狂想曲:ChatGPTに翻弄されるGoogleのご乱心 | p2ptk[.]org
                                • Introducing ChatGPT and Whisper APIs

                                  Developers can now integrate ChatGPT and Whisper models into their apps and products through our API. ChatGPT and Whisper models are now available on our API, giving developers access to cutting-edge language (not just chat!) and speech-to-text capabilities. Through a series of system-wide optimizations, we’ve achieved 90% cost reduction for ChatGPT since December; we’re now passing through those

                                    Introducing ChatGPT and Whisper APIs
                                  • AIでスーパーマリオのステージを生成する「MarioGPT」発表。土管多め、敵少なめなど自然言語で指示 | テクノエッジ TechnoEdge

                                    著書に『宇宙世紀の政治経済学』(宝島社)、『ガンダムと日本人』(文春新書)、『教養としてのゲーム史』(ちくま新書)、『PS3はなぜ失敗したのか』(晋遊舎)、共著に『超クソゲー2』『超アーケード』『超ファミコン』『PCエンジン大全』(以上、太田出版)、『ゲーム制作 現場の新戦略 企画と運営のノウハウ』(MdN)など。 昨年11月にOpenAIがChatGPTを公開して以来、Googleの「Bard」やマイクロソフトの新たなBing検索エンジンやEdgeブラウザーも会話型AIサービスの大波に乗る事態となっています。 どれもが質問に対して自然な文体で賢い回答が期待されているなか、同じく言語モデルを使って『スーパーマリオブラザーズ』のステージを自動生成する「MarioGPT」の研究が公開されました。 コペンハーゲンIT大学研究チームは、「スーパーマリオ」のレベル(ステージ)を生成する新たな手法につ

                                      AIでスーパーマリオのステージを生成する「MarioGPT」発表。土管多め、敵少なめなど自然言語で指示 | テクノエッジ TechnoEdge
                                    • プロンプトインジェクション対策|ChatGPT APIのLINEボットを一ヶ月運用して戦った記録 - Qiita

                                      ChatGPTのチャットボットを安全に運用する方法 プロンプトインジェクションは、不適切な文字列や悪意のあるコードを含むプロンプトがChatGPTに送信されることで発生するセキュリティ上の懸念です。 2023/04/11現在、LINEボットとして公開されている多くのサービスでプロンプトインジェクション対策がなされていないようです。この記事では、プロンプトインジェクション対策の背景や具体的なプロンプトの例を紹介し、ChatGPT APIを安全に利用する方法を説明します。 背景 ChatGPT APIは、OpenAIが開発した大規模な言語モデルで、自然言語処理のタスクを実行するために利用されます。しかし、APIを利用する際にはセキュリティ上の問題が生じることがあります。プロンプトインジェクションはその一例で、攻撃者が意図的に悪意のあるプロンプトを送信することで、システムやユーザーに悪影響を与え

                                        プロンプトインジェクション対策|ChatGPT APIのLINEボットを一ヶ月運用して戦った記録 - Qiita
                                      • 社内情報検索システムで用いられるRAGの4つの実装方法

                                        2 松本 和高
 株式会社エクスプラザ リードエンジニア
 X: _mkazutaka
 Github: mkazutaka
 18年にバックエンドエンジニアとしてメルカリに入社。その後、ミラ ティブ、フリーランスを得て株式会社エクスプラザに所属。フロント エンドからバックエンドまで幅広く開発しています。趣味で、FXの自 動売買Botを作成している
 現在08/30に第一子が生まれ現在育休中
 https://note.com/mkazutaka/n/n9f0e2c4dee96 CONFIDENTIAL INFORMATION: Not for Public Distribution - Do Not Copy 3 株式会社エクスプラザ (EXPLAZA, Inc.) 会社名 プロダクトの力で、豊かな暮らしをつくる ミッション 代表取締役CEO 高橋一生 代表者 2020年07月03日 設

                                          社内情報検索システムで用いられるRAGの4つの実装方法
                                        • 病院で使えるChatGPT命令文3選|患者視点の医療経営 長 英一郎

                                          ここ数日いくつかのクライアント病院に訪問し、ChatGPTについて議論させていただきました。現場の業務を劇的に改善させる可能性のある命令文(プロンプト)の3選をご紹介させていただきます。 命令文のいずれもシェア、使用は自由です!どんどんパクっていただいて現場の業務効率化に活かしていただきたいです。 患者名などがサンプル命令文に入っていますが、実際に使う場合には学習に使われる場合がありますので、学習されないよう下記のように設定変更をオススメします。 学習されないようチェックを外すChatGPTを使って少しでも医療従事者の皆様が患者さんと接する時間が増えますように。 当直表の作成については、こちらの記事を参考にさせていただきました。genkAIjokyo先生ありがとうございました! 献立表👇 質問例👇 私は管理栄養士です。病院で高齢者が食べたくなるような朝、昼、夜の3食の献立を考えています

                                            病院で使えるChatGPT命令文3選|患者視点の医療経営 長 英一郎
                                          • AWSの構成図をChatGPT(GPT-4V)に読み込ませてIaCコードを生成してみた | DevelopersIO

                                            こんにちは、つくぼし(tsukuboshi0755)です! 最近ChatGPTがGPT-4Vを発表し、AI業界がさらに盛り上がりを見せてますね。 GPT-4Vを用いる事で、ChatGPTがユーザ側から入力された画像を読み取った上で、応答を返してくれるようになります。 GPT-4V(ision) system card この機能追加により、なんと以下のようにAWSの構成図を読み取って、IaCコードを生成できる事が話題になっていました。 本日をもって引退します pic.twitter.com/fygAQDQ5kj — 電気ひつじ(onoteru) (@teru0x1) October 13, 2023 これを見て私もGPT-4Vを試してみたくなったので、今回はChatGPTを使って、様々なAWSの構成図を入力し、どこまで正確にIaCコードを生成できるか確認してみます! GPT-4Vを利用する際

                                              AWSの構成図をChatGPT(GPT-4V)に読み込ませてIaCコードを生成してみた | DevelopersIO
                                            • GoogleのAI「Bard」、YouTube動画の内容要約も可能に

                                              米Googleは11月21日(現地時間)、生成AIチャット「Bard」が「YouTube動画を理解する能力の第一歩を踏み出した」と発表した。 同社は9月に、YouTubeからリアルタイム情報を取得できるようにしているが、今回のアップデートで、動画の概要や、長い動画のどの当たりで目的の情報が得られるかなどを答えられるようになったようだ。 Googleは例として、ケーキのレシピ動画を探している場合、そのレシピに必要な卵の数を尋ねられるようになるとしている。 「美味しいミルクティーの入れ方を紹介するYouTube動画から、手順を教えてください」と尋ねたところ、複数の画像入りの説明が表示された。最初の手順に「ティーポットに水と紅茶を入れ」とあるが、それがどのようなYouTubeからの情報かは不明だ。 画像をクリックするとYouTube動画ではなく、画像を掲載しているWebサイトに飛ぶ。 「ポトフの

                                                GoogleのAI「Bard」、YouTube動画の内容要約も可能に
                                              • 【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します!|Jun Ito

                                                安野たかひろ事務所 技術チームリーダーの伊藤です。 安野は大学時代の友人で、彼が今回の選挙戦で実現しようとしている、老若男女の意見を募り、誰も取り残さないことを旨とする選挙活動・民主主義の形に共感し、ぜひ力になりたいと思いPdM・エンジニアとして手伝いをしております! この記事では、先日公開になった「AIあんの」のシステムについて、技術者の観点から、実現しようとしている状態と、技術的な裏側について解説してみようと思います。 AIあんのとはAIあんのは、安野たかひろの政策を学習したAI応答システムが、本人のアバターと声色によって、Youtube Liveと電話という2つの経路で、みなさまのご意見やご質問に回答するシステムです。 配信でAIあんのに質問したい場合は、以下からアクセスしてみてください。 (URLは変更になる場合があります。その際はアカウントから配信を探してみてください。) また電

                                                  【都知事選2024】AIによるマニフェストへの質疑応答システム「AIあんの」の裏側を公開します!|Jun Ito
                                                • 生成AIの利用ガイドライン作成のための手引き|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

                                                  第1 本手引きについて 1 本手引きの利用目的 本手引きは以下の目的に利用されることを想定しています。 ① 生成AIサービスの導入を検討している企業の経営陣・セキュリティ部門・法務部門が導入に際しての法的リスク評価や、社内独自の生成AI利用ガイドラインを作成する際の参考にする。 ② フリーランスの方や、所属する会社・機関に生成AI利用ガイドラインがない方が、生成AIサービス利用の際の注意事項を把握する。 ③ 生成AIサービスを開発・提供する事業者がサービス・システム設計の参考にする。 2 本手引きが対象とする生成AIサービス ChatGPTのようなLLM(大規模言語モデル)を利用した文章生成AIサービスを主たる対象としますが、画像生成AIサービスについても必要な限度で触れます。 3 本手引きの構成 生成AIサービスは、いずれのサービスも基本的に「ユーザーが何らかのデータを入力して何らかの処

                                                    生成AIの利用ガイドライン作成のための手引き|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
                                                  • Llama 3.1

                                                    The open source AI model you can fine-tune, distill and deploy anywhere. Our latest models are available in 8B, 70B, and 405B variants.

                                                      Llama 3.1
                                                    • ついにご家庭にやってきたシンギュラリティ。AIサイエンティストが勝手に仮説を立て、実験して、論文を書く|shi3z

                                                      SakanaAIがまた面白い研究を発表した。その名も「AI Scientist(AI科学者)」 AIの研究をする科学者ではなく、科学者をやるAIである。 しかもすごいのは、基本的に難しいAIはすべてクラウド上で動作する(GPT-4oやOpenRouter対応LLMなど)ので、ご家庭で手軽に遊ぶことができる。AIの実験をする場合はGPUくらいは欲しいところだが、AIじゃないものを研究する場合はGPUすら不要だ。 実際に動かしてみると様々な罠があるぞ(まだ) AI-Scientistの使い方は簡単・・・とまではいかないが、templateを書いて「こういう仮説があるんだよね」というアイデアをいくつかseed_ideas.jsonに書いてあとは電子レンジでチンするが如く実行するだけだ。 ただ、記事執筆時点(2024/8/13 18:50 JST)では、リポジトリが不完全なのか書かれた通りにコマン

                                                        ついにご家庭にやってきたシンギュラリティ。AIサイエンティストが勝手に仮説を立て、実験して、論文を書く|shi3z
                                                      • AWSの生成AIで社内文書検索! Bedrockのナレッジベースで簡単にRAGアプリを作ってみよう - Qiita

                                                        生成AI、流行ってますね! 今みんながやってる「社内文書検索」アプリ、いわゆるRAGアーキテクチャをAWSで簡単に作ってみましょう。1時間程度でサクッと試せるハンズオンです。 そもそもBedrockって何だっけ? こちらの資料で紹介していますので、お時間ある方はご覧ください! 0. 事前説明 このハンズオンで実施することは以下です。 今回作成するアプリケーションの構成イメージ 1. 環境準備 以下の部分を作成していきます。 1-1. AWSアカウント作成 以下の手順でAWSアカウントを新規作成してください。 クレジットカード情報が必要です。ログイン用のEメールアドレスとパスワードをお忘れなく! ※アカウント作成を複数名で同時に実施する場合、同じネットワークを利用すると不正検知に引っかかり、SMS認証から先にうまく進めない可能性があります。20名を超える場合は、会場Wi-Fiとテザリングを使

                                                          AWSの生成AIで社内文書検索! Bedrockのナレッジベースで簡単にRAGアプリを作ってみよう - Qiita
                                                        • Zennへのスパム投稿が急増したのでLLMでなんとかした話

                                                          はじめに Zennチームの吉川(dyoshikawa)です。 2024年6月頃より、Zennにいわゆるスパム投稿が急増したため、LLM(生成AI)を活用してのスパム投稿自動検出の仕組みを構築しました。 目的の性質上、あまり詳細については開示できないのですが、技術的な知見の共有のため、そして可能な限りコミュニティへ運営チームの取り組みをオープンにしたいという思いがあり本件の概要を紹介したいと思います。 課題 2024年6月頃より、Zennにスパム投稿が急増しました。それに伴いユーザの違反報告が増加したことで我々Zennの運営メンバーも事態を認識することになりました。 スパム投稿が読者の目に触れることが定常化することは避けたいですし、その都度違反報告をしてくださるユーザの負担も大きなものだろうという思いがあり、対策を進めることになりました。 解決策 この状況に対して、ある程度自動でスパム投稿を

                                                            Zennへのスパム投稿が急増したのでLLMでなんとかした話
                                                          • 日本語に特化した大規模言語モデル(生成AI)を試作|2023年|NICT-情報通信研究機構

                                                            国立研究開発法人情報通信研究機構(NICT(エヌアイシーティー)、理事長: 徳田 英幸)は、ユニバーサルコミュニケーション研究所データ駆動知能システム研究センターにおいて、独自に収集した350 GBの日本語Webテキストのみを用いて400億パラメータの生成系の大規模言語モデルを開発しました。今回の開発を通し、事前学習用テキストの整形、フィルタリング、大規模計算基盤を用いた事前学習等、生成系の大規模言語モデル開発における多くの知見を得ました。現在は、更に大規模な1,790億パラメータの生成系大規模言語モデル(OpenAI社のGPT-3と同等規模)の学習を実施中で、また、学習用テキストの大規模化にも取り組んでいます。今後、共同研究等を通して民間企業、国研、大学等と協力して、日本語の大規模言語モデルの研究開発や利活用に取り組む予定です。 NICTでは、これまでWebページを収集し、インターネット

                                                              日本語に特化した大規模言語モデル(生成AI)を試作|2023年|NICT-情報通信研究機構
                                                            • 実践!大規模言語モデル / 1000億パラメータ越えモデルを動かすには?

                                                              こんにちは。Turing株式会社の機械学習チームでインターンをしている九州大学修士1年の岩政(@colum2131)です。 Turingは完全自動運転EVの開発をするスタートアップです。 自動運転技術において、カメラやセンサ情報は正確な制御をする上で不可欠な要素である一方、自然言語やマルチモーダルな処理が必要となる状況もしばしば存在します。特に完全自動運転車においては、音声認識によってドライバーの音声命令を認識し、リアルタイムで適切な制御を行うことや、複雑な交通状況の背景にあるコンテクストを理解させるといった要求が出てきます。そのために、「基盤モデル」と呼ばれるような、自然言語処理を含む大規模モデルの学習が必要になってくると、私たちは考えています。 そこで本記事では、言語モデルの発展の流れとTuringが目指す基盤モデルの開発について紹介します! 1. 言語モデルとは? 近年の言語処理モデ

                                                                実践!大規模言語モデル / 1000億パラメータ越えモデルを動かすには?
                                                              • 無料で始めるAmazon CodeWhisperer on VSCode(Github Copilotと同等の性能?) - Qiita

                                                                無料で始めるAmazon CodeWhisperer on VSCode(Github Copilotと同等の性能?)AmazoncopilotCodeWhisperer 現在の AIを一言で説明すると・・・ フミコ・フミオさんはTwitterを使っています: 「ほぼ全員がご高齢者の会社上層部からの「対話型AI とは何かその功罪について簡潔に分かりやすく出来たら一言で説明しろ」という難題にヤケクソで「ドラえもんです」と答えたら「便利だけど取扱注意ということだな」とほぼ正解な認識をしてくれたので藤子・F・不二雄先生は偉大すぎる。」 / Twitter Github Copilot と Amazon CodeWhisperer の比較 現時点では Github Copilot の方が使いやすい。 単純な機能だと同じくらいだが、 Github Copilot は、コマンドパレットがあるので、その

                                                                  無料で始めるAmazon CodeWhisperer on VSCode(Github Copilotと同等の性能?) - Qiita
                                                                • ChatGPTにgitのリポジトリ渡すと全ソースコード.txtをダウンロードさせてくれるやつ〜〜〜〜(AIに食わせるコード一覧が欲しい時用)

                                                                  クレデンシャル含むソースコードをChatGPT等のクラウドLLMサービスにアップロードしないでください。 今回のプロンプトはオープンなリポジトリのみを対象としており、シェルスクリプトが実行される環境もChatGPT側のクラウド上のサンドボックス内のみを想定しています。 ローカル環境では以下のシェルスクリプトをそのまま実行せずに、ご自身が作成したシェルスクリプトを利用してください。 以下はソースコードのプロジェクトルートで実行することで、ソースコードのダンプを.txt形式でダンプするシェルスクリプトです。 \`\`\` #!/bin/bash # バイナリファイルかどうかを判定する関数 is_binary_file() { local file="$1" local file_output file_output=$(file "$file") if [[ "$file_output" ==

                                                                    ChatGPTにgitのリポジトリ渡すと全ソースコード.txtをダウンロードさせてくれるやつ〜〜〜〜(AIに食わせるコード一覧が欲しい時用)
                                                                  • ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する | gihyo.jp

                                                                    いまからわかる!ChatGPT活用プログラミング ChatGPT APIのFunction callingを使って⁠⁠、請求書の構造化データを抽出する 先月、OpenAIからFunction calling(関数呼び出し)機能がリリースされました。これが何なのか、何のために使うべきなのか、ちょっと見ただけでは分かりづらいと思います。 今回は請求書から情報抽出をするというよくありがちなケースを題材に、Function callingの利便性を示してみます。 Function callingとは OpenAIが2023年6月13日にリリースしたChat APIの追加機能です。主にできることとして以下の3つが挙げられています。 外部ツールを呼び出して質問に答えるチャットボットを作成する 自然言語を内部APIの呼び出しやSQLに変換する テキストから構造化データを抽出する たとえば天気予報と血液型

                                                                      ChatGPT APIのFunction callingを使って、請求書の構造化データを抽出する | gihyo.jp
                                                                    • Introducing OpenAI Japan

                                                                      As we grow our operations internationally, we’re expanding into Asia with a new office in Tokyo, Japan. We are committed to collaborating with the Japanese government, local businesses, and research institutions to develop safe AI tools that serve Japan’s unique needs and to unlock new opportunities. We chose Tokyo as our first Asian office for its global leadership in technology, culture of servi

                                                                        Introducing OpenAI Japan
                                                                      • TypeScriptでGPT-3.5を使ってChatGPTクローンを作る1 - GPTで検索エージェント

                                                                        OpenAI が提供している ChatGPT は非常に面白いですね。今年以後、GPTやChatGPT周りがさらに流行ると思います。 この記事は、TypeScriptでChatGPTクローンを作る第一弾です。長くなりすぎるため、この記事では、GPTを使った検索エージェントを実行するまでを取り上げます。 検索エージェントは「ぼっち・ざ・ろっくの作者は?」と尋ねたら検索エンジンとGPTを使って「はまじあき」という結果を生成できる技術です。 またこの記事や、続く記事でLangChainのプロンプトをあれこれ読み解いていこうと考えています。 筆者は機械学習の初心者であるため、間違ったことが書かれている可能性があります。間違いがあった場合は、ぜひご指摘いただけると幸いです。 なお、この記事では添削にChatGPTおよびGPT-3.5を使っています[1]。 どうやってTypeScriptでChatGPT

                                                                          TypeScriptでGPT-3.5を使ってChatGPTクローンを作る1 - GPTで検索エージェント
                                                                        • UbisoftのNPCセリフAI生成ツール「Ghostwriter」発表。“その他大勢”のセリフ作成をAIに任せる時短ツール - AUTOMATON

                                                                          「Ghostwriter」は、ゲーム内のNPCが発するセリフや声を、AIを用いて生成するツールだという。一般的にオープンワールドゲームにおいては、主要なキャラとは別に雑多なNPCが配置される。雑多なNPCといえどもゲーム内世界にリアリティをもたせる存在であり、状況に応じてさまざまなセリフが用意されることも多い。従来は、そうしたセリフもシナリオチームが手がける必要があった。「Ghostwriter」はその手間を省くツールとなるわけだ。 「Ghostwriter」を用いる際にはキャラを作成し、そのキャラが置かれた状況や経験する出来事といった変数とともに入力。すると、AIによってさまざまなセリフが生成されるという。シナリオチームは生成されたセリフを草案にして、雑多なNPCのセリフを仕上げることが可能になるそうだ。 動画の30秒ごろでは、実際に「Ghostwriter」を用いている様子も確認できる

                                                                            UbisoftのNPCセリフAI生成ツール「Ghostwriter」発表。“その他大勢”のセリフ作成をAIに任せる時短ツール - AUTOMATON
                                                                          • 「ひろゆきの論破芸は時代の象徴」西田亮介氏が説く「ネットとのつきあい方」 | FRIDAYデジタル

                                                                            ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標 (登録番号 第6091713号) です。 ABJマークについて、詳しくはこちらを御覧ください。https://aebs.or.jp/

                                                                              「ひろゆきの論破芸は時代の象徴」西田亮介氏が説く「ネットとのつきあい方」 | FRIDAYデジタル
                                                                            • LLM Visualization

                                                                              A 3D animated visualization of an LLM with a walkthrough.

                                                                              • 大規模言語モデル活用総まとめ with Azure OpenAI

                                                                                3/24にアップした資料が含まれますが、 ベーシックなとこから全部入りにした資料です。 ・今までのAIとGPT ・GPT関連ニュースリリース ・OpenAIとMicrosoftの関係 ・Azure OpenAI Serviceの位置づけ ・ChatGPTなど言語生成モデルの挙動イメージ ・…

                                                                                  大規模言語モデル活用総まとめ with Azure OpenAI
                                                                                • AIプロ集団から見た「ChatGPTの歴史」 たった5年で何が起こったのか

                                                                                  IT業界において大規模言語AIサービス「ChatGPT」が大盛り上がりだ。2023年に入ってからはあらゆる業界の企業がChatGPTを使ったサービスをこぞって発表している。IT超大手GAFAMも続々大規模言語AIの活用方針を打ち出している。 そんなChatGPTはどうやってここまでの人気を得るに至ったのか。日本語特化の大規模言語AIを開発してきた東大発ベンチャー・ELYZA(東京都文京区)は3月16日の発表会で、今この業界で何が起きているのかを、歴史とともに解説した。 GAFAMが続々アプローチ IT業界が一瞬でAIカラーに染まる ChatGPTは2022年11月の公開以降、飛ぶ鳥を落とす勢いでユーザーを獲得してきた。ユーザー数はリリースから5日で100万人、2カ月で1億人を突破した。米Microsoftは開発元の米OpenAIにもともと10億ドルを出資していたが、ChatGPT登場後さら

                                                                                    AIプロ集団から見た「ChatGPTの歴史」 たった5年で何が起こったのか

                                                                                  新着記事