サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
weel.co.jp
ホーム生成AIテックオープンソースAI【kotaemon】洗練されたUIのオープンRAGシステム!論文PDFをアップロードして分かりやすく解説させてみた kotaemonの概要 Kotaemonaはドキュメントとチャットでやりとりができる、カスタマイズ可能なオープンソースのRAG UIです。開発者だけではなく、エンドユーザーについても念頭に置いて開発がされています。 開発したのは日本の会社のシナモンAIが開発しました。 参考:https://raw.githubusercontent.com/Cinnamon/kotaemon/main/docs/images/preview-graph.png RAGについて 生成AIの普及に伴い、大規模言語モデル(LLM)という言葉は馴染みになってきましたが、RAGという単語はまだ馴染みがない方も多いのではないでしょうか。 RAGはRetrieval-
2024年8月1日、「FLUX.1」という新たな画像生成AIが発表されました! FLUX.1は「Stable Diffusion」の開発者たちが新たに立ち上げた会社「Black Forest Labs」が、新たに開発した画像生成AIです。FLUX.1の強みは、プロンプトの指示に忠実に従ってくれ、画像中に文字も入れられる点。 Black Forest LabsがFLUX.1を発表したXのポストは30万人以上の方々が見ており、非常に関心の高い画像生成AIであることがわかります。 Today we release the FLUX.1 suite of models that push the frontiers of text-to-image synthesis. read more at https://t.co/49zTUK8Q5V pic.twitter.com/hmcKRIlizn
AI漫画とは? AI漫画とは、最近YouTubeで流行しているジャンルであり、「AIツールで生成したイラストや音声を用いた作品」を指します。 例えば、以下はAI漫画を運営しているYouTubeチャンネルの動画です。 本来このような漫画系動画を制作するには、下記のようなスキルが必要です。 イラスト作成 ナレーション 動画編集 もちろんスキルがなければ外注するというのも手ですが、外注費用だけで1本あたり安くても2万円以上かかってしまうため、ある程度資金力がなければなりません。 しかし近年、AIツールが進化したことにより、誰でも簡単にイラストや音声を生成できるようになりました。 しかもAIツールは利用料金が安く、ものによっては無料で使えるため、コストも大幅に削減できます。 つまり、スキル・資金力がなくても、誰でも簡単に漫画系動画が制作できる時代がやって来たのです! 実際、たった5本のAI漫画動画
WEELメディア事業部LLMライターのゆうやです。 MiniCPM-Llama3-V 2.5は、中国のOpenBMB(Open Lab for Big Model Base)が開発した最新のオープンソースマルチモーダル言語モデルで、8BというサイズながらGPT-4Vと同等の性能を有しています。 🚀 Excited to introduce MiniCPM-Llama3-V 2.5! With 8B parameters, it’s our latest breakthrough, outperforming top models like GPT-4V. 📈 💪 Superior OCR capabilities 🔑 Supports 30+ languages HuggingFace:https://t.co/Skivve1BgN GitHub:https://t.co/x868
WEELメディア事業部AIライターの2scです。 みなさん、各種文書の引用機能「RAG」を備えた生成AIチャットボットにはNGがあります。 それは……「文書をそのまま読み込ませる」ということです。実はRAGの場合、読み込ませる文書に「前処理」を施す必要があります。前処理なしだと、正しく引用が行われなかったり、ハルシネーションが生じたりしてしまうんです。 ということで今回は、RAGの前処理について、その効果や手法をお伝えします。さらに、RAGの精度を高めるTipsも紹介!完読いただくと「かしこいチャットボット」が作れるかも……です。 ぜひ、最後までお読みください。 RAGにおける「前処理」とは? LLM(大規模言語モデル)に学習範囲外の知識・事実を示す手法「RAG / Retrieval Augmented Generation」は、企業用チャットボットの開発に不可欠。そのしくみは下図のとお
ChatGPTを使って文字起こし・議事録作成!プラグインやGPTs、プロンプトも紹介 2024 5/06 議事録の作成や文字起こしは簡単にできる作業ではなく、相当な時間を要します。また、担当者によって内容の質やかかる時間にバラつきがあり、属人的要素の強い業務です。 ChatGPTでは、入力したテキストの要約が可能です。また、現在はテキストだけでなく音声情報にも対応しています。ChatGPTと関連するツールを組み合わせると、議事録の作成や文字起こしなどの作業を大幅に効率化できるでしょう。 この記事では、ChatGPTと組み合わせて 文字起こしや議事録作成に使えるツールを紹介します。ビジネスや教育における人材不足の解消、価値の高い業務へのリソース配置の実現に役立ててください。 ChatGPTには議事録作成や文字起こしができるプラグインもありますが、プラグイン機能の使用は2024年4月9日に終了
WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんは「ComfyUI」というAIツールをご存知でしょうか?ノードベースのUIでStable Diffusionの画像生成機能を利用できるほか、パラメーターを細かく調整して高精度の画像を生成できるのが魅力です。 今回の記事では、ComfyUIの概要や使い方、おすすめの拡張機能まで詳しく解説します。最後まで目を通すと、ComfyUIを使ってハイクオリティな画像を生成できるようになるので、宣伝をはじめとした企業のさまざまな戦略で活かせること間違いありません。 ぜひ最後までご覧ください。 ComfyUIとは ComfyUIとは、画像生成AIのStable Diffusionを使用できるAIツールです。ノードベースのUIでプロンプトから手軽に画像を生成できるので、コーディングの必要はありません。 また、無料かつ無制限で画像を生成でき
Perplexity Pagesとは Perplexity Pagesとは、2024年5月に新たに発表された新機能です。ユーザーが検索した結果をもとに、AIが記事を自動生成してくれます。 Perplexity Pagesの特徴は、検索したいトピックを入力するだけで複数のソースから関連情報を収集し、まとまった記事形式で出力してくれる点です。また、 記事構成の編集や画像の挿入が自由にできます。 さらに、作成したページは誰とでも共有可能。現在は有料プランユーザー限定の機能ですが、今後のコンテンツ作成のプラットフォームとしてPerplexity Pagesは非常に注目されているのです! Perplexityの特徴 Perplexityとは対話型AI検索エンジンであると言われても、どういう特徴を有しているのかイマイチ分からない方も多いはず。ここでは、Perplexityについてより詳しく解説します。
WEELメディア事業部LLMライターのゆうやです。 2024年4月24日、ついにあのAppleからオープンソースLLMである「OpenELM」が登場しました! Appleが「OpenELM」なるAIモデルファミリーをオープンソースでリリース! ネットに接続なしで、完全にデバイス上で動く前提でを重視して作ったとのこと。 これはスマホ上で動く大本命LLMになる可能性大! pic.twitter.com/N25jNwQzq5 — とーます|AIX人材育成|AIコーチ開発|可能性開花をAIX (@Xroid_Lab) April 24, 2024 このモデルは、4つの異なるサイズ(270M、450M、1.1B、3B)で公開され、軽量で実行コストが低いためAppleデバイスでも動作します。また、「layer-wise scaling戦略」を使用し、効率的にパラメータを活用することで他の同規模モデルよ
【悪用厳禁ChatGPTプラグイン】他社サイトをスクレイピングできる「Scraper」の導入方法から使い方 2024 4/29 今回は、Webサイトから情報をスクレイピングできる、ChatGPTプラグイン「Scraper」を紹介します。スクレイピングとは、Webサイトから情報を自動的に取得する技術のことを指します。手動で情報を集める手間が省け、大量のデータを効率的に処理することが可能です。 例えば、下記の様なことができます。 特定した商品の価格情報を複数のECサイトから一括で取得 ニュースサイトの最新記事を自動的に取得 この技術は、市場調査や競合分析、ニュースのトレンド分析など、ビジネスの様々な場面で活用されています。「Scraper」プラグインは、プログラミング知識がなくても、スクレイピング作業をChatGPTの簡単なプロンプトで行うことが可能です。 スクレイピングは情報収集の効率化を実
WEELメディア事業部LLMライターのゆうやです。 2024年4月18日、ついにMetaよりLlamaシリーズの最新モデルとなるLlama 3が公開されました! Introducing Meta Llama 3: the most capable openly available LLM to date. Today we’re releasing 8B & 70B models that deliver on new capabilities such as improved reasoning and set a new state-of-the-art for models of their sizes. Today's release includes the first two Llama 3… pic.twitter.com/Q80lVTeS7m — AI at Meta (@
WEELメディア事業部LLMライターのゆうやです。 2024年4月4日、CohereForAIから最新のLLMとなるCommand R+が公開されました。 Announcing C4AI Command R+ open weights, a state-of-the-art 104B LLM with RAG, tooling and multilingual in 10 languages. This release builds on our 35B and is a part of our commitment to make AI breakthroughs accessible to the research community. 🎉https://t.co/2UCLl5sfPB pic.twitter.com/R3U2l6eJ0G — Cohere For AI (@Cohe
WEELメディア事業部LLMライターのゆうやです。 Googleから新しい動画生成AI「VLOGGER」が発表されました。 VLOGGERは、たった一枚の人物の画像と音声から人物の動きを予測し、会話する人間の動画を生成できます。 [写真から動画へ] ・Googleの研究者らが、1枚の静止画像から人物の動画を生成する新しい人工知能システム「VLOGGER」を開発 ・自動的に動画を他の言語に吹き替えたり、欠けているフレームを補完したりする能力があり、俳優の3Dモデルを使って新しいパフォーマンスを生成することも可能… pic.twitter.com/1cJz1D0pcC — 横山貴寛 | テック系重要ニュースを発信 (@ytakahiro0702) March 21, 2024 さらにVLOGGERは、動画の生成だけでなく、動画編集や動画内の音声の翻訳までできちゃうんです! このような恐ろしいほ
WEELメディア事業部LLMリサーチャーの藤崎です。 2024年3月26日、「Stable Code Instruct 3B」を、Stability AIが公開しました。 「stable-code-instruct-3b」は、Stable Code 3Bをベースにした指示学習済みのコード生成言語モデルで、自然言語プロンプトによりコード生成、数学、その他のソフトウェア開発に関連するクエリなどの様々なタスクを処理することができます。 Xでの投稿のいいね数は、すでに1000を超えており、注目されていることが分かります。 Introducing Stable Code Instruct 3B, our new instruction tuned LLM based on Stable Code 3B. With natural language prompting, this model can
Stable DiffusionのCFG scaleとは?おすすめの設定値と使い方を徹底解説 2024 3/29 WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんはStable Diffusionのパラメーターである「CFG scale」についてご存知でしょうか。CFG scaleを活用すれば、入力したプロンプトや画像の忠実度を手軽に調整できるので便利です。 今回は、CFG scaleの概要や設定方法、パラメーターごとの画像の違いについて詳しく解説します。最後まで目を通していただければ、CFG scaleを駆使して、思い通りの画像生成ができるようになるでしょう。 ぜひ最後までご覧ください。 CFG Scaleとは CFG Scaleは、Stable Diffusionにおける重要なパラーメーターの1つです。一言で説明すると、「入力したプロンプトや画像に対してどれだけ忠
WEELメディア事業部LLMリサーチャーの中田です。 AIスタートアップ企業のCognitionが開発した完全自立型のエンジニアAI「Devin」の、オープンソース版である「OpenDevin」が公開されました。 あの話題のDevinを、ローカル環境で実行できるんです! The OpenDevin open-source coding assistant is really taking shape! We now have a frontend that connects to a rudimentary agent that solves coding tasks, a docker sandbox, and other things. Next up is optimizing accuracy, we welcome contributions! https://t.co/3Gpb
WEELメディア事業部AIライターの2scです。 みなさん、シンプルな記述でチャートやグラフが作れる「マーメイド記法」はご存知ですか? こちらは2019年の『JavaScript OS Awards』にノミネートされた、クールなプログラミング言語。なんと無料版を含むChatGPTからの生成が可能で、慣れれば一瞬でテキストが図式化できちゃうんです! ということで当記事では、ChatGPT×マーメイド記法で作れる図式の種類やその作り方・裏ワザを紹介していきます。 完読いただくとしばらくの間、なんでも図式化しちゃいたくなるかも…… ぜひ、最後までお読みくださいね。 マーメイド記法とは? 「PowerPointでのプレゼン資料作りが面倒くさい!」「企画書に図式を入れると時間がかかる……」 などなど資料作りでお悩みのあなたに、おすすめのツールがあります! それが……図やグラフを生成できるスクリプト言
WEELメディア事業部LLMリサーチャーの中田です。 3月17日、OpenAIのSoraを再現したプロジェクト「Open-Sora」を、HPC-AI TechのColossal-AIチームが公開しました。 あの話題のSoraを、オープンソースで疑似的に利用できるんだとか! Exciting News from Open-Sora! 🚀 They've just made the ENTIRE suite of their video-generation model open source! Dive into the world of cutting-edge AI with access to model weights, comprehensive training source code, and detailed architecture insights. Start bui
WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんはStable Diffusionの可能性を広げる「Civitai」についてご存知でしょうか。 CivitaiにはStable Diffusionで使用できるAIモデルが多数共有されており、ダウンロードしたモデルを使用すれば生成画像のクオリティを向上させられるのが魅力です。 今回は、Civitaiの概要や使い方、活用事例について詳しく解説します。Civitaiのおすすめモデルや、画像のプロンプト使用方法についてもご紹介していますので、ぜひ最後までご覧ください! Civitaiとは 参考:https://civitai.com/ Civitaiは、Stable Diffusionで使用できるAIモデルを多数共有しているプラットフォームです。ユーザーは簡単なテキスト入力やパラメータの調整を通じて、高品質な画像を生成できます。
WEELメディア事業部LLMライターのゆうやです。 TripoSRは、Stability AIがTripo AIと提携して開発した、1秒以内に単一の画像から高品質な3Dモデルを生成するモデルです。 🎉新リリース🎉@tripoAI とのコラボレーションにより、TripoSR をリリースしました。 TripoSR は、1秒以内に高品質なアウトプットを作成できる新しい image-to-3D モデルです。 詳細はこちら:https://t.co/3vts0AHAh6 pic.twitter.com/EUVgAnmDVi — Stability AI Japan (@StabilityAI_JP) March 5, 2024 このモデルは、2023年11月に公開された「LRM: Large Reconstruction Model for Single Image to 3D」という論文にイン
WEELメディア事業部LLMリサーチャーの中田です。 3月11日、日本語特化型の大規模言語モデル「Swallow on mistral(Swallow-MS 7B, Swallow-MX 8x7B)」を、東京工業大学の岡崎研究室と横田研究室、産業技術総合研究所の研究チームが公開しました。 このモデルは、「Mistral 7B」と「Mixtral 8x7B」の日本語能力が強化されたものなんです! Xでの投稿のいいね数は、国内だけですでに300を超えており、注目されていることが分かります。 📢 大規模言語モデルSwallow-MS 7BとSwallow-MX 8x7Bを公開しました。東京工業大学の岡崎研究室と横田研究室、産業技術総合研究所の研究チームでMistral 7BとMixtral 8x7Bの日本語能力を引き上げました。Swallow-MS 7Bはオープンな7BのLLMの中で日本語最高
WEELメディア事業部LLMライターのゆうやです。 2024年3月12日、ELYZA-japanese-Llama-2-7bなどの日本語特化LLMを開発してきたELYZA社が、最新の700億パラメータの大規模言語モデル (LLM) である「ELYZA-japanese-Llama-2-70b」を公開しました。 【お知らせ】700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、グローバルモデルに匹敵する性能を達成しました。デモサイトも同時に公開しています。 詳細は以下をクリックしてご覧ください。https://t.co/kw8euBuKz5 — ELYZA, Inc. (@ELYZA_inc) March 12, 2024 このモデルは、これまでのモデルと同様に、Meta社の「Llama2」をベースに、日本語の追加事前学習と事後学習を行い、Llam
WEELメディア事業部LLMリサーチャーの中田です。 3月14日、最先端のオープンソース自律型エージェント「Data Interpreter」を、MetaGPTが公開しました。 このツールを用いることで、以下のように「NVIDIAの株価予測のためのPythonコーディング」を簡単に行えるんです! Do the Data Analysis and ML Modeling: Nividia Stock Prediction pic.twitter.com/s1ZjYUWSfJ — MetaGPT (@MetaGPT_) March 14, 2024 Introducing MetaGPT's Data Interpreter: Open Source and Better "Devin". Data Interpreter has achieved state-of-the-art score
Evaluation is everything! While testing Inflection-2.5, we found that MT-Bench has a bunch of incorrect answers. Here we share the corrections for everyone to use, and we release a new Physics GRE benchmark for people to try out.https://t.co/CDkcqOPGrp — Inflection AI (@inflectionAI) March 7, 2024 Inflection-2.5の概要 「Inflection-2.5」は、Inflection AIによって開発された汎用LLMです。同社が開発したチャットボットの「Pi」に搭載されています。 「Pi」は
Claude 3の使い方 Claude 3の使い方は主に以下5つの方法があります。 Claude公式Webブラウザ版のClaude.AI Claude のAPIを利用 AWSのBedrock GoogleのVertex AI アプリでの利用(iOSのみ) 基本的にはWebブラウザから利用するケースが多く、公式ページにアクセスし、「Try Claude 3」を選択します。 続いて、「Try Claude」を選択します。 認証情報を求められるため、初めて使う方はアカウントの登録を行い、2回目以降の利用の方はログインを行ってください。 以下のようなプロンプト画面が表示されたら、後は指示を入力するだけでClaude 3が利用できます。 なお、Webブラウザ以外でも2024年5月1日にClaude 3のアプリがiOS向けでリリースされたため、iOS端末ではアプリでも利用が可能となっています。And
【LongWriter】たった2分で2万文字のブログ記事を生成できるAI!長文出力でGPT-4oを超える?
WEELメディア事業部LLMリサーチャーの中田です。 3月4日、次世代の大規模言語モデル「Claude 3」を、Anthropicが公開しました。特に、Claude 3 Opusは、様々な業界ベンチマークでSOTAを達成しており、GPT-4よりも高い性能を発揮しているんです! 公式Xでの投稿のいいね数は、9800を超えており、かなり期待されていることが分かります。 Today, we're announcing Claude 3, our next generation of AI models. The three state-of-the-art models—Claude 3 Opus, Claude 3 Sonnet, and Claude 3 Haiku—set new industry benchmarks across reasoning, math, coding, mul
WEELメディア事業部LLMライターのゆうやです。 2024年2月26日、MIstral 7BやMixtral 8×7Bなどを開発したMistral AI社が最新のLLM「Mistral Large」を公開しました。 このモデルは、Mistral AIが「最高レベルの推論能力」を持つと自信を持って語る新たなフラッグシップモデルです。 数あるLLMの中で最高クラスの性能を持つだけでなく、Gemini Proなどのクローズドモデルよりも高いベンチマークスコアを獲得し、様々なベンチマーク結果が、GPT-4に次ぐ世界第2位となっています! MMLUのベンチマーク結果 引用元:https://mistral.ai/news/mistral-large/ また、Mistral Largreと同時に「Le Chat」というチャットインターフェースも公開され、Le chatを通じてMIstralのモデルが
WEELメディア事業部LLMリサーチャーの中田です。 2月21日、オープンソースの大規模言語モデル「Gemma」を、Googleが公開しました。 このモデルはGeminiをもとに設計されており、軽量ながら高精度なんです! For my first official contribution to the @modal_labs examples: running Gemma 7B on an H100 at >2500 tok/s 🚀 With very little effort, that's already just ~75¢ per megatoken — and you have full "tensors-and-a-shell" control over the execution environment pic.twitter.com/D6ls1m8MAE — Charl
次のページ
このページを最初にブックマークしてみませんか?
『WEEL | AIを使う全ての人へ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く