サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
Switch 2
weel.co.jp
VSCodeやCursorで機能するAIエージェント型拡張機能 導入ハードルは低く、AIエージェントに詳しくなくても導入可能 たった数分でWebアプリの開発が可能 2024年には多くのLLMがリリースされました。大規模言語モデルと言われる中、小型のモデルでも大規模言語モデルと同等の性能を発揮できるものが開発され、高性能な大規模言語モデルという流行から高性能な小型なモデルという流れに変わってきていると感じます。 いくつものLLMがリリースされる中、AIエージェントと呼ばれるものもリリースがされ始め、2024年11月12月に公開されたBrowser Useのインパクトが大きかったのではないでしょうか。 Cline+DeepSeek-V3、もう試しましたか? DeepSeek-V3はGPT-4oと同等がそれ以上で2月までは10倍以上安い。 私は基本Cursorを使っていますがCline+Deep
画像生成AIを試してみたけど、思った通りの画像ができなくて悩んだことはありませんか? 最新モデルStable Diffusion 3.5の「プロンプトガイド」を活用すれば、思い描いたイメージを高精度に再現できます! プロンプト次第でリアルな写真風、ファンタジーイラスト、さらには芸術作品風の画像も自在に作成可能です。
Introducing the Model Context Protocol (MCP) An open standard we've been working on at Anthropic that solves a core challenge with LLM apps – connecting them to your data. No more building custom integrations for every data source. MCP provides one protocol to connect them all: pic.twitter.com/kYsivQyPDq — Alex Albert (@alexalbert__) November 25, 2024 Model Context Protocolの概要 Model Context Protoc
誰でもWebアプリを作れる!Replit Agentの使い方・料金・活用事例を徹底解説 2024 11/12 プログラミングを根本から変える「Replit Agent」をご存知ですか? このAI開発支援ツールは、なんと「イベント管理サービスを作って」という一言の指示だけで、ログイン機能やデータベース連携まで備えたWebサービスを自動生成できてしまうのです。 この記事では、Replit Agentの基本機能から活用事例、料金プラン、商用利用まで徹底解説します。 プログラミング未経験でも、AIの力を借りて本格的なアプリケーション開発できる時代が来ています。最後まで読めば、あなたもアイデアを素早くカタチにできるようになるはずです。 ぜひ、最後までご覧ください! Replitとは Replit みなさんは、プログラミングを始めようとして環境構築に手こずった経験はありませんか?ブラウザがあれば、すぐ
ホーム生成AIテックオープンソースAI【kotaemon】洗練されたUIのオープンRAGシステム!論文PDFをアップロードして分かりやすく解説させてみた kotaemonの概要 Kotaemonaはドキュメントとチャットでやりとりができる、カスタマイズ可能なオープンソースのRAG UIです。開発者だけではなく、エンドユーザーについても念頭に置いて開発がされています。 開発したのは日本の会社のシナモンAIが開発しました。 参考:https://raw.githubusercontent.com/Cinnamon/kotaemon/main/docs/images/preview-graph.png RAGについて 生成AIの普及に伴い、大規模言語モデル(LLM)という言葉は馴染みになってきましたが、RAGという単語はまだ馴染みがない方も多いのではないでしょうか。 RAGはRetrieval-
【最新】FLUX1.1[pro]で最新画像生成AIモデルを使ってトルコの無課金おじさんを生成してみた 2024 10/15 2024年8月1日、「FLUX1」という新たな画像生成AIが発表されました! FLUX.1は「Stable Diffusion」の開発者たちが新たに立ち上げた会社「Black Forest Labs」が、新たに開発した画像生成AIです。FLUX.1の強みは、プロンプトの指示に忠実に従ってくれ、画像中に文字も入れられる点。 Black Forest LabsがFLUX.1を発表したXのポストは30万人以上の方々が見ており、非常に関心の高い画像生成AIであることがわかります。 Today we release the FLUX.1 suite of models that push the frontiers of text-to-image synthesis. re
WEELメディア事業部LLMライターのゆうやです。 MiniCPM-Llama3-V 2.5は、中国のOpenBMB(Open Lab for Big Model Base)が開発した最新のオープンソースマルチモーダル言語モデルで、8BというサイズながらGPT-4Vと同等の性能を有しています。 🚀 Excited to introduce MiniCPM-Llama3-V 2.5! With 8B parameters, it’s our latest breakthrough, outperforming top models like GPT-4V. 📈 💪 Superior OCR capabilities 🔑 Supports 30+ languages HuggingFace:https://t.co/Skivve1BgN GitHub:https://t.co/x868
WEELメディア事業部AIライターの2scです。 みなさん、各種文書の引用機能「RAG」を備えた生成AIチャットボットにはNGがあります。 それは……「文書をそのまま読み込ませる」ということです。実はRAGの場合、読み込ませる文書に「前処理」を施す必要があります。前処理なしだと、正しく引用が行われなかったり、ハルシネーションが生じたりしてしまうんです。 ということで今回は、RAGの前処理について、その効果や手法をお伝えします。さらに、RAGの精度を高めるTipsも紹介!完読いただくと「かしこいチャットボット」が作れるかも……です。 ぜひ、最後までお読みください。 RAGにおける「前処理」とは? LLM(大規模言語モデル)に学習範囲外の知識・事実を示す手法「RAG / Retrieval Augmented Generation」は、企業用チャットボットの開発に不可欠。そのしくみは下図のとお
ChatGPTを使って文字起こし・議事録作成!プラグインやGPTs、プロンプトも紹介 2024 7/16 議事録の作成や文字起こしは簡単にできる作業ではなく、相当な時間を要します。また、担当者によって内容の質やかかる時間にバラつきがあり、属人的要素の強い業務です。 ChatGPTでは、入力したテキストの要約が可能です。また、現在はテキストだけでなく音声情報にも対応しています。ChatGPTと関連するツールを組み合わせると、議事録の作成や文字起こしなどの作業を大幅に効率化できるでしょう。 この記事では、ChatGPTと組み合わせて 文字起こしや議事録作成に使えるツールを紹介します。ビジネスや教育における人材不足の解消、価値の高い業務へのリソース配置の実現に役立ててください。 ChatGPTには議事録作成や文字起こしができるプラグインもありますが、プラグイン機能の使用は2024年4月9日に終了
WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんは「ComfyUI」というAIツールをご存知でしょうか?ノードベースのUIでStable Diffusionの画像生成機能を利用できるほか、パラメーターを細かく調整して高精度の画像を生成できるのが魅力です。 今回の記事では、ComfyUIの概要や使い方、おすすめの拡張機能まで詳しく解説します。最後まで目を通すと、ComfyUIを使ってハイクオリティな画像を生成できるようになるので、宣伝をはじめとした企業のさまざまな戦略で活かせること間違いありません。 ぜひ最後までご覧ください。 ComfyUIとは ComfyUIとは、画像生成AIのStable Diffusionを使用できるAIツールです。ノードベースのUIでプロンプトから手軽に画像を生成できるので、コーディングの必要はありません。 また、無料かつ無制限で画像を生成でき
Perplexity Pagesとは Perplexity Pagesとは、2024年5月に新たに発表された新機能です。ユーザーが検索した結果をもとに、AIが記事を自動生成してくれます。 Perplexity Pagesの特徴は、検索したいトピックを入力するだけで複数のソースから関連情報を収集し、まとまった記事形式で出力してくれる点です。また、 記事構成の編集や画像の挿入が自由にできます。 さらに、作成したページは誰とでも共有可能。現在は有料プランユーザー限定の機能ですが、今後のコンテンツ作成のプラットフォームとしてPerplexity Pagesは非常に注目されているのです! Perplexity Shoppingとは Perplexity Shoppingとは、2024年11月に追加された新機能で商品のスペックや価格などの商品情報の取得はもちろん、そのままシームレスに買い物ができるとい
WEELメディア事業部LLMライターのゆうやです。 2024年4月24日、ついにあのAppleからオープンソースLLMである「OpenELM」が登場しました! Appleが「OpenELM」なるAIモデルファミリーをオープンソースでリリース! ネットに接続なしで、完全にデバイス上で動く前提でを重視して作ったとのこと。 これはスマホ上で動く大本命LLMになる可能性大! pic.twitter.com/N25jNwQzq5 — とーます|AIX人材育成|AIコーチ開発|可能性開花をAIX (@Xroid_Lab) April 24, 2024 このモデルは、4つの異なるサイズ(270M、450M、1.1B、3B)で公開され、軽量で実行コストが低いためAppleデバイスでも動作します。また、「layer-wise scaling戦略」を使用し、効率的にパラメータを活用することで他の同規模モデルよ
【悪用厳禁ChatGPTプラグイン】他社サイトをスクレイピングできる「Scraper」の導入方法から使い方 2024 7/16 今回は、Webサイトから情報をスクレイピングできる、ChatGPTプラグイン「Scraper」を紹介します。スクレイピングとは、Webサイトから情報を自動的に取得する技術のことを指します。手動で情報を集める手間が省け、大量のデータを効率的に処理することが可能です。 例えば、下記の様なことができます。 特定した商品の価格情報を複数のECサイトから一括で取得 ニュースサイトの最新記事を自動的に取得 この技術は、市場調査や競合分析、ニュースのトレンド分析など、ビジネスの様々な場面で活用されています。「Scraper」プラグインは、プログラミング知識がなくても、スクレイピング作業をChatGPTの簡単なプロンプトで行うことが可能です。 スクレイピングは情報収集の効率化を実
WEELメディア事業部LLMライターのゆうやです。 2024年4月18日、ついにMetaよりLlamaシリーズの最新モデルとなるLlama 3が公開されました! Introducing Meta Llama 3: the most capable openly available LLM to date. Today we’re releasing 8B & 70B models that deliver on new capabilities such as improved reasoning and set a new state-of-the-art for models of their sizes. Today's release includes the first two Llama 3… pic.twitter.com/Q80lVTeS7m — AI at Meta (@
WEELメディア事業部LLMリサーチャーの中田です。 4月10日、音楽生成AIの「Udio」がパブリックベータ版として一般公開されました。以前から「Suno AIの対抗馬」として注目を集めており、高品質な音楽生成が可能だと話題なんです! Udioで1曲フルで作ってみました↓! 正直かなり高品質で、音楽として成り立っていますね。 Introducing Udio, an app for music creation and sharing that allows you to generate amazing music in your favorite styles with intuitive and powerful text-prompting. 1/11 pic.twitter.com/al5uYAsU5k — udio (@udiomusic) April 10, 2024 公式
WEELメディア事業部LLMライターのゆうやです。 2024年4月4日、CohereForAIから最新のLLMとなるCommand R+が公開されました。 Announcing C4AI Command R+ open weights, a state-of-the-art 104B LLM with RAG, tooling and multilingual in 10 languages. This release builds on our 35B and is a part of our commitment to make AI breakthroughs accessible to the research community. 🎉https://t.co/2UCLl5sfPB pic.twitter.com/R3U2l6eJ0G — Cohere For AI (@Cohe
WEELメディア事業部LLMライターのゆうやです。 Googleから新しい動画生成AI「VLOGGER」が発表されました。 VLOGGERは、たった一枚の人物の画像と音声から人物の動きを予測し、会話する人間の動画を生成できます。 [写真から動画へ] ・Googleの研究者らが、1枚の静止画像から人物の動画を生成する新しい人工知能システム「VLOGGER」を開発 ・自動的に動画を他の言語に吹き替えたり、欠けているフレームを補完したりする能力があり、俳優の3Dモデルを使って新しいパフォーマンスを生成することも可能… pic.twitter.com/1cJz1D0pcC — 横山貴寛 | テック系重要ニュースを発信 (@ytakahiro0702) March 21, 2024 さらにVLOGGERは、動画の生成だけでなく、動画編集や動画内の音声の翻訳までできちゃうんです! このような恐ろしいほ
WEELメディア事業部LLMリサーチャーの藤崎です。 2024年3月26日、「Stable Code Instruct 3B」を、Stability AIが公開しました。 「stable-code-instruct-3b」は、Stable Code 3Bをベースにした指示学習済みのコード生成言語モデルで、自然言語プロンプトによりコード生成、数学、その他のソフトウェア開発に関連するクエリなどの様々なタスクを処理することができます。 Xでの投稿のいいね数は、すでに1000を超えており、注目されていることが分かります。 Introducing Stable Code Instruct 3B, our new instruction tuned LLM based on Stable Code 3B. With natural language prompting, this model can
Stable Diffusionの「CFG Scale」とは?概要とおすすめ設定を比較しながら解説 2024 9/12 WEELメディア事業部リサーチャーのいつきです。 Stable Diffusionで目的にかなう画像を生成するには、重要なパラメータである「CFG Scale(Classifier-Free Guidance Scale)」の理解と活用が欠かせません。 CFG scaleにより、入力したプロンプトや画像の忠実度を手軽に調整できるので便利です。しかし、最適なCFG Scaleの設定が分からないという方もいるのではないでしょうか。 今回は、CFG scaleの基本や設定方法を解説し、数値を変えて画像を比較してみます。おすすめの設定も記載しているため、CFG scaleを駆使して思い通りの画像生成が可能になるでしょう。 ぜひ最後までご覧ください。 CFG Scaleとは CFG
WEELメディア事業部LLMリサーチャーの中田です。 AIスタートアップ企業のCognitionが開発した完全自立型のエンジニアAI「Devin」の、オープンソース版である「OpenDevin」が公開されました。 あの話題のDevinを、ローカル環境で実行できるんです! The OpenDevin open-source coding assistant is really taking shape! We now have a frontend that connects to a rudimentary agent that solves coding tasks, a docker sandbox, and other things. Next up is optimizing accuracy, we welcome contributions! https://t.co/3Gpb
WEELメディア事業部AIライターの2scです。 みなさん、シンプルな記述でチャートやグラフが作れる「マーメイド記法」はご存知ですか? こちらは2019年の『JavaScript OS Awards』にノミネートされた、クールなプログラミング言語。なんと無料版を含むChatGPTからの生成が可能で、慣れれば一瞬でテキストが図式化できちゃうんです! ということで当記事では、ChatGPT×マーメイド記法で作れる図式の種類やその作り方・裏ワザを紹介していきます。 完読いただくとしばらくの間、なんでも図式化しちゃいたくなるかも…… ぜひ、最後までお読みくださいね。 マーメイド記法とは? 「PowerPointでのプレゼン資料作りが面倒くさい!」「企画書に図式を入れると時間がかかる……」 などなど資料作りでお悩みのあなたに、おすすめのツールがあります! それが……図やグラフを生成できるスクリプト言
WEELメディア事業部LLMリサーチャーの中田です。 3月17日、OpenAIのSoraを再現したプロジェクト「Open-Sora」を、HPC-AI TechのColossal-AIチームが公開しました。 あの話題のSoraを、オープンソースで疑似的に利用できるんだとか! Exciting News from Open-Sora! 🚀 They've just made the ENTIRE suite of their video-generation model open source! Dive into the world of cutting-edge AI with access to model weights, comprehensive training source code, and detailed architecture insights. Start bui
WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんはStable Diffusionの可能性を広げる「Civitai」についてご存知でしょうか。 CivitaiにはStable Diffusionで使用できるAIモデルが多数共有されており、ダウンロードしたモデルを使用すれば生成画像のクオリティを向上させられるのが魅力です。 今回は、Civitaiの概要や使い方、活用事例について詳しく解説します。Civitaiのおすすめモデルや、画像のプロンプト使用方法についてもご紹介していますので、ぜひ最後までご覧ください! Civitaiとは 参考:https://civitai.com/ Civitaiは、Stable Diffusionで使用できるAIモデルを多数共有しているプラットフォームです。ユーザーは簡単なテキスト入力やパラメータの調整を通じて、高品質な画像を生成できます。
皆さんは「Suno」という音楽生成AIをご存じですか? このツールは、これまで出来なかったユーザーが入力した歌詞でボーカルまで生成してくれる革新的な音楽生成AIです。 そして、この度大型アップデートによって、Suno v3が搭載されました。 You can make better music with v3, but we have a lot more work to do. We're still in the early innings of Suno, and we'll continue improving along the axes of quality, control and speed. v4 is already under development, and we're working around the clock on some new, exciting… —
WEELメディア事業部LLMライターのゆうやです。 TripoSRは、Stability AIがTripo AIと提携して開発した、1秒以内に単一の画像から高品質な3Dモデルを生成するモデルです。 🎉新リリース🎉@tripoAI とのコラボレーションにより、TripoSR をリリースしました。 TripoSR は、1秒以内に高品質なアウトプットを作成できる新しい image-to-3D モデルです。 詳細はこちら:https://t.co/3vts0AHAh6 pic.twitter.com/EUVgAnmDVi — Stability AI Japan (@StabilityAI_JP) March 5, 2024 このモデルは、2023年11月に公開された「LRM: Large Reconstruction Model for Single Image to 3D」という論文にイン
WEELメディア事業部LLMリサーチャーの中田です。 3月11日、日本語特化型の大規模言語モデル「Swallow on mistral(Swallow-MS 7B, Swallow-MX 8x7B)」を、東京工業大学の岡崎研究室と横田研究室、産業技術総合研究所の研究チームが公開しました。 このモデルは、「Mistral 7B」と「Mixtral 8x7B」の日本語能力が強化されたものなんです! Xでの投稿のいいね数は、国内だけですでに300を超えており、注目されていることが分かります。 📢 大規模言語モデルSwallow-MS 7BとSwallow-MX 8x7Bを公開しました。東京工業大学の岡崎研究室と横田研究室、産業技術総合研究所の研究チームでMistral 7BとMixtral 8x7Bの日本語能力を引き上げました。Swallow-MS 7Bはオープンな7BのLLMの中で日本語最高
WEELメディア事業部LLMライターのゆうやです。 2024年3月12日、ELYZA-japanese-Llama-2-7bなどの日本語特化LLMを開発してきたELYZA社が、最新の700億パラメータの大規模言語モデル (LLM) である「ELYZA-japanese-Llama-2-70b」を公開しました。 【お知らせ】700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、グローバルモデルに匹敵する性能を達成しました。デモサイトも同時に公開しています。 詳細は以下をクリックしてご覧ください。https://t.co/kw8euBuKz5 — ELYZA, Inc. (@ELYZA_inc) March 12, 2024 このモデルは、これまでのモデルと同様に、Meta社の「Llama2」をベースに、日本語の追加事前学習と事後学習を行い、Llam
WEELメディア事業部LLMリサーチャーの中田です。 3月14日、最先端のオープンソース自律型エージェント「Data Interpreter」を、MetaGPTが公開しました。 このツールを用いることで、以下のように「NVIDIAの株価予測のためのPythonコーディング」を簡単に行えるんです! Do the Data Analysis and ML Modeling: Nividia Stock Prediction pic.twitter.com/s1ZjYUWSfJ — MetaGPT (@MetaGPT_) March 14, 2024 Introducing MetaGPT's Data Interpreter: Open Source and Better "Devin". Data Interpreter has achieved state-of-the-art score
Evaluation is everything! While testing Inflection-2.5, we found that MT-Bench has a bunch of incorrect answers. Here we share the corrections for everyone to use, and we release a new Physics GRE benchmark for people to try out.https://t.co/CDkcqOPGrp — Inflection AI (@inflectionAI) March 7, 2024 Inflection-2.5の概要 「Inflection-2.5」は、Inflection AIによって開発された汎用LLMです。同社が開発したチャットボットの「Pi」に搭載されています。 「Pi」は
次のページ
このページを最初にブックマークしてみませんか?
『WEEL | AIを使う全ての人へ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く