サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
デスク環境を整える
weel.co.jp
Runway Gen-4とは? Runway Gen-4は、AIを使った映像生成ツールの最新バージョンです。大きな特徴は、キャラクターや背景を統一した表現で作れること。一度作ったキャラクターは、角度や照明が変わっても見た目は変わらず、物語の流れに合わせた映像を簡単に仕上げられます。 さらに、AIが自然な動きや表情を補ってくれるので、感情が伝わるリアルな表現が可能です。映画やCM、アニメーション制作など、さまざまなシーンで活用できるでしょう。 操作もわかりやすく、映像制作が初めての人でも高品質な作品を作ることができます。短い時間で完成度の高い映像を作りたい方にとって、Runway Gen-4は心強いサポーターになるでしょう。 なお、動画生成AIについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
思考を行動に変える自律型汎用AIエージェント 仕事や生活の多種多様なユースケースに対応 ユーザーが休んでいる間に作業が完結 Manusは通常の対話型AIと異なり、人間の「思考」を「行動」に橋渡しすることを目指した自律型のAIで、ユーザーの指示から計画立案、実行までを一貫して行い、最終的な成果物を提供できる点が特徴です。 旅行プランの作成や株式分析レポートの生成など、日常生活からビジネスまで、幅広いタスクに対応できるとのこと。 本記事では、そんな「Manus」の概要から使い方までご説明します。 ぜひ、最後までご覧ください。 Manusの概要 「Manus」は、季逸超(Ji “Peak” Yichao)氏を中心とする開発チームにより開発され、季氏は、「Manusは世界初の真の汎用AIエージェントであり、単なるチャットボットではなく、構想から実行まで橋渡しする次世代のAIだ」と述べています。 招
2025/02/25、AnthropicからClaudeの新たなモデルがリリースされました! 今回リリースされたのはClaude 3.7 Sonnetで、安全性と性能を兼ね備えたハイブリッド型の推論モデルです。 従来のモデルにはない新たな「拡張思考モード」を搭載し、複雑な問題に対しても回答できるようになっています。 Introducing Claude 3.7 Sonnet: our most intelligent model to date. It's a hybrid reasoning model, producing near-instant responses or extended, step-by-step thinking. One model, two ways to think. We’re also releasing an agentic coding tool:
VSCodeやCursorで機能するAIエージェント型拡張機能 導入ハードルは低く、AIエージェントに詳しくなくても導入可能 たった数分でWebアプリの開発が可能 2024年には多くのLLMがリリースされました。大規模言語モデルと言われる中、小型のモデルでも大規模言語モデルと同等の性能を発揮できるものが開発され、高性能な大規模言語モデルという流行から高性能な小型なモデルという流れに変わってきていると感じます。 いくつものLLMがリリースされる中、AIエージェントと呼ばれるものもリリースがされ始め、2024年11月12月に公開されたBrowser Useのインパクトが大きかったのではないでしょうか。 Cline+DeepSeek-V3、もう試しましたか? DeepSeek-V3はGPT-4oと同等がそれ以上で2月までは10倍以上安い。 私は基本Cursorを使っていますがCline+Deep
画像生成AIを試してみたけど、思った通りの画像ができなくて悩んだことはありませんか? 最新モデルStable Diffusion 3.5の「プロンプトガイド」を活用すれば、思い描いたイメージを高精度に再現できます! プロンプト次第でリアルな写真風、ファンタジーイラスト、さらには芸術作品風の画像も自在に作成可能です。
Introducing the Model Context Protocol (MCP) An open standard we've been working on at Anthropic that solves a core challenge with LLM apps – connecting them to your data. No more building custom integrations for every data source. MCP provides one protocol to connect them all: pic.twitter.com/kYsivQyPDq — Alex Albert (@alexalbert__) November 25, 2024 Model Context Protocolの概要 Model Context Protoc
WEELメディア事業部AIライターの2scです。 みなさん、生成AIツールをノーコードで開発できるプラットフォーム「Dify」はご存知ですか? このDifyはなんと、プログラミングの知識不要でRAG搭載のチャットボットやAIエージェントが作れる優れもの。ローカルでの利用にも対応していて、小型LLMとの組み合わせでノートPC上で動く業務用AIツールまで作れちゃうんです。 そんなDifyはすでに6万人以上のユーザーを集めていて、一部の国内企業でも導入・活用が始まっています。 当記事ではそんなDifyのうち、ローカル版にクローズアップ。Webアプリ版と比べたときのメリットやインストールの方法、使い方までを詳しく解説していきます! 完読いただくと、セキュリティやコストの関係で生成AI導入を見送っていた企業様でも、生成AI活用の稟議が通せるかもしれません。ぜひぜひ、最後までお読みくださいね! Dif
誰でもWebアプリを作れる!Replit Agentの使い方・料金・活用事例を徹底解説 2024 11/12 プログラミングを根本から変える「Replit Agent」をご存知ですか? このAI開発支援ツールは、なんと「イベント管理サービスを作って」という一言の指示だけで、ログイン機能やデータベース連携まで備えたWebサービスを自動生成できてしまうのです。 この記事では、Replit Agentの基本機能から活用事例、料金プラン、商用利用まで徹底解説します。 プログラミング未経験でも、AIの力を借りて本格的なアプリケーション開発できる時代が来ています。最後まで読めば、あなたもアイデアを素早くカタチにできるようになるはずです。 ぜひ、最後までご覧ください! Replitとは Replit みなさんは、プログラミングを始めようとして環境構築に手こずった経験はありませんか?ブラウザがあれば、すぐ
WEELメディア事業部AIライターの2scです。 みなさん!2024年9月12日に登場したOpenAI最新のLLM「OpenAI o1-preview」がアップデートを受け、完全版の「OpenAI o1」になりました! このOpenAI o1は、専門家顔負けの数学力&理数科目の知識量を持っていて、o1-previewよりも速く回答生成が可能です。しかも、画像の入力にも完全対応しています! OpenAI o1 is now out of preview in ChatGPT. What’s changed since the preview? A faster, more powerful reasoning model that’s better at coding, math & writing. o1 now also supports image uploads, allowing
ホーム生成AIテックオープンソースAI【kotaemon】洗練されたUIのオープンRAGシステム!論文PDFをアップロードして分かりやすく解説させてみた kotaemonの概要 Kotaemonaはドキュメントとチャットでやりとりができる、カスタマイズ可能なオープンソースのRAG UIです。開発者だけではなく、エンドユーザーについても念頭に置いて開発がされています。 開発したのは日本の会社のシナモンAIが開発しました。 参考:https://raw.githubusercontent.com/Cinnamon/kotaemon/main/docs/images/preview-graph.png RAGについて 生成AIの普及に伴い、大規模言語モデル(LLM)という言葉は馴染みになってきましたが、RAGという単語はまだ馴染みがない方も多いのではないでしょうか。 RAGはRetrieval-
【最新】FLUX1.1[pro]で最新画像生成AIモデルを使ってトルコの無課金おじさんを生成してみた 2024 10/15 2024年8月1日、「FLUX1」という新たな画像生成AIが発表されました! FLUX.1は「Stable Diffusion」の開発者たちが新たに立ち上げた会社「Black Forest Labs」が、新たに開発した画像生成AIです。FLUX.1の強みは、プロンプトの指示に忠実に従ってくれ、画像中に文字も入れられる点。 Black Forest LabsがFLUX.1を発表したXのポストは30万人以上の方々が見ており、非常に関心の高い画像生成AIであることがわかります。 Today we release the FLUX.1 suite of models that push the frontiers of text-to-image synthesis. re
WEELメディア事業部LLMライターのゆうやです。 MiniCPM-Llama3-V 2.5は、中国のOpenBMB(Open Lab for Big Model Base)が開発した最新のオープンソースマルチモーダル言語モデルで、8BというサイズながらGPT-4Vと同等の性能を有しています。 🚀 Excited to introduce MiniCPM-Llama3-V 2.5! With 8B parameters, it’s our latest breakthrough, outperforming top models like GPT-4V. 📈 💪 Superior OCR capabilities 🔑 Supports 30+ languages HuggingFace:https://t.co/Skivve1BgN GitHub:https://t.co/x868
WEELメディア事業部AIライターの2scです。 みなさん、各種文書の引用機能「RAG」を備えた生成AIチャットボットにはNGがあります。 それは……「文書をそのまま読み込ませる」ということです。実はRAGの場合、読み込ませる文書に「前処理」を施す必要があります。前処理なしだと、正しく引用が行われなかったり、ハルシネーションが生じたりしてしまうんです。 ということで今回は、RAGの前処理について、その効果や手法をお伝えします。さらに、RAGの精度を高めるTipsも紹介!完読いただくと「かしこいチャットボット」が作れるかも……です。 ぜひ、最後までお読みください。 RAGにおける「前処理」とは? LLM(大規模言語モデル)に学習範囲外の知識・事実を示す手法「RAG / Retrieval Augmented Generation」は、企業用チャットボットの開発に不可欠。そのしくみは下図のとお
2024年6月6日(現地時間)に、米Googleから新たな情報整理ツール「NotebookLM」がリリースされました! Google製マルチモーダル生成AI(MLLM)の最新版「Gemini 1.5 Pro」が搭載されており、非常に優秀なAIツールとしてすでにその性能の高さが噂となっています! NotebookLMがすごい!!! Discordで書いているTextデータを全部inputしたら、 コミュニティに関するブログ記事を無限生成してくれるAIが爆誕した…!!!!#IwakenLab pic.twitter.com/zculw0blNp — イワケン@XR界の吉田松陰 (@iwaken71) June 10, 2024 NotebookLMとは NotebookLMとは、Googleが開発した生成AIを活用してユーザーの思考を支援する新しい情報整理ツールです。実験的なサービスとしてスタ
ChatGPTを使って文字起こし・議事録作成!プラグインやGPTs、プロンプトも紹介 2024 7/16 議事録の作成や文字起こしは簡単にできる作業ではなく、相当な時間を要します。また、担当者によって内容の質やかかる時間にバラつきがあり、属人的要素の強い業務です。 ChatGPTでは、入力したテキストの要約が可能です。また、現在はテキストだけでなく音声情報にも対応しています。ChatGPTと関連するツールを組み合わせると、議事録の作成や文字起こしなどの作業を大幅に効率化できるでしょう。 この記事では、ChatGPTと組み合わせて 文字起こしや議事録作成に使えるツールを紹介します。ビジネスや教育における人材不足の解消、価値の高い業務へのリソース配置の実現に役立ててください。 ChatGPTには議事録作成や文字起こしができるプラグインもありますが、プラグイン機能の使用は2024年4月9日に終了
WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんは「ComfyUI」というAIツールをご存知でしょうか?ノードベースのUIでStable Diffusionの画像生成機能を利用できるほか、パラメーターを細かく調整して高精度の画像を生成できるのが魅力です。 今回の記事では、ComfyUIの概要や使い方、おすすめの拡張機能まで詳しく解説します。最後まで目を通すと、ComfyUIを使ってハイクオリティな画像を生成できるようになるので、宣伝をはじめとした企業のさまざまな戦略で活かせること間違いありません。 ぜひ最後までご覧ください。 ComfyUIとは ComfyUIとは、画像生成AIのStable Diffusionを使用できるAIツールです。ノードベースのUIでプロンプトから手軽に画像を生成できるので、コーディングの必要はありません。 また、無料かつ無制限で画像を生成でき
Perplexity Pagesとは Perplexity Pagesとは、2024年5月に新たに発表された新機能です。ユーザーが検索した結果をもとに、AIが記事を自動生成してくれます。 Perplexity Pagesの特徴は、検索したいトピックを入力するだけで複数のソースから関連情報を収集し、まとまった記事形式で出力してくれる点です。また、 記事構成の編集や画像の挿入が自由にできます。 さらに、作成したページは誰とでも共有可能。現在は有料プランユーザー限定の機能ですが、今後のコンテンツ作成のプラットフォームとしてPerplexity Pagesは非常に注目されているのです! Perplexity Shoppingとは Perplexity Shoppingとは、2024年11月に追加された新機能で商品のスペックや価格などの商品情報の取得はもちろん、そのままシームレスに買い物ができるとい
WEELメディア事業部LLMライターのゆうやです。 2024年4月24日、ついにあのAppleからオープンソースLLMである「OpenELM」が登場しました! Appleが「OpenELM」なるAIモデルファミリーをオープンソースでリリース! ネットに接続なしで、完全にデバイス上で動く前提でを重視して作ったとのこと。 これはスマホ上で動く大本命LLMになる可能性大! pic.twitter.com/N25jNwQzq5 — とーます|AIX人材育成|AIコーチ開発|可能性開花をAIX (@Xroid_Lab) April 24, 2024 このモデルは、4つの異なるサイズ(270M、450M、1.1B、3B)で公開され、軽量で実行コストが低いためAppleデバイスでも動作します。また、「layer-wise scaling戦略」を使用し、効率的にパラメータを活用することで他の同規模モデルよ
【悪用厳禁ChatGPTプラグイン】他社サイトをスクレイピングできる「Scraper」の導入方法から使い方 2024 7/16 今回は、Webサイトから情報をスクレイピングできる、ChatGPTプラグイン「Scraper」を紹介します。スクレイピングとは、Webサイトから情報を自動的に取得する技術のことを指します。手動で情報を集める手間が省け、大量のデータを効率的に処理することが可能です。 例えば、下記の様なことができます。 特定した商品の価格情報を複数のECサイトから一括で取得 ニュースサイトの最新記事を自動的に取得 この技術は、市場調査や競合分析、ニュースのトレンド分析など、ビジネスの様々な場面で活用されています。「Scraper」プラグインは、プログラミング知識がなくても、スクレイピング作業をChatGPTの簡単なプロンプトで行うことが可能です。 スクレイピングは情報収集の効率化を実
WEELメディア事業部LLMライターのゆうやです。 2024年4月18日、ついにMetaよりLlamaシリーズの最新モデルとなるLlama 3が公開されました! Introducing Meta Llama 3: the most capable openly available LLM to date. Today we’re releasing 8B & 70B models that deliver on new capabilities such as improved reasoning and set a new state-of-the-art for models of their sizes. Today's release includes the first two Llama 3… pic.twitter.com/Q80lVTeS7m — AI at Meta (@
WEELメディア事業部LLMリサーチャーの中田です。 4月10日、音楽生成AIの「Udio」がパブリックベータ版として一般公開されました。以前から「Suno AIの対抗馬」として注目を集めており、高品質な音楽生成が可能だと話題なんです! Udioで1曲フルで作ってみました↓! 正直かなり高品質で、音楽として成り立っていますね。 Introducing Udio, an app for music creation and sharing that allows you to generate amazing music in your favorite styles with intuitive and powerful text-prompting. 1/11 pic.twitter.com/al5uYAsU5k — udio (@udiomusic) April 10, 2024 公式
WEELメディア事業部LLMライターのゆうやです。 2024年4月4日、CohereForAIから最新のLLMとなるCommand R+が公開されました。 Announcing C4AI Command R+ open weights, a state-of-the-art 104B LLM with RAG, tooling and multilingual in 10 languages. This release builds on our 35B and is a part of our commitment to make AI breakthroughs accessible to the research community. 🎉https://t.co/2UCLl5sfPB pic.twitter.com/R3U2l6eJ0G — Cohere For AI (@Cohe
WEELメディア事業部LLMライターのゆうやです。 Googleから新しい動画生成AI「VLOGGER」が発表されました。 VLOGGERは、たった一枚の人物の画像と音声から人物の動きを予測し、会話する人間の動画を生成できます。 [写真から動画へ] ・Googleの研究者らが、1枚の静止画像から人物の動画を生成する新しい人工知能システム「VLOGGER」を開発 ・自動的に動画を他の言語に吹き替えたり、欠けているフレームを補完したりする能力があり、俳優の3Dモデルを使って新しいパフォーマンスを生成することも可能… pic.twitter.com/1cJz1D0pcC — 横山貴寛 | テック系重要ニュースを発信 (@ytakahiro0702) March 21, 2024 さらにVLOGGERは、動画の生成だけでなく、動画編集や動画内の音声の翻訳までできちゃうんです! このような恐ろしいほ
WEELメディア事業部LLMリサーチャーの藤崎です。 2024年3月26日、「Stable Code Instruct 3B」を、Stability AIが公開しました。 「stable-code-instruct-3b」は、Stable Code 3Bをベースにした指示学習済みのコード生成言語モデルで、自然言語プロンプトによりコード生成、数学、その他のソフトウェア開発に関連するクエリなどの様々なタスクを処理することができます。 Xでの投稿のいいね数は、すでに1000を超えており、注目されていることが分かります。 Introducing Stable Code Instruct 3B, our new instruction tuned LLM based on Stable Code 3B. With natural language prompting, this model can
WEELメディア事業部リサーチャーのいつきです。 Stable Diffusionで目的にかなう画像を生成するには、重要なパラメータである「CFG Scale(Classifier-Free Guidance Scale)」の理解と活用が欠かせません。 CFG scaleにより、入力したプロンプトや画像の忠実度を手軽に調整できるので便利です。しかし、最適なCFG Scaleの設定が分からないという方もいるのではないでしょうか。 今回は、CFG scaleの基本や設定方法を解説し、数値を変えて画像を比較してみます。おすすめの設定も記載しているため、CFG scaleを駆使して思い通りの画像生成が可能になるでしょう。 ぜひ最後までご覧ください。 CFG Scaleとは CFG Scaleは、Stable Diffusionにおける重要なパラーメーターの1つです。「入力したプロンプトや画像に対し
WEELメディア事業部LLMリサーチャーの中田です。 AIスタートアップ企業のCognitionが開発した完全自立型のエンジニアAI「Devin」の、オープンソース版である「OpenDevin」が公開されました。 あの話題のDevinを、ローカル環境で実行できるんです! The OpenDevin open-source coding assistant is really taking shape! We now have a frontend that connects to a rudimentary agent that solves coding tasks, a docker sandbox, and other things. Next up is optimizing accuracy, we welcome contributions! https://t.co/3Gpb
WEELメディア事業部AIライターの2scです。 みなさん、シンプルな記述でチャートやグラフが作れる「マーメイド記法」はご存知ですか? こちらは2019年の『JavaScript OS Awards』にノミネートされた、クールなプログラミング言語。なんと無料版を含むChatGPTからの生成が可能で、慣れれば一瞬でテキストが図式化できちゃうんです! ということで当記事では、ChatGPT×マーメイド記法で作れる図式の種類やその作り方・裏ワザを紹介していきます。 完読いただくとしばらくの間、なんでも図式化しちゃいたくなるかも…… ぜひ、最後までお読みくださいね。 マーメイド記法とは? 「PowerPointでのプレゼン資料作りが面倒くさい!」「企画書に図式を入れると時間がかかる……」 などなど資料作りでお悩みのあなたに、おすすめのツールがあります! それが……図やグラフを生成できるスクリプト言
WEELメディア事業部LLMリサーチャーの中田です。 3月17日、OpenAIのSoraを再現したプロジェクト「Open-Sora」を、HPC-AI TechのColossal-AIチームが公開しました。 あの話題のSoraを、オープンソースで疑似的に利用できるんだとか! Exciting News from Open-Sora! 🚀 They've just made the ENTIRE suite of their video-generation model open source! Dive into the world of cutting-edge AI with access to model weights, comprehensive training source code, and detailed architecture insights. Start bui
WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんはStable Diffusionの可能性を広げる「Civitai」についてご存知でしょうか。 CivitaiにはStable Diffusionで使用できるAIモデルが多数共有されており、ダウンロードしたモデルを使用すれば生成画像のクオリティを向上させられるのが魅力です。 今回は、Civitaiの概要や使い方、活用事例について詳しく解説します。Civitaiのおすすめモデルや、画像のプロンプト使用方法についてもご紹介していますので、ぜひ最後までご覧ください! Civitaiとは 参考:https://civitai.com/ Civitaiは、Stable Diffusionで使用できるAIモデルを多数共有しているプラットフォームです。ユーザーは簡単なテキスト入力やパラメータの調整を通じて、高品質な画像を生成できます。
次のページ
このページを最初にブックマークしてみませんか?
『WEEL | AIを使う全ての人へ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く