サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
災害への備え
weel.co.jp
AI漫画とは? AI漫画とは、最近YouTubeで流行しているジャンルであり、「AIツールで生成したイラストや音声を用いた作品」を指します。 例えば、以下はAI漫画を運営しているYouTubeチャンネルの動画です。 本来このような漫画系動画を制作するには、下記のようなスキルが必要です。 イラスト作成 ナレーション 動画編集 もちろんスキルがなければ外注するというのも手ですが、外注費用だけで1本あたり安くても2万円以上かかってしまうため、ある程度資金力がなければなりません。 しかし近年、AIツールが進化したことにより、誰でも簡単にイラストや音声を生成できるようになりました。 しかもAIツールは利用料金が安く、ものによっては無料で使えるため、コストも大幅に削減できます。 つまり、スキル・資金力がなくても、誰でも簡単に漫画系動画が制作できる時代がやって来たのです! 実際、たった5本のAI漫画動画
WEELメディア事業部LLMライターのゆうやです。 MiniCPM-Llama3-V 2.5は、中国のOpenBMB(Open Lab for Big Model Base)が開発した最新のオープンソースマルチモーダル言語モデルで、8BというサイズながらGPT-4Vと同等の性能を有しています。 🚀 Excited to introduce MiniCPM-Llama3-V 2.5! With 8B parameters, it’s our latest breakthrough, outperforming top models like GPT-4V. 📈 💪 Superior OCR capabilities 🔑 Supports 30+ languages HuggingFace:https://t.co/Skivve1BgN GitHub:https://t.co/x868
WEELメディア事業部AIライターの2scです。 みなさん、各種文書の引用機能「RAG」を備えた生成AIチャットボットにはNGがあります。 それは……「文書をそのまま読み込ませる」ということです。実はRAGの場合、読み込ませる文書に「前処理」を施す必要があります。前処理なしだと、正しく引用が行われなかったり、ハルシネーションが生じたりしてしまうんです。 ということで今回は、RAGの前処理について、その効果や手法をお伝えします。さらに、RAGの精度を高めるTipsも紹介!完読いただくと「かしこいチャットボット」が作れるかも……です。 ぜひ、最後までお読みください。 RAGにおける「前処理」とは? LLM(大規模言語モデル)に学習範囲外の知識・事実を示す手法「RAG / Retrieval Augmented Generation」は、企業用チャットボットの開発に不可欠。そのしくみは下図のとお
ChatGPTを使って文字起こし・議事録作成!プラグインやGPTs、プロンプトも紹介 2024 5/06 議事録の作成や文字起こしは簡単にできる作業ではなく、相当な時間を要します。また、担当者によって内容の質やかかる時間にバラつきがあり、属人的要素の強い業務です。 ChatGPTでは、入力したテキストの要約が可能です。また、現在はテキストだけでなく音声情報にも対応しています。ChatGPTと関連するツールを組み合わせると、議事録の作成や文字起こしなどの作業を大幅に効率化できるでしょう。 この記事では、ChatGPTと組み合わせて 文字起こしや議事録作成に使えるツールを紹介します。ビジネスや教育における人材不足の解消、価値の高い業務へのリソース配置の実現に役立ててください。 ChatGPTには議事録作成や文字起こしができるプラグインもありますが、プラグイン機能の使用は2024年4月9日に終了
WEELメディア事業部リサーチャーの大竹です。 2022年12月頃、検索エンジンMicrosoft Bingと大規模言語モデルGPTを活用したPerplexityが登場。AIに質問を投げかけると、インターネットから収集した情報を基に回答を生成できます。 大規模言語モデルは、10兆トークンの学習データで開発されたGPT4も選択可能。人間が書いた文章に近い回答を出力できます。 まるで、映画『アイアンマン』にてトニー・スタークが使う、リアルタイムで情報を取得し問題を解決するAIアシスタントのジャービスのようです! この記事では、Perplexityの特徴と使い方について解説します。社内業務改善や研究のための論文検索などにお役立てください。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 Perplexityの概要 Perplexityとは、A
メディア事業部AIライターのたけしとLLMリサーチャーの中田です。この記事は専門的な内容を含むため、AIスペシャリストとの共同執筆となっています。 2023年11月15日、Builder.ioより「GPT Crawler」がオープンソース化されました。 GPT Crawlを利用すれば、URLを指定するだけで、そのサイト独自のGPTsをたった2分で簡単に作れてしまうんです! というわけで今回は、GPT Crawlerの概要や使い方について詳しく解説します。 ぜひ最後までご覧いただき、お手元のPCでGPTsを作成してみてください! なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 GPT Crawlerの概要 GPT Crawlerは、【サイトのURLを指定するだけで、独自のGPTsをChatGPT上で作成できるソフトウェア】です。 例として
WEELメディア事業部LLMライターのゆうやです。 2024年4月24日、ついにあのAppleからオープンソースLLMである「OpenELM」が登場しました! Appleが「OpenELM」なるAIモデルファミリーをオープンソースでリリース! ネットに接続なしで、完全にデバイス上で動く前提でを重視して作ったとのこと。 これはスマホ上で動く大本命LLMになる可能性大! pic.twitter.com/N25jNwQzq5 — とーます|AIX人材育成|AIコーチ開発|可能性開花をAIX (@Xroid_Lab) April 24, 2024 このモデルは、4つの異なるサイズ(270M、450M、1.1B、3B)で公開され、軽量で実行コストが低いためAppleデバイスでも動作します。また、「layer-wise scaling戦略」を使用し、効率的にパラメータを活用することで他の同規模モデルよ
【Suno AI】テキストだけで曲、歌詞、歌声を作れる禁断の音楽生成AIの使い方〜実践まで 2024 4/18 皆さんは「Suno」という音楽生成AIをご存じですか? Suno AIは、これまで出来なかったユーザーが入力した歌詞でヴォーカルまで生成してくれる革新的な音楽生成AIです。さらに音楽の知識や作曲知識がなくともプロンプト次第で、あなたも音楽プロデューサーになれてしまうとんでもないAIなのです。 今回は、Sunoの概要や実際に使ってみた感想、Stability AI社が2023年9月に公開したStable Audioとの比較をお届けします。 Suno AIの登場によって誰でも簡単に音楽制作をできるような時代がやってきたと言えるほど、革新的なサービスであるSuno。 その優れている点や将来性についても触れますので、是非最後までご覧ください! なお弊社では、生成AIツール開発についての無
【悪用厳禁ChatGPTプラグイン】他社サイトをスクレイピングできる「Scraper」の導入方法から使い方 2024 4/29 今回は、Webサイトから情報をスクレイピングできる、ChatGPTプラグイン「Scraper」を紹介します。スクレイピングとは、Webサイトから情報を自動的に取得する技術のことを指します。手動で情報を集める手間が省け、大量のデータを効率的に処理することが可能です。 例えば、下記の様なことができます。 特定した商品の価格情報を複数のECサイトから一括で取得 ニュースサイトの最新記事を自動的に取得 この技術は、市場調査や競合分析、ニュースのトレンド分析など、ビジネスの様々な場面で活用されています。「Scraper」プラグインは、プログラミング知識がなくても、スクレイピング作業をChatGPTの簡単なプロンプトで行うことが可能です。 スクレイピングは情報収集の効率化を実
WEELメディア事業部LLMライターのゆうやです。 2024年4月18日、ついにMetaよりLlamaシリーズの最新モデルとなるLlama 3が公開されました! Introducing Meta Llama 3: the most capable openly available LLM to date. Today we’re releasing 8B & 70B models that deliver on new capabilities such as improved reasoning and set a new state-of-the-art for models of their sizes. Today's release includes the first two Llama 3… pic.twitter.com/Q80lVTeS7m — AI at Meta (@
WEELメディア事業部LLMリサーチャーの中田です。 2月7日、Stable Diffusionの新webUI「Stable Diffusion WebUI Forge」が公開されました。このモデルを使うことで、省エネかつ高速な画像生成が可能になるんです、、、! Stable Diffusion WebUI Forgeに関するXの投稿のいいね数は、すでに1100を超えており、国内だけでもかなり注目されていることが分かります。 Controlnetのlllyasviel氏がStableDiffusion用の新webUI「forge」を公開。8GB程度のVRAMなら約30~45%の高速化が見込め、out of memoryを起こさずに約2~3倍の解像度で生成できるようになるとしています。 A1111版webUIを100%使用しており、基本UIは変わらない模様(▼)https://t.co/mk
WEELメディア事業部LLMライターのゆうやです。 2024年4月4日、CohereForAIから最新のLLMとなるCommand R+が公開されました。 Announcing C4AI Command R+ open weights, a state-of-the-art 104B LLM with RAG, tooling and multilingual in 10 languages. This release builds on our 35B and is a part of our commitment to make AI breakthroughs accessible to the research community. 🎉https://t.co/2UCLl5sfPB pic.twitter.com/R3U2l6eJ0G — Cohere For AI (@Cohe
WEELメディア事業部LLMライターのゆうやです。 Googleから新しい動画生成AI「VLOGGER」が発表されました。 VLOGGERは、たった一枚の人物の画像と音声から人物の動きを予測し、会話する人間の動画を生成できます。 [写真から動画へ] ・Googleの研究者らが、1枚の静止画像から人物の動画を生成する新しい人工知能システム「VLOGGER」を開発 ・自動的に動画を他の言語に吹き替えたり、欠けているフレームを補完したりする能力があり、俳優の3Dモデルを使って新しいパフォーマンスを生成することも可能… pic.twitter.com/1cJz1D0pcC — 横山貴寛 | テック系重要ニュースを発信 (@ytakahiro0702) March 21, 2024 さらにVLOGGERは、動画の生成だけでなく、動画編集や動画内の音声の翻訳までできちゃうんです! このような恐ろしいほ
WEELメディア事業部LLMリサーチャーの藤崎です。 2024年3月26日、「Stable Code Instruct 3B」を、Stability AIが公開しました。 「stable-code-instruct-3b」は、Stable Code 3Bをベースにした指示学習済みのコード生成言語モデルで、自然言語プロンプトによりコード生成、数学、その他のソフトウェア開発に関連するクエリなどの様々なタスクを処理することができます。 Xでの投稿のいいね数は、すでに1000を超えており、注目されていることが分かります。 Introducing Stable Code Instruct 3B, our new instruction tuned LLM based on Stable Code 3B. With natural language prompting, this model can
Stable DiffusionのCFG scaleとは?おすすめの設定値と使い方を徹底解説 2024 3/29 WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんはStable Diffusionのパラメーターである「CFG scale」についてご存知でしょうか。CFG scaleを活用すれば、入力したプロンプトや画像の忠実度を手軽に調整できるので便利です。 今回は、CFG scaleの概要や設定方法、パラメーターごとの画像の違いについて詳しく解説します。最後まで目を通していただければ、CFG scaleを駆使して、思い通りの画像生成ができるようになるでしょう。 ぜひ最後までご覧ください。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる CFG Scaleとは CFG Scaleは、St
WEELメディア事業部LLMリサーチャーの中田です。 AIスタートアップ企業のCognitionが開発した完全自立型のエンジニアAI「Devin」の、オープンソース版である「OpenDevin」が公開されました。 あの話題のDevinを、ローカル環境で実行できるんです! The OpenDevin open-source coding assistant is really taking shape! We now have a frontend that connects to a rudimentary agent that solves coding tasks, a docker sandbox, and other things. Next up is optimizing accuracy, we welcome contributions! https://t.co/3Gpb
WEELメディア事業部AIライターの2scです。 みなさん、シンプルな記述でチャートやグラフが作れる「マーメイド記法」はご存知ですか? こちらは2019年の『JavaScript OS Awards』にノミネートされた、クールなプログラミング言語。なんと無料版を含むChatGPTからの生成が可能で、慣れれば一瞬でテキストが図式化できちゃうんです! ということで当記事では、ChatGPT×マーメイド記法で作れる図式の種類やその作り方・裏ワザを紹介していきます。 完読いただくとしばらくの間、なんでも図式化しちゃいたくなるかも…… ぜひ、最後までお読みくださいね。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる マーメイド記法とは? 「PowerPointでのプレゼン資料作りが面倒くさい!」「企画書に図式を入れると
WEELメディア事業部LLMリサーチャーの中田です。 3月17日、OpenAIのSoraを再現したプロジェクト「Open-Sora」を、HPC-AI TechのColossal-AIチームが公開しました。 あの話題のSoraを、オープンソースで疑似的に利用できるんだとか! Exciting News from Open-Sora! 🚀 They've just made the ENTIRE suite of their video-generation model open source! Dive into the world of cutting-edge AI with access to model weights, comprehensive training source code, and detailed architecture insights. Start bui
Stable Diffusionの可能性を広げるCivitaiとは?使い方や注意点を徹底解説 2024 3/22 WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんはStable Diffusionの可能性を広げる「Civitai」についてご存知でしょうか。 CivitaiにはStable Diffusionで使用できるAIモデルが多数共有されており、ダウンロードしたモデルを使用すれば生成画像のクオリティを向上させれるのが魅力です。 今回は、Civitaiの概要や使い方、活用事例について詳しく解説します。最後まで目を通していただければ、Civitaiを活用したハイクオリティな画像生成をマスターできるでしょう。 ぜひ最後までご覧ください。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Ci
WEELメディア事業部LLMリサーチャーの中田です。 3月11日、日本語特化型の大規模言語モデル「Swallow on mistral(Swallow-MS 7B, Swallow-MX 8x7B)」を、東京工業大学の岡崎研究室と横田研究室、産業技術総合研究所の研究チームが公開しました。 このモデルは、「Mistral 7B」と「Mixtral 8x7B」の日本語能力が強化されたものなんです! Xでの投稿のいいね数は、国内だけですでに300を超えており、注目されていることが分かります。 大規模言語モデルSwallow-MS 7BとSwallow-MX 8x7Bを公開しました。東京工業大学の岡崎研究室と横田研究室、産業技術総合研究所の研究チームでMistral 7BとMixtral 8x7Bの日本語能力を引き上げました。Swallow-MS 7Bはオープンな7BのLLMの中で日本語最高性能を
WEELメディア事業部LLMライターのゆうやです。 2024年3月12日、ELYZA-japanese-Llama-2-7bなどの日本語特化LLMを開発してきたELYZA社が、最新の700億パラメータの大規模言語モデル (LLM) である「ELYZA-japanese-Llama-2-70b」を公開しました。 【お知らせ】700億パラメータの日本語LLM「ELYZA-japanese-Llama-2-70b」を開発し、グローバルモデルに匹敵する性能を達成しました。デモサイトも同時に公開しています。 詳細は以下をクリックしてご覧ください。https://t.co/kw8euBuKz5 — ELYZA, Inc. (@ELYZA_inc) March 12, 2024 このモデルは、これまでのモデルと同様に、Meta社の「Llama2」をベースに、日本語の追加事前学習と事後学習を行い、Llam
WEELメディア事業部LLMリサーチャーの中田です。 3月14日、最先端のオープンソース自律型エージェント「Data Interpreter」を、MetaGPTが公開しました。 このツールを用いることで、以下のように「NVIDIAの株価予測のためのPythonコーディング」を簡単に行えるんです! Do the Data Analysis and ML Modeling: Nividia Stock Prediction pic.twitter.com/s1ZjYUWSfJ — MetaGPT (@MetaGPT_) March 14, 2024 Introducing MetaGPT's Data Interpreter: Open Source and Better "Devin". Data Interpreter has achieved state-of-the-art score
Evaluation is everything! While testing Inflection-2.5, we found that MT-Bench has a bunch of incorrect answers. Here we share the corrections for everyone to use, and we release a new Physics GRE benchmark for people to try out.https://t.co/CDkcqOPGrp — Inflection AI (@inflectionAI) March 7, 2024 Inflection-2.5の概要 「Inflection-2.5」は、Inflection AIによって開発された汎用LLMです。同社が開発したチャットボットの「Pi」に搭載されています。 「Pi」は
WEELメディア事業部リサーチャーのいつきです。 突然ですが、みなさんは「Claude 3」を活用されているでしょうか? Claude 3は2024年3月4日に公開された新しい言語モデルで、その性能はGPT-4をも上回ると言われるほどです。 今回は、Claude 3の活用事例を10個ご紹介するので、まだ使ったことがない方は参考にしてみてください。 Claude 3について詳しく知りたい方は、こちらの記事をご覧ください。 最後まで目を通せば、新たな言語モデルの可能性に気づけるので、今後積極的に業務効率化を図れるようになること間違いなしです。 ぜひ最後までご覧ください! なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Claude 3とは 「Claude 3」は、Anthropicが発表した大規模言語モデルです。
WEELメディア事業部LLMリサーチャーの中田です。 3月4日、次世代の大規模言語モデル「Claude 3」を、Anthropicが公開しました。 特に、Claude 3 Opusは、様々な業界ベンチマークでSOTAを達成しており、GPT-4よりも高い性能を発揮しているんです! 【Claude 3がリリース🔥】 OpenAIの競合である「Anthropic」が、全てのスコアにおいてChatGPTとGeminiの最高モデルを上回る「Claude 3」をリリース。 Claude3には3種類のモデルがある ・性能が高く、市場最高のパフォーマンスを発揮する「Claude 3 Opus」… pic.twitter.com/yLm7gYnORf — 木内翔大@SHIFT AI代表「日本をAI先進国に」𝕏 (@shota7180) March 4, 2024
WEELメディア事業部LLMライターのゆうやです。 2024年2月26日、MIstral 7BやMixtral 8×7Bなどを開発したMistral AI社が最新のLLM「Mistral Large」を公開しました。 このモデルは、Mistral AIが「最高レベルの推論能力」を持つと自信を持って語る新たなフラッグシップモデルです。 数あるLLMの中で最高クラスの性能を持つだけでなく、Gemini Proなどのクローズドモデルよりも高いベンチマークスコアを獲得し、様々なベンチマーク結果が、GPT-4に次ぐ世界第2位となっています! MMLUのベンチマーク結果 引用元:https://mistral.ai/news/mistral-large/ また、Mistral Largreと同時に「Le Chat」というチャットインターフェースも公開され、Le chatを通じてMIstralのモデルが
WEELメディア事業部LLMリサーチャーの中田です。 2月21日、オープンソースの大規模言語モデル「Gemma」を、Googleが公開しました。 このモデルはGeminiをもとに設計されており、軽量ながら高精度なんです! For my first official contribution to the @modal_labs examples: running Gemma 7B on an H100 at >2500 tok/s 🚀 With very little effort, that's already just ~75¢ per megatoken — and you have full "tensors-and-a-shell" control over the execution environment pic.twitter.com/D6ls1m8MAE — Charl
WEELメディア事業部LLMリサーチャーの中田です。 ここ数日で、言語生成AIの「Groq」が話題になりました。 これにより、GPTよりも高速でテキストを生成できるんです、、、! "GPT-3.5 class LLMs are too slow." Sure, that was true last week. Here is Groq (not the same as Musk's Grok) running Llama 2. Watch for the moment I click send. If you want to try: https://t.co/aZKkWVsamS pic.twitter.com/gOlB4cL5MC — Ethan Mollick (@emollick) February 19, 2024 XでのGroq関連の投稿のいいね数は、すで1100を超えており、
2024年2月15日(米国時間)に突如OpenAIから発表された動画生成AIの「Sora」。2024年2月16日(日本時間)現在、アーティストやデザイナーなどの一部のみしかアクセスが許可されていないため、一般公開はされていませんが、発表直後より世界中で大きな注目を集めています。 この記事では、新しく発表されたSoraの特徴や今後期待できるSoraの活用方法について解説します。最後までお読みいただくことで、Soraのすごいところがわかるので、ぜひご覧ください。 なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる Soraとは? 前述の通り、OpenAIから発表された新しい動画生成AIです。まだ一般公開されてはいませんが、公式サイトやX(旧Twitter)上にSoraで生成された動画が公開されており、その動画のクオリ
次のページ
このページを最初にブックマークしてみませんか?
『WEEL | AIを使う全ての人へ』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く