並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 4086件

新着順 人気順

テキストの検索結果41 - 80 件 / 4086件

  • 無料&ブラウザ上でPDF・JPEG・PNG・GIFファイルからOCRによるテキスト抽出ができる「OCR PDFs and images directly in your browser」

    PNG・JPEG・GIFといった画像ファイルやPDFファイルから、TesseractによるOCR(光学文字認識)でテキストを抽出できる「OCR PDFs and images directly in your browser」をエンジニアのサイモン・ウィルソン氏が公開しました。OCR PDFs and images directly in your browserはすべての処理をブラウザ上で実行するため、ファイルをどこかのサーバーにアップロードすることがないというのが大きな特徴です。 OCR PDFs and images directly in your browser https://tools.simonwillison.net/ocr Running OCR against PDFs and images directly in your browser https://simon

      無料&ブラウザ上でPDF・JPEG・PNG・GIFファイルからOCRによるテキスト抽出ができる「OCR PDFs and images directly in your browser」
    • Excelに毎度同じWebサイト上のテキストデータをまとめる苦行は自動化で解脱!【残業を減らす!Officeテクニック】

        Excelに毎度同じWebサイト上のテキストデータをまとめる苦行は自動化で解脱!【残業を減らす!Officeテクニック】
      • 心を読んでテキストに変換する「BrainGPT」が登場、実験の様子がムービーで確認可能

        2023年12月10日から16日にかけて行われた機械学習と計算論的神経科学のカンファレンスイベント「NeurIPS」において、シドニー工科大学の研究チームによる「生の脳波を直接言語に翻訳する」という大規模言語モデル「BrainGPT」の論文が注目論文として選出されました。 Portable, non-invasive, mind-reading AI turns thoughts into text | University of Technology Sydney https://www.uts.edu.au/news/tech-design/portable-non-invasive-mind-reading-ai-turns-thoughts-text New Mind-Reading "BrainGPT" Turns Thoughts Into Text On Screen | I

          心を読んでテキストに変換する「BrainGPT」が登場、実験の様子がムービーで確認可能
        • Figmaの基本機能で簡単につくる、テキスト&あしらい表現TIPS - ICS MEDIA

          リリース以来数多くのアップデートが行われ、多機能になっていくFigma。今回はそんなFigmaの基本機能を使用した、簡単なデザイン作成やあしらいづくりに活かせる表現TIPSを紹介します。 テキストの表現 マスク機能やエフェクト、そしてレイヤーのブレンドモードを使用したテキストの表現をいくつか紹介します。 TIPS:画像をテキストでマスクする マスク機能を使用して、画像をテキストの形に切り抜きます。 以下の手順で切り抜きます。 画像とテキストレイヤーを用意 画像が前面になるようにして、画像とテキストレイヤーを重ねる 両方のレイヤーを選択状態にして、右クリックメニューから[マスクとして使用]を選択(ショートカットキーは、Mac:control + command + M、Windows:Ctrl + Alt + M) マスクした後も、テキストレイヤーは編集可能です。 さらに画像をレイヤーブラー

            Figmaの基本機能で簡単につくる、テキスト&あしらい表現TIPS - ICS MEDIA
          • 「AIチャットbotを作りたいけど、どんなリスクがあるの?」 デジタル庁、テキスト生成AIのガイドブック(α版)を公開

            デジタル庁などの関係省庁では2023年12月から、生成AIの業務利用に関する技術検証を進めており、今回のガイドブックもその検証結果を踏まえたものになる。なお今回公開したものはα版。デジタル庁は「現時点では、α版のため内容に不十分な点があるが、生成AI利活用時のリスクや対策に関する議論の参考にしてほしい」と案内している。 今後も定期的に内容の拡充・改善を行い、正式版の公開を目指す。 関連記事 生成AIを巡る日本の現状は? 東大・松尾教授の考察資料が無料公開 「1年間、日本は最善手を指し続けている」 内閣府は5月23日、22日に開催した「第9回 AI戦略会議」で取り扱った資料を公開した。公開したのは、AI研究の権威として知られる東京大学の松尾豊教授が作成した「生成AIの産業における可能性」と題した全33ページの資料など。 「RAGはそんなに簡単じゃない」──AIエンジニア主導でLLMを導入する

              「AIチャットbotを作りたいけど、どんなリスクがあるの?」 デジタル庁、テキスト生成AIのガイドブック(α版)を公開
            • X (Twitter) で従来のようにOGP画像にタイトル等のテキストを表示する方法まとめ

              2023年10月5日頃、X (Twitter) でOGP画像が設定されたWebページの URLをツイート(ポスト)しても従来のようにページのタイトルや概要が表示されなくなり、OGP画像とドメイン名だけが表示されるようになりました。 このままでは、画像の投稿 なのか、リンクの投稿なのかが分かりにくくなり、「画像だと思ってタップしたら外部のページに遷移してしまった」とか、逆に「リンクだと思ってタップしたら画像だった」ということで困っている方もいらっしゃるようです。 Webメディアを運用している方や、 私のようにブログを運用している場合などは、 このままではサイトへの流入が減少するため困ると言う方もいらっしゃると思います。 そこで、この記事では、「閲覧者側」と「メディア運営者側」と「ツイート(ポスト)投稿者側」それぞれにできる対策をまとめました。 投稿者側の対策については、閲覧者側の対策の下に書

                X (Twitter) で従来のようにOGP画像にタイトル等のテキストを表示する方法まとめ
              • 画像生成AIのプロンプトもお任せ! テキスト入力支援ツール「ペースター」v7.31/マウスをポチポチするだけでプロンプトをビルドして挿入できる

                  画像生成AIのプロンプトもお任せ! テキスト入力支援ツール「ペースター」v7.31/マウスをポチポチするだけでプロンプトをビルドして挿入できる
                • 『リュックのお姉さんが出てくるぞ』墓にQRコード彫って故人追悼するサービスと管理の話「テキストならアリ」

                  川峠@Andriders @eaglesakura お墓にQRコードを彫り込むニュースやってるけど、ガチでやめとけ。 20年後にはサービス終了ドメイン失効で、詐欺サイトかリュック背負ったオネーチャンが出てくるぞ。 2023-09-25 18:11:27

                    『リュックのお姉さんが出てくるぞ』墓にQRコード彫って故人追悼するサービスと管理の話「テキストならアリ」
                  • 予告|Illustratorの文字組み機能・テキストエンジンが進化|いまから備えよう!Illustrator 2023(27.7)以降で再保存のお願い

                    予告|Illustratorの文字組み機能・テキストエンジンが進化|いまから備えよう!Illustrator 2023(27.7)以降で再保存のお願い アドビでは現在、Illustratorをはじめとしたデザインアプリケーションの文字組み品質向上のために、テキストエンジンの刷新に取り組んでいます。この記事では、テキストエンジンをアップデートする背景と、アプリケーション側の対応について紹介します。 品質向上のメリットを体験していただくには、みなさんがお手持ちのIllustratorファイル(.ai)を再保存をしていただく必要があります。 ぜひ、最後までご一読ください。 テキストエンジン=文字組みの品質を決めるプログラム Adobe IllustratorやAdobe InDesign、Adobe Photoshop、Adobe Premiere Proといったクリエイティブアプリケーションに

                      予告|Illustratorの文字組み機能・テキストエンジンが進化|いまから備えよう!Illustrator 2023(27.7)以降で再保存のお願い
                    • 「メモ帳」にAI機能、選択テキストの説明を「Copilot in Windows」に依頼/まずはプレビュー版「Windows 11」(Canary/Dev)でテスト

                        「メモ帳」にAI機能、選択テキストの説明を「Copilot in Windows」に依頼/まずはプレビュー版「Windows 11」(Canary/Dev)でテスト
                      • GoogleがAIに無限の長さのテキストを処理できる能力を与える技術を発表

                        Googleの研究者が、大規模言語モデル(LLM)に無限の長さのテキストを処理させる手法だという「Infini-attention」に関する論文を発表しました。 [2404.07143] Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention https://arxiv.org/abs/2404.07143 Google’s new technique gives LLMs infinite context | VentureBeat https://venturebeat.com/ai/googles-new-technique-gives-llms-infinite-context/ Google Demonstrates Method to Scale Languag

                          GoogleがAIに無限の長さのテキストを処理できる能力を与える技術を発表
                        • テキスト抽出不要のRAGを実現するColPali

                          導入 こんにちは、株式会社ナレッジセンスの須藤英寿です。普段はエンジニアとして、LLMを使用したチャットのサービスを提供しており、とりわけRAGシステムの改善は日々の課題になっています。 本記事では、画像の情報をそのままベクトルデータにして検索する手法、ColPaliについて解説します。 サマリー 通常、RAGでは文書データからテキストを抽出して、その文字をベクトルデータに変換します。しかしColPaliは、文書データを画像として認識してベクトル化を行います。画像として保管することでテキスト化できない情報を扱うことができます。他にもベクトルを複数に分解することで精度を改善し、テキストの抽出が必要ないことからデータ保管時のコストの大幅な低減などのメリットを享受できます。 PDFのデータを保管する際には、ColPaliモデルに正規化したPDF画像を入力として渡し1024個の128次元ベクトルを

                            テキスト抽出不要のRAGを実現するColPali
                          • 「Microsoft Copilot」が音楽生成AI「Suno」と提携、テキストでの命令で自由に作曲/プラグインとして提供

                              「Microsoft Copilot」が音楽生成AI「Suno」と提携、テキストでの命令で自由に作曲/プラグインとして提供
                            • GoogleがLLMで「非構造化文書」高精度テキスト抽出するOCR『LMDX』発表 | AIDB

                              ★AIDB会員限定Discordを開設いたしました! 会員登録/ログインの上、マイページをご覧ください。 Googleは、非構造化文書(例えばレシートなど)から高精度にテキストを抽出するOCR(Optical Character Recognition)技術『LMDX(Language Model-based Document Information Extraction and Localization)』を発表しました。この技術は、特にGoogleの大規模な言語モデル「Bard」と、Google DriveやGmailなどのサービスとの連携をさらに強化する可能性もあります。 参照論文情報 タイトル:LMDX: Language Model-based Document Information Extraction and Localization 著者:Vincent Perot, K

                                GoogleがLLMで「非構造化文書」高精度テキスト抽出するOCR『LMDX』発表 | AIDB
                              • ムービーとテキストからフレーム間の一貫性を維持して実用性の高いムービーを生成するAI「StableVideo」

                                2022年8月にStability AIの「Stable Diffusion」が登場して以来、画像生成AIは急激な進歩を遂げ、画像だけではなくムービーも生成できるようになりました。しかし、生成AIによって作られるムービーに描かれるオブジェクトや背景は形を激しく変えたり色が変わったりするため、実用性には乏しいといえます。浙江大学とMicrosoftの研究チームが発表した「StableVideo」はテキスト駆動拡散モデルに時間の概念を導入することで、安定していて実用性が高いムービーを生成することが可能となっています。 rese1f.github.io/StableVideo/ https://rese1f.github.io/StableVideo/ GitHub - rese1f/StableVideo: [ICCV 2023] StableVideo: Text-driven Consis

                                  ムービーとテキストからフレーム間の一貫性を維持して実用性の高いムービーを生成するAI「StableVideo」
                                • なぜか消えた[新規作成]-[テキストドキュメント]右クリックメニューを復活させる【Windows 11】

                                  右クリックメニューの[新規作成]-[テキストドキュメント]を復活させる エクスプローラーの右クリックメニューにある[新規作成]を開いても、[テキストドキュメント]が表示されないことがある。このような場合の対処方法として、レジストリを編集する方法なども紹介されているが、より簡単な方法がある。[テキストドキュメント]を復活させる、より簡単な方法を紹介しよう。 新しいテキストファイルを作成する場合、エクスプローラーやデスクトップの空いているところを右クリックして、表示されたメニュー(コンテキストメニュー)の[新規作成]-[テキストドキュメント]を選択している人も多いのではないだろうか。 ところが、右クリックメニューの[新規作成]を開いても、[テキストドキュメント]が表示されなくなることがある。そのような場合、アプリケーションを開いて、保存する際に[名前を付けて保存]ダイアログで保存先のフォルダま

                                    なぜか消えた[新規作成]-[テキストドキュメント]右クリックメニューを復活させる【Windows 11】
                                  • マーケティング理論のThe教科書of教科書、有斐閣アルマ『マーケティング戦略〈第6版〉』をテキストとした全14回の理論学習プログラムの提供を開始します(無料です!!)|池田紀行@トライバル代表

                                    ついに夢のひとつが叶いました! 何をするのか掲題の通り、マーケティング理論のThe教科書of教科書『マーケティング戦略〈第6版〉』(有斐閣アルマ)をテキストとした全14回の理論学習プログラムの提供を開始します。しかもMARPSだから無料! 講師は不肖ワタクシ池田が務めます。 本書は、実務家マーケターや大学生が体系的なマーケティング理論を学ぶ一冊として高い評判と信頼を獲得してきたまさに定番中の定番の書です(初版は1996年4月)。 MARPSはこのたび、本書の出版元である有斐閣(ゆうひかく)さんおよび著者である和田 充夫 先生(慶應義塾大学名誉教授)、恩藏 直人 先生(早稲田大学教授)、三浦 俊彦 先生(中央大学教授)の了承を得て、本書をテキストとした理論学習プログラムの提供を開始できる運びとなりました。 僕はいつか(それこそ20年くらい前から)本書をテキストとした理論学習プログラムを提供し

                                      マーケティング理論のThe教科書of教科書、有斐閣アルマ『マーケティング戦略〈第6版〉』をテキストとした全14回の理論学習プログラムの提供を開始します(無料です!!)|池田紀行@トライバル代表
                                    • 「OneNote」に統合された新しい「付箋」アプリ、すべてのユーザーが利用可能に/スクリーンショット、OCR(画像のテキスト認識)、ソースURLの自動追加などに対応

                                        「OneNote」に統合された新しい「付箋」アプリ、すべてのユーザーが利用可能に/スクリーンショット、OCR(画像のテキスト認識)、ソースURLの自動追加などに対応
                                      • YouTube、テキストや鼻歌から楽曲をAI生成する機能

                                          YouTube、テキストや鼻歌から楽曲をAI生成する機能
                                        • インターネットとウッチャンナンチャンと日記猿人と日記才人とテキスト庵と私(インターネット老人会 Advent Calendar 2023 18日目) - Really Saying Something

                                          この記事は、インターネット老人会 Advent Calendar 2023の18日目の記事です。 インターネット老人会 Advent Calendar 2023 - Adventar 老人会なのでたっぷり自分の昔話をします。 インターネットとの出会い(1996年) 私とインターネットの出会いは学生時代。大学の計算センターでインターネットに関する授業を受け、HTMLを教わり、「日本の新着情報」(NTT)や「ディレクトリ型」のWebサイト(ヤフーなど)を知り、fjの存在も知り(ちょっとしか触らなかった)、自分の「ホームページ」を作る課題が出た、というのが長きにわたるネットとの付き合いの幕開けでした。 ホームページといってもせいぜい自己紹介を書いて写真や画像素材を載せ、marqeeやblinkやcenterタグを駆使したWeb0.3みたいなものでしたが、自分の手でWebページを作ったり変えたり消

                                            インターネットとウッチャンナンチャンと日記猿人と日記才人とテキスト庵と私(インターネット老人会 Advent Calendar 2023 18日目) - Really Saying Something
                                          • テキストで指定した音楽を自動で生成するAI「Stable Audio」が登場

                                            画像生成AI「Stable Diffusion」の開発で知られるAI開発企業のStability AIが音楽生成AI「Stable Audio」をリリースしました。Stable Audioを使えば文章で指示するだけで音楽を生成できるとのこと。ただし、記事作成時点ではアクセス過多によって音楽生成が失敗する状況に陥っています。 音楽とサウンド生成のための「Stable Audio」を発表 — Stability AI Japan https://ja.stability.ai/blog/stable-audio Stable Audioは生成したい音楽に含まれる要素をテキストで入力するだけで音楽を生成できるAIアプリです。「Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw

                                              テキストで指定した音楽を自動で生成するAI「Stable Audio」が登場
                                            • ノートにまとめるより「テキストに書き込む派」向け。理解と記憶に効く本当に効果的な書き込み方 - STUDY HACKER(スタディーハッカー)|社会人の勉強法&英語学習

                                              「勉強効果が上がるとわかっていても、わざわざノートを書くのは面倒」 「ノートをまとめる時間がもったいない」 そう感じた経験はありませんか? ノートをとる本来の目的は、勉強した内容を覚え、仕事や試験に活かすこと。知識が身につくならば、ノートに書かず直接テキストに書き込んでもいいはずですよね。 そこで、本記事ではテキストへの書き込みで効率よく知識を定着させる方法を紹介します。ぜひ日々の勉強にお役立てください。 【ライタープロフィール】 澤田みのり 大学では数学を専攻。卒業後はSEとしてIT企業に勤務した。仕事のパフォーマンスアップに不可欠な身体の整え方に関心が高く、働きながらピラティスの国際資格を取得。現在は国際中医師合格を目指し毎日勉強している。勉強効率を上げるため、脳科学や記憶術についても積極的に学習中。 効果的な書き込み方1. ペンの色は1色だけにする 効果的な書き込み方2. 余白に要約

                                                ノートにまとめるより「テキストに書き込む派」向け。理解と記憶に効く本当に効果的な書き込み方 - STUDY HACKER(スタディーハッカー)|社会人の勉強法&英語学習
                                              • 音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル(LLM)「AnyGPT」が登場

                                                音声・テキスト・画像・音楽など複数の種類のデータを一度に処理できるマルチモーダルな大規模言語モデル(LLM)の「AnyGPT」が発表されました。 AnyGPT https://junzhan2000.github.io/AnyGPT.github.io/ 既存の大規模言語モデル(LLM)のアーキテクチャやトレーニングパラダイムを変更することなく、安定してトレーニングすることができるという新しいマルチモーダルLLMがAnyGPTです。AnyGPTはデータレベルの前処理のみに依存しており、新しい言語を組み込むのと同様に、新しいモダリティのLLMへのシームレスな統合を促進することが可能。マルチモーダルアライメントの事前トレーニング用に、マルチモーダルテキスト中心のデータセットを構築することで、生成モデルを利用して大規模な「Any-to-Any」(任意のデータ形式から任意のデータ形式に出力できる)

                                                  音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル(LLM)「AnyGPT」が登場
                                                • Illustrator の「テキストからベクター生成(AI生成機能)」で、統一感のあるアイコンを制作する方法

                                                  Illustrator に「テキストからベクター生成」というAI生成機能が搭載されました。 この記事では「統一感のある、ゲーム風ベクターアイコンの制作」を例に使い方を解説します。

                                                    Illustrator の「テキストからベクター生成(AI生成機能)」で、統一感のあるアイコンを制作する方法
                                                  • テキストを1文字ずつアニメーションさせる時の注意点と実装例 | TAKLOG

                                                    次の実装例のように、テキストを1文字ずつspan要素で区切ってアニメーションする際の注意点と実装例について纏めたメモ書きです。 実装例テキストアニメーションの実装例(英文)

                                                      テキストを1文字ずつアニメーションさせる時の注意点と実装例 | TAKLOG
                                                    • CSSの擬似要素に代替テキストをつける

                                                      こんにちは、株式会社ナレッジワークの@nakajmgです。 今回はChrome 127 betaの機能紹介を見て「こんなのあったの?」となった、擬似要素に代替テキストをつける機能について紹介します。 /で区切って代替テキストが指定できる ::beforeや::afterのcontentプロパティは、/区切りで代替テキストが指定できます。

                                                        CSSの擬似要素に代替テキストをつける
                                                      • キャプチャー画像をOCRで素早くテキスト化 いざというとき便利なSnipping Toolの活用法【Windows 11】

                                                        Snipping Toolの便利な機能を紹介 Windows 11の標準スクリーンキャプチャーツール「Snipping Tool」には、スクリーンキャプチャーや画面の録画をするだけでなく、ちょっとした編集も可能になっている。本Tech TIPSでは、いつの間にか追加された「OCR機能」と「墨消し機能」の2つの使い方を紹介しよう。 Windows 11でスクリーンキャプチャーを撮る場合、[Windows]+[Shift]+[S]キーを使っている人も多いのではないだろうか。[Windows]+[Shift]+[S]キーを押すと、Windows 11の標準スクリーンキャプチャーツール「Snipping Tool」が呼び出される。このツールは、着々と進化しており、単純にスクリーンキャプチャーや画面の録画をするだけでなく、ちょっとした編集も可能になっている。 本Tech TIPSでは、「Snippi

                                                          キャプチャー画像をOCRで素早くテキスト化 いざというとき便利なSnipping Toolの活用法【Windows 11】
                                                        • Vertex AIとBigQueryでつくる、簡単ベクトル検索&テキスト分析システム | DevelopersIO

                                                          Vertex AIパイプラインを使うことで、BigQueryおよびBigQueryから参照できるデータを対象にしつつも、Google Cloud Pipeline ComponentsやVertex AIメタデータなどVertex AIの機能の恩恵もできるだけ受けることができます。 データアナリティクス事業本部 機械学習チームの鈴木です。 BigQueryでは、Vertex AIと連携して格納したデータを生成AIで処理することが可能です。 例えばテーブルに格納済みのテキストをもとに埋め込みベクトルや別のテキストを生成することができます。 特に埋め込みベクトルがあれば興味があるテキストに類似したテキストをBigQuery内で検索し、類似レコードの特徴から関心のあるテキストを分析することもできます。また、RAGに使用することもできます。 今回はBigQueryとVertex AIを使って、テー

                                                            Vertex AIとBigQueryでつくる、簡単ベクトル検索&テキスト分析システム | DevelopersIO
                                                          • macOSのVisionフレームワークでOBSの映像からテキストを抽出するWebSocketプロキシ - 詩と創作・思索のひろば

                                                            激安HDMIキャプチャーボードを買ってから、ときどきゲームプレイの録画・配信をしている。OBS Studioというソフトウェアがデファクトらしく、自分もこれを使っている。 便利なことにOBSにはWebSocketで操作できるインタフェースがあり、JavaScriptやPythonからかなり自由に操作することができる。となればソフトウェアエンジニアとしてはプレイログを構造化して残したいわけ。 WebSocket経由でスクリーンショットも随時取得できるので、画像を分析することでたとえばシーン判定はできるが、さらに詳細な情報を取ろうとするとテキスト情報もほしい。クラウドサービスなどに金をかけずに手軽にやるならTessaract一択となるが、素晴らしいソフトウェアではあるものの期待する精度を出すには工夫がいりそう。具体的には、ポケモンの名前は日本語だけでなく中国語の場合もある(左下の「古劍豹」)。

                                                              macOSのVisionフレームワークでOBSの映像からテキストを抽出するWebSocketプロキシ - 詩と創作・思索のひろば
                                                            • テキストからの実世界理解に向けて

                                                              IBIS2023 企画セッション1 Vision and Languageの最前線 テキストからの実世界理解に向けて

                                                                テキストからの実世界理解に向けて
                                                              • ブラウザ版「Illustrator」、β版を一般公開 テキストからベクター画像を生成するAI機能も搭載へ

                                                                なお、現時点では英語版のみの提供となっており、日本からもアクセスはできるがUIは英語のまま。搭載されている機能も少なく、パブリックβでより多くのユーザーからフィードバックを得て正式版の提供を目指す。Photoshop Web版と同じく、正式版もCreative Cloudの全有料ユーザーであれば利用可能となる見込み。 Illustratorなどデザインツールを担当する同社バイスプレジデントのエリック・スノーデン氏によると、同日に発表された生成AI機能「テキストからベクター生成」なども利用できるとのニュアンスだったが、こちらもβ版のためか現時点では実装されていない。先行して9月28日から正式リリースされたPhotoshop Web版を見るに、今後実装されるとみられる。 (取材協力:アドビ) 関連記事 イラレに「テキストからベクター生成」登場 編集できるベクター画像をプロンプトで一発生成 米A

                                                                  ブラウザ版「Illustrator」、β版を一般公開 テキストからベクター画像を生成するAI機能も搭載へ
                                                                • Stability AI、テキスト→動画の「Stable Video Diffusion」をGitHubで公開

                                                                  Stability AI、テキスト→動画の「Stable Video Diffusion」をGitHubで公開 Stability AIは、テキストから動画を生成するAIモデル「Stable Video Diffusion」のリサーチプレビュー版をGitHubで公開した。テキスト入力のためのWebツールを入手するにはウェイティングリストに登録する必要がある。

                                                                    Stability AI、テキスト→動画の「Stable Video Diffusion」をGitHubで公開
                                                                  • ≪買取価格最大80%UP ~1/15≫ 大掃除にもってこい、大学受験の参考書や赤本・予備校テキストを買い取ってくれる「学参プラザ」!?【妄想カタログ】 - YANO-T’s blog

                                                                    [本ページはプロモーションが含まれています] ブログの前のみなさ~ん、 今回もYANO-T's blogにお越し頂き ありがとうございます。 感謝感謝。 広告・スポンサーリンク 今回の妄想カタログのテーマは ≪買取価格最大80%UP ~1/15≫ 大掃除にもってこい、大学受験の参考書や赤本・予備校テキストを買い取ってくれる「学参プラザ」!? 何気なしに、何の目的も持たずネットサーフィンをしていたら、 「大学受験の参考書や赤本、予備校テキストを買い取ってくれる」 という特化したサイトを見つけました。 それが、 学参プラザ です。 広告・スポンサーリンク☝☝☝ 受験も終わって参考書など不要になったけど、古本屋では下取ってくれず、廃品回収に出すのももったいなく......... って、押入れの奥や倉庫に眠っている、って人、多くありませんか? それをしたどってくれるんです(;゚Д゚) ちょうど

                                                                      ≪買取価格最大80%UP ~1/15≫ 大掃除にもってこい、大学受験の参考書や赤本・予備校テキストを買い取ってくれる「学参プラザ」!?【妄想カタログ】 - YANO-T’s blog
                                                                    • 生成AIがアシストしてくれるテキストエディターが爆誕! 「EmEditor」のマクロで実現[Sponsored]

                                                                        生成AIがアシストしてくれるテキストエディターが爆誕! 「EmEditor」のマクロで実現[Sponsored]
                                                                      • YouTube、生成AIでテキストからショート動画背景を“創造”

                                                                          YouTube、生成AIでテキストからショート動画背景を“創造”
                                                                        • 「Notepad++」が20周年 ~マルチ編集をフルサポートした記念バージョンv8.6が公開/海外のプログラマーを中心に幅広い支持を集めているWindows向けのテキストエディター

                                                                            「Notepad++」が20周年 ~マルチ編集をフルサポートした記念バージョンv8.6が公開/海外のプログラマーを中心に幅広い支持を集めているWindows向けのテキストエディター
                                                                          • 1兆のテキストトークン・34億個の画像・PDF・ArXivの論文などを含むオープンソースのデータセット「MINT-1T」をSalesforceが公開

                                                                            クラウドコンピューティングサービスを提供するSalesforceのAI研究部門・Salesforce AI Researchが、1兆ものテキストトークンを含むオープンソースのマルチモーダルデータセット「MINT-1T」を公開しました。 GitHub - mlfoundations/MINT-1T: MINT-1T: A one trillion token multimodal interleaved dataset. https://github.com/mlfoundations/MINT-1T MINT-1T: Scaling Open-Source Multimodal Data by 10x: A Multimodal Dataset with One Trillion Tokens https://blog.salesforceairesearch.com/mint-1t/ B

                                                                              1兆のテキストトークン・34億個の画像・PDF・ArXivの論文などを含むオープンソースのデータセット「MINT-1T」をSalesforceが公開
                                                                            • NHKが「テキストニュース」を次々に閉鎖する懸念

                                                                              このところNHK関係者から漏れ聞こえてくるのは、各ニュースサイトが廃止に向かって動いているとの情報だ。NHKは2015年に「公共放送から公共メディアへ」をスローガンに掲げ、NEWS WEBに限らず「政治マガジン」「事件記者取材note」などを開設したり、放送したテーマをその後も追って、視聴者からの情報も取り入れてネットで成果を提供するなど次々にニュースサイトを充実させてきた。これらを一気に廃止するのなら、もはや「公共メディア」の目標を取り下げたも同然だ。 「NHKプラス」をめぐる受信料問題 NHKは今は任意業務であるネット業務の必須業務化をめざしている。必須業務化で、現在は放送契約者のみが利用できる番組配信サービス「NHKプラス」を、テレビを持っていない人でもネット単独で契約できるようにしたいらしい。放送だけでは受信料収入を若い世代から取れなくなるのが目に見えているため、少しでも収入を増や

                                                                                NHKが「テキストニュース」を次々に閉鎖する懸念
                                                                              • 単一GPUで動画・画像・音声・テキスト対応のマルチモーダルモデルを訓練して推論!?何を言ってるかわかねーと思うが、俺も何を見ているのかわからねえ|shi3z

                                                                                お正月なのですがAIは待ってはくれないので毎日「デイリーAIニュース」だけは続けている今日この頃。 中国のテンセントがとんでもないオープンソースをぶっ込んできた。 https://crypto-code.github.io/M2UGen-Demo/ 動画、画像、音楽、テキストという四つのモードを学習させた「マルチモーダル」モデルで、しかもベースはllama-7Bということで、V100 32GB一つで推論可能(CPUのRAMは49GB以上必要)どころか学習も可能。ホントかよ!! しかもしれっと日本語でも命令できるし。 ほんとにテクノっぽい音楽が流れるなんかこの研究の名前はかなり控えめに「音楽理解できるマルチモーダルモデル」みたいに書いてあるんだけど、とんでもない。実際にはこれは「どんな情報も入力できるマルチモーダルモデル」のプロトタイプである。 MU2GENのモデル構造図音声、画像、動画とい

                                                                                  単一GPUで動画・画像・音声・テキスト対応のマルチモーダルモデルを訓練して推論!?何を言ってるかわかねーと思うが、俺も何を見ているのかわからねえ|shi3z
                                                                                • テキストや画像から動画を生成するAI「Stable Video Diffusion」をStability AIが公開へ

                                                                                  画像生成AI「Stable Diffusion」を開発するStability AIが、テキストや画像から高解像度の動画を生成できる潜在動画拡散モデル「Stable Video Diffusion」を公開しました。 Stable Video Diffusion のご紹介 — Stability AI Japan https://ja.stability.ai/blog/stable-video-diffusion Stable Video Diffusion: Scaling Latent Video Diffusion Models to Large Datasets — Stability AI https://stability.ai/research/stable-video-diffusion-scaling-latent-video-diffusion-models-to-lar

                                                                                    テキストや画像から動画を生成するAI「Stable Video Diffusion」をStability AIが公開へ