並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 4085件

新着順 人気順

テキストの検索結果121 - 160 件 / 4085件

  • テキストマイニングで、2023年のブログをふりかえりました - 叡智の三猿

    2023年もあっという間に終わります。 1年は早いと毎年、思うのですが、その早さは歳を重ねる毎に加速しているような気がします。 今年1年、わたしが投稿したブログを「ユーザーローカル テキストマイニング(https://textmining.userlocal.jp/)」というツールを使って「スコア」による分析をしたら、以下の結果となりました。 情報セキュリティは、このブログの骨格ですので、目立つのは当然です。情報セキュリティに関係が深い、パスワードや個人情報もやはり目立ちますね。 概ね、想定通りの結果ですが、異質な感じを受けるのが「韓国ドラマ」というキーワードです。 現在、わたしは、ネットフリックス、Amazonプライム、ユーネクスト、ディズニー+と、主要な動画配信サービスと契約し、韓国ドラマと共に生活をしてます。ブログで韓国ドラマについて言及する機会も多かった年だと思います。 韓国ドラマ

      テキストマイニングで、2023年のブログをふりかえりました - 叡智の三猿
    • Google、テキストや画像から動画を生成するAI「Veo」発表 OpenAIの「Sora」対抗

      マスク編集機能もあり、動画とテキストプロンプトにマスク領域を追加し、動画の特定の領域を変更することができる。 また、テキストではなく画像を入力して動画を生成することもできるマルチモーダルだ。画像をテキストと組み合わせてプロンプトに入力することで、Veoは画像のスタイルを参照した動画を生成する。 Googleは、将来的にはVeoの機能の一部をYouTubeショートなどにも導入する計画だ。 関連記事 Androidに“Google AI”の新機能 OSにGeminiを統合、「かこって検索」で問題を解く機能など 米Googleが、Android向けに搭載するAI関連の新機能を発表した。特定の部分を丸で囲って検索ができる「かこって検索」を、学習に活用できるようにする。Androidに生成AIモデルの「Gemini」を統合し、アプリ上のオーバーレイ表示から、より簡単にGeminiを利用可能になる。

        Google、テキストや画像から動画を生成するAI「Veo」発表 OpenAIの「Sora」対抗
      • Anthropic Claudeで英訳したテキストをもとにStability AI Stable Diffusion XL(SDXL)で画像を生成するAmazon Bedrockの使用例 - NRIネットコムBlog

        小西秀和です。 以前の記事でAmazon Bedrockの参考資料、モデル一覧、価格、使い方、トークンやパラメータの用語説明、Runtime APIの実行例について紹介しました。 Amazon Bedrockの基本情報とRuntime APIの実行例まとめ - 参考資料、モデルの特徴、価格、使用方法、トークンと推論パラメータの説明 今回はAnthropic Claudeで英訳したテキストをもとにStability AI Stable Diffusion XL(SDXL)で画像を生成するAmazon Bedrockの使用例を紹介します。 ※本記事および当執筆者のその他の記事で掲載されているソースコードは自主研究活動の一貫として作成したものであり、動作を保証するものではありません。使用する場合は自己責任でお願い致します。また、予告なく修正することもありますのでご了承ください。 ※本記事執筆にあ

          Anthropic Claudeで英訳したテキストをもとにStability AI Stable Diffusion XL(SDXL)で画像を生成するAmazon Bedrockの使用例 - NRIネットコムBlog
        • Apple、UCSBと共同でマルチモーダルLLM採用のテキストベースの画像編集「MGIE」発表

          米Appleと米カリフォルニア大学サンタバーバラ校(UCSB)の研究者らは2月5日(現地時間)、マルチモーダル大規模言語モデル(MLLM)によるテキストベースの画像編集についての論文を発表し、その実装である「MGIE」(MLLM-Guided Image Editing)のコードをGitHubで公開した。また、Hugging Faceで試すこともできる。 MGIEは、テキストプロンプトで画像のトリミングやサイズ変更、フィルターの追加などの編集操作を行えるツール。画像全体の編集だけでなく、部分的な変更も可能だ。例えば、ピザの画像を「もっとヘルシーに」と命じるとミニトマトを追加したり、写真内のPCのディスプレイの画面を差し替えたりできる。 Hugging Faceのデモでは、編集したい画像をドロップして英語で命令を入力すると、結果が表示される。短い命令を、MGIEがより詳しい命令に変えてから実

            Apple、UCSBと共同でマルチモーダルLLM採用のテキストベースの画像編集「MGIE」発表
          • エディタにAIが統合、「EmEditor」v24.3.0が正式版に ~マクロだけでなくアプリ本体にもAIを統合/正規表現で対象ファイルを指定したテキスト検索も実現

              エディタにAIが統合、「EmEditor」v24.3.0が正式版に ~マクロだけでなくアプリ本体にもAIを統合/正規表現で対象ファイルを指定したテキスト検索も実現
            • Google Pixel 9などの端末ではテキストメッセージやSOS発信を衛星接続でできるようになる

              Googleは2024年後半に「Pixel 9」「Pixel 9 Pro」「Pixel 9 Pro XL」の3モデルで展開と見込まれているのですが、このPixel 9シリーズでは、緊急時のSOSが5G非地上系ネットワーク(NTN)、つまり衛星ベースで送信できるようになる見込みであることが明らかになりました。 Exclusive: Google Pixel 9 to get new modem, satellite connectivity https://www.androidauthority.com/pixel-9-sos-satellite-connectivity-3433498/ Google’s Pixel 9 may get an Apple-like satellite SOS feature - The Verge https://www.theverge.com/202

                Google Pixel 9などの端末ではテキストメッセージやSOS発信を衛星接続でできるようになる
              • AIがテキストから音楽を作成してくれるWebサービスで手軽にBGMやSEを作っちゃおう

                AIがテキストから音楽を作成してくれるWebサービスで手軽にBGMやSEを作っちゃおう2023.09.19 19:00 三浦一紀 これ、ずっとやっちゃう。 AIがいろいろなものを作ってくれる時代になってきていますが、とうとうテキストから音楽を作ってくれる生成AIサービスが登場。その名も「Stable Audio」です。 思いつく単語を入れていこうImage: Stable Audio使い方は簡単。まずジャンルや楽器、シチュエーション、雰囲気、テンポなどなど、思いつくままに単語を入力します。あ、英語でお願いします。 すると、AIがそのテキストを元に音楽を生成してくれます。 英語ってところがちょっとハードル高いかもしれませんが、単語でOKなので、臆せず入れていきましょう。 ほんの1、2分で曲が出来上がってきます。 無料版でもダウンロード可能こちら、無料の会員登録をすれば使用できます。無料会員の

                  AIがテキストから音楽を作成してくれるWebサービスで手軽にBGMやSEを作っちゃおう
                • 「Google Chrome」にも3つの生成AI機能が導入へ……ただし、今のところ米国のみ/タブの管理、テーマの作成、テキストの下書きに機械学習技術の成果を

                    「Google Chrome」にも3つの生成AI機能が導入へ……ただし、今のところ米国のみ/タブの管理、テーマの作成、テキストの下書きに機械学習技術の成果を
                  • 「DeepL」公式の「Firefox」アドオンが提供開始 ~高品質なAI翻訳サービス/部分テキストの翻訳ならば無料、オンラインフォームの書き込みも翻訳できる

                      「DeepL」公式の「Firefox」アドオンが提供開始 ~高品質なAI翻訳サービス/部分テキストの翻訳ならば無料、オンラインフォームの書き込みも翻訳できる
                    • テキストのテキスト - 日々のこと

                      テキストのテキスト 昨夜から忙しくて、その続きで朝からバタバタ、相方と角上魚類へ買い出しに行き、お昼は魚屋さんのお寿司で。 これくらいの量がちょうどいいのです。^^ 食べながら・・・昨日と違って日差したっぷりのベランダを見たら・・・イタリアンパセリとパセリに当たる日差しにしばし見とれました・・・急に寒くなりましたから。^^ テキストのテキスト お昼を食べるとすぐにパソコンボランティアの勉強会へ。 「テキストの作り方のテキスト」を昨夜から作っていたのです。(笑) PrintScreenキーがどんどん使いやすくなっていますね。 実はテキストを作る作業が好きです。^^; でもこれまでいっぱい作ってみて、「人の作ったテキストは使い難い」と言うことも分かっていますから、講師は自分で作って欲しいと思うわけなのです。 参考資料として「ペイントでのサイズ変更」も付け足しておきましたが、miyotaさんのブ

                        テキストのテキスト - 日々のこと
                      • 辻政信は戦後日本で、こんなふうに「人気者」だったという資料(1952年、朝日新聞。画像からテキスト化) - INVISIBLE D. ーQUIET & COLORFUL PLACE-

                        以前、こんな記事を書いた。 戦後裏面史〜元陸軍参謀・辻政信の参院全国区3位当選を描く「1959年の辻政信」を読んでみたい。【敗将列伝】 m-dojo.hatenadiary.com wikipedia:辻政信 政治家として 追放解除後の1952年に旧石川1区から衆議院議員に初当選。自由党を経て自由民主党鳩山一郎派、石橋派に所属。石橋内閣時代に外遊をし、エジプトのガマール・アブドゥン=ナーセル、ユーゴスラビアのヨシップ・ブロズ・チトー、中国の周恩来、インドのジャワハルラール・ネルーと会談している。 政治家になった辻は1955年(昭和30年)にソ連に視察旅行に出かける。このとき辻はソ連のさまざまな人と会話をして、ソ連の実情を看破した。また、ノモンハン事件で対決したジューコフと辻は極秘に会談し「アメリカが日本に小笠原列島と沖縄を返還したら、ソ連は千島と樺太を返すだろう」などの内容を話し合った。辻

                          辻政信は戦後日本で、こんなふうに「人気者」だったという資料(1952年、朝日新聞。画像からテキスト化) - INVISIBLE D. ーQUIET & COLORFUL PLACE-
                        • テキスト編集&サイズ可変ができるリボンのグラフィックスタイル

                          llustrator Factoryは、商用利用可能なフリー素材のイラストなどを提供しているウェブサイトです。 イラストをはじめAdobe Illustratorで利用できるグラフィックスタイル、フォントなどのフリー素材をご自由にダウンロードできます。

                            テキスト編集&サイズ可変ができるリボンのグラフィックスタイル
                          • テキストから音楽をAIが生成するサービス「Stable Audio」。45秒なら無料

                              テキストから音楽をAIが生成するサービス「Stable Audio」。45秒なら無料
                            • ドコモ、メタバース空間内のNPCをテキスト入力のみで自動生成する生成AIを開発

                              NTTドコモは1月16日、メタバース空間内のノンプレイヤーキャラクター(以下、NPC)を、テキスト入力のみで自動生成する生成AIを開発したと発表。 同社によると、メタバース業界は急速に成長し大きな注目を集めている一方で、利用するユーザー数は十分とは言えない状況であり、メタバース提供事業者の課題となっている。そこで、空間内の賑わいを創出し、群集心理の作用によりユーザーを惹きつけることにNPCが効果的であると考え、NPCを生成AIで制作できる同技術を開発した。同技術を利用することで、プログラミングやアルゴリズムなどの専門知識が無くても、外見や行動、空間内での役割を備えたNPCを20分程度で自動生成できるという。 なお、「行動ロジック生成AI」「アニメーション生成AI」「外見生成AI」の3つの生成AIで構成。「行動ロジック生成AI」の開発および、3つの生成AIを自動連携する技術の開発は独自のもの

                                ドコモ、メタバース空間内のNPCをテキスト入力のみで自動生成する生成AIを開発
                              • CSS Custom Highlight API でのテキストハイライト

                                先日、Safari Technology Preview 175の情報を眺めていたところ、Web API について次の変更の記述がありました。 Added support for priority to CSS Highlight API CSS Highlight API に priority とやらのサポートが追加されたとのことです。 自分はそもそも CSS Highlight API が何かを知らなかったため、少し調べてみました。 CSS Custom Highlight API とは mdn がとても参考になります。 CSS Custom Highlight API とは、Web ページにおいて、テキストの範囲を装飾するための API のことです。 もともと存在していた Range()と組み合わせることで、JavaScript 上からテキスト範囲をコントロールしつつ、その範囲に対し

                                  CSS Custom Highlight API でのテキストハイライト
                                • Android版「Microsoft To Do」アプリに3つの新機能 ~Windows/iOSで使えるオマケも/ウィジェットのカスタマイズ拡充、リッチテキスト対応のメモ、AIによるタスク提案

                                    Android版「Microsoft To Do」アプリに3つの新機能 ~Windows/iOSで使えるオマケも/ウィジェットのカスタマイズ拡充、リッチテキスト対応のメモ、AIによるタスク提案
                                  • テキスト作り&ウォーキング - miyotyaのブログ

                                    晴れ時々曇りで気温も22℃と気持ちの良い日になりました。 地区の福祉ネットボランティア活動の一つとして行われてきたパソコン教室が今年で15年になります。 熟練者の中には10年ぐらい学んでいる生徒さんもおられ、熟練者向けのオリジナルのテキストが底をついてきました。 何か斬新なテキストを作れないかと四苦八苦しております。 もちろん、テキストを作ることは私自身のスキルアップに繋がるので何か良い資料が無いものかと探しております。 そこで、四季折々に咲く野草の花を在材として6月・7月・8月のカレンダーを作ることにしました。 最初は2022年の秋に作成してテキストに使ったことがあります。 今回は画像のデザインを変えて作ってみました。 なるべくその月に咲く野草の花を八角形の枠の中に挿入して、図形の効果を面取の(丸い凸レンズ)を使ってみました。 花が浮き出る感じで見栄えが良いです。 様々な機能を使っての作

                                      テキスト作り&ウォーキング - miyotyaのブログ
                                    • 【テキストサイト『虚構新聞』】「実際にありそうで実は存在しないニュース」という洒落がわかる大人になろう。 - ioritorei’s blog

                                      テキストサイト『虚構新聞』 テキストサイト『虚構新聞』 「実際にありそうで実は存在しないニュース」という洒落がわかる大人になろう 『虚構新聞』とは うっかり現実化しちゃったニュース リスモくん死去(2011年9月23日) ウィキペディア書籍化(2012年10月16日) 体罰被害申告サイト「体罰.in」(2013年2月18日) 北朝鮮事実上の勝利宣言(2013年4月8日) 森永グロス発売(2013年7月4日) KDDI 次世代炊飯器「INFOJAR」(2014年1月22日) まるで本物 ステーキさいころ、来月発売(2014年6月24日) 日本の「謙虚」、海外アピールに200億計上(2015年2月17日) ほのかな甘み かぼちゃワイン『エル』4月発売(2015年3月4日) フジ、自局専用リモコンを無料配布へ 他局も追随(2015年7月21日) シャープ、゜(半濁点)の売却を検討(2015年10

                                        【テキストサイト『虚構新聞』】「実際にありそうで実は存在しないニュース」という洒落がわかる大人になろう。 - ioritorei’s blog
                                      • 「Firefox 119」が正式版に ~現在・過去のタブを一覧できる新しい「Firefox View」/PDF編集では画像の代替テキストを編集可能。脆弱性の修正は11件

                                          「Firefox 119」が正式版に ~現在・過去のタブを一覧できる新しい「Firefox View」/PDF編集では画像の代替テキストを編集可能。脆弱性の修正は11件
                                        • iOS 17/iPadOS 17ではテキストカーソルに表示される拡大ルーペのデザインが刷新。

                                          iOS 17/iPadOS 17ではテキストカーソルに表示される拡大ルーペのデザインが刷新されています。詳細は以下から。 Appleは2021年09月にリリースした「iOS 15/iPadOS 15」で、それまで廃止していたテキストカーソルのセレクターに表示される拡大ルーペ(Magnifying loupe/glass/bubble etc…)を復活させましたが、現地時間2023年09月18日にリリースされた「iOS 17/iPadOS 17」では、この拡大ルーペのデザインが刷新されています。 テキストカーソルの拡大ルーペは、2019年にリリースしたiOS 13/iPadOS 13で突如廃止され、その後2021年にiOS 15/iPadOS 15がリリースされるまで利用できませんでしたが、その復活した拡大ルーペはiOS 12までの旧デザインと異なり、小さく見ずらいデザインとなっていました。

                                            iOS 17/iPadOS 17ではテキストカーソルに表示される拡大ルーペのデザインが刷新。
                                          • Google Colab で Claude 3 の テキスト生成 を試す|npaka

                                            3. APIキーの取得APIキーの取得手順は、次のとおりです。 (1) 「Anthropic」のサイトのAPIの「Get API Access」をクリックしてログイン。 はじめての場合は、アカウントを新規作成します。 (2) ダッシュボードを確認。 初回は「Get started testing Claude with $5 in fee credits.」で$5分のクレジットを取得できます。 (3) 「Get API Keys → Create Key」でAPIキーを作成。 APIキーはGoogle Colabで利用します。 4. Colab での実行Colabでの実行手順は、次のとおりです。 (1) パッケージのインストール。 # パッケージのインストール !pip install anthropic(2) 環境変数の準備。 左端の鍵アイコンで「ANTHROPIC_API_KEY」を設

                                              Google Colab で Claude 3 の テキスト生成 を試す|npaka
                                            • OpenAI、高性能なAI生成テキスト検出ツールのリリースを保留中との報道

                                              米OpenAIは、テキストがChatGPTを使って生成したものかどうかを検出する高性能なツールを1年前にほぼ完成させているが、そのリリースを巡って社内で論争になっていると、米Wall Street Journalが8月4日(現地時間)、事情に詳しい人々や独自に入手した内部文書に基づいてそう報じた。 こうしたツールは、学生が課題の論文をChatGPTに代筆させるといった不正行為を取り締まるためなどで求められている。 OopenAIは、テキストが人間によるものかどうか判定するツールを1月に無料公開したが、精度が低いとして7月に公開を停止した。 報じられたツールはこれとは別のもので、ChatGPTによるトークン選択方法を少し変更することで、透かしのようなパターンを残す技術を使う。Wall Street Journalが入手した内部文書によると、OpenAIの検出ツールを使えば、この透かしを99.

                                                OpenAI、高性能なAI生成テキスト検出ツールのリリースを保留中との報道
                                              • メガソフト、「ChatGPT」を統合したiOS向け本格テキストエディターをリリース/文書の変換・校正、情報収集、ソースコードの自動作成といった作業をAIに任せられる

                                                  メガソフト、「ChatGPT」を統合したiOS向け本格テキストエディターをリリース/文書の変換・校正、情報収集、ソースコードの自動作成といった作業をAIに任せられる
                                                • テキスト作り&春一番 - miyotyaのブログ

                                                  こちらも今日は春一番が吹き荒れて日中の気温も20℃にあがり、砂埃がひどくてウォーキングを断念しました。 この所数日間、時間のある時にPC教室の熟練者用のテキスト作りをしています。 タイミング良く、新聞にテキストに使える良いチラシが入っていたので自分なりにアレンジして作成して見ました。 A4サイズですが、結構内容が細かくて様々な機能を駆使して作らないと紙面に収まらないし見栄えも悪いです。 それに、2~3mm単位に収める微妙な所が沢山あってピッタリ収まらない場合もあり、その辺は臨機応変に教えていきたいと思っています。 私自身も四苦八苦しましたが完成して見ると楽しいです。 パソコンが好きで、仕事でもパソコンで学んだ技術を生かしている熟練の生徒さんがおりまして、一緒に学ぶつもりで教えて行くようにします。 手順書も作成しましたが微妙な所はその都度直接教えることにします。 私のモットーは「見栄え良く作

                                                    テキスト作り&春一番 - miyotyaのブログ
                                                  • 数式やイラストを含む画像をOCRやLLMを使ってテキスト化した話

                                                    こんにちは!株式会社 COMPASS でエンジニアをしている安齋です。私はシステム開発部というエンジニアリングの組織に所属をしており、現在はLLMを利活用するための研究開発の一環で様々な取り組みを行っています。 今回は、画像で表現された問題データをOCRやLLMを使ってテキストデータとして扱えるようにした取り組みについて、技術選定から実際の解決アプローチまでをご紹介します。 この記事はこんな方におすすめ 株式会社COMPASSの技術的な取り組みについて知りたい方 OCRサービスを使った開発の事例を知りたい方 LLMの活用事例を探されている方 背景と解決したかった課題 COMPASSでは、AIが子どもたち一人ひとりに合った問題を出題する公教育向けのデジタル教材「Qubena(キュビナ)」を開発、提供しています。Qubenaは公教育での学びに必要な小学校、中学校向けの国語、算数・数学、理科、社

                                                      数式やイラストを含む画像をOCRやLLMを使ってテキスト化した話
                                                    • [解決!Python]PDFファイルからテキストや画像を抽出するには

                                                      pdfminer.sixパッケージを用いて、PDFファイルからテキストや画像を抽出する方法を紹介する。 from pdfminer.high_level import extract_text from pathlib import Path # PDFファイルからテキストを抽出 source = Path('atmarkit_ebook116.pdf') text = extract_text(source) print(text) # extract_text_to_fp関数を使う from pdfminer.high_level import extract_text_to_fp dest = Path('out.txt') with open(source, 'rb') as fp_in, open(dest, 'wb') as fp_out: extract_text_to_fp

                                                        [解決!Python]PDFファイルからテキストや画像を抽出するには
                                                      • Metaがテキストベースのプロンプトに視覚情報ベースで回答するAIエージェントのベンチマーク「OpenEQA」をリリース

                                                        現地時間の2024年4月11日、Metaがテキストベースの質問に対してAIエージェントの物理空間の理解度を測定することができるベンチマーク「OpenEQA」をリリースしました。 OpenEQA: From word models to world models https://ai.meta.com/blog/openeqa-embodied-question-answering-robotics-ar-glasses/ OpenEQA: Embodied Question Answering in the Era of Foundation Models https://open-eqa.github.io/ Meta AI releases OpenEQA to spur 'embodied intelligence' in artificial agents | VentureBea

                                                          Metaがテキストベースのプロンプトに視覚情報ベースで回答するAIエージェントのベンチマーク「OpenEQA」をリリース
                                                        • テキスト作り&ナナフシモドキを見つけた! - miyotyaのブログ

                                                          朝から小雨が降っていましたがお昼前に雨が止み薄日が射してきました。 大雨の予報が外れてホッとしました。 古いパソコンで作成したテキストをWindows11で作り直しているところです。 いざ、作ってみると機能の操作の違いが出てきて戸惑う事もあります。 これでは古いパソコンで作ったテキストでは教えられないと思いました。 暇な時に一つ、一つ作って行くようにします。 もちろん私の復習も兼ねてですが。 庭先のツルバラの花も最後になり、風に吹かれて木が倒れそうなので紐でくくりました。 このツルバラは私達がマイホームを建てた時に、夫の父親からプレゼントされたものでもう45年になります。 私達同様に、バラも年数が経って木も弱り花数も少なくなりました。 今年もナナフシモドキが昨年よりも1週間早くやってきました。 今の所3匹ですがまだ子供です。 ナナフシとナナフシモドキがおりますが、ナナフシモドキは触角が前足

                                                            テキスト作り&ナナフシモドキを見つけた! - miyotyaのブログ
                                                          • Xユーザーのange187さん: 「PRで見かけるこれ ・代表氏名や社名が判りやすいところにない ・やっと見つけてもコピペできないようにしてたりテキストじゃなくて画像 というアレな会社条件が役満だったんだけど 一番下にちんまり書いてる重要事項に関する表示を見たら オーディションぽく見せてる85万円の高額商材だった。 https://t.co/XXaeSyrKZJ」 / X

                                                            • 2024.4.1 見るべきと おすすめしたい ところなど) 書いてある 全てのテキスト 七五調。七五調 ポータルZに なりました

                                                              2024.4.1 見るべきと おすすめしたい ところなど) 書いてある 全てのテキスト 七五調。七五調 ポータルZに なりました こんばんは ごきげんいかが 林です。 今日からは サイトのトーンが 代わります。 書いてある 全てのテキスト 七五調。七五調 ポータルZに なりました 嗚呼リズミカル リニューアル。 記念して 七五調たる 記事あまた。ここにある タイトルが 本日の ラインナップに なりて候。

                                                                2024.4.1 見るべきと おすすめしたい ところなど) 書いてある 全てのテキスト 七五調。七五調 ポータルZに なりました
                                                              • 大規模画像テキストデータのフィルタリング手法の紹介

                                                                基盤モデルのための事前学習用のデータは「量」にフォーカスされがちですが、昨今では「質」の部分にも注目が集まっています。特に昨年開催されたDataCompは、データの質にフォーカスしたData-centricなコンペ設計となっており、データフィルタリングのノウハウが多数共有されました。本発表ではDataCompでの事例を中心に、最近の大規模画像テキストペアデータのためのフィルタリング手法について紹介します。

                                                                  大規模画像テキストデータのフィルタリング手法の紹介
                                                                • 無料テキスト読み上げソフト「SofTalk」に64bit版、「MeCab」やMP3録音にも対応/

                                                                    無料テキスト読み上げソフト「SofTalk」に64bit版、「MeCab」やMP3録音にも対応/
                                                                  • テキストに加えてメロディやテンポなど時間的変化がある要素もコントロール可能な音楽生成モデル「Music ControlNet」が開発される

                                                                    近年はテキストから音楽を生成するAIツールが進歩を遂げ、さまざまなスタイルで高品質の音楽を生成できるようになっていますが、従来のテキストによる生成ではビートの位置や音楽のダイナミクス(強弱)など、時間と共に変化する属性を制御するのが難しかったとのこと。そこでカーネギーメロン大学とAdobe Researchの研究チームが、複数の時間的変化コントロールを可能にする音楽生成モデル「Music ControlNet」を発表しました。 [2311.07069] Music ControlNet: Multiple Time-varying Controls for Music Generation https://arxiv.org/abs/2311.07069 Music ControlNet https://musiccontrolnet.github.io/web/ 以前からテキストを基に音

                                                                      テキストに加えてメロディやテンポなど時間的変化がある要素もコントロール可能な音楽生成モデル「Music ControlNet」が開発される
                                                                    • Stable Diffusionを利用しテキストから画像を生成できるMacアプリ「Amazing AI」が、A17 Proチップを搭載したiPhone 15 ProやM1チップ以降のiPadに対応。

                                                                      Stable Diffusionを利用しテキストから画像を生成できるMacアプリ「Amazing AI」が、A17 Proチップを搭載したiPhone 15 ProやM1チップ以降のiPadに対応しています。詳細は以下から。 Amazing AIは2022年にSindre Sorhusさんが公開したApple Silicon Mac用のStable Diffusionクライアントで、ディープラーニングを利用しオフラインでテキストから画像(text-to-image)を生成することができますが、このAmazing AIアプリがiPhoneやiPadに対応しています。 Amazing AIアプリが利用できるようになったのは、AppleのA17 Proチップを搭載したiPhone 15 ProとiPhone 15 Pro Max、そしてApple Silicon M1以降を搭載したiPadで、M

                                                                        Stable Diffusionを利用しテキストから画像を生成できるMacアプリ「Amazing AI」が、A17 Proチップを搭載したiPhone 15 ProやM1チップ以降のiPadに対応。
                                                                      • Google Research、かなり自然なテキスト→動画生成AI「Lumiere」発表

                                                                        米Googleの研究部門Google Researchは1月23日(現地時間)、「リアルな動画生成のための時空拡散モデル」と呼ぶ動画生成AIモデル「Lumiere」(仏語で光という意味)を発表した。テキストや画像からリアルな動画を生成する。生成できるのは、1024×1024ピクセルの5秒間の動画だ。 論文によると、Lumiereは独自のアーキテクチャを利用して、動画の時間全体を一度に生成するという。キーフレーム間をつないで合成する従来のモデルとは異なり、「モデル内の単一パスを通じて、動画の時間的継続全体を一度に生成する時空間U-Netアーキテクチャを導入」した。大まかに言うと、空間と時間の両方を同時に処理できるように設計されており、多数のフレームを組み合わせるのではなく、1つのなめらかなプロセスで動画全体を生成する。

                                                                          Google Research、かなり自然なテキスト→動画生成AI「Lumiere」発表
                                                                        • PC教室用テキストチェック&作成 - miyotyaのブログ

                                                                          今日も晴れて日中の気温が12℃とやや暖かい日でした。 9日からパソコン教室が始まるのでテキストのチェックなどをしました。 特に熟練者向けのテキストのチェックを念入りに行い、私も忘れている部分があったりして良い勉強になりました。 過去に福岡地区福祉ネットで、バスツアーで東京の名所旧跡巡りをした時に作成したしおりの一部ですがテキストに使う予定です。 エクセルで作成した表をワードに貼り付ける際に、「形式を選択して貼り付け」をクリックして「Microsoft Excel ワークシートオブジェクト」をクリックして貼り付けると便利です。 表を修正する際に表をWクリックするとエクセルが開きその場で修正が出来ます。 そういう方法がある事を生徒さんに覚えてもらいたいです。 と言っても、こんなに細かい表は直接エクセルで修正して再度貼り付けた方が簡単かもしれませんが。 表の隣の文章はテキストボックスを使って入力

                                                                            PC教室用テキストチェック&作成 - miyotyaのブログ
                                                                          • アドビ、生成AIを刷新 画像を貼って「このテイストで出力して」も可能に テキスト→動画生成も開発中

                                                                            2023年3月にβ版を提供し、9月から正式提供をスタートした米Adobeの生成AI「Firefly」に早速アップデートが入った。プロンプトから画像を生成するモデルが後継の「Adobe Firefly Image 2 Model」に刷新された。生成できる解像度が4倍になった他、新たに「生成Match」も実装。まずはFirefly Web版から提供する。 Firefly Image 2 Modelは、先代の生成モデルから出力精度を上げつつ、ユーザーの出力オーダーにより柔軟に対応するという。例えば人物のレンダリングは、肌、髪、目、手、身体の構造を改善した他、カラー表現、ダイナミックレンジを改善している。生成できる画像の解像度も4倍に拡大した。引き続き商用利用も可能で、学習は「Adobe Stock」からの許諾済みデータ、オープンライセンス画像、著作権が失効したパブリックドメインデータなどから行っ

                                                                              アドビ、生成AIを刷新 画像を貼って「このテイストで出力して」も可能に テキスト→動画生成も開発中
                                                                            • 製品の宣伝やアピールに最適な画像やテキストの生成を行う広告主向け生成AIツールの強化をMetaが発表

                                                                              Metaが、広告主向けに提供している生成AIツールの拡張セットを発表しました。これにより、広告を出したいという人や企業は、宣伝したい製品・サービスを用いたまったく新しい画像を作り出すことができるようになります。 Introducing Enhanced Gen AI Features and Other Tools to Help Build Your Business | Meta for Business https://www.facebook.com/business/news/Introducing-Enhanced-Gen-AI-Features-and-Other-Tools-to-Help-Build-Your-Business Meta’s AI tools for advertisers can now create full new images, not just

                                                                                製品の宣伝やアピールに最適な画像やテキストの生成を行う広告主向け生成AIツールの強化をMetaが発表
                                                                              • 自動生成アイキャッチ画像のテキストの改行位置の改善など、ソーシャルシェアに関連した複数の改善を行いました - はてなブログ開発ブログ

                                                                                はてなブログでは、アイキャッチ画像の設定がない記事をX(旧Twitter)やFacebook、はてなブックマークなどのソーシャルメディアでシェアする際に、自動でブログタイトルや記事タイトルから自動でアイキャッチ画像を作成する機能を提供しています。 この機能やソーシャルシェアに関連するいくつかの改善を加えました。どうぞご利用ください。 自動生成アイキャッチ画像のタイトルの改行位置を改善し読みやすくしました 自動生成アイキャッチ画像の余白の幅を小さく変更しました 記事投稿完了画面のXにポストするボタンでフィルインされるテキストを変更しました Twitterへの投稿ボタンをXへのポストボタンに変更しました 記事編集画面のサイドバーのTwitter貼り付け機能を削除しました 自動生成アイキャッチ画像のタイトルの改行位置を改善し読みやすくしました これまでは、一定の文字数でテキストが改行されていまし

                                                                                  自動生成アイキャッチ画像のテキストの改行位置の改善など、ソーシャルシェアに関連した複数の改善を行いました - はてなブログ開発ブログ
                                                                                • Android 15のベータ版が登場、「日本語テキストの改行位置を整える機能」「アプリを部分的にアンインストールして容量を確保する機能」など

                                                                                  GoogleがAndroid 15のベータ版を公開しました。公開されたベータ版には「日本語テキストの改行位置を整えて読みやすくする機能」「アプリの表示領域を拡大する機能」「アプリを部分的にアンインストールして容量を確保する機能」などが含まれています。 Android 15  |  Android Developers https://developer.android.com/about/versions/15 Android Developers Blog: The First Beta of Android 15 https://android-developers.googleblog.com/2024/04/the-first-beta-of-android-15.html ◆日本語テキストの改行位置を整える Androidアプリの開発者は「JUSTIFICATION_MODE_I

                                                                                    Android 15のベータ版が登場、「日本語テキストの改行位置を整える機能」「アプリを部分的にアンインストールして容量を確保する機能」など