並び順

ブックマーク数

期間指定

  • から
  • まで

761 - 800 件 / 1881件

新着順 人気順

テキストの検索結果761 - 800 件 / 1881件

  • 数式やイラストを含む画像をOCRやLLMを使ってテキスト化した話

    こんにちは!株式会社 COMPASS でエンジニアをしている安齋です。私はシステム開発部というエンジニアリングの組織に所属をしており、現在はLLMを利活用するための研究開発の一環で様々な取り組みを行っています。 今回は、画像で表現された問題データをOCRやLLMを使ってテキストデータとして扱えるようにした取り組みについて、技術選定から実際の解決アプローチまでをご紹介します。 この記事はこんな方におすすめ 株式会社COMPASSの技術的な取り組みについて知りたい方 OCRサービスを使った開発の事例を知りたい方 LLMの活用事例を探されている方 背景と解決したかった課題 COMPASSでは、AIが子どもたち一人ひとりに合った問題を出題する公教育向けのデジタル教材「Qubena(キュビナ)」を開発、提供しています。Qubenaは公教育での学びに必要な小学校、中学校向けの国語、算数・数学、理科、社

      数式やイラストを含む画像をOCRやLLMを使ってテキスト化した話
    • [解決!Python]PDFファイルからテキストや画像を抽出するには

      pdfminer.sixパッケージを用いて、PDFファイルからテキストや画像を抽出する方法を紹介する。 from pdfminer.high_level import extract_text from pathlib import Path # PDFファイルからテキストを抽出 source = Path('atmarkit_ebook116.pdf') text = extract_text(source) print(text) # extract_text_to_fp関数を使う from pdfminer.high_level import extract_text_to_fp dest = Path('out.txt') with open(source, 'rb') as fp_in, open(dest, 'wb') as fp_out: extract_text_to_fp

        [解決!Python]PDFファイルからテキストや画像を抽出するには
      • 「宇宙船や洞窟を永遠に高速移動するシーン」を生成するAI テキスト指示で映像作成

        Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 イスラエルのWeizmann Institute of ScienceとNVIDIA Researchに所属する研究者らが発表した論文「SceneScape: Text-Driven Consistent Scene Generation」は、テキスト入力だけから高速に移動する永久シーンを生成する学習ベースのモデルを提案した研究報告である。 風景などの限られた領域にしか適用できない先行研究とは対照的に、宇宙船や洞窟、氷の城などの屋内の永久シーンの生成も可能にする。 1枚の入力画像からもっともらしい長時間映像を生成することは、いくつかの課題を抱えている。

          「宇宙船や洞窟を永遠に高速移動するシーン」を生成するAI テキスト指示で映像作成
        • キッズが遊びながら学べる?!DMM英会話のテキストが凄い理由 - マルチアレルギーの息子と過ごす幸せな日々

          (この記事はアフィリエイトリンクを含みます) 子供に英会話を始めたいけど、何歳から始められるのか。どのくらい効果があって、続けられるのか。親は話せなくてもいいのか。 私たちが、子供の頃には無かったものだからこそ、体験談が少なくて悩みますよね。 我が家は、周りの子の多くがインターナショナルスクールにも通っており、英語への意識が高い地域となっています。その中でインターに行かせず出遅れた息子を、3歳10ヶ月からオンライン英会話をスタートさせました。 有名なオンライン英会話であるネイティブキャンプと、DMM英会話を使い比べた結果、子供特有の大きな違いがでたのでまとめてみます。 目次 1. DMM英会話テキストのメリット 2.DMM英会話のデメリット 3.ネイティブキャンプのメリット 4. ネイティブキャンプ のデメリット 5. おすすめの勉強法 6. 親は英語が話せなくても大丈夫なのか 7. オン

            キッズが遊びながら学べる?!DMM英会話のテキストが凄い理由 - マルチアレルギーの息子と過ごす幸せな日々
          • サービス内のトレンドを把握するために、テキストデータを可視化・通知してくれるslack botを作った話 - コネヒト開発者ブログ

            本記事はコネヒト Advent Calendar 2019 17日目の記事です。 こんにちは!MLエンジニアの野澤(@takapy0210)です! 今回は、ママリ内に日々蓄積されているテキストデータを良い感じに可視化して、定期的にslack通知する仕組みを実装したお話です。 ※下記で使用している画像やデータに関しては、あくまでママリ内での傾向を算出しており、個人を特定できるものではございません。また、画像に関しては一部加工しております。 目次 どんなもの? なぜやったのか アーキテクチャ CloudWatch StepFunctions Glue Fargate 終わりに どんなもの? 毎朝9時頃に、前日投稿されたテキストデータを元に、word cloudやN-gramによる単語の出現頻度を可視化してslackに投稿しています。 下記は12月のとある日の投稿ですが、インフルエンザやワクチン

              サービス内のトレンドを把握するために、テキストデータを可視化・通知してくれるslack botを作った話 - コネヒト開発者ブログ
            • Metaがテキストベースのプロンプトに視覚情報ベースで回答するAIエージェントのベンチマーク「OpenEQA」をリリース

              現地時間の2024年4月11日、Metaがテキストベースの質問に対してAIエージェントの物理空間の理解度を測定することができるベンチマーク「OpenEQA」をリリースしました。 OpenEQA: From word models to world models https://ai.meta.com/blog/openeqa-embodied-question-answering-robotics-ar-glasses/ OpenEQA: Embodied Question Answering in the Era of Foundation Models https://open-eqa.github.io/ Meta AI releases OpenEQA to spur 'embodied intelligence' in artificial agents | VentureBea

                Metaがテキストベースのプロンプトに視覚情報ベースで回答するAIエージェントのベンチマーク「OpenEQA」をリリース
              • テキスト作り&ナナフシモドキを見つけた! - miyotyaのブログ

                朝から小雨が降っていましたがお昼前に雨が止み薄日が射してきました。 大雨の予報が外れてホッとしました。 古いパソコンで作成したテキストをWindows11で作り直しているところです。 いざ、作ってみると機能の操作の違いが出てきて戸惑う事もあります。 これでは古いパソコンで作ったテキストでは教えられないと思いました。 暇な時に一つ、一つ作って行くようにします。 もちろん私の復習も兼ねてですが。 庭先のツルバラの花も最後になり、風に吹かれて木が倒れそうなので紐でくくりました。 このツルバラは私達がマイホームを建てた時に、夫の父親からプレゼントされたものでもう45年になります。 私達同様に、バラも年数が経って木も弱り花数も少なくなりました。 今年もナナフシモドキが昨年よりも1週間早くやってきました。 今の所3匹ですがまだ子供です。 ナナフシとナナフシモドキがおりますが、ナナフシモドキは触角が前足

                  テキスト作り&ナナフシモドキを見つけた! - miyotyaのブログ
                • Xユーザーのange187さん: 「PRで見かけるこれ ・代表氏名や社名が判りやすいところにない ・やっと見つけてもコピペできないようにしてたりテキストじゃなくて画像 というアレな会社条件が役満だったんだけど 一番下にちんまり書いてる重要事項に関する表示を見たら オーディションぽく見せてる85万円の高額商材だった。 https://t.co/XXaeSyrKZJ」 / X

                  • 2024.4.1 見るべきと おすすめしたい ところなど) 書いてある 全てのテキスト 七五調。七五調 ポータルZに なりました

                    2024.4.1 見るべきと おすすめしたい ところなど) 書いてある 全てのテキスト 七五調。七五調 ポータルZに なりました こんばんは ごきげんいかが 林です。 今日からは サイトのトーンが 代わります。 書いてある 全てのテキスト 七五調。七五調 ポータルZに なりました 嗚呼リズミカル リニューアル。 記念して 七五調たる 記事あまた。ここにある タイトルが 本日の ラインナップに なりて候。

                      2024.4.1 見るべきと おすすめしたい ところなど) 書いてある 全てのテキスト 七五調。七五調 ポータルZに なりました
                    • 音声入力でテキストを出力できるウェブアプリ「voicod」レビュー

                      音声入力でメモを記録できるウェブアプリケーション「voicod」が登場したので実際に使用してみました。 voicod https://voicod.pages.dev/ まずはvoicodのページを開くのですが、voicodはSpeechRecognitionという音声認識APIを使用しているとのことで、SpeechRecognitionに対応しているブラウザで開く必要があります。該当するのはGoogle ChromeやSafariなどということで、今回はGoogle Chromeでアクセスします。アクセスするとマイクの使用許可が求められるので「許可」をクリックします。 このまま音声入力を行うと、テキストとして記録されます。試しに梶裕貴氏がYouTubeに公開している外郎売の朗読を聞かせてみたところ、以下のように記録されました。 漢字やカナへの変換は自動で行われますが、一部おかしな変換結果

                        音声入力でテキストを出力できるウェブアプリ「voicod」レビュー
                      • GitHub - VOICEVOX/voicevox_engine: 無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXの音声合成エンジン

                        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                          GitHub - VOICEVOX/voicevox_engine: 無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXの音声合成エンジン
                        • グーグルはスマートテキスト選択をどう改善したのか?その手法が明らかに

                            グーグルはスマートテキスト選択をどう改善したのか?その手法が明らかに
                          • 好みのサーバーを建ててテキスト&音声チャットが可能なDiscord風のウェブアプリ「Revolt」を使ってみた

                            オープンソースで開発されているウェブアプリ「Revolt」は、ゲーマー御用達のチャットアプリ「Discord」のように好みのサーバーを建ててテキストチャットやボイスチャットを楽しむことができます。そんなRevoltを実際に使って、使い方や機能を確かめてみました。 Revolt https://revolt.chat/ ・目次 ◆Revoltのアカウント作成 ◆初めてのサーバー作成 ◆他のユーザーをサーバーに招待する ◆ボイスチャットを開始する ◆まとめ ◆Revoltのアカウント作成 Revoltはオープンソースで開発されており、記事作成時点ではパブリックベータテストを実施中。テストに参加するには、公式サイトにアクセスして「Join Public Beta」をクリックします。 次に、「ベータ版のためバグが多く含まれている」という旨の注意書きが表示されるので「Continue」をクリック。

                              好みのサーバーを建ててテキスト&音声チャットが可能なDiscord風のウェブアプリ「Revolt」を使ってみた
                            • ビデオ会議上の発言を音声認識で自動的にテキスト化してみよう | さくらのナレッジ

                              こんにちは。さくらインターネットの大井@在宅勤務中です。 ここ最近の世界情勢の中、インターネットを介して遠隔で会議を行う「ビデオ会議」が急速に普及しつつあります。これまではどうしても現地に参加者が集まることができない場合など限定的なシチュエーションでの利用が中心となっていましたが、すでに原則として在宅勤務となった弊社ではミーティングのほぼ100%がビデオ会議で開催されるまでになりました。また、弊社での利用例のようなクローズドな業務用以外にも、広く世の中で授業や講演といった不特定多数が参加する場面でも当たり前に利用されるまでになっています。 ビデオ会議システムでは、オフラインでの会合には無い便利な機能が利用できるのも大きな特徴です。例えば多くのビデオ会議システムに搭載されている録画機能。ミーティング中の動画や音声を記録し、終了後もいつでも参照することが可能になったことで、後でゆっくり議事録や

                                ビデオ会議上の発言を音声認識で自動的にテキスト化してみよう | さくらのナレッジ
                              • macOS 11 Big SurのCatalystアプリはコンテンツやテキストスケーリングが100%で最適化できるように。

                                  macOS 11 Big SurのCatalystアプリはコンテンツやテキストスケーリングが100%で最適化できるように。
                                • 【JavaScript】テキストアドベンチャーゲームのシステムを作りかけてみました - Little Strange Software

                                  どうも!LSSです!! 先日、このブログに という記事を書きました。 で、考えていたんですが、 「容易にシステムとなるスクリプトをコピペできて、誰でもカンタンに項目を増やせるようなWebゲームブックシステムを公開したら…誰かゲームブック作ってくれないかな?」 とw で、とりあえず、作ってみました! サンプル コード サンプルはあくまでサンプル と、作ってはみたものの… サンプル コード <style><!-- #gamen{border:2px solid #aaccff;} .sntk{text-decoration:underline #ffaaff;} --></style> <div id="gamen"> </div> <script>// <![CDATA[ hstr=[0]; st=[]; st[0]={ text:'あなたは今、門の前にいます。', sentaku:[ {g

                                    【JavaScript】テキストアドベンチャーゲームのシステムを作りかけてみました - Little Strange Software
                                  • 大規模画像テキストデータのフィルタリング手法の紹介

                                    基盤モデルのための事前学習用のデータは「量」にフォーカスされがちですが、昨今では「質」の部分にも注目が集まっています。特に昨年開催されたDataCompは、データの質にフォーカスしたData-centricなコンペ設計となっており、データフィルタリングのノウハウが多数共有されました。本発表ではDataC…

                                      大規模画像テキストデータのフィルタリング手法の紹介
                                    • 無料テキスト読み上げソフト「SofTalk」に64bit版、「MeCab」やMP3録音にも対応/

                                        無料テキスト読み上げソフト「SofTalk」に64bit版、「MeCab」やMP3録音にも対応/
                                      • テキストに加えてメロディやテンポなど時間的変化がある要素もコントロール可能な音楽生成モデル「Music ControlNet」が開発される

                                        近年はテキストから音楽を生成するAIツールが進歩を遂げ、さまざまなスタイルで高品質の音楽を生成できるようになっていますが、従来のテキストによる生成ではビートの位置や音楽のダイナミクス(強弱)など、時間と共に変化する属性を制御するのが難しかったとのこと。そこでカーネギーメロン大学とAdobe Researchの研究チームが、複数の時間的変化コントロールを可能にする音楽生成モデル「Music ControlNet」を発表しました。 [2311.07069] Music ControlNet: Multiple Time-varying Controls for Music Generation https://arxiv.org/abs/2311.07069 Music ControlNet https://musiccontrolnet.github.io/web/ 以前からテキストを基に音

                                          テキストに加えてメロディやテンポなど時間的変化がある要素もコントロール可能な音楽生成モデル「Music ControlNet」が開発される
                                        • 【TechFeed】テキスト生成AI、画像生成AI、コード生成AI界隈の注目記事をまとめてみました【2023年4月版】

                                            【TechFeed】テキスト生成AI、画像生成AI、コード生成AI界隈の注目記事をまとめてみました【2023年4月版】
                                          • PCのテキスト作り & プリンター故障 - miyotyaのブログ

                                            今朝室温が4℃に下がり寒い冬晴れになりました。 4~5日前に、PCのテキストに出来そうなチラシが新聞折込に入っていました。 B4サイズの横書きのチラシで複雑な作りですが私にも出来そう。 3日ぐらい前から少しずつ手掛けて見ました。 熟練者用のテキストに使いたいのでA4の横書きで作り始めました。 プリンターPIXUS Pro 9000 Mark|| ようやく出来たので印刷してみようとプリンターの電源を入れた所、グリーンとイエローのランプが点滅していて印刷できないのです。 サポートナンバーが出ていたのでキャノンに問い合わせました。 電話で指示を受けながら操作してみましたが故障しているとのことです。 2017年に製造が中止されていて、部品が無いので修理が出来ないと言われました。 早速、新しいものを買わなければなりません。 今まで8色刷りのプリンターを使っていたので、また8色刷りのプリンターを買いた

                                              PCのテキスト作り & プリンター故障 - miyotyaのブログ
                                            • ノベルゲームのテキストをリアルタイムに抽出するツール Textractor がすごい - castaneaiのブログ

                                              Textractorというノベルゲームのテキストをリアルタイムに抽出するツールがある。 https://github.com/Artikash/Textractor このツールは起動中のノベルゲーム内のテキストをリアルタイムに抽出し、翻訳の結果も一緒に出してくれる。 海外のノベルゲームファンが日本語のノベルゲームをプレイするために開発されたものと思われるが、ソースコードがGPLv3ライセンスで公開されており使っている技術が面白かったので紹介したい。 https://github.com/Artikash/Textractor/blob/master/README.md の画像を引用 Textractorはテキスト抽出をどのように実現しているのか? OCR技術で画面上のテキストを認識していると思ってしまいそうだが、実際は違う。 起動中のノベルゲームのプロセスに潜り込み、テキストが渡される関数

                                                ノベルゲームのテキストをリアルタイムに抽出するツール Textractor がすごい - castaneaiのブログ
                                              • [Stable Diffusion] AIでテキストから画像を生成する使い方を解説 [text2img]

                                                [Stable Diffusion] AIでテキストから画像を生成する使い方を解説 [text2img] 2022年8月23日火曜日 Artificial Intelligence Stable Diffusion 概要 Stable Diffusionは、拡散モデルによる画像合成モデルです。 自然言語で入力されたテキスト(prompt)から画像を生成するText to Imageタスクなどを実現します。 Latent Diffusionをベースとした本モデルは、非常に大規模なデータセットであるLAION-5Bを用いてトレーニングされています。 GoogleのImagenやOpenAIのGLIDE, DALLE-2など最新の画像生成モデルは社会に与える影響が大きいことなどを理由に学習済みモデルの公開を控えるケースが目立っていましたが、 Stable Diffusionでは、AIの平等な使用

                                                  [Stable Diffusion] AIでテキストから画像を生成する使い方を解説 [text2img]
                                                • 絹谷 田貫@名誉テキストゴリラ【∃】 on Twitter: "しかしてこれは彼らの『苛立ち』のコアの部分で つまり「自分と異なる見方をしてる人」という情報そのものに苛立っている https://t.co/rimwTbZRMB"

                                                  しかしてこれは彼らの『苛立ち』のコアの部分で つまり「自分と異なる見方をしてる人」という情報そのものに苛立っている https://t.co/rimwTbZRMB

                                                    絹谷 田貫@名誉テキストゴリラ【∃】 on Twitter: "しかしてこれは彼らの『苛立ち』のコアの部分で つまり「自分と異なる見方をしてる人」という情報そのものに苛立っている https://t.co/rimwTbZRMB"
                                                  • Apple、iPhone 8やiPhone SE (第2世代)以降のiPhoneに対しデザインを刷新したロック画面や日本語のテキスト認識をサポートした「iOS 16」を正式にリリース。

                                                    AppleがiPhone 8やiPhone SE (第2世代)などに対しウィジェットに対応したロック画面や日本語のテキスト認識表示をサポートした「iOS 16」を正式にリリースしています。詳細は以下から。 Appleは現地時間2022年09月12日、iPhone 8シリーズやiPhone X、iPhone SE (第2世代)以降のiPhoneに対応し、ロック画面のパーソナライズや集中モード、日本語のテキスト認識表示をサポートした「iOS 16」を正式にリリースしています。 iOS 16では、ロック画面のデザインが一新され、画面のカスタマイズ方法が新しくなり、またウィジェットで情報を一目で確認できるようになりました。ロック画面を集中モードとリンクさせて、集中モードフィルタで気が散るようなコンテンツをAppで見えないようにすることができます。 リリースノートより iOS 16の最小システム要件

                                                      Apple、iPhone 8やiPhone SE (第2世代)以降のiPhoneに対しデザインを刷新したロック画面や日本語のテキスト認識をサポートした「iOS 16」を正式にリリース。
                                                    • OpenAI の超高品質テキスト→画像生成モデル DALL·E 2 の技術詳細を解説

                                                        OpenAI の超高品質テキスト→画像生成モデル DALL·E 2 の技術詳細を解説
                                                      • Masato Kinugawa Security Blog: SVGフォントとCSSを使ってページ内のテキストを読み取る

                                                        English version is here: https://mksben.l0.cm/2021/11/css-exfiltration-svg-font.html この記事では、SVGフォントとCSSを使って、ページ内のテキストを読み取る方法を紹介します。 CSSを使ってデータを読み取る方法はいくつか知られており、既知の手法が以下のサイトでよくまとめられています。 CSS Injection Primitives :: DoomsDay Vault https://x-c3ll.github.io/posts/CSS-Injection-Primitives/ これらのテクニックは、入力がサニタイズされていて使えるHTMLタグが限られているケースや、Content Security Policy(CSP)の制限によってJavaScriptが使えない状況などでも、スタイルの記述ができる

                                                        • Stable Diffusionを利用しテキストから画像を生成できるMacアプリ「Amazing AI」が、A17 Proチップを搭載したiPhone 15 ProやM1チップ以降のiPadに対応。

                                                          Stable Diffusionを利用しテキストから画像を生成できるMacアプリ「Amazing AI」が、A17 Proチップを搭載したiPhone 15 ProやM1チップ以降のiPadに対応しています。詳細は以下から。 Amazing AIは2022年にSindre Sorhusさんが公開したApple Silicon Mac用のStable Diffusionクライアントで、ディープラーニングを利用しオフラインでテキストから画像(text-to-image)を生成することができますが、このAmazing AIアプリがiPhoneやiPadに対応しています。 Amazing AIアプリが利用できるようになったのは、AppleのA17 Proチップを搭載したiPhone 15 ProとiPhone 15 Pro Max、そしてApple Silicon M1以降を搭載したiPadで、M

                                                            Stable Diffusionを利用しテキストから画像を生成できるMacアプリ「Amazing AI」が、A17 Proチップを搭載したiPhone 15 ProやM1チップ以降のiPadに対応。
                                                          • Google Research、かなり自然なテキスト→動画生成AI「Lumiere」発表

                                                            米Googleの研究部門Google Researchは1月23日(現地時間)、「リアルな動画生成のための時空拡散モデル」と呼ぶ動画生成AIモデル「Lumiere」(仏語で光という意味)を発表した。テキストや画像からリアルな動画を生成する。生成できるのは、1024×1024ピクセルの5秒間の動画だ。 論文によると、Lumiereは独自のアーキテクチャを利用して、動画の時間全体を一度に生成するという。キーフレーム間をつないで合成する従来のモデルとは異なり、「モデル内の単一パスを通じて、動画の時間的継続全体を一度に生成する時空間U-Netアーキテクチャを導入」した。大まかに言うと、空間と時間の両方を同時に処理できるように設計されており、多数のフレームを組み合わせるのではなく、1つのなめらかなプロセスで動画全体を生成する。

                                                              Google Research、かなり自然なテキスト→動画生成AI「Lumiere」発表
                                                            • PC教室用テキストチェック&作成 - miyotyaのブログ

                                                              今日も晴れて日中の気温が12℃とやや暖かい日でした。 9日からパソコン教室が始まるのでテキストのチェックなどをしました。 特に熟練者向けのテキストのチェックを念入りに行い、私も忘れている部分があったりして良い勉強になりました。 過去に福岡地区福祉ネットで、バスツアーで東京の名所旧跡巡りをした時に作成したしおりの一部ですがテキストに使う予定です。 エクセルで作成した表をワードに貼り付ける際に、「形式を選択して貼り付け」をクリックして「Microsoft Excel ワークシートオブジェクト」をクリックして貼り付けると便利です。 表を修正する際に表をWクリックするとエクセルが開きその場で修正が出来ます。 そういう方法がある事を生徒さんに覚えてもらいたいです。 と言っても、こんなに細かい表は直接エクセルで修正して再度貼り付けた方が簡単かもしれませんが。 表の隣の文章はテキストボックスを使って入力

                                                                PC教室用テキストチェック&作成 - miyotyaのブログ
                                                              • 【3週間で合格】スペイン語検定5級の勉強法 おすすめテキストも紹介・2022年編 - ポリグロットライフ | 言語まなび∞ラボ

                                                                はじめに 今回はスペイン語検定5級の勉強法を丁寧に解説していきます。3週間程度で合格できるように、ポイントを絞って解説していきます。ますます注目度が高まっているスペイン語の学習をぜひ2022年から始めてみてください。おすすめテキストも紹介していきます! 注意 ※2021年春試験よりテスト形式が変更になりました 形式が大幅に変更したので、必ず下記サンプル問題を事前に確認 5級の主な変更点 一部記述方式→全てマークシート方式 100語程度の読解問題の導入 サンプル問題 https://casa-esp.com/wp-content/uploads/2021/03/tslevel5-sample.pdf casa-esp.com スペイン語とは スペイン語技能検定試験 スペイン語技能検定試験とは 2022年日程 スペイン語技能検定試験の試験内容 受験料と合格基準 スペイン語検定5級 レベル 設問

                                                                  【3週間で合格】スペイン語検定5級の勉強法 おすすめテキストも紹介・2022年編 - ポリグロットライフ | 言語まなび∞ラボ
                                                                • Adobe Premiere Pro「音声のテキスト化」ついに搭載

                                                                    Adobe Premiere Pro「音声のテキスト化」ついに搭載
                                                                  • 「テキストのやりとり」で増加"ロジハラ"に注意

                                                                    こんにちは。生きやすい人間関係を創る「メンタルアップマネージャⓇ」の大野萌子です。 コロナ禍になり、メール、チャットなど、テキストコミュニケーションの占める割合が、以前にも増して多くなりました。そこで、問題になりがちなのが、文字による威圧です。書く側に、相手を威圧する意図がなかったとしても「挨拶もなくいきなり用件のみ」「命令調」「正論で否定する」など、ハラスメントと受け取られて相談案件になることも。 直接話すより圧倒的に情報量が少ない そもそも、テキストコミュニケーションは、直接話すより圧倒的に情報量が少なく、齟齬が生まれやすいツールです。ある管理者の方は、メールを返信するだけで、一日の大半の時間が奪われてしまうと嘆いていました。

                                                                      「テキストのやりとり」で増加"ロジハラ"に注意
                                                                    • 『DOOM』がWindowsの「メモ帳」でプレイされる。 60fpsテキスト描画で、ぼんやり浮かび上がるドゥームガイ - AUTOMATON

                                                                      Samperson氏が投稿した映像には、テキストで描かれた画面で『DOOM』をプレイする様子が収められている。まず目に入るのは、文字が敷き詰められた「メモ帳」アプリだ。テキストによる画像表現、いわゆるアスキーアートにて描かれた『DOOM』のゲーム画面が確認できる。さらに注目すべきは、その画像が動き、実際にゲームプレイをおこなっている点だろう。アスキーアートの文字列が書き換えられることでゲーム画面が変遷。かなり見づらいものの、「メモ帳」アプリに記述された文字だけで『DOOM』のゲームプレイが描写されていることが分かる。大量の文字列が高速で入れ替わることで、ゲーム画面を表現しているわけだ。 同氏によると、この映像はフェイクではなく、実際にリアルタイムでプレイ可能とのこと。60fpsで動作しており、映像を早送りしているわけではないとも述べている。さらに、使用している「メモ帳」アプリ自体は、何も改

                                                                        『DOOM』がWindowsの「メモ帳」でプレイされる。 60fpsテキスト描画で、ぼんやり浮かび上がるドゥームガイ - AUTOMATON
                                                                      • PDFのテキストをアウトライン化する(Acrobat/Illustrator) | DTP Transit

                                                                        Illustrator、Photoshop、InDesignをはじめとしたDTP関連の情報サイト。2005年にスタート。 フォントが埋め込まれているPDFをアウトライン化する方法についてまとめました。 Acrobatで状況を確認する AcrobatでPDFを開き、[ファイル]メニューの[プロパティ]をクリックして[文書のプロパティ]ウィンドウを開く [フォント]タブをクリックすると、フォントの埋め込み状況を確認できます。 Acrobatでテキストをアウトライン化する(1)PDFフィックスアップを使う Acrobatでは[プリフライト]でPDFフィックスアップを実行します。 AcrobatでPDFを開く [編集]メニューの[プリフライト]をクリック(キーボードショートカットは⌘ + ) PDFフィックスアップの[フォントをアウトラインに変換]を選択し、[解析してフィックスアップ]ボタンをクリ

                                                                          PDFのテキストをアウトライン化する(Acrobat/Illustrator) | DTP Transit
                                                                        • 商用利用も可能な画像生成AI「Stable Diffusion」無料でリリース。誰でも簡単にテキストから画像を生成できるデモページを公開中

                                                                          商用利用も可能な画像生成AI「Stable Diffusion」無料でリリース。誰でも簡単にテキストから画像を生成できるデモページを公開中 編集部:Akasaka イギリスのスタートアップ企業Stability AIは本日(2022年8月23日),高性能画像生成AI「Stable Diffusion」と,それを使用したサービス「DreamStudio」のβ版をリリースした。Stable Diffusionは,近頃SNSなどで話題になっている「Midjourney」と同様の,テキストから画像を生成できるAIだ。商用利用も可能なライセンスの下でリリースされており,ゲーム制作への利用も期待できそうだ。 公開中のデモページでは,テキストを入力して“Generate image”を押すだけで,誰でも無料で簡単に画像を生成できる。 デモページで“flower”と入力し生成された画像 「Stable D

                                                                            商用利用も可能な画像生成AI「Stable Diffusion」無料でリリース。誰でも簡単にテキストから画像を生成できるデモページを公開中
                                                                          • Instagramが計画中のテキストベースSNS、Twitterそっくりのスクリーンショットが流出【やじうまWatch】

                                                                              Instagramが計画中のテキストベースSNS、Twitterそっくりのスクリーンショットが流出【やじうまWatch】
                                                                            • アドビ、生成AIを刷新 画像を貼って「このテイストで出力して」も可能に テキスト→動画生成も開発中

                                                                              2023年3月にβ版を提供し、9月から正式提供をスタートした米Adobeの生成AI「Firefly」に早速アップデートが入った。プロンプトから画像を生成するモデルが後継の「Adobe Firefly Image 2 Model」に刷新された。生成できる解像度が4倍になった他、新たに「生成Match」も実装。まずはFirefly Web版から提供する。 Firefly Image 2 Modelは、先代の生成モデルから出力精度を上げつつ、ユーザーの出力オーダーにより柔軟に対応するという。例えば人物のレンダリングは、肌、髪、目、手、身体の構造を改善した他、カラー表現、ダイナミックレンジを改善している。生成できる画像の解像度も4倍に拡大した。引き続き商用利用も可能で、学習は「Adobe Stock」からの許諾済みデータ、オープンライセンス画像、著作権が失効したパブリックドメインデータなどから行っ

                                                                                アドビ、生成AIを刷新 画像を貼って「このテイストで出力して」も可能に テキスト→動画生成も開発中
                                                                              • キー操作だけでテキストを選択できる「マークモード」が「Windows Terminal」に追加【9月14日追記】/「Windows Terminal Preview 1.15」が公開、「Windows Terminal 1.14」は正式版に

                                                                                  キー操作だけでテキストを選択できる「マークモード」が「Windows Terminal」に追加【9月14日追記】/「Windows Terminal Preview 1.15」が公開、「Windows Terminal 1.14」は正式版に
                                                                                • 浜学園の計算・漢字テキストの感想と予習シリーズ・日能研・サピックス・進研ゼミ 中学受験講座の計算・漢字教材(ドリル)比較 - 知らなかった!日記

                                                                                  計算教材比較 浜学園の計算テキスト 同じ種類の計算が一週間続く 1週間(やさしい計算6問+難しい計算4問)×5日分 活用していないご家庭も多いのでは 予習シリーズの計算テキスト 1週間(やさしい計算6問+難しい計算2問)×7日分 いろんな種類の計算を楽しめる 進研ゼミ中学受験講座の計算ドリル 毎日(いろいろ計算3問+復習の文章題2問) 日能研の計算ドリル『マスター1095題一行計算問題集 』 毎日たった3問の計算! 漢字教材比較 浜学園の漢字テキスト『漢字のひろば』 「成り立ち」や「漢字の意味」が載っていない! 使い方欄にある「熟語の意味」が載っていない サピックスの漢字教材『サピかん SAPI×漢 』 「成り立ち」や「漢字の意味」が載っている! 四谷大塚「予習シリーズ」の『漢字とことば』 漢字学習に必要なものがすべてそろっている! 平日は漢字2文字だけ!練習問題も1文字につき4問だけ!

                                                                                    浜学園の計算・漢字テキストの感想と予習シリーズ・日能研・サピックス・進研ゼミ 中学受験講座の計算・漢字教材(ドリル)比較 - 知らなかった!日記