並び順

ブックマーク数

期間指定

  • から
  • まで

561 - 600 件 / 1938件

新着順 人気順

テキストの検索結果561 - 600 件 / 1938件

  • BINGのAIにテキスト書かせるやつの遊んでみてるレポート - ←ズイショ→

    zuisho.hatenadiary.jp BINGが順番待ち食らって我慢できなかったので自分でAIみたいな文章を書く、ということをやってたのですが無事に使えるようになったので、AIにも書かせて対決しました。 なんとかまだ人類代表の俺の方が勝ててるんじゃないかと思います。 ただ、一点、先走ってブログ書くとそもそもBINGって検索サービスなので「のび太の葬式でジャイアンが読む弔辞」で検索すると余裕で俺のブログが一位に表示されてしまったので、今後純粋な勝負をする場合はブログにアップする前にAIに書かせる必要があります。 他にも色々遊び方を模索していますが、得意ジャンルと不得意ジャンル、面白くなることと面白くならないことがなんとなく見えてきて、面白い遊び方を考え中です。 以下はその一部。 BING、シンプルにズイショさんは大喜利で面白いことじゃなくて人が嫌な気持ちになることを言ってるのをちゃんと

      BINGのAIにテキスト書かせるやつの遊んでみてるレポート - ←ズイショ→
    • ロリポップ!、ChatGPTを用いたウェブページ作成機能を追加。テキスト情報からHTML/CSS生成 「GMOレンシュ」にも連絡文の生成機能

        ロリポップ!、ChatGPTを用いたウェブページ作成機能を追加。テキスト情報からHTML/CSS生成 「GMOレンシュ」にも連絡文の生成機能
      • 無料&商用利用も可能なテキストとデータ曲線を融合できる不思議なフォント「Datalegreya」

        オープンソースのAlegreya Sansというフォントをベースにデザインされた、テキストとデータ曲線を織り交ぜることができるタイプフェイス(書体)が「Datalegreya」です。ベースとなったAlegreya Sansと同じSIL Open Font Licenseのもと配布されており、無料でダウンロード可能で商用利用もできるということで、実際にどんなフォントになっているのか確かめてみました。 Datalegreya http://www.datalegreya.com/ 書体をダウンロードするにはページ下部にある「Datalegreya OpenType [.otf, zipped, 658 Ko]」をクリック。 ZIPファイルがダウンロードできるので、これをExplzhなどを用いて解凍します。 解凍したフォルダの中には3つのOpenTypeフォントが格納されているので、まとめて選択

          無料&商用利用も可能なテキストとデータ曲線を融合できる不思議なフォント「Datalegreya」
        • 無料のテキストエディター「Notepad++」v7.9.3が公開 ~Windows XP対応を断念/ライセンスが“GPL 2.0”から“GPL 3.0”へと変更

            無料のテキストエディター「Notepad++」v7.9.3が公開 ~Windows XP対応を断念/ライセンスが“GPL 2.0”から“GPL 3.0”へと変更
          • ランダムラベルを利用することでテキスト分類が改善する!

            3つの要点 ✔️ 予測手順において余分な計算コストをかけることなく性能を向上 ✔️ ラベルスムージング法に対するLabel Confusion Model(LCM)の優位性も検証 ✔️ LCMは混乱したデータセットやノイズの多いデータセットに特に有効であり、ラベル平滑化法(LS)よりもかなりの程度優れていることが実証 Label Confusion Learning to Enhance Text Classification Models written by Biyang Guo, Songqiao Han, Xiao Han, Hailiang Huang, Ting Lu (Submitted on 9 Dec 2020) Comments: Accepted by AAAI 2021. Subjects: Computation and Language (cs.CL); Art

              ランダムラベルを利用することでテキスト分類が改善する!
            • 「黙読早い人はフルボイスゲームが苦手」に納得「テキストだけ読んで次へ行っちゃう」

              卵アイコンの逆襲 @tamagyaku 『黙読早い人はフルボイスゲームが苦手』っての見てなるほどって思った。確かに音声まどろっこしくてツラくて飛ばしちゃう。eラーニングも音声待つのツラくて飛ばしちゃう。最近の子は動画で調べるってのに対して『それ面倒臭くない?』って理解出来なかったのもそういう話だったのかも。 2021-03-08 03:49:58

                「黙読早い人はフルボイスゲームが苦手」に納得「テキストだけ読んで次へ行っちゃう」
              • CyberMates チャットAI教育テキスト無償配布プログラム - CyberMates (サイバーメイツ)

                CyberMates チャットAI教育テキスト無償配布プログラムは、チャットAIを軸に「AIの仕組みや危険性、正しい使い方を広めること」を通じて、「AIに関連する危険な事故や事件を未然に防ぎ、正しく規制や改善を行える環境作りを行い、AIを安全かつ便利に使えるようにすること。」を目的に、チャットAIの教育テキストを無償配布するプログラムです。 プログラムの内容 チャットAI 教育テキストを無償配布 プログラムの趣旨 ・チャットAIの仕組みや危険性、正しい使い方を周知する。 ・チャットAIを使用することや、使用されることによる事故や事件を未然に防ぐ。 ・AI全体の規制や未来について考えるための前提的な知識を広める。 プログラムの実施期間 2024年3月9日~終了日未定 プログラムの対象 次の全てに該当し ・営利を目的としない ・本プログラムの趣旨に賛同する ・本プログラムの条件、注意事項に同意

                  CyberMates チャットAI教育テキスト無償配布プログラム - CyberMates (サイバーメイツ)
                • Adobe XDは確実に進化している!テキストには依存せず、アクセシブルなUIを構築するためのUIキット

                  先月のAdobe MAXを経て、Adobe XDも大きく進化しましたね。 リアルタイムの共同編集、ドキュメントの履歴、共有モードといったワークフローに役立つものをはじめ、コンポーネントのステート、ホバーのアクショントリガー、プラグインマネージャー、Sketchファイルとの互換性強化などアプリ自体の機能も進化しています。 2020年に向けてこれから増えてくるであろう、テキストには依存しないUIを構築するためのUIキットを紹介します。 世界では20%が読み書き能力に欠け、アメリカでは43%が識字能力の低い状態です。視覚障がいは、アメリカだけでもさらに3千4百万人に関連します。そして、失読症などの読み書きに関する障がいは人口の最大15%に影響するかもしれません。こうした識字に関わる障がい者は誰もが、テキストに大きく依存するUIを利用できない可能性があります。特に、テキストが分かりやすいアイコンと

                    Adobe XDは確実に進化している!テキストには依存せず、アクセシブルなUIを構築するためのUIキット
                  • 松尾潔 on Twitter: "#ミヤネ屋 で、山下達郎さんのラジオ発言に関する3つの質問にお答えしました。 メディア10数社からの取材依頼に応じたのは今回が初めて。番組側が「自筆テキスト、切り取りなしの全文紹介」の条件を呑んでくれたからです。お待たせしている他社のご担当の皆さま、ご海容ください。 以下、全文です。 https://t.co/s1VTFZp2d4"

                    • ついに登場! 星海社テキスト作品配信開始キャンペーン

                      『Fate/Zero』『ひぐらしのなく頃に』『RPF レッドドラゴン』など、星海社テキスト作品の一部がついに配信開始! 今回配信される90点がコイン+30%還元! さらに一部対象のシリーズがセットで10%OFFとなります! ※今回配信されない星海社テキスト作品は、9月以降に順次配信される予定です。

                        ついに登場! 星海社テキスト作品配信開始キャンペーン
                      • Aceでテキストエリアをエディタ化する

                        はじめに こんにちは。 GMO NIKKOのKONCEです。 今回はJS製エディタのAceについて調べる機会があったのでブログの題材にしてみます。 使用するケースはかなり限られてくると思いますがよければご覧ください 背景 ネイティブアドの取り扱い 僕の担当しているプロダクトGMOSSPではネイティブアドを取り扱っています。 ネイティブアドはデマンド側のサービスに対して広告素材を要求してGMOSSPでデザインを当てていきます。そのため、管理画面からデザインを登録更新できるフォームを用意しています。 運用面の課題 基本的には担当者がHTML/CSS/JavaScript のタグを登録/編集して運用しています。その中で通常のテキストエリアを使用してきましたが、 タグの不備 全角の混入 画面上での操作性 など課題がありました。不備などはバックエンドのバリデーションでケアできればベストだと思いますが

                          Aceでテキストエリアをエディタ化する
                        • リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介 — Stability AI Japan

                          ポイント SDXL Turboは、新しい蒸留技術によって最先端の性能を達成し、これまでにない品質のシングルステップ画像生成を可能にし、必要なステップ数を50から1に削減 非商用研究ライセンスでのリリース(Hugging Faceのモデルウェイトとコードをダウンロードしてください。) Clipdrop にてベータ版を公開中 新しいテキスト画像合成モードである SDXL Turbo をご紹介します。SDXL Turbo は、敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術に基づいています。この技術により、SDXL Turbo は1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。技術的な詳細に興味のある研究者や愛好家のために、研究論文はこちらで

                            リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介 — Stability AI Japan
                          • 情報をまとめる人がテキストではなく動画という形をとるようになって「インターネットが不便になった」よね…って話

                            chokudai(高橋 直大)@AtCoder社長 @chokudai Youtuberをみんな見るようになって、情報を纏める人がテキストではなく動画という形で情報を纏めるようになり始めたので、インターネットが以前より不便になったように感じてる。 検索性が低い・見るのに時間がかかる・必要な情報を切り出しにくい、などなど、色々ダメな要素が多い気がする。 2022-03-22 16:41:48 chokudai(高橋 直大)@AtCoder社長 @chokudai とはいえ、動画という形が嬉しい人がいるから動画が流行ってるというのもあるとも思っているので、AtCoderの解説は文章も動画もあるよ。 (最近のすぬけ解説は頑張り過ぎだけど) 2022-03-22 16:42:30 リンク AtCoder AtCoder:競技プログラミングコンテストを開催する国内最大のサイト プログラミング初級者か

                              情報をまとめる人がテキストではなく動画という形をとるようになって「インターネットが不便になった」よね…って話
                            • テキストの指示だけでハイクオリティ動画を制作!OpenAI の動画生成AI「Sora」 - ナゾロジー

                              動画もAIに作らせる時代がきたOpenAI が文章から動画を生成してくれる超高性能AIが発表! / Credit:OpenAI「未来の映画監督はAIかもしれない」というのは、もはや空想の話ではないかもしれません。 OpenAIが2月15日(米国時間)発表した「Sora」は、まるで魔法のようにテキストから動画を生み出すAIモデルです。 OpenAIと言えば、会話型AIのChatGPTや画像生成ツールのDall-Eでその名を馳せていますが、動画を生成するAIツールとしては、Soraがその初陣を飾ります。 Soraの魔法は、ただの動画を超えたもの。最大60秒の長さで、細部までこだわり抜かれたシーン、カメラワークの鮮やかな動き、感情豊かなキャラクターたちを生み出します。これまでの動画生成AIがせいぜい数秒のクリップに留まっていたことを考えると、動画の長さはもちろん、その質においてもSoraはこれま

                                テキストの指示だけでハイクオリティ動画を制作!OpenAI の動画生成AI「Sora」 - ナゾロジー
                              • テーマ機能と新しいテキスト描画エンジンを搭載した「Windows Terminal 1.16」がプレビュー公開/マークモード対応の「Windows Terminal 1.15」は安定版に

                                  テーマ機能と新しいテキスト描画エンジンを搭載した「Windows Terminal 1.16」がプレビュー公開/マークモード対応の「Windows Terminal 1.15」は安定版に
                                • 無料で使える音楽生成AI「Stable Audio Open」をStable Diffusion開発元が公開、テキストから最長47秒のサウンドトラックを生成可能

                                  画像生成AI「Stable Diffusion」の開発元として知られるStability AIが、オープンソースの音楽生成AI「Stable Audio Open」を公開しました。Stable Audio Openは、文章で指示するだけで最長47秒の音楽を生成できます。 Stable Audio Open — Stability AI https://stability.ai/news/introducing-stable-audio-open We’re excited to announce Stable Audio Open, an open source model optimised for generating short audio samples, sound effects and production elements using text prompts. This

                                    無料で使える音楽生成AI「Stable Audio Open」をStable Diffusion開発元が公開、テキストから最長47秒のサウンドトラックを生成可能
                                  • AIを駆使した音声翻訳システムをMetaが公開、テキストデータの収集が困難なマイナー言語にも対応

                                    Facebookの親会社であるMetaの人工知能(AI)研究部門であるMeta AIが、口頭での会話をほぼリアルタイムで翻訳可能なAIを用いた音声翻訳システムを開発し、オープンソースで公開しています。 A new AI-powered speech translation system for Hokkien pioneers a new approach for a primarily oral language https://ai.facebook.com/blog/ai-translation-hokkien/ Using AI to Translate Speech For a Primarily Oral Language | Meta https://about.fb.com/news/2022/10/hokkien-ai-speech-translation/ (1/3)

                                      AIを駆使した音声翻訳システムをMetaが公開、テキストデータの収集が困難なマイナー言語にも対応
                                    • 日本語テキストの折り返しを自然に ~Googleが分かち書き器「BudouX」を紹介/「Google Chrome」や「Android」に標準搭載へ

                                        日本語テキストの折り返しを自然に ~Googleが分かち書き器「BudouX」を紹介/「Google Chrome」や「Android」に標準搭載へ
                                      • 16GBにおよぶWikipediaの全テキストがDNAに保存できました

                                        16GBにおよぶWikipediaの全テキストがDNAに保存できました2019.07.05 12:0043,933 ヤマダユウス型 液体ハードディスクとか石英ディスクとか、未来のストレージってすごいよね。 マイクロソフトがDNAストレージを商業化すべく頑張っていますが、ボストンのスタートアップ企業CATALOGが面白い成果をあげたようです。英語版Wikipediaの全テキストをDNAに保存したとニュースになっています。 Holding the entire 16 GB of Wikipedia written in DNA between my fingers! Congrats @catalogdna!!https://t.co/vjaoqjZcSlpic.twitter.com/qlwgfnaZxg — Jun Axup, PhD (@junaxup) 2019年6月30日はい、これが

                                          16GBにおよぶWikipediaの全テキストがDNAに保存できました
                                        • 【12/24にGitLab対応!】テキストで自在に「描く」- KrokiではじめるDiagram as Code - Qiita

                                          【12/24にGitLab対応!】テキストで自在に「描く」- KrokiではじめるDiagram as CodeMarkdownGitLabasciidocVisualStudioCodekroki これは、 NTTコミュニケーションズ Advent Calendar 2020 25日目の記事です。 昨日は @tnoyama さんの「TEKTONとArgoを比較してみた」でした。お楽しみいただけましたか? Krokiとは 本記事では、テキストからの図表生成ツール Krokiを紹介します。最新バージョンは0.9.0です。 公式docs: Kroki! GitHub: yuzutech/kroki: Creates diagrams from textual descriptions! 概要 Kroki!は、テキストから統一的なAPIで、 UML C4 データ可視化 その他図表 を、PNG,

                                            【12/24にGitLab対応!】テキストで自在に「描く」- KrokiではじめるDiagram as Code - Qiita
                                          • 2020年のデイリーポータルZによく出てきた単語は「自分」~テキスト分析で見る総集編

                                            年末総集編ウィーク、今日は記事中でよくつかわれた単語がわかる、ワードクラウドで振り返ります! ワードクラウドというのは、テキスト中に頻出した単語を並べて、特に多く出てきた単語を大きく描いた図のこと。 今年一年の記事をライターのほりさんが分析して、ワードクラウドにしてくれました。サイトの傾向からライターごとの個性、それから時期別の分析など、興味深いデータとともに2020年の記事を振り返っていきます!

                                              2020年のデイリーポータルZによく出てきた単語は「自分」~テキスト分析で見る総集編
                                            • 長いテキストを読まない!? インドネシアのメディア事情、人気は「ファッション、コスメ、お金持ち」 - Media × Tech

                                              はじめまして、SmartNews メディア事業開発所属の山口 亮と申します。コンテンツをユーザーに届けるために、記事や動画を分析したり、コンテンツ掲出システム / ロジックの改善案を考えたりしています。 スマートニュースは米国にオフィスがあり、外国籍社員も多く在籍するなど“世界”を意識することが多々あります。最近この国ではこんなアプリが流行っているらしい、この地域はこんなコンテンツを好む傾向にある、母国ではこんな取り組みがーーなんて会話もちらほら。 その中でも「会話に出てこない」のがインドネシア。約2.5億人超の人口、著しい経済成長を見せるなど世界的には目立つ存在ではありながらも、どのような国なのかほとんど知りません。 アメリカをはじめとする欧米諸国、インドや中国といったアジア圏の大国については情報がそれなりに出回っていて知る機会もある。でも、インドネシアってどんな国なんだろう? どんな人

                                                長いテキストを読まない!? インドネシアのメディア事情、人気は「ファッション、コスメ、お金持ち」 - Media × Tech
                                              • Cloudflare、エッジアプリにAIをもたらす「Constellation」発表。画像認識、アノマリ検出、テキスト処理、音声認識など可能

                                                Cloudflare、エッジアプリにAIをもたらす「Constellation」発表。画像認識、アノマリ検出、テキスト処理、音声認識など可能 Cloudflareは、同社のCDNプラットフォーム上でAI機能を提供する「Constellation」を発表しました。 Cloudflareは同社のエッジデータセンターで実行されるJavaScriptランタイムであるCloudflare Workersを提供しており、ここでアプリケーションが実行可能です。Constellationは、このアプリケーションに画像認識やテキスト処理などを追加できるようにします。 Today, we're excited to welcome Constellation to the Cloudflare stack. Constellation allows you to run fast, low-latency i

                                                  Cloudflare、エッジアプリにAIをもたらす「Constellation」発表。画像認識、アノマリ検出、テキスト処理、音声認識など可能
                                                • 生成AIが簡単なテキストをもとに画像と音声を雑然と出力し続ける「EasyZatuGen」/数秒ごとに画像と共にセリフを生成し、合成音声で読み上げ【レビュー】

                                                    生成AIが簡単なテキストをもとに画像と音声を雑然と出力し続ける「EasyZatuGen」/数秒ごとに画像と共にセリフを生成し、合成音声で読み上げ【レビュー】
                                                  • iOS15/iPadOS15「テキストの認識表示/ライブテキスト」の使い方 写真内の文字をコピペや翻訳可能に - こぼねみ

                                                    「iOS 15」および「iPadOS 15」に搭載される「テキストの認識表示(Live Text)」機能。 写真の中にある文字部分をタップすることで、テキストとして認識し、電話をかけたり、Eメールを送ったり、(A12 Bionic以降であれば)道順を調べることも可能になります。 iOS 15:テキストの認識表示 その方法としては、 写真をアプリを開く レストランのメニューや商品のタグなど、文字が写っている写真を探す 文字が小さく表示されている場合は、ピンチ操作で写真を拡大するなど調整 文字部分を長押しすることで選択ツールが出現。選択ツールの端をドラッグして、コピーしたい文字をハイライト 画面から指を離し、ポップアップメニューから「コピー」や「翻訳」を選択 メモなどを開き、ペーストする これで写真にあるテキストを活用できるようになります。 下の写真はメモアプリに認識したテキストをコピペしたと

                                                      iOS15/iPadOS15「テキストの認識表示/ライブテキスト」の使い方 写真内の文字をコピペや翻訳可能に - こぼねみ
                                                    • たのまな「登録販売者合格講座」の口コミ・合格率は? テキストや費用・評判も徹底解説

                                                      「たのまな」は登録販売者の通信講座の中でも一番バランスが取れた講座だよ。 テキストはもちろん、eラーニングやDVDの映像講義でも学べるから理解しやすいんだ。 料金も相場程度で、テキストやサポート体制なども万全だよ。 ドラッグストアで働く上で登録販売者の資格はマストになりつつあります。 資格を持っていないと昇進はあり得ませんし、一見、薬とは関係ない化粧品担当も登録販売者の資格を取るように言われます。 しかし、いきなり「資格を取れ」と言われてもなかなか独学では難しいもの。 通信講座を使う人も多いですが、たくさんあるのでどれを選べばいいかわからない人が多いと思います。 せっかく高いお金を出すのだから後悔はしたくないですよね。 ヒューマンアカデミーの通信講座「たのまな」は数ある通信講座のうちの一つの会社であり、通信講座だけでなく、セミナーも開催している大手の会社です。 たのまなにも登録販売者の通信

                                                        たのまな「登録販売者合格講座」の口コミ・合格率は? テキストや費用・評判も徹底解説
                                                      • 「Raspberry Pi OS」がアップデート--テキスト検索やネットワーク管理機能が強化

                                                        「Raspberry Pi OS」はデスクトップ環境を向上させる最新アップデートにより、テキスト検索やネットワーク管理機能が強化されたほか、Raspberry Piのカメラシステムが利用しやすくなった。 Raspberry Pi OSには、「File Manager」「Raspberry Pi Imager」「Image Viewer」のようなアプリを探すための新たなテキスト検索ボックスが追加された。「Raspberry Pi」用キーボードであればRaspberryキーを、「Windows」用キーボードであればWindowsキーを押せば呼び出せる。既存のメニューの位置は変わらない。 音声出力を表すアイコンと音声入力を表すアイコンもある。また、USB接続やBluetooth接続のオーディオ機器をつなぐと、マイクのアイコンが表示される。 多くのLinuxディストリビューションで採用されている、

                                                          「Raspberry Pi OS」がアップデート--テキスト検索やネットワーク管理機能が強化
                                                        • 選挙の根幹を揺るがす?AIがすべてを生成した米共和党「反バイデンCM」の意味 入力テキストから最適な動画をつくるモデルも、生成AIは選挙をどう変えるか | JBpress (ジェイビープレス)

                                                          (小林 啓倫:経営コンサルタント) 米共和党が作成した「反バイデンCM」 来年2024年は米大統領選の年だ。毎回さまざまなドラマが繰り広げられるが、今回はトランプ元大統領が2020年のリベンジを掲げて再出馬を表明する中、同じく現職のバイデン大統領も出馬する構えを見せており、いつにも増して大きな注目を集めている。 そんな中、民主主義の根幹とも言える選挙のあり方が、今大きく変わる可能性がある。それを象徴しているのが、米共和党が今年4月末に発表したこんな選挙CMだ。 一見したところ、何の変哲もないように見えるかもしれない。共和党のCMということで、民主党のバイデン大統領を攻撃する内容となっており、「過去最弱の大統領が再選されるようなことになったら?」と問いかけている。もちろんその答えは、国際的な緊張の高まりや国内での治安悪化など、さまざまな悪いことが起きるだろうというわけだ。 ただこの動画には、

                                                            選挙の根幹を揺るがす?AIがすべてを生成した米共和党「反バイデンCM」の意味 入力テキストから最適な動画をつくるモデルも、生成AIは選挙をどう変えるか | JBpress (ジェイビープレス)
                                                          • テキスト装飾されたWord文書をMarkdown書式のプレーンテキストへ変換「docx2md」/リンクや引用ブロックにもちゃんと対応【レビュー】

                                                              テキスト装飾されたWord文書をMarkdown書式のプレーンテキストへ変換「docx2md」/リンクや引用ブロックにもちゃんと対応【レビュー】
                                                            • GoogleがGemini 1.5をリリース、最大100万トークンを処理できて1時間のムービーや70万語のテキストを扱うことが可能

                                                              Googleがテキスト・画像・ムービーをまとめて処理できるマルチモーダルAI「Gemini」の次世代モデルとして「Gemini 1.5」を発表しました。処理できるトークン数の上限が100万まで上昇したほか、従来の1.0モデルと比べて少ない計算で高い品質の結果を提供できるとのことです。 Google Japan Blog: 次世代モデル、 Gemini 1.5 を発表 https://japan.googleblog.com/2024/02/gemini-15.html 従来モデルであるGemini 1.0は「GPT-4を超える性能のマルチモーダルAI」として2023年12月6日に登場しました。最上位モデルのGemini 1.0 Ultraを使用したハンズオンムービーではまるで人間かと思うような受け答えをしている様子が確認できます。 文字・音声・画像を同時に処理して人間以上に自然なやりとりが

                                                                GoogleがGemini 1.5をリリース、最大100万トークンを処理できて1時間のムービーや70万語のテキストを扱うことが可能
                                                              • Firefox、オンデバイスAIで画像のAltテキストを自動生成する実験的機能を導入、スクリーンリーダーのユーザーに利便性

                                                                Firefoxの開発元であるMozillaは、Webページ上の画像のAltテキストをオンデバイスAIモデルを使用して自動的に生成する実験的な機能を、9月にリリースされる予定のFirefox 130で導入することを明らかにしました。 この機能は、Firefoxに搭載されているPDFエディタの一部となる予定です。 最終目標としては、Webページを音声で読み上げるスクリーンリーダーを使用している視覚障害者などのユーザが一般的なブラウジングで利用できるようにすることとされています。 オンデバイスAIでAltテキストを生成する理由 画像のAltテキストは、Webページで画像が表示できないときに、画像の代わりに使われるテキストの情報です。しかし、Altテキストが設定されていない画像は多くのWebページで存在します。 今回のMozillaの取り組みは、こうしたAltテキストが設定されていない画像を含むW

                                                                  Firefox、オンデバイスAIで画像のAltテキストを自動生成する実験的機能を導入、スクリーンリーダーのユーザーに利便性
                                                                • スマホカメラで写したものを検索できる「Googleレンズ」に手書き文字をテキスト形式でPCにコピペする新機能が実装されたので試してみた

                                                                  Googleが、Androidスマートフォンのカメラで目の前にあるものを調べたり翻訳したりできる「Google レンズ」に、手書きの文章をコピーしてPCに送信する機能を搭載したと発表しました。そこで、実際に手元にあるAndroidスマートフォンを使って、手書きのテキストをどうやってPCで編集可能にできるのかを試してみました。 New Google Lens features to help you be more productive at home https://blog.google/products/google-lens/new-google-lens-features-help-you-be-more-productive-home/ 用意したのは手書きのメモと、Android 10がインストールされたPixel 3a。 Androidのカメラアプリを立ち上げ、「その他」タブを

                                                                    スマホカメラで写したものを検索できる「Googleレンズ」に手書き文字をテキスト形式でPCにコピペする新機能が実装されたので試してみた
                                                                  • macOS 13 Venturaではプレビューやイメージキャプチャアプリで画像をOCR処理し、PDFにテキストとして埋め込むことが可能に。

                                                                    macOS 13 Venturaではプレビューやイメージキャプチャアプリで画像をOCR処理し、PDFにテキストとして埋め込むことが可能になっています。詳細は以下から。 Appleは2021年にリリースしたmacOS 12 MontereyとiOS 15で、機械学習を利用し、オンデバイスで写真内にある文字や文章を検出、編集可能なテキストとしてコピー&ペーストできる「テキスト認識表示 (Live Text)」機能を導入し、

                                                                      macOS 13 Venturaではプレビューやイメージキャプチャアプリで画像をOCR処理し、PDFにテキストとして埋め込むことが可能に。
                                                                    • 学参プラザの評判・口コミを徹底解説【参考書・赤本・テキスト買取】

                                                                      「学参プラザ」は参考書や赤本、テキストなどの書籍を買い取ってくれる会社だよ。 買取実績もあり、一冊一冊きちんと査定してくれるから安心。 ブックオフなどの古本屋より高く売れることが多いよ。 こんな方におすすめ 学参プラザについて知りたい評判や口コミを知りたい買取の流れを知りたいフリマアプリや古本屋との違いを知りたい教科書や参考書を売りたい受験の時に使った書籍を売りたい赤本や予備校のテキストを売りたい 「学参プラザ」は、受験のときに使った参考書や赤本、テキストなどを買い取ってくれる買い取り業者です。 買取実績も多く、「Amazonマケプレアワード 2016 カテゴリー賞」も受賞している信頼できる会社です。 大学受験などで勉強した赤本や参考書、予備校などで使ったテキストなどの処理に困っている人は多いでしょう。 教科書や参考書、予備校のテキストなどは、年度ごとに最新の情報に合わせてどんどん更新され

                                                                        学参プラザの評判・口コミを徹底解説【参考書・赤本・テキスト買取】
                                                                      • 国立国語研究所、「語彙研究文献語別目録」の全文テキストデータを公開

                                                                        2019年10月25日、国立国語研究所は、「語彙研究文献語別目録」の全文テキストデータの公開を発表しました。 「語彙研究文献語別目録」は、佐藤喜代治氏編『講座日本語の語彙別巻』(明治書院、1983年)所収の目録であり、個々の語にどのような研究文献があるかを語別に検索することが可能です。今回、「編集のことば」「あとがき」と凡例はPDF形式で、目録はExcel形式及びTSV形式で公開されています。 なお、「語彙研究文献語別目録」の公開ページ上の記載によれば、全文テキストデータの二次利用条件はクリエイティブ・コモンズ・ライセンスのCC BY-NC(クリエイティブ・コモンズ 表示 – 非営利4.0 国際ライセンス)となっています。 2019年度のニュース一覧(国立国語研究所) https://www.ninjal.ac.jp/newsyears/2019/ ※2019年10月25日付けのニュースに

                                                                          国立国語研究所、「語彙研究文献語別目録」の全文テキストデータを公開
                                                                        • 月刊テキストマイニングレポートVol.32:フェミニズムへの憎悪を扇動する「オタク政治家」――荻野稔研究|後藤和智@テキストマイニングとか

                                                                          本稿は、「コミックマーケット97」第2新刊『月刊テキストマイニングレポート総集編2 続・ツイッターにおける女性差別に関する考察』の第4章として書かれたものです。 4.1 はじめに本書の締めとして、まえがきで採り上げた荻野稔・太田区議について採り上げたい。筆者はtwitteRを使って、荻野のアカウントである「@ogino_otaku」を検索ワードに、リツイートされている荻野のツイートを集計した。集計を行ったのは2019年12月12日の深夜で、API検索を用いている関係から、国際標準時で2019年12月11日15時17分から2日15時51分までの34,089件のツイートが取得できた。その中からリツイート27,169件を抽出して集計すると、一番多かったのは漫画家による自分の活動の紹介だが、その他にも反差別やフェミニズムを揶揄するようなツイートが多くの支持を集めている(改行を「/」に置換している)

                                                                            月刊テキストマイニングレポートVol.32:フェミニズムへの憎悪を扇動する「オタク政治家」――荻野稔研究|後藤和智@テキストマイニングとか
                                                                          • [Latent Diffusion] AIでテキストから画像を生成する

                                                                            初めに、論文発表元のGithubからソースコードを取得します %cd /content !git clone https://github.com/CompVis/latent-diffusion.git 次にライブラリをインストールします。 %cd /content !git clone https://github.com/CompVis/taming-transformers !pip install -e ./taming-transformers !pip install omegaconf>=2.0.0 pytorch-lightning>=1.0.8 torch-fidelity einops import sys sys.path.append(".") sys.path.append('./taming-transformers') from taming.models

                                                                              [Latent Diffusion] AIでテキストから画像を生成する
                                                                            • 3秒間の人声で模倣完了。マイクロソフトのテキスト読み上げAI

                                                                              3秒間の人声で模倣完了。マイクロソフトのテキスト読み上げAI2023.01.18 20:0010,393 Andrew Liszewski - Gizmodo US [原文] ( そうこ ) 真似すんな!「マネスンナ!」 急激に盛り上がりつつあるAI業界。便利で楽しい反面、著作権や本物と偽物の判断が難しくなるなど、問題も多々あります。 偽物を容易に作れるのも問題を助長します。マイクロソフトのAI、人間の声をマネするために必要なのはたった3秒のデータですって…。 高度な模倣を可能にしている技術マイクロソフトのAIツール「VALL-E」は、Metaのエンコード音声コンプレッション技術「ニューラルコーデック言語モデル」をベースに開発されています。 このMetaの技術は、AIを使うことで、音質を損なわずにCD以上の音質データをPM3ファイルより10倍小さいデータレートに圧縮するというもの。Meta

                                                                                3秒間の人声で模倣完了。マイクロソフトのテキスト読み上げAI
                                                                              • 『古今著聞集』の電子テキストを公開しました : やた管ブログ

                                                                                『古今著聞集』の電子テキストを公開しました。いつもどおり、翻刻部分はパブリックドメインで、校訂本文部分はクリエイティブ・コモンズライセンス 表示 - 継承(CC BY-SA 4.0)で公開します。 宮内庁書陵部本『古今著聞集』 トップページに2015年1月10日入力開始となっていますが、漢文があったり宣命書きがあったりで面倒くさくなり、すぐに挫折してほっぽってあったのを再開したのが去年の1月19日です(『古今著聞集』リスタートしました:2020年01月19日参照)。『『今昔物語集』に次ぐ大きな説話集ですから二年はかかると予想していましたが、コロナによる長い休みのおかげで一年ちょいで終わることができました。 今回は誤写と判読に悩まされました。底本の宮内庁書陵部本は日本古典文学大系(岩波書店)の底本でもあるのですが、とても誤写が多く、その上文字の判読が難しいものが多かったのです。判読の難しさに

                                                                                  『古今著聞集』の電子テキストを公開しました : やた管ブログ
                                                                                • ヘッダにあるブランドロゴの代替テキスト、みなさんならどうする?|平尾ゆうてん

                                                                                  はい。ロゴが文字として可読かどうかは関係ないかと思います。結局グラフィックとしてのロゴもテキストとしての名称も、ブランドという抽象概念への別メディアにおけるポインタに過ぎないからです。だからこそこれらは代替可能と言えると思います。 — Kotaro Kokubo (@kotarok) March 24, 2020 つまり、それが例えばTwitterのロゴだったとして、そのシェイプ(鳥のカタチ)を見た人は「Twitterという不特定多数の140字以内のつぶやきを読んだり、つぶやいたりできるSNS」のような概念を認識している。それは「Twitter」というテキストを識字したときや、「ついったー」と音で聞いたときと最終的に同じ概念を認識できるので代替可能というわけだ。 で、ここまでは自分も理解できていたのだけど、問題はここからだ。トップページへのリンクが貼られている場合「トップページへ戻る」とい

                                                                                    ヘッダにあるブランドロゴの代替テキスト、みなさんならどうする?|平尾ゆうてん