並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 20 件 / 20件

新着順 人気順

テキストの検索結果1 - 20 件 / 20件

  • 「AI生成キャラクター」はいまどのレベルまで進んでいるのか?バンダイナムコ研究所が語るAIテキスト生成の光と影【CEDEC 2024】

    頼展韜氏プロフィール 會田翔氏プロフィール バンダイナムコ研究所は、バンダイナムコエンターテインメントと協力して配信AIキャラクタープロジェクトを実施しており、「ゴー・ラウンド・ゲーム(ごらんげ)」という企画を進行している。その裏側で、あるいはゲームテキスト素材生成ツールを作る際において、どのようにAIテキスト生成を利用していたか解説が行われた。 ゲーム開発環境においてもAI生成は当たり前に 近年、LLMは目まぐるしい発展をしており、さまざまな領域を含む問題で構成されるベンチマーク「MMLU」において、人間の専門家を超えるスコアを達成しているという。 しかもこれは商用モデルのみならず、MetaのLlamaをはじめとするオープンモデルも性能差が縮まってきているという。ゆえに、ゲーム開発においても応用が効くわけだ。 ゲーム内のテキスト生成という分野においては、 『ダンジョンズ&ドラゴンズ』のゲ

      「AI生成キャラクター」はいまどのレベルまで進んでいるのか?バンダイナムコ研究所が語るAIテキスト生成の光と影【CEDEC 2024】
    • 帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました(付・プレスリリース)|国立国会図書館―National Diet Library

      2024年8月23日 帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました(付・プレスリリース) 国立国会図書館は、帝国議会会議録検索システムにおいて、戦前・戦中期分(明治23(1890)年11月~昭和20(1945)年8月)の速記録の画像データ(合計約27万ページ)からOCR(光学的文字認識)処理により作成した本文テキストデータを、新たに公開しました。 これにより、既に本文テキストデータを提供している戦後期分(昭和20(1945)年9月~昭和22(1947)年3月)と合わせて、帝国議会の全期間にわたり、速記録に掲載された質疑や議案本文などの全文検索とテキスト表示ができるようになりました。 ぜひご利用ください。 なお、今回公開した戦前・戦中期分の本文テキストデータは、人手による校正を行った戦後期分と異なり、OCR処理による文字の認識間違い(誤字・脱字)や認識不

      • LLMに日本語テキストを学習させる意義

        こちらのスライドは「第261回自然言語処理研究発表会」の発表で用いたものです。 Reference:

          LLMに日本語テキストを学習させる意義
        • PythonでPDFからテキスト/表情報の抽出精度を比較してみた - Taste of Tech Topics

          はじめに こんにちは。ついにジム通いを始めて四六時中筋肉痛を感じながら過ごしているイワツカです。 最近はLLM(大規模言語モデル)とRAG(検索拡張生成)を用いて企業内ドキュメントを活用する取り組みが多く見受けられます。 ドキュメントは基本PDFで保存されているため、PDFからテキストを抽出して、検索対象にすることが必要です。 そこで今回は、PythonでPDFからテキストを抽出するためのライブラリを比較して、どれが良いのか検証しました。 はじめに 概要 実装 PyMuPDF pdfplumber unstructured 比較結果 テキスト抽出 サンプル1のテキスト抽出結果 サンプル2のテキスト抽出結果 表の抽出 サンプル3の表抽出結果 サンプル4の表抽出結果 検証結果 まとめ 概要 今回はPDF読み取りライブラリとして、PyMuPDF、pdfplumber、unstructuredの3

            PythonでPDFからテキスト/表情報の抽出精度を比較してみた - Taste of Tech Topics
          • たった5秒でテキストが図形化された!Napkin AIを使えば資料づくりが爆速で解決できるぞ | ライフハッカー・ジャパン

            Nintendo Switchの純正プロコンを異次元レベルの操作性に!使わない理由がない革新的アダプター

              たった5秒でテキストが図形化された!Napkin AIを使えば資料づくりが爆速で解決できるぞ | ライフハッカー・ジャパン
            • 無償テキストエディター「Mery」、Migemoを用いたローマ字検索に正式対応へ【8月27日追記】/カスタムフォントのフォールバックなどにも対応した最新ベータ版が公開

                無償テキストエディター「Mery」、Migemoを用いたローマ字検索に正式対応へ【8月27日追記】/カスタムフォントのフォールバックなどにも対応した最新ベータ版が公開
              • Word で「打」で始まるテキスト ファイルを開くとコンバーターを要求される

                こんにちは、Office サポート チームの中村です。 今回の記事では、Word でテキスト ファイルを開くとき、一部の内容においてコンバーターが要求される動作について説明します。 1. 現象以下の条件を満たすテキスト ファイルを Windows デスクトップ アプリの Word で開くと、「このファイルは新しいバージョンの Microsoft Word で作成されているため、このファイルを開くにはコンバーターが必要です。」というメッセージが表示されます。 <ファイルの条件> ファイル内容の先頭が Shift-JIS の「打」 (0x91C5) で始まること 2 文字目以降に文字が続くこと (制御コードを含め、何らかのデータがあること) 2. 原因多くのファイル形式では、先頭数バイトでそのファイル形式を表します。このため Word でファイルを開くとき、ファイルのバイナリ データの先頭数バ

                  Word で「打」で始まるテキスト ファイルを開くとコンバーターを要求される
                • スーパーマリオのプレイ映像を学習してテキストからゲーム動画を自動生成するAIモデル「MarioVGG」

                  by Carles Escrig i Royo AI開発スタートアップのVirtuals Protocolが、テキストを入力することで「スーパーマリオブラザーズ」のゲームプレイ映像を生成できるAIモデル「MarioVGG」を開発したと発表しました。MarioVGGは約73万フレームに及ぶ「スーパーマリオブラザーズ」のゲームプレイ動画で学習しています。 MarioVGG https://virtual-protocol.github.io/mario-videogamegen/ New AI model “learns” how to simulate Super Mario Bros. from video footage | Ars Technica https://arstechnica.com/ai/2024/09/new-ai-model-learns-how-to-simulat

                    スーパーマリオのプレイ映像を学習してテキストからゲーム動画を自動生成するAIモデル「MarioVGG」
                  • 国立国会図書館、戦前・戦中期の帝国議会会議録を全文検索可能に/「帝国議会会議録検索システム」で速記録の画像をOCR処理し、テキストデータ化

                      国立国会図書館、戦前・戦中期の帝国議会会議録を全文検索可能に/「帝国議会会議録検索システム」で速記録の画像をOCR処理し、テキストデータ化
                    • オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説(生成AIウィークリー)(テクノエッジ) - Yahoo!ニュース

                        オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説(生成AIウィークリー)(テクノエッジ) - Yahoo!ニュース
                      • テキスト処理が得意な高性能画像生成AI「Ideogram 2.0」登場

                        元Google Brain研究者によって設立されたAI企業「Ideogram AI」は8月21日、最新の画像生成AI「Ideogram 2.0」を発表した。 Ideogram2.0の主要機能 今回発表されたIdeogram 2.0は、2023年8月にリリースされた初期バージョンと比べ大幅に機能が向上している。 特に強化されたのが画像内テキスト生成の精度だ。ロゴ、看板、タイトルなど、画像に文字を自然に組み込む能力が強化されたことで、デザイナーやマーケティング担当者のニーズにより適切に応えられるようになった。 また、生成する画像のトーンを「General(一般)」「Realistic(リアリスティック)」「Design(デザイン)」「3D」「Anime(アニメ)」など、5つの異なるスタイルから選択できる「スタイルオプション」機能が導入されている。これにより、ユーザーは自分のビジョンにより近い画

                          テキスト処理が得意な高性能画像生成AI「Ideogram 2.0」登場
                        • テキストをビジュアル変換するNapkin AIが日本語に対応 | gihyo.jp

                          2024年9月4日、テキストコンテンツをビジュアルに変換するサービスNapkin AIが、英語のほか日本語、タイ語、ベトナム語、ドイツ語、フランス語、ポルトガル語、スペイン語などを新たにサポートすることが発表された。 🕒 The wait is over! We’re excited to announce that support for Japanese, Thai, Vietnamese, German, French, Portuguese, Spanish, and more languages is now live on @napkin_ai 🎉 It’s now easier than ever to create stunning visuals in your language. Go to https://t.co/GcU0kDlHrR… pic.twitter.

                            テキストをビジュアル変換するNapkin AIが日本語に対応 | gihyo.jp
                          • オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                            2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 OpenAIが新たに強力な推論モデル「OpenAI o1」と、高速で安価な推論モデル「 OpenAI o1-mini」を発表しました。o1は従来モデルより時間をかけて考えることで、複雑なタスクの正答率が大幅に向上します。 国際数学オリンピック予備試験での正答率はGPT-4oの13%から83%に上昇し、安全性テストでも3倍以上の高いスコアを記録しました。o1は ChatGPT PlusとTeamユーザーに提供され、APIでもプレビュー版の利用が可能となります。 Adobeが動画生成AI「Adobe Firefly Video」を発表しました。テキストや画像から動画を生成するだけでなく、角度、モーション、ズームなどの豊富なカメラコントロールを活用して、

                              オープンワールドゲームを生成するAI「GameGen-O」、テキスト化を省き瞬時に応えるオープン音声AIモデル「LLaMA-Omni」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                            • ブラウザはどのようにしてテキストを描画しているのか?――Chromiumにみるテキスト描画の深淵

                              ブラウザはどのようにして テキストを描画しているのか? ―― Chromiumにみるテキスト描画の深淵

                                ブラウザはどのようにしてテキストを描画しているのか?――Chromiumにみるテキスト描画の深淵
                              • Windows版「Word」にアクセシビリティの複数の問題をまとめて修正する機能が追加/画像の代替テキストもまとめて自動生成可能に

                                  Windows版「Word」にアクセシビリティの複数の問題をまとめて修正する機能が追加/画像の代替テキストもまとめて自動生成可能に
                                • テキストからUIデザインを自動生成。AIツール「Motiff」、Figma90%の機能実現も定価はわずか2割 | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア

                                  中国のテック系スタートアップ企業「猿輔導(Yuanfudao)」が6月5日、シンガポールで開催されたアジア最大のAIイベント「SuperAI」で、開発に2年近くを費やしたAIデザインツール「Motiff」を発表した。もともとオンライン教育で名を馳せた同社だが、これを機にAIデザイン分野への本格的な参入を果たす。 2012年に設立された猿輔導は幼稚園児から高校生を対象にしたオンライン教育を展開し、同分野で初のユニコーン企業となった。創業から10回以上の資金調達で総額53億ドル(約7800億円)を集め、20年の評価額は170億ドル(約2兆5000億円)に達したが、21年に「中国版ゆとり教育」とも呼ばれる「双減」政策が導入されたことで、学外教育業界に大規模な再編の波が訪れた。猿輔導は政府の指針に基づき、主力事業のオンライン授業を非営利組織化して親会社から完全に切り離し、コーヒーショップ「Grid

                                    テキストからUIデザインを自動生成。AIツール「Motiff」、Figma90%の機能実現も定価はわずか2割 | 36Kr Japan | 最大級の中国テック・スタートアップ専門メディア
                                  • ブラウザはどのようにしてテキストを描画しているのか?――Chromiumにみるテキスト描画の深淵

                                    ブラウザはどのようにして テキストを描画しているのか? ―― Chromiumにみるテキスト描画の深淵

                                      ブラウザはどのようにしてテキストを描画しているのか?――Chromiumにみるテキスト描画の深淵
                                    • 資格ソムリエが語る、最短距離で合格するための学び方 最初に使う教材は「テキスト」よりも「試験問題」

                                      株式会社主体的なキャリア形成が主催した本イベントでは、『資格が教えてくれたこと 400の資格をもつ社労士がみつけた学び方・活かし方・選び方』著者の林雄次氏がゲストに登壇。「資格の活かし方」の観点から、「主体的なキャリア形成」のポイントを解き明かしていきます。本記事では、難関資格を取得した人ほど注意すべきことや、資格を仕事に活かすためのブランディングの重要性についてお話しします。 前回の記事はこちら 最初に使う教材は、テキストではない 林雄次氏(以下、林):あと最初に使う教材は、テキストじゃなくて、本試験の問題を最初に見ます。学校の勉強は最初教科書から始まるので、みなさんその勉強の癖がついちゃってるんですけれども。 学校の勉強は最初にテストをやるわけにはいかないですから、それでいいんです。でも資格の勉強は、いきなりテストを受けてもいいんです。いきなりテストを受けて合格するんだったら逆に勉強す

                                        資格ソムリエが語る、最短距離で合格するための学び方 最初に使う教材は「テキスト」よりも「試験問題」
                                      • 任意の範囲を指定してその場で矢印やテキスト等の挿入も可能できるオープンソースのスクリーンショットアプリ・「Flameshot」 - かちびと.net

                                        Flameshotは任意の範囲を指定してその場で矢印やテキスト等の挿入も可能できるオープンソースのスクリーンショットアプリです。Windows、MacOS、Linuxなど各OSに対応しています。 いわゆるスクショアプリですが、起動するとPrintScreenがトリガー(設定可能)になり、上記のように任意の範囲をしていしてそのままSSを撮る事が出来る、というものになっています。 また、矢印や矩形、テキストの挿入、任意の場所のボカシ、数字+矢印の挿入(手順を伝えるのに便利)、その場でクリップボードにコピー、ダウンロード、imgurへのアップロード等もその場で出来るようになっています。テキストや矢印等の色の選択は右クリックにて行います。 ブログや仕事で割と頻繁にSSを撮るのでこのアプリを導入して凄く捗る様になりました。割と昔からあるみたいですが最近知りました。とても良いです。他にもスクショアプリ

                                          任意の範囲を指定してその場で矢印やテキスト等の挿入も可能できるオープンソースのスクリーンショットアプリ・「Flameshot」 - かちびと.net
                                        • 無料の AI 画像ジェネレーター、Microsoft Designer のテキストから画像へのアプリ | Microsoft Create

                                          Microsoft の AI 画像ジェネレーターで夢を膨らませることができる画像を作成する アイデアを説明し、それがテキストから画像に変化するのを見てください。次のプレゼンテーションやポスター用に AI で生成されたアートを作成したい場合でも、完璧な写真を生成 したい場合でも、Microsoft Designer の Image Creator はあらゆるスタイルや形式を簡単に処理できます。

                                            無料の AI 画像ジェネレーター、Microsoft Designer のテキストから画像へのアプリ | Microsoft Create
                                          1