タグ

ブックマーク / techable.jp (2)

  • AIがこの世にいない人の顔画像を大量生成する、著作権フリーの画像が10万枚! | Techable(テッカブル)

    創作AIの進化は予想以上に速く、気づけば創作物の多くをAIが担っていた…なんて状況も、信憑性を帯びてきた。クオリティの高い創作物を大量生成するAIの出現で、著作の使用料体系に崩壊が起きる可能性がある。 ヒトの書いたものと見分けがつかないような文章を生成する「GPT-2」の登場も衝撃的だったが、真っ先に市場にインパクトを与えそうなのが画像の領域だ。 Webサイト、generated.photos上に、著作権フリーのオリジナル顔画像10万枚が公開された。あらゆるシーンでハイクオリティの顔画像が利用可画像生成AIは、悪用されることでマイナスの影響もあるが、著作権フリーの画像が出回れば自身の創作の幅が広がり、恩恵を受ける方も多いだろう。同プロジェクトは、まさにこれを狙ったものだ。 GAN(敵対的生成ネットワーク)による画像生成は、ヒトやネコ、アニメキャラから賃貸物件まで、たくさんの対象で試されてい

    AIがこの世にいない人の顔画像を大量生成する、著作権フリーの画像が10万枚! | Techable(テッカブル)
  • テープ起こしの必要がなくなる?音声データを即時にテキスト化できる「Trint」はかなりの正確さ | Techable(テッカブル)

    インタビューや講演、会議などで録音したヒトの言葉を文章にする“テープ起こし”は、音声データを聴きなおし、キーボードで文字を入力するというマニュアルな作業。 多くのジャーナリストは、日常的に、記事執筆に着手する前、取材活動を通じて収集した音声データを聴き、手作業でテキスト化している。 このように旧態依然とした非効率な作業を自然言語処理(NLP)のテクノロジーによって革新しようとしているのが、英ロンドンで開発された「Trint(トリント)」だ。 ・音声からテキストに自動変換 「Trint」は、音声ファイルや動画ファイルをアップロードすると、90%以上の正確性で、音声をテキストに自動変換できるソリューションだ。 テキスト化によって、長時間にわたるインタビューやスピーチも、瞬時にキーワードで検索できるようになる。 また、「Trint」では、自動変換されたテキストが、単語ごとに音声とリンクされる仕組

    テープ起こしの必要がなくなる?音声データを即時にテキスト化できる「Trint」はかなりの正確さ | Techable(テッカブル)
  • 1