タグ

画像と音声に関するshunkeenのブックマーク (9)

  • GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること

    GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること2023.11.08 17:009,334 Maxwell Zeff・Gizmodo US [原文] ( mayumine ) これは嬉しい進化です。 OpenAIの開発者向けカンファレンス「DevDay」で、サム・アルトマンCEOよりGPT-4 Turboの公開が発表されました(こちらの記事もどうぞ)。 いちばん大きなアップデートは、今回で扱えるトークン数が128Kになって、従来の16倍となる300ページを超える長い文書を1つのプロンプトに入れられるように。をまるごと一冊読み込ませられるようになったということです。長い文章を要約させたり、気になる箇所を教えてもらったりできるようになったことで、活用の幅はさらに大きく広がると思います。 さらにGPT-4 Turboでは、JSONモードが実装され、JS

    GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること
    shunkeen
    shunkeen 2023/11/09
    “Retrieval機能が搭載され、Google Driveといった外部のデータソースから知識を取り込むことができるようになります”/今のAssistants APIのKnowledge Retrievalはファイルをアップロードする必要があるはずだけど。予定の話か?
  • OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka

    以下の記事が面白かったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。 開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

    OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
    shunkeen
    shunkeen 2023/11/07
    Assistants API群(Assistants,Threads,Messages,Runs)の複雑さに面食らっている。Code Interpreter、Retrieval、ファイル、スレッド回りの面倒を見てもらえるから楽になったんだけど、代わりに仕様を勉強しないといけないやつ。
  • ChatGPT can now see, hear, and speak

    We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT what you’re talking about. We are beginning to roll out new voice and image capabilities in ChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or show ChatGPT w

    ChatGPT can now see, hear, and speak
    shunkeen
    shunkeen 2023/09/26
    音声会話ができて、画像を解析できるようになるんか。BingのチャットAIは先行して画像解析できてたけど、ChatGPT PlusとEnterpriseユーザーにも2週間くらいで展開されるのかー。
  • 喪失感埋まる?ただの"電子人形"? 中国で賛否「バーチャル故人」AIとCG駆使、ビデオ通話もOK(西日本新聞) - Yahoo!ニュース

    【北京・坂信博】人工知能AI)やデジタル技術の普及が進む中国で、亡くなった親族らの生前の画像や音声データを基に人そっくりの「バーチャル故人」を制作し、スマートフォンやパソコンを使って対話することが話題を集めている。交流サイト(SNS)では「遺族の喪失感を埋められる」と理解が示される一方で「電子人形に過ぎない」との指摘もあり、賛否が分かれている。 【画像】「AIおばあちゃん」との会話の様子 「生きていた頃、おばあちゃんは父さんと電話でどんな話をしてたの?」。孫の問いかけに画面の中で白髪の女性が「酒を飲むな、節約しろ、ばくちはするなって言ったんだよ」と湖北省なまりで答える。20代のビジュアルデザイナー呉伍六さん=上海市=は3月、動画配信サイトで「AIおばあちゃん」とのやりとりを公開した。 彼女は物の人間のようにまばたきをし、呉さんが職場での昇進や最近の体調を報告すると、うなずいたり、笑

    喪失感埋まる?ただの"電子人形"? 中国で賛否「バーチャル故人」AIとCG駆使、ビデオ通話もOK(西日本新聞) - Yahoo!ニュース
    shunkeen
    shunkeen 2023/05/22
    これから遺言書を書くときは、バーチャル化して良いか否か、明記する必要があるのかな?むしろ終活で積極的にバーチャル化する人とかも居そう。不治の病で子供を残していかなきゃならない親とか。
  • あるAIの歌 10年前に他界した妻の歌声と写真を再現する理由──第一回AIアートグランプリ受賞

    「第一回AIアートグランプリ」受賞作となった「Desperado - - Diff-SVC generated 音源とりちゃん[AI]」 Koya Matsuo <AIを使ったアート作品を競うコンテスト「第一回AIアートグランプリ」で、グランプリ受賞作が生まれた経緯とは......> 2022年の夏、かつてのパソコンブーム、インターネットの大衆化、スマートフォンの普及に匹敵すると思われる動きがありました。ジェネレーティブ(生成系)AIの登場です。 最初はイラスト・写真をAIで生成することが注目され、現在ではChatGPTをはじめとするテキスト生成によるAIとのインタラクティブなやり取りがマイクロソフトやグーグルなどのビッグテックを中心に、新しい産業革命とも言うべき大きなうねりを引き起こしています。 クリエイティブな世界においても生成系AIという新しい道具の登場で、アーティストたちの心は大

    あるAIの歌 10年前に他界した妻の歌声と写真を再現する理由──第一回AIアートグランプリ受賞
    shunkeen
    shunkeen 2023/03/30
    妻との関係性、これまでの歩みを手伝ってくれた人たちとの関係性、技術だけがあるわけではなく、人と人が居たから、その発露としてAIの歌と写真が召喚できたのかもしれない。
  • 第一回AIアートグランプリを受賞したので自分の作品解説とファイナリスト作品への感想。そしてその先(CloseBox) | テクノエッジ TechnoEdge

    第一回AIアートグランプリを受賞したので自分の作品解説とファイナリスト作品への感想。そしてその先(CloseBox) | テクノエッジ TechnoEdge
    shunkeen
    shunkeen 2023/03/14
    感情論に他ならないが、この方なら大丈夫だと思わせてくれる。今までの積み重ねの中で、様々な批判にも晒されただろうけど、それでも向き合い続けてきて、たまたまAIという道具を手にした。AIは脇役で、想いが主役。
  • 「GPT-4」が間もなく登場か--テキストから動画の生成が可能に

    ChatGPT」は、コードをデバックしたり、小論文を書いたり、ジョークを言ったりする高度な機能で、絶大な人気を集めている。そうした能力にもかかわらず、ChatGPTが支援できるのはこれまで、テキストに限られていた。その状況が間もなく変わることになる。 Microsoft Germanyの最高技術責任者(CTO)Andreas Braun氏は現地時間3月9日に「AI in Focus - Digital Kickoff」で、GPT-4が3月13日の週に公開予定で、それによってテキストから動画が生成できるようになる可能性を明らかにした。 同イベントを取材していたドイツの報道機関heise onlineによると、「GPT-4を来週公開する予定だ。GPT-4には、動画などまったく異なる可能性を提供する、マルチモーダルモデルが搭載されている」と、Braun氏は述べたという。 ChatGPTは、Op

    「GPT-4」が間もなく登場か--テキストから動画の生成が可能に
    shunkeen
    shunkeen 2023/03/13
    てっきり読み取れるだけだと思ってたけど、生成できるのか。ほんとに?/できるとすると、コードを書いて説明してくれていたように、図を描いて説明してくれたりするのかな。
  • “ AIで亡き妻の歌声を再現”した作品がAIアートグランプリに | NHK

    人工知能AIを使って制作した動画や漫画などの作品を表彰するコンテストが東京・秋葉原で開かれ、亡くなったの声などをAIで再現して歌を歌わせた東京都のクリエイターの動画がグランプリに選ばれました。 AIをめぐっては、簡単な命令でテキストや画像など生成してくれる「生成系AI」と呼ばれる新しいタイプのものが次々と登場するなど、ビジネスやアートなどさまざまな分野に利用が広がっています。 「AIアートグランプリ」は、CGクリエイターや研究者などの有志で作る実行委員会が初めて開催したもので、東京の秋葉原で開かれた最終審査会では、AIを使って制作した動画やゲーム漫画などの279の応募作品から、1次審査を通過した動画と漫画の5作品の審査が行われました。 その結果、グランプリには、東京都のクリエイター松尾公也さんの動画「Desperado by 音源とりちゃん[AI]」が選ばれました。 この作品は、亡

    “ AIで亡き妻の歌声を再現”した作品がAIアートグランプリに | NHK
    shunkeen
    shunkeen 2023/03/13
    “AIは人間の眠っている才能を呼び覚ますと感じた。人間の創造性を伸ばすパートナーとして共に健全に発展し、すばらしい作品が登場することに期待したい”/偉い人「健全ならええんやで」。
  • AITuber育成完全入門(冴えないAITuberの育て方)|みゆきP

    はじめにAITuberと書いて、アイチューバーと読みます。VTuberとは違って中の人が存在しないことが特徴です。 AITuber開発は高尚な深層学習のモデル開発ではまったくなく、むしろ、ただの推しの育成ゲームです。 なので、GPUPythonもいりません。PCさえあれば今すぐはじめられます! この記事でできること以下のようなAITuberが作れます。可愛いですね(親バカ) 妹系AITuber🌸桜井りりか Twitter: https://twitter.com/Ririka_AIsister YouTube: https://www.youtube.com/@ririkasakurai 早い人で週末に2日で作れると思います! 土日に作ったAITuberをみんなに公開しちゃいましょう!!! AITuber作成手順立ち絵の生成 モデル・VAEの選定 Google ColabでStable

    AITuber育成完全入門(冴えないAITuberの育て方)|みゆきP
    shunkeen
    shunkeen 2023/03/12
    少子高齢化社会の行き着く先をちょっと見た気がする。「老後に備え、あなただけの成年後見AIを育てておきましょう!寝たきりになっても、痴呆になっても、あなたのAIがあなたを守ります!!」
  • 1