並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 2545件

新着順 人気順

speechの検索結果281 - 320 件 / 2545件

  • AppleがiPhoneで15分のトレーニングをするだけで「自分に似た合成音声」で他人と会話できる機能を発表

    Appleが視覚・聴覚・認知・モビリティのアクセシビリティを向上するためのソフトウェア機能をiPhoneやMacに導入すると、2023年5月16日に発表しました。その中でも特に目玉となる機能が、iPhoneやiPadに声を吹き込むだけで、自分の声を再現した音声を合成し、コミュニケーションに応用できるという「Live Speech」です。 Apple previews Live Speech, Personal Voice, and more new accessibility features - Apple https://www.apple.com/newsroom/2023/05/apple-previews-live-speech-personal-voice-and-more-new-accessibility-features/ Live SpeechはiPhone・iPad・

      AppleがiPhoneで15分のトレーニングをするだけで「自分に似た合成音声」で他人と会話できる機能を発表
    • OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る

      米OpenAIは3月29日(現地時間)、人の声を再現できる生成AIモデル「Voice Engine」を発表した。テキスト入力と15秒分の音声サンプルで、元の話者によく似た自然な音声を生成できる。感情的なリアルな音声で、母国語以外の言語も話せる。 2022年から開発していたこのモデルは、既に同社の「Text-to-Speech API」や「ChatGPT」アプリの音声チャット機能、ChatGPTのテキスト読み上げ機能「Read Aloud」などで採用されている。 OpenAIは、こうした合成音声が悪用される可能性を認めており、広範囲にリリースをするかどうかを検討するために、慎重にテストを行っているという。 スウェーデンSpotifyは昨年9月、このモデルを採用した新機能「Voice Translation」を発表した。これはPodcastをホスト自身の声で複数言語に吹き替えるものだ。 Ope

        OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る
      • 人には正しく聞こえるが“AIにはゆがんで聞こえる声”に変えるツール 合成音声に使われないために保護

        音声合成技術の進歩は顕著であるが、人間や機械を欺くために悪用されることもある。これはディープフェイクと呼ばれ、例えば、詐欺師たちがCEOの声を合成して部下に連絡して大金を振り込ませた事件も起きている。影響力のある人物の声を合成して誤情報やヘイトスピーチを生成し、社会に広範な悪影響を及ぼす可能性もある。法整備も追い付いていない。 (関連記事:「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか? NTT社会情報研究所が調査) この脅威に対処するため、研究チームは「AntiFake」と呼ばれる新しい防御ツールを開発。このツールは従来のディープフェイクを後から検出する方法と異なり、被害者の声として合成されること自体を未然に防ぐ。 被害者が音声データを外部(SNSやWebサイトなど)に公開する前に、録音した音声信号に最適化されたノイズ(敵対的摂動)を適用する。これにより、人間の耳には正し

          人には正しく聞こえるが“AIにはゆがんで聞こえる声”に変えるツール 合成音声に使われないために保護
        • なぜウェブサイトに年齢認証を義務づけるべきではないのか | p2ptk[.]org

          Electronic Frontier Foundation 年齢認証システムは監視システムである。年齢認証の義務化、それに伴うID認証の義務化は、若者をオンラインで保護するアプローチとしては間違っている。これを制度化すれば、ウェブサイトは訪問者に政府発行の身分証明書等を提出させ、年齢を証明させることが義務づけられることになる。このスキームは、我々の個人データがデフォルトで収集・販売されるインターネットへの道をさらに舗装することになる。政府発行の身分証明書を持たない数千万人の米国人は、インターネットのかなりの部分にアクセスできなくなるかもしれない。さらに、匿名でのインターネットアクセスは不可能になることにもなりうる。 年齢認証の義務化に反対する理由 年齢認証を義務づける法律は、若者だけに影響を及ぼすのではない。特定の年齢層を排除するために、ウェブサイトの訪問者すべての年齢を確認しなくてはな

            なぜウェブサイトに年齢認証を義務づけるべきではないのか | p2ptk[.]org
          • 画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

            2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第23回目は、AIアニメーションを次の段階に進ませる技術と大きな脚光を浴びた「Animate Anyone」、3D Gaussian Splattingを使った新しい3D応用技術など、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップ画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」 アリババらが開発 話した言葉をリアルタイム翻訳できるシステムMeta「Seamless」 話し方や感情なども忠実に再現 リアルな動きを持つ高品質なアバターを生成するモデル「Animatable Gaussians」 写真から3D

              画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
            • 脳波から「聞いていた音楽」を再構成することに成功、再構成した音楽を聴けるムービーもあり

              カリフォルニア大学バークレー校の研究チームが脳波を分析して「聞いていた音楽」を再構成する技術を開発しました。開発された技術では音階の変化やフレーズの一部を判別可能なほど鮮明に音楽を再構成できます。 Music can be reconstructed from human auditory cortex activity using nonlinear decoding models | PLOS Biology https://doi.org/10.1371/journal.pbio.3002176 Brain recordings capture musicality of speech — with help from Pink Floyd | Berkeley https://news.berkeley.edu/2023/08/15/releases-20230811 研究チームは

                脳波から「聞いていた音楽」を再構成することに成功、再構成した音楽を聴けるムービーもあり
              • 海外層VRCのアプデで激おこな理由|ぽてと旅録

                7月25日に発表されたVRCのベータ版アップデート内容。主にセキュリティーアップデートと謳い、ApexやFortnite等でおなじみの対チート対策システムEasyAntiCheatの導入が発表されました。 公式バグ報告システムCannyのEAC関連の苦情発表直後からTwitterやVRCDiscord並びにバグ報告用システムCannyが大荒れ。トレンド入りしたりEAC導入反対のCannyが一万票を超えたりと騒がしい一日となりました。 一体なぜここまで荒れたのか? それには色んな理由があるのでざっくりまとめてここに置いておきます。 簡易目次:①MODとは、その仕組み ②海外層のプレイ形態 ③炎上の理由1:QOL、プレイ環境のクオリティーの低下 ④炎上の理由2:障がい者コミュニティーへの配慮が足りない ⑤炎上の理由3:悪質なユーザーへの対策にならない ⑥EAC自体の問題点 ⑦あとがき 前置き:

                  海外層VRCのアプデで激おこな理由|ぽてと旅録
                • アメリカのジャーナリストたちと一緒に、Twitterアカウントを凍結された件について、経緯を詳しく書いておく。

                  中途半端な英語使いが英国からのニュースを東京で読み、あちこちふらふらうろうろ。時々嘘。 はてブ = http://b.hatena.ne.jp/nofrills Twitter = http://twitter.com/nofrills Twitterのログ = http://twilog.org/nofrills ◆「なぜ、イスラム教徒は、イスラム過激派のテロを非難しないのか」という問いは、なぜ「差別」なのか。(2014年12月) ◆「陰謀論」と、「陰謀」について。そして人が死傷させられていることへのシニシズムについて。(2014年11月) ◆知らない人に気軽に話しかけることのできる場で、知らない人から話しかけられたときに応答することをやめました。また、知らない人から話しかけられているかもしれない場所をチェックすることもやめました。あなたの主張は、私を巻き込まずに、あなたがやってください

                    アメリカのジャーナリストたちと一緒に、Twitterアカウントを凍結された件について、経緯を詳しく書いておく。
                  • 最新の深層学習技術による古典くずし字認識の現状と今後の展望 - May the Neural Networks be with you

                    こんにちは。@shunk031 です。 普段は最先端の技術が大好きなパソコンのオタクですが、京都へ旅行して古き良き日本の文化に感化されました。 この記事は 法政大応情 Advent Calendar 2020 21 日目の記事です。 From http://codh.rois.ac.jp/ 今回は日本古典籍の分類タスクについて取り組んでみようと考え、近年の日本古典籍における「くずし字認識」に着目して調査をしました *1。 日本古典籍といった古文書に対して、OCR 等の文字認識技術によって文字情報をデジタル化し、それらの情報をもとに解析を行う流れは現代では自然だと考えています。 しかしながら、一般的に OCR は難しく、また古文書を機械に解析させることはさらなる困難があるのは容易に想像できます。 くずし字認識に対して、近年の取り組みでは ROIS-DS 人文学オープンデータ協働センターが K

                      最新の深層学習技術による古典くずし字認識の現状と今後の展望 - May the Neural Networks be with you
                    • 【無料】高精度&爆速で文字起こしが終わるAIツール「Gladia」がスゴイ | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

                      こんにちは、インハウスマーケティング部のかけるです。 生成AIによってライティング業務の効率化が進むなかで、「文字起こし」は生成AIが得意とする領域の一つです。 今回は数ある文字起こしAIのなかでも、実際に使ってみて良かった文字起こしAI「Gladia」について、その使い方や魅力をご紹介します! 「Gladia」は精度が抜群 https://www.gladia.io/ まず前提として、Gladiaの文字起こしの技術には、OpenAIがオープンソースとして公開している文字起こしAI「Whisper」が活用されています。 Gladiaの大きな魅力は、なんといっても音声から文字を起こす(Speech-to-Text)際の精度の高さです。 一般的に、音声認識の精度は「単語誤り率 (WER)」という、その音声認識モデルが音声をテキストへ変換する際にどれぐらい間違えてしまったのかという評価尺度があり

                        【無料】高精度&爆速で文字起こしが終わるAIツール「Gladia」がスゴイ | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
                      • 村上春樹さん「常に卵の側に立つ」ガザ侵攻したイスラエルで伝えた、たった一つのメッセージ【改めて読みたい】

                        村上春樹さん「常に卵の側に立つ」ガザ侵攻したイスラエルで伝えた、たった一つのメッセージ【改めて読みたい】

                          村上春樹さん「常に卵の側に立つ」ガザ侵攻したイスラエルで伝えた、たった一つのメッセージ【改めて読みたい】
                        • GitHub - google-research/tuning_playbook: A playbook for systematically maximizing the performance of deep learning models.

                          This document is for engineers and researchers (both individuals and teams) interested in maximizing the performance of deep learning models. We assume basic knowledge of machine learning and deep learning concepts. Our emphasis is on the process of hyperparameter tuning. We touch on other aspects of deep learning training, such as pipeline implementation and optimization, but our treatment of tho

                            GitHub - google-research/tuning_playbook: A playbook for systematically maximizing the performance of deep learning models.
                          • pdf2audiobook - ぱたへね

                            Twitter で気がついた佐藤さんのpdf読み上げシステムの動画を見ました。 Google I/Oが5/18 - 20にオンライン開催。私はpdf2audiobookデモ紹介とMLOps AMAで参加します! #gcpja https://t.co/tLpBgTB4Xo— Kazunori Sato (@kazunori_279) 2021年4月7日 www.youtube.com PDFをテキストにして読み上げサービスを使用して音声ファイルに変換しています。 このシステムで使用しているGoogleのテクノロジーです。ひとつひとつは聞いたことあります。 Cloud functions Cloud Storage OCR with Vision API AutoML Table Text to Speech ここで上手いなと思ったところがAutoML Tableによるtext(paragr

                              pdf2audiobook - ぱたへね
                            • UI = f(statesⁿ)

                              “UI is a function of state” is a pretty popular saying in the front-end world. In context (pun intended), that’s typically referring to application or component state. I thought I’d pull that thread a little further and explore all the states that can effect the UI layer… First-party application states Every application whether it’s a to-do list or a shopping cart or some radically complex app wil

                              • Linux Audio is Dead | Non

                                CENSORED Due to threats directed at TuxFamily from those behind the attack of this project and its author, the content of this post has been relocated to a platform more supportive of freedom of speech and freedom of information. Please click the link below to read this important message! https://archive.is/3Tggt

                                • 検閲の大部分は「自己検閲」で成り立っている――国家による検閲と個人の自己検閲/仲介者検閲 | p2ptk[.]org

                                  以下の文章は、コリイ・ドクトロウの「The majority of censorship is self-censorship」という記事を翻訳したものである。 Pluralistic 私は多くの博識者を知っているが、エイダ・パーマーは別格だ。優れたSF作家であり、優れた歴史家であり、優れた脚本家であり、優れた歌手であり……。 – https://pluralistic.net/2022/02/10/monopoly-begets-monopoly/#terra-ignota パーマーは友人であり同僚だ。2018年、彼女とエイドリアン・ジョーンズ、そして私は、シカゴ大学歴史学部(エイダは宗教裁判とルネサンス期の禁忌の知識を専門とするテニュア教授)で「印刷機からインターネットまでの検閲、情報統制、情報革命」という大学院セミナーを共同で行った。 – https://ifk.uchicago.e

                                    検閲の大部分は「自己検閲」で成り立っている――国家による検閲と個人の自己検閲/仲介者検閲 | p2ptk[.]org
                                  • Japan’s Shift to the Right: Computational Propaganda, Abe Shinzō’s LDP, and Internet Right-Wingers (Netto Uyo) - The Asia-Pacific Journal: Japan Focus

                                    Abstract: In recent years, academic research and investigative reports have brought to light several cases of computational propaganda (i.e. orchestrated attempts to manipulate public opinion or the outcome of elections via social media), as well as proof that filter algorithms amplify right-wing conservative content on Japanese social media. Piecing together the scattered pieces of a puzzle, this

                                      Japan’s Shift to the Right: Computational Propaganda, Abe Shinzō’s LDP, and Internet Right-Wingers (Netto Uyo) - The Asia-Pacific Journal: Japan Focus
                                    • 「CLOVA Note」は、なぜ高精度な音声認識を実現できるのか。Speechチームが語る開発秘話

                                      LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog 2022年5月24日より、LINE株式会社は「会話を目で見る」ことができる無料のAI音声認識アプリ「CLOVA Note」のβ版の提供を開始しました。「CLOVA Note」は、LINE CLOVAのAI技術である「CLOVA Speech(音声認識)」の音声認識AIを活用して、録音した声をテキストに変換します。アプリをインストールし、スマートフォンやタブレットの録音ボタンを押すだけで、誰でも簡単に利用可能です。 「CLOVA Speech」は、近年注目を集めているSelf-Supervised Learning(自己教師あり学習)を利用した、最先端のEnd-to-End音声認識を採用しています。そして複数名の話者の区別を行う

                                        「CLOVA Note」は、なぜ高精度な音声認識を実現できるのか。Speechチームが語る開発秘話
                                      • ChatGPTのセキュリティへの影響 | Cloud Security Alliance Japan

                                        © Copyright 2023, Cloud Security Alliance.All rights reserved. 1 Acknowledgements Authors: Kurt Seifried Sean Heide Bogdan Filip Vishwa Manral Lars Ruddigkeit Walter Dula Eric E. Cohen Billy Toney Supro Ghose Marina Bregkou Additional Staff: Stephen Lumpe (Cover illustration, with assistance from Midjourney) This is a Release Candidate version and is subject to change. © 2023 Cloud Security Allian

                                        • litagin/moe-speech · Datasets at Hugging Face

                                          Not-For-All-Audiences This repository has been marked as containing sensitive content and may contain potentially harmful and sensitive information. View content

                                            litagin/moe-speech · Datasets at Hugging Face
                                          • CeVIO Pro(仮)改めVoiSonaのβ版無料公開がスタート。VSTiに加えAudio Unitsにも対応し、M1にもネイティブ対応|DTMステーション

                                            6月2日、テクノスピーチが最新のAI技術で人間の歌声をリアルに再現する歌声合成ソフト、VoiSona(ボイソナ)のβ版を無料で公開しました。これは、今年2月に「WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始」という記事で紹介したCeVIO Pro(仮)が名称を変更するとともに、β版へとアップグレードしたもので、ソングエディタとともに、デフォルトボイスライブラリとして女性シンガーである「知声」(読み:ちせい、英語表記:Chis-A)が付属している点も同様です。 CeVIO Pro(仮)でもWindowsとMacに対応するとともにスタンドアロンおよびVSTiプラグインとして動作する形になっていましたが、β版となったVoiSonaではMacのAudio Unitsプラグインにも対応。さらに、MacのM1プロセッサにもネ

                                              CeVIO Pro(仮)改めVoiSonaのβ版無料公開がスタート。VSTiに加えAudio Unitsにも対応し、M1にもネイティブ対応|DTMステーション
                                            • スコットランドのトランスジェンダーを不愉快にしたら地球のどこに居ても犯罪者になる「ヘイトクライム法」が施行される

                                              2024年4月1日に、スコットランドで「ヘイトクライムと公共の秩序法(Hate Crime and Public Order Act)」が施行されました。インターネットの書き込みを含め、スコットランドで読めるものならすべて「ヘイト」となり得るこの法律は、言論の自由への影響が懸念されています。 Scotland's Hate Speech Act and Abuse of Process - Craig Murray https://www.craigmurray.org.uk/archives/2024/03/scotlands-hate-speech-act-and-abuse-of-process/ Scotland’s new hate crime law: what does it cover and why is it controversial? | Scotland | Th

                                                スコットランドのトランスジェンダーを不愉快にしたら地球のどこに居ても犯罪者になる「ヘイトクライム法」が施行される
                                              • Yann LeCun’s Deep Learning Course at CDS is Now Fully Online & Accessible to All

                                                CDS is excited to announce the release of all materials for Yann LeCun’s Deep Learning, DS-GA 1008, co-taught in Spring 2020 with Alfredo Canziani. This unique course material consists of a mix of close captioned lecture videos, detailed written overviews, and executable Jupyter Notebooks with PyTorch implementations. The course covers the latest techniques in both deep learning and representation

                                                  Yann LeCun’s Deep Learning Course at CDS is Now Fully Online & Accessible to All
                                                • https://www.waseda.jp/top/assets/uploads/2022/04/2204_speech_koreeda.pdf

                                                  • 「こんなに感情移入した曲はない…!」鬼龍院翔さん、自身とGACKTさんの格付けチェックをテーマにしたボカロ曲を絶賛

                                                    VoiSona公式 @VoiSonaOfficial AI技術でリアルな歌声を再現する音声創作ソフト「VoiSona」(旧CeVIO Pro)公式です。 音声創作ソフト「CeVIO」姉妹ブランド。 ▼運営会社:株式会社テクノスピーチ(@techno_speech) ※本アカウントは告知・宣伝用の為、個別のご意見ご質問は下記公式サイトCONTACT宛にお寄せ下さいませ。 voisona.com VoiSona公式 @VoiSonaOfficial 【NEWS】 AI歌唱ソフト「VoiSona」新規ボイスライブラリ、「機流音」&「AiSuu」をリリースしました!! 機流音(CV:鬼龍院翔<ゴールデンボンバー>) voisona.com/artist/kirune_… AiSuu(CV:すぅ<SILENT SIREN>) voisona.com/artist/aisuu_j… #VoiSona

                                                      「こんなに感情移入した曲はない…!」鬼龍院翔さん、自身とGACKTさんの格付けチェックをテーマにしたボカロ曲を絶賛
                                                    • 色々な生成AIモデルをColabで動かして今年を振り返る - ABEJA Tech Blog

                                                      こんにちは、ラボで研究開発をしたりプロトタイプを作っている藤本(X(Twitter))です。ABEJAアドベントカレンダー2023の21日目の記事です。ここ近年、生成AIの勢いが凄いです。最近は一夜明けたら世界が変わっているみたいなことがしょっちゅう起きています。そんな状況なので、なかなか世の中についていくのが難しいのではないかと思います。そこで今回は、これまでに色々と出てきた生成モデルを振り返りつつ、ひたすら思いつく限りColabで動かしまくってみる企画をやってみようかと思います。流石に全部Colabで動かすのは大変でした・・・。 まずは言語を対象として日本語モデルを含む様々なモデルを対象に推論実験を行います。続いて高速化の実験、更にSFTによるInstructionチューニングや、RLHFもやってみます。最後に、ソースコード生成もやってみましょう。次に、画像を対象として、言語同様に色々

                                                        色々な生成AIモデルをColabで動かして今年を振り返る - ABEJA Tech Blog
                                                      • 参院選当選の暴露系YouTuber「ガーシー」、SNSをマストドンに立てる

                                                        NHK党から参議院選に出馬し当選した暴露系YouTuber(現在チャンネルは停止中)のガーシーこと東谷義和さんが7月13日、独自のSNSを立ち上げた。 プラットフォームとしては分散型SNSのマストドンを採用。動画サービスのFC2の元社長である高橋理洋さんがバックアップする形で独自SNS「GAAC2 FREE SPEECH」を立ち上げた。

                                                          参院選当選の暴露系YouTuber「ガーシー」、SNSをマストドンに立てる
                                                        • What We Learned from a Year of Building with LLMs (Part I)

                                                          Join the O'Reilly online learning platform. Get a free trial today and find answers on the fly, or master something new and useful. Learn more It’s an exciting time to build with large language models (LLMs). Over the past year, LLMs have become “good enough” for real-world applications. The pace of improvements in LLMs, coupled with a parade of demos on social media, will fuel an estimated $200B

                                                            What We Learned from a Year of Building with LLMs (Part I)
                                                          • オンライン表現の自由のチョークポイント――なぜインフラの検閲はプラットフォームの検閲よりも深刻なのか | p2ptk[.]org

                                                            オンライン表現の自由のチョークポイント――なぜインフラの検閲はプラットフォームの検閲よりも深刻なのか投稿者: heatwave_p2p 投稿日: 2021/1/142021/1/14 Electronic Frontier Foundation 先週、トランプ大統領の支持者が連邦議会議事堂に侵入・破壊行為を行った暴動を受けて、FacebookとTwitterは大統領を追い出す決定を下した。両社がこれまで、トランプ大統領を世界の政治指導者の一人としてコンテンツモデレーションのルールの大半を免除する立場をとってきたことを考えれば、踏み込んだ決断を下したといえる。大統領のフォロワーの多くは、すぐさまParlerに乗り換えた。だが今週、この動きは新たな展開を見せている。Amazon Web Service(AWS)やGoogleのAndroid・AppleのiOSのアプリストアなど、技術的「スタッ

                                                              オンライン表現の自由のチョークポイント――なぜインフラの検閲はプラットフォームの検閲よりも深刻なのか | p2ptk[.]org
                                                            • 口パクで音声入力できるイヤフォン 口を動かした際の耳穴の変形から予測 米国チームが開発

                                                              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米University at Buffalo, State University of New York、米ノースウェスタン大学、米ワシントン大学、米コロラド大学の研究チームが開発した「EarCommand: “Hearing” Your Silent Speech Commands In Ear」は、口パク(無声発話)で音声入力できるイヤフォンだ。口を動かした際の耳穴の変化を取得して入力を区別する。 音声を発することなく口の動きだけでモバイル機器を操作するサイレントスピーチインタラクション(Silent Speech Interaction、SSI)が広く研究されている。音声入力による情

                                                                口パクで音声入力できるイヤフォン 口を動かした際の耳穴の変形から予測 米国チームが開発
                                                              • イーロン・マスクが「Twitter」から「X」に名称を変更した理由を語る、金融取引を含む包括的アプリになるため「Twitter」の名前はそぐわないと主張

                                                                2023年7月24日、長らく「Twitter」の名称で運営されてきたSNSの名称が「X」に変更され、ユーザーの間に戸惑いが広がりました。「X」のアイコンを見慣れた「青い鳥」に戻す拡張機能をリリースするユーザーも現れる中、Twitterを買収したイーロン・マスク氏が「社名を変更した企業」の一覧に「X: Twitter」と付け加えた投稿へのリプライで、「Twitterの名称をXに変更した理由」について説明しています。 Twitter was acquired by X Corp both to ensure freedom of speech and as an accelerant for X, the everything app. This is not simply a company renaming itself, but doing the same thing. The Twi

                                                                  イーロン・マスクが「Twitter」から「X」に名称を変更した理由を語る、金融取引を含む包括的アプリになるため「Twitter」の名前はそぐわないと主張
                                                                • Microsoft社のアーキテクトが説く、LLM実装の最前線 登場から今までを振り返って、予想する未来像

                                                                  登壇者の自己紹介 蒲生弘郷氏:「ChatGPTの10ヶ月と開発トレンドの現在地」というタイトルで、蒲生から発表します。よろしくお願いいたします。 ちょっと私の自己紹介です。Azure OpenAI Champという立場で、外部発信などをやっています。いっぱい自己紹介をしていきたいところですが、本日はあまり時間もないので省略して、次にいきたいと思います。 今回は、けっこう開発者向けの発展的な内容を扱っていきますが、もし基本的な内容から確認していきたいという場合には、「Azure OpenAI 大全」というものを公開していて、リンクを貼っておくので、そちらの資料を併せてご確認いただければと思います。 「ChatGPT」の登場から今までを振り返る では、本日のテーマとして「ChatGPT」の登場から10ヶ月(※登壇当時)ということで、2022年11月から登場したChatGPTに関する技術について

                                                                    Microsoft社のアーキテクトが説く、LLM実装の最前線 登場から今までを振り返って、予想する未来像
                                                                  • State of GUI 2022 - KAS blog

                                                                    Rust: state of GUI, December 2022 There was a recent call for blogs about Rust GUI. So, Are we GUI yet? Contents: Categorised listing of toolkits State of KAS State of GUI Categorised listing of toolkits Lets start by categorising entries from Are we GUI yet, ignoring those which appear abandoned or not very functional. Bindings Wrappers around platform-specific toolkits: Mac OS / iOS - cacao - Ru

                                                                    • 「表現の不自由展・その後」に足りなかった「他者のための自由」に向き合う覚悟 | p2ptk[.]org

                                                                      「表現の不自由展・その後」に足りなかった「他者のための自由」に向き合う覚悟投稿者: heatwave_p2p 投稿日: 2019/8/122019/8/12 8月3日土曜、「表現の不自由展・その後」を見てきた。翌日には展示が中止されてしまったので、現時点では最終日ということになる。この時点で、物議を醸すどころか狂騒とも言える状態に陥っていた。展示中止の方向で話が進んでいると報じられていたこともあり、会場前には長蛇の列ができていた。 この展覧会をめぐっては、少女像や昭和天皇の写真を焼き踏んで火を消す映像の展示の是非、写真投稿禁止の是非、政治的中立性の問題、政治的介入の問題、文化行政のあり方、中止の是非、中止決定に至るプロセスの問題、あるいは批判のための粗探しなど、さまざまな論点から膨大な意見が噴出し、ハレーションを起こしている。 だが、実際に見に行った者として、表現の自由を最重要のテーマとし

                                                                        「表現の不自由展・その後」に足りなかった「他者のための自由」に向き合う覚悟 | p2ptk[.]org
                                                                      • GPT-4oがどれぐらい早くなったのかコールセンターに導入して試してみた話 - APC 技術ブログ

                                                                        gpt-4o はじめに こんにちは、ACS事業部の佐竹です。 今回のMicrosoft Buildで発表されたGPT-4oについて、どの程度レスポンスが良くなったか是非触ってみたく、今回の記事を書くことにしました。 1.1.5.Azure OpenAI Serviceの主なAIの進化 news.microsoft.com 以前、Azure Communication ServiceとAzure OpenAI Serviceを使って、コールセンターを作ってみたのですが、そこにGPT-4oを組み込む形でGPT-4-32kとの速度比較を行いました。 techblog.ap-com.co.jp 上記の記事はハンズオン形式で記載しておりますので、お手隙の際に是非手を動かしていただけますと幸いです。 概要 全体アーキテクチャは以下のようになります。 アーキテクチャ図 全体の流れは以下の通りです。 ユー

                                                                          GPT-4oがどれぐらい早くなったのかコールセンターに導入して試してみた話 - APC 技術ブログ
                                                                        • 面倒な仕事やサイト作成がたった2日でマスター可能!人気のPythonやWordPressでスキルアップできる「Udemy」初夏のビッグセール

                                                                          「新たなスキルを身につけて年収UPを目指したい」「プログラミングで仕事を自動化して楽に稼ぎたい」と日々思っている人は少なくないはず。しかし、いざ学習を始めようとしても忙しい毎日の中から時間を確保するのは難しいものです。ちょうど講座をムービー形式で受講できる学習プラットフォームの「Udemy」が5月27日(木)まで初夏のビッグセールを行っており、丁寧で分かりやすい解説講座が1270円~受講可能とのことで、忙しい毎日を送っていても週末の2日間だけで学習を完了できそうな短期集中型の講座をピックアップしてみました。外出がおっくうになる梅雨の季節や、ステイホームをうまく活用するために、この機会に買いだめしておくのがオススメです。 オンラインコース -世界最大級のオンライン学習プラットフォーム- Udemy https://www.udemy.com/ ・目次 ◆1:WordPressの使い方を習得し

                                                                            面倒な仕事やサイト作成がたった2日でマスター可能!人気のPythonやWordPressでスキルアップできる「Udemy」初夏のビッグセール
                                                                          • Amazon Is Booting Parler Off Of Its Web Hosting Service

                                                                            Amazon notified Parler that it would be cutting off the social network favored by conservatives and extremists from its cloud hosting service Amazon Web Services, according to an email obtained by BuzzFeed News. The suspension, which will go into effect on Sunday just before midnight, means that Parler will be unable to operate and will go offline unless it can find another hosting service. People

                                                                              Amazon Is Booting Parler Off Of Its Web Hosting Service
                                                                            • End-to-End音声認識の計算量を削減した話

                                                                              ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、音声処理黒帯(黒帯はヤフー内のスキル任命制度)の藤田です。今日のブログでは、音声認識技術の研究開発におけるヤフーの最新の取り組みを紹介します。 特に、近年注目されているTransformerという手法に基づく、End-to-End音声認識の計算量を削減した研究を紹介します。この研究は、難関国際会議IEEE ICASSP2020に投稿し、採択されました。また、arXivでプレプリントを公開しています。そして、ESPnetというEnd-to-Endモデルのツールキット上でソースコードも公開しています。興味のある方はぜひ、こちらもご参照ください。 音声認識で用いられるEnd-to-Endモデルとは? 音声認識技術は音声をテキ

                                                                                End-to-End音声認識の計算量を削減した話
                                                                              • 「日本人のフォロワーが沢山だ!」再び大拡散した感動的なスピーチ、論破劇が爽快

                                                                                「日本人のフォロワーが沢山だ!」再び大拡散した感動的なスピーチ、論破劇が爽快ウィリアムソンさんの論破劇が爽快すぎ。ユーモアもあるけど、シンプルかつ1番重要なことをしっかりと伝えていて、何度も聞きたくなるスピーチです。👏 2013年にニュージーランドの議会で行われた「ビッグ・ゲイ・レインボー演説」が再び、日本のSNS上で話題を呼んでいます。 モーリス・ウィリアムソン議員(当時)が、同性婚を認める法案に賛成を訴える演説でした。 5月20日、与党・自民党でLGBTなど性的マイノリティーに対する理解増進に向けた法案の審査が行われました。しかし、様々な理由で法案に反対する議員が多く、議論はまとまりませんでした。中には「道徳的にLGBTは認められない」と発言した出席者もいると報じられています。 こうした政治の動きをうけて、ウィリアムソン元議員の演説が国内で改めて注目されるようになり、趣旨に賛同する人

                                                                                  「日本人のフォロワーが沢山だ!」再び大拡散した感動的なスピーチ、論破劇が爽快
                                                                                • リリースされたGPT-4oを使って動画のサマリー生成をしてみる! - Qiita

                                                                                  概要 GPT-4oが発表されました。 GPT-4oについては以下のツイートによくまとまっています。 使用している映像は以下でまとめられています。 非常に優秀でAI系のプロダクトがまた何個か死んだと思いますが、それはさておき使っていきましょう。 APIではすでに利用可能になっております。 今回は以下のcookbookにある動画要約をgradioに移植します。 https://cookbook.openai.com/examples/gpt4o/introduction_to_gpt4o デモ 以下の Huggingface Space を作りました。APIキーと動画を貼り付けて試用することができます。 1分間の動画で0.1ドル / 60秒くらいかかります。API使用料に注意してください。 現状のGPT-4o APIの制限 動画はそのままアップロードできません これは将来的にもできるとされてい

                                                                                    リリースされたGPT-4oを使って動画のサマリー生成をしてみる! - Qiita