並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 26177件

新着順 人気順

speechの検索結果241 - 280 件 / 26177件

  • AmazonやAppleの音声認識アルゴリズムに「黒人の声を上手く聞き取ることができない」問題があると研究者が指摘

    音声認識アルゴリズムはスマートスピーカーやスマートフォンなど、さまざまなデバイスやアプリケーションに採用されており、もはや日常の一部となっています。ところが、AppleやAmazon、Google、IBM、Microsoftなどの音声認識アルゴリズムを使った実験で、「音声認識アルゴリズム白人の声と比較して黒人の声を上手く認識できない」問題があることが判明しました。 Racial disparities in automated speech recognition | PNAS https://www.pnas.org/content/117/14/7684 There Is a Racial Divide in Speech-Recognition Systems, Researchers Say - The New York Times https://www.nytimes.com/

      AmazonやAppleの音声認識アルゴリズムに「黒人の声を上手く聞き取ることができない」問題があると研究者が指摘
    • 【雑記】雪が……。 - 昭和PRIDE

      皆さんこんにちは☀️ いつもあんぽんたんのブログをお読みいただきありがとうございます🙇‍♂️ 「※当ブログはアフィリエイト広告を利用し商品を紹介しています。」 久々の更新になってしまいました😅 ちょっと熱量がなくなってしまいまして…笑 それより、今年の冬は雪がハンパじゃないです( ;  ; ) 自分の車がわからなくなるほどです。 皆様もニュースでご存知のこととは思いますが… JR北海道では3日間で2113本が雪害による運休。 今は少しずつ運行しています。 とにかくもう、めちゃくちゃです😅 私の住む地域でも除雪が追いつかず、ゴミの収集も後回しになっています。 復旧や除雪に携わる方々、本当にご苦労様です! 最近はロクなことがなくて、ちょっと腹が立ってます笑 理由は私の勤務する会社内のことですw 全て落ち着き、面白いネタに出来ればブログで書いてみようと思います👍 今回はただの日記、雑記で

        【雑記】雪が……。 - 昭和PRIDE
      • メンタルヘルス×機械学習まとめ

        近年、精神疾患の患者数は増加し続けています。厚生労働省が3年毎に行っている患者調査を見ても、以下の図からも見られる通り精神疾患の患者数は平成11年の204万人から平成26年の392万人と、15年間でおよそ2倍に増えています。 https://www.mhlw.go.jp/file/05-Shingikai-12201000-Shakaiengokyokushougaihokenfukushibu-Kikakuka/0000108755_12.pdfより引用また、最近ではコロナの影響もあり、自粛などによる生活の変化への不安が人々の精神状態の悪化に拍車をかけています。 一方で、近年のテクノロジーの進展は目覚ましいものがあり、認知行動療法のデジタル化などが近年国内でも取り組まれており、精神疾患の治療にIT技術を役立てようという動きも出てきています。 これらの流れを踏まえた上で、本記事では機械学習

          メンタルヘルス×機械学習まとめ
        • 「シノギ」を英語で言うと何? 主人公の春日一番の名前はローカライズすると“ナンバーワン”? 『龍が如く』欧米版ローカライズプロデューサーに日本文化、極道世界をどう翻訳したのかを聞いてみた

          「シノギ」を英語で言うと何? 主人公の春日一番の名前はローカライズすると“ナンバーワン”? 『龍が如く』欧米版ローカライズプロデューサーに日本文化、極道世界をどう翻訳したのかを聞いてみた 東京の架空の街「神室町」を舞台に、熱い人間ドラマが描かれる『龍が如く』シリーズ。シリーズの累計出荷本数は全世界で1400万本を超え、日本のみならず海外でも人気を博している。海外ではアジア地域、北米、スペインで人気が高く、RPGにジャンルが刷新されたシリーズ最新作『龍が如く7 光と闇の行方』も『Yakuza: Like a Dragon』というタイトルで発売。レビュー集積サイトMetacriticでは84と高スコアを記録しており、英語圏でも人気の高さが見て取れる。 ただ、ご存知のとおり、『龍が如く』は極道世界に生きる人々の生き様が描かれているタイトル。日本独特のカルチャーをどのようにローカライズしたのか?

            「シノギ」を英語で言うと何? 主人公の春日一番の名前はローカライズすると“ナンバーワン”? 『龍が如く』欧米版ローカライズプロデューサーに日本文化、極道世界をどう翻訳したのかを聞いてみた
          • 早期英語教育とは? メリット・デメリットを徹底検証 効率的な英語学習法のヒントは?? - ポリグロットライフ | 言語まなび∞ラボ

            はじめに 今回は早期英語教育とは?というテーマで小学校英語教育について改めて考えてみました。ここ数年早期英語教育熱が高まっているので、そのメリット・デメリットや問題点などの現状を徹底的に考えていきたいと思います。理論面では、早期英語教育をめぐる2大論点を外観しながら、小学校英語教育法を解説していきます。最後に、子供への効率的な英語学習方法を考えていきます。 ↓↓英語学習動画も随時追加するので、登録よろしくお願いします。 www.youtube.com 日本の小学校英語教育 小学校英語教育とは? 小学校英語教育導入の背景 日本の英語教育の歴史 文明開花と実学英語 英語教育改革と英語排斥運動 大衆英語 コミュニケーション英語と外国語必修化 早期英語教育をめぐる2大論点 言語の臨界期 2言語共有説 小学校英語必修化 必修科の背景と歴史 新学習指導要領の変更点 小学校英語教育法 英語教授法 CLT

              早期英語教育とは? メリット・デメリットを徹底検証 効率的な英語学習法のヒントは?? - ポリグロットライフ | 言語まなび∞ラボ
            • 権力者の“特別扱い”を止めよ:ソーシャルメディアによるトランプ大統領アカウントの遮断・凍結についてのEFFの考え方 | p2ptk[.]org

              権力者の“特別扱い”を止めよ:ソーシャルメディアによるトランプ大統領アカウントの遮断・凍結についてのEFFの考え方投稿者: heatwave_p2p 投稿日: 2021/1/102021/1/10 Electronic Frontier Foundation EFFは、米国及び世界中の多くの人々と同様に、水曜の米国議会議事堂の襲撃にショックを受け、嫌悪感を抱いている。我々は、憲法と法の支配を守るべく尽力するすべての人々を支持し、数時間におよぶロックダウンに耐え、憲法上の義務を果たすために再結集した政治家、職員らに感謝の意を表したい。 Twitter、Facebook、Instagram、Snapchatなどが、自社プラットフォームにおけるトランプ大統領のコミュニケーションを一時凍結・遮断した決定は、修正第一条及び(通信品位法)第230条における自社サイトをキュレーションする権利を行使したに

                権力者の“特別扱い”を止めよ:ソーシャルメディアによるトランプ大統領アカウントの遮断・凍結についてのEFFの考え方 | p2ptk[.]org
              • Elasticsearch の reindex をするために試行錯誤して分かったこと - Uzabase for Engineers

                こんにちは。NewsPicksでエンジニアやっております崔(チェ)です。現在は Data / Algorithm チームで検索エンジン開発を担当しております。弊社は、検索エンジンとして Elasticsearch を Amazon EC2 に乗せて構築しておりますが、メンテナンスに消極的だった部分があり、これからはマネージド化や検索精度向上など積極的に取り組んでいきたいと考えております(伸びしろしかない!)。今回は、その中でも色んなタスクのボトルネックだったアルゴリズムを変更した話をしたいと思います。ただ、アルゴリズムの詳細よりもそれの変更のために行ったインフラ的な内容にフォーカスしております。ご興味ある方は是非読んでいただけると嬉しいです。 はじめに ちょっとまって、reindex とは? 本題に戻り reindex の実験 実験環境づくり そもそも Elasticsearch のシステ

                  Elasticsearch の reindex をするために試行錯誤して分かったこと - Uzabase for Engineers
                • グーグルが選ぶ、2023年のお気に入り「Chrome」拡張機能--AI関連が多数

                  自分に合ったブラウザー拡張機能を見つけるのはなかなか難しい。興味のあるものを検索して見つけるだけでなく、実際に追加して使い勝手をひとつずつ試してみる必要があるからだ。 Googleが先頃発表した、2023年のお気に入り「Chrome」拡張機能をチェックすれば、そうした手間が少し省けるかもしれない。 Googleはまず、「Get tasks done faster」(タスクを迅速に終える)というカテゴリーで同社お気に入りの5つの拡張機能を挙げている。これらはいずれも人工知能(AI)を活用したものだ。 「Scribe」はAIを用いてユーザーのワークフローを文書化することで、職場でのさまざまなプロセスの訓練を実施するためのガイド作成を支援してくれる。「DeepL翻訳」はウェブページの内容を即座にさまざまな言語に翻訳する拡張機能だ。「QuillBot」は、文章作成時(電子メールの作成や返信)におけ

                    グーグルが選ぶ、2023年のお気に入り「Chrome」拡張機能--AI関連が多数
                  • ケンモFMの配信バックエンド :: ラジオ番組の制作からライブ配信、Podcast化までを全自動化 - Qiita

                    ケンモFMとは 5ちゃんねる嫌儲板で、コロナ感染者を適当に予測したスレが立ち、明確なソースが貼られないまま「ソースはラジオで聴いた」などの一文が添えられていました。それを揶揄し、「ケンモFMかよ」のようなレスが付いたのが元ネタです。 せっかくなので、fmドメインを取得した上で、スレタイ(スレッドのタイトルのことです)を自動で読み上げるサイトを作ったのが https://kenmo.fm です。YouTubeにも同時配信しており、 https://www.youtube.com/channel/UCHBucrED96_pdOCvIs6jNSQ/live で聴けます。 とりあえずサイトにて自動で生成される音声を聴いてみてください。 システム構成 現状はこのようになっています。 ほぼTypeScriptで書かれており、所々にBashも使用しています。 順に解説します。 1 スクレイピング この項

                      ケンモFMの配信バックエンド :: ラジオ番組の制作からライブ配信、Podcast化までを全自動化 - Qiita
                    • VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート

                      VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート コードエディタのVisual Studio Code(以下、VSCode)は2024年2月のアップデートで、音声入力やCopilotによる変数名の提案などの新機能が追加されました。 More developer goodness in the February update of @code Use your voice to write code (in your language!) Code faster with multi-cursor suggestions Renaming gets easier (because it's AI powered) Release notes: https://t.co/zwokiQvbPU Download: http

                        VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート
                      • スクウェア・エニックスによる、リアルな「架空言語」音声の作り方。Text-to-speechの機械学習モデルで生成した没入感の高いボイスコンテンツ【CEDEC+KYUSHU 2022】

                        3年振りのリアル開催となった福岡で例年行われるゲーム開発者向けのカンファレンス「CEDEC+KYUSHU 2022」が、2022年11月12日(土)に開催されました。スクウェア・エニックス AI部のAIリサーチャー 森 友亮氏が登壇し、『意味が分からないからこそ、リアル ~「架空言語」音声合成による、没入感の高いボイス付きコンテンツの実現~』と題した講演が行われました。見慣れた母国語のテキストから聞いたことのない架空言語の音声を生成する手法について語られた本講演をレポートします。 TEXT / じく EDIT / 酒井 理恵

                          スクウェア・エニックスによる、リアルな「架空言語」音声の作り方。Text-to-speechの機械学習モデルで生成した没入感の高いボイスコンテンツ【CEDEC+KYUSHU 2022】
                        • 東京都水道局、コールセンターに「IBM Watson」導入 問い合わせ内容をテキスト化、回答の候補を提案

                          東京都水道局、コールセンターに「IBM Watson」導入 問い合わせ内容をテキスト化、回答の候補を提案 日本アイ・ビー・エム(IBM)は2月18日、東京都水道局に「IBM Watson」の音声認識機能と情報検索機能を提供したと発表した。同局は19日から、コールセンターの電話対応業務に両機能を採り入れ、オペレーターの負担軽減とサービス向上に取り組んでいるという。 東京都水道局が導入した機能は、ディープラーニングによって音声の特徴を認識し、発話内容をテキストに書き起こす「IBM Watson Speech to Text」と、問い合わせ内容から情報を抽出し、関連する文書を呼び出す「IBM Watson Discovery」。いずれもクラウドサービス「IBM Cloud」経由で利用する。 同局では今後、消費者から電話で問い合わせがあった際は、IBM Watsonが内容をリアルタイムで書き起こし

                            東京都水道局、コールセンターに「IBM Watson」導入 問い合わせ内容をテキスト化、回答の候補を提案
                          • DEEP LEARNING · Deep Learning

                            Description This course concerns the latest techniques in deep learning and representation learning, focusing on supervised and unsupervised deep learning, embedding methods, metric learning, convolutional and recurrent nets, with applications to computer vision, natural language understanding, and speech recognition. The prerequisites include: DS-GA 1001 Intro to Data Science or a graduate-level

                            • GitHub - isletennos/MMVC_Trainer: AIを使ったリアルタイムボイスチェンジャー(Trainer)

                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                GitHub - isletennos/MMVC_Trainer: AIを使ったリアルタイムボイスチェンジャー(Trainer)
                              • Metaが日本語音声を入力するだけで文字起こしなどが可能なAI「SeamlessM4T」の改良版「SeamlessM4T v2」をリリース

                                Metaが2023年8月に公開したAI「SeamlessM4T」は、音声を入力するだけで文字起こしや別言語への翻訳、別言語への吹き替えが可能です。さらにMetaは2023年11月30日に、SeamlessM4Tの改良版となる「SeamlessM4T v2」を発表しました。この「SeamlessM4T V2」では、SeamlessM4Tのパフォーマンスを向上させているだけでなく、感情やスタイルを維持しながら、別の言語へ吹き替えを行うことも可能です。 Introducing a suite of AI language translation models that preserve expression and improve streaming https://ai.meta.com/blog/seamless-communication/ Seamless Communication T

                                  Metaが日本語音声を入力するだけで文字起こしなどが可能なAI「SeamlessM4T」の改良版「SeamlessM4T v2」をリリース
                                • スマホが高性能ICレコーダーに!使ってわかったLINEの無料AI音声認識アプリ「CLOVA Noteβ」の実力|@DIME アットダイム

                                  ビジネスパーソンに必須といえる〝会議〟。 会議には議事録がつきものですが、できることなら機械に任せたいもの。しかし、音声認識をして文字起こしするソフトやサービスは昔からありましたが、高額かつ低認識率のものも多かったです。 そんな中、奇跡のスマホアプリが出現しました。まだベータ版(試用版)ですがいずれ正式版がリリースされるはずです。 それでは、LINEの無料AI音声認識アプリ「CLOVA Noteβ」についてご紹介します。 楽するだけではない! 議事録を書かなくて済むメリットとは? 「CLOVA Noteβ」は、録音しながらまずは話の概要をざっくり聞き、録音・文字認識が完了した二周目に「CLOVA Noteβ」で音声を「耳」で聞きます。そして自動文字起こしされた「文字情報」を目で確認できるのです。つまり、会議の内容を熟考できて知識が深まるのが最大のメリットです。 「CLOVA Noteβ」を

                                    スマホが高性能ICレコーダーに!使ってわかったLINEの無料AI音声認識アプリ「CLOVA Noteβ」の実力|@DIME アットダイム
                                  • VSCodeへ「Hey Code!」と呼びかけ、Copilot Chatが起動する新機能。2024年1月のアップデート

                                    VSCodeへ「Hey Code!」と呼びかけ、Copilot Chatが起動する新機能。2024年1月のアップデート コードエディタのVisual Studio Code(以下、VSCode)は2024年1月のアップデートで、「Hey Code!」と音声で呼びかけると、Copilot Chatが起動する新機能が追加されたことが明らかになりました。 The January release of @code is here! Check out what's new: Per-window zoom levels "Hey Code" voice command Triggered breakpoints ... & much more! Release notes: https://t.co/ourbLiwakw Download: https://t.co/1CSkQpMbwd pic.

                                      VSCodeへ「Hey Code!」と呼びかけ、Copilot Chatが起動する新機能。2024年1月のアップデート
                                    • OpenAIが自動応答するコールセンターを作ってみよう📲

                                      概要 今回はAzure Communication ServiceとAzure OpenAI Serviceを使って、コールセンターを作ってみたいと思います。 全体アーキテクチャは以下のようになります。 全体の流れは以下の通りです。 ユーザーが Azure Communication Service に登録された電話番号に架電する。 Azure Communication Servicce の Incoming Call をトリガーとしてサーバーサイドアプリケーションの API に Webhook を実行する。 Webhook 要求にサーバーサイドアプリケーションが応答する。 ユーザー発話内容に基づいて Azure Cognitive Service が Speech-to-Text、Azure OpenAI Service からの応答内容に基づいて Text-to-Speech を実行す

                                        OpenAIが自動応答するコールセンターを作ってみよう📲
                                      • Google Cloud Next '22で発表された全 123 項目 | Google Cloud 公式ブログ

                                        ※この投稿は米国時間 2022 年 10 月 15 日に、Google Cloud blog に投稿されたものの抄訳です。 今週、世界中の都市で Google Cloud Next '22を開催し、皆様に重要なニュースやお知らせをご紹介できたことを嬉しく思います。ニューヨーク市の開会基調講演から 24 時間のライブ配信が始まり、その後西海岸に移動し、カリフォルニア州サニーベールの Google Cloud 本社から「Top 10 Cloud Predictions」のデベロッパー基調講演が行われました。Next '22はその後太平洋を渡り、東京(日本)、バンガロール(インド)へと移り、ミュンヘン(ドイツ)で終了しました。グローバルなイベント、Innovators Hive にご参加いただいた何千人ものデベロッパーの皆様に感謝いたします。ぜひ、すべてのブレイクアウト セッションをご確認くださ

                                          Google Cloud Next '22で発表された全 123 項目 | Google Cloud 公式ブログ
                                        • 中国政府の「拘束中の作家に言論の自由賞を与えるな」という脅迫をスウェーデン首相が一蹴

                                          By TheDigitalArtist スウェーデンの文化団体が中国で拘束中の作家・桂民海(グイ・ミンハイ)氏に対して言論の自由を称える賞を授与しました。授与に対して在スウェーデン中国大使館は「重大な過ち」だと抗議しましたが、スウェーデン首相は「この種の脅迫に屈するつもりはない」と回答しました。 PEN International — Sweden: Tucholsky Award fitting tribute to… https://pen-international.org/news/sweden-tucholsky-award-fitting-tribute-to-gui-minhai Swedish PM hits back at China over literature prize threat - The Local https://www.thelocal.se/2019

                                            中国政府の「拘束中の作家に言論の自由賞を与えるな」という脅迫をスウェーデン首相が一蹴
                                          • The 100 Best, Worst, and Strangest Sherlock Holmes Portrayals of All-Time, Ranked

                                            The 100 Best, Worst, and Strangest Sherlock Holmes Portrayals of All-Time, Ranked Once you eliminate the least compelling Sherlock Holmes performances, whatever remains, no matter how improbable, must be the best. We’re ranking Sherlock Holmes performances. One hundred of them. Not Sherlock Holmes adaptations, but the representations within them of Sherlock Holmes himself. Now, you might think tha

                                              The 100 Best, Worst, and Strangest Sherlock Holmes Portrayals of All-Time, Ranked
                                            • イーロン・マスクいわくTwitterで「シス」「シスジェンダー」という単語は誹謗中傷とみなされる、ハリポタ作者も同調

                                              イーロン・マスク氏が2023年6月21日に「このプラットフォーム(Twitter)では『シス』および『シスジェンダー』という単語は誹謗(ひぼう)中傷とみなされる」とツイートしました。ハリー・ポッターの作者であるJ・K・ローリング氏もマスク氏に同調する意見をツイートしています。 Repeated, targeted harassment against any account will cause the harassing accounts to receive, at minimum, temporary suspensions. The words “cis” or “cisgender” are considered slurs on this platform.— Elon Musk (@elonmusk) シスジェンダーとは生物学的性と性自認が一致する人を指す比較的新しい言葉で、

                                                イーロン・マスクいわくTwitterで「シス」「シスジェンダー」という単語は誹謗中傷とみなされる、ハリポタ作者も同調
                                              • Markdown の Table 記法を CSS で実現する | blog.jxck.io

                                                Intro 本ブログは Markdown で原稿を書き、それを HTML に変換して表示している。このとき、 CSS を用いて Markdown のシンタックスに似せた Style を適用している。例えば以下のように h2::before に content: '##' を指定するといった具合だ。 しかし、これまで <table> だけはうまく Markdown 記法を再現する CSS が書けないでいた。 そこで、周りの CSS 強者に実現できないか聞いてみたところ、@shqld, @araya, @yoshiko 達の協力を得て、かなりの完成度にすることができた。実現方法を記録する。 Before 実現したいのは以下のような記法だ。 | file type | size | ratio | |:----------|-----:|------:| | .webp | 9474 | 100

                                                  Markdown の Table 記法を CSS で実現する | blog.jxck.io
                                                • 緒方貞子さんが亡くなった。|よしログ

                                                  緒方貞子さんが亡くなった。 国連で最初の仕事を始めた時、冷戦構造が崩壊し、あちこちで内戦が勃発していた。そんな時に新米の挨拶に数分の時間をさいてくれた。 プロが必要だ、キャッチフレーズは役に立たないとよく仰っていた。 やがて彼女の講演会のパネルや対談や調査に呼ばれるようになったが、 — yoshilog (@yoshilog) October 29, 2019 The English version is at the bottom.* * * 緒方貞子さんが亡くなった。 国連で最初の仕事を始めた時、冷戦構造が崩壊し、あちこちで内戦が勃発していた。そんな時に新米の挨拶に数分の時間をさいてくれた。 プロが必要だ、キャッチフレーズは役に立たないとよく仰っていた。 やがて彼女の講演会のパネルや対談や調査に呼ばれるようになったが、いつまでも経っても公の会議でもヨシと呼ぶので外務省の人達は怪訝な顔を

                                                    緒方貞子さんが亡くなった。|よしログ
                                                  • TechCrunch | Startup and Technology News

                                                    Welcome to Week in Review: TechCrunch’s newsletter recapping the week’s biggest news. This week Apple unveiled new iPad models at its Let Loose event, including a new 13-inch display for…

                                                      TechCrunch | Startup and Technology News
                                                    • Introducing Whisper

                                                      Whisper is an automatic speech recognition (ASR) system trained on 680,000 hours of multilingual and multitask supervised data collected from the web. We show that the use of such a large and diverse dataset leads to improved robustness to accents, background noise and technical language. Moreover, it enables transcription in multiple languages, as well as translation from those languages into Eng

                                                        Introducing Whisper
                                                      • 右翼過激派がイーロン・マスクを利用してTwitterから反ファシズム運動家と左翼系ジャーナリストを追放する運動を行っている

                                                        by Eden, Janine and Jim 約440億ドル(約6兆円)でTwitterを買収したイーロン・マスク氏は自らTwitterのCEOに就任し、実際にユーザーからの直接要請を受けてアカウント凍結や強制非表示(シャドウバン)を解除したり、野放しになっている規約違反のアカウントを停止したりといった処分を行っています。そんな中、極右思想を持つことで知られる作家のアンディ・ンゴ氏が、自らが批判する反ファシスト一派のANTIFA関連のアカウントを利用規約違反だとしてマスクCEOに報告し、アカウント停止に追い込んでいると報じられています。 Twitter Thrills Far-Right Trolls by Silencing Left-Wing Voices https://theintercept.com/2022/11/29/elon-musk-twitter-andy-ngo-a

                                                          右翼過激派がイーロン・マスクを利用してTwitterから反ファシズム運動家と左翼系ジャーナリストを追放する運動を行っている
                                                        • GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisper model in C/C++

                                                          Stable: v1.5.4 / Roadmap | F.A.Q. High-performance inference of OpenAI's Whisper automatic speech recognition (ASR) model: Plain C/C++ implementation without dependencies Apple Silicon first-class citizen - optimized via ARM NEON, Accelerate framework, Metal and Core ML AVX intrinsics support for x86 architectures VSX intrinsics support for POWER architectures Mixed F16 / F32 precision 4-bit and 5

                                                            GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisper model in C/C++
                                                          • Twitterが投稿禁止例からトランスジェンダーに関する記述を削除するポリシー改悪を実施

                                                            Twitterは、暴力的言動や差別的言動に関するポリシーを作成しており、人種や民族、性的指向、性別などを理由にした他者への攻撃を禁じています。ところが、2023年4月頃に当該ポリシーからトランスジェンダーに関する言及が削除されたことが明らかになりました。 GLAAD Responds To Twitter’s Roll-Back of Long-Standing LGBTQ Hate Speech Policy | GLAAD https://www.glaad.org/releases/glaad-responds-twitters-roll-back-long-standing-lgbtq-hate-speech-policy 暴言や脅迫、差別的言動に対するTwitterのポリシー | Twitterヘルプ https://help.twitter.com/ja/rules-and-p

                                                              Twitterが投稿禁止例からトランスジェンダーに関する記述を削除するポリシー改悪を実施
                                                            • Shinzo Abe: Japan ex-leader assassinated while giving speech

                                                              A man has admitted to shooting the former PM during a campaign event in the city of Nara, police say.

                                                                Shinzo Abe: Japan ex-leader assassinated while giving speech
                                                              • 無料のAI音声認識アプリ「CLOVA Note β(クローバ・ノート)」 本日より提供開始! | ニュース | LINE株式会社

                                                                LINEの音声認識AIによるテキスト変換機能を無料提供 複数名の話者分離を可能とした会議の議事録作成や書き起こしにマルチデバイスで対応 LINE株式会社(本社:東京都新宿区、代表取締役社長:出澤 剛)は、LINEのAIテクノロジーブランド「LINE CLOVA」より、「会話を目で見る」ことができる無料のAI音声認識アプリ「CLOVA Note(クローバ・ノート)」のβ版の提供を本日5月24日(火)より開始しましたので、お知らせいたします。 「CLOVA Note」は、LINE CLOVAのAI技術である「CLOVA Speech(音声認識)」の音声認識AIによって、録音した声をテキストに変換するAI音声認識アプリです。アプリをインストールし、スマートフォンやタブレットの録音ボタンを押すだけで、誰でも簡単にご利用いただけます。学校での授業やセミナーなどの書き起こしメモだけでなく、録音時の複数

                                                                  無料のAI音声認識アプリ「CLOVA Note β(クローバ・ノート)」 本日より提供開始! | ニュース | LINE株式会社
                                                                • [速報]OpenAI DevDayの発表内容をまとめる!GPT VisionのAPI提供やGPT-4 turboのリリースなど | DevelopersIO

                                                                  2023年11月6日にOpenAIが初めての開発者向けのイベントであるOpenAI DevDayを開催しました。Youtubeにてオンライン中継が行われたため内容をまとめていきます。 この記事は速報記事であり、英語での発表を日本語で記載するため、内容に誤りがある可能性があります。今後、誤りが見つかった場合は適宜更新していくためご容赦ください。 既にOpenAIの公式でもリリース情報が記載されています。より正確な情報が知りたい方は以下をご覧ください。 https://openai.com/blog/new-models-and-developer-products-announced-at-devday まずは一年の振り返りからイベントは始まりました。この一年で、GPT3.5 / GPT4のリリースや音声への対応、画像生成としてDalle3、エンタープライズプランのリリース、Visionが追

                                                                    [速報]OpenAI DevDayの発表内容をまとめる!GPT VisionのAPI提供やGPT-4 turboのリリースなど | DevelopersIO
                                                                  • Metaがすべての言語をリアルタイムで翻訳するAI「バベルフィッシュ」を開発中

                                                                    メタバース事業に注力するMetaが、あらゆる言語を瞬時に翻訳する独自AI「Babelfish(バベルフィッシュ)」を開発中であると発表しました。 Meta announces plans to build an AI-powered ‘universal speech translator’ - The Verge https://www.theverge.com/2022/2/23/22947368/meta-facebook-ai-universal-speech-translation-project Meta AI: company builds translation engine for the metaverse - Protocol https://www.protocol.com/bulletins/meta-ai-translation-metaverse-babelf

                                                                      Metaがすべての言語をリアルタイムで翻訳するAI「バベルフィッシュ」を開発中
                                                                    • OpenAIがわずか15秒の音声からクローン音声を生成できるAIモデル「Voice Engine」をリリース

                                                                      OpenAIがわずか15秒の音声サンプルから合成音声を作成できるAIモデル「Voice Engine」への限定的なアクセスを提供開始しました。Voice Engineは、合成音声を作成する際に使用した音声サンプルと同じ言語だけでなく、さまざまな言語で入力したテキストを音声読み上げすることができるというテキスト音声生成ツールです。 Navigating the Challenges and Opportunities of Synthetic Voices https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices OpenAI built a voice cloning tool, but you can’t use it… yet | TechCrunch https://

                                                                        OpenAIがわずか15秒の音声からクローン音声を生成できるAIモデル「Voice Engine」をリリース
                                                                      • 二次元美少女の性的表現を「女性(や子ども)の性的モノ化」と非難することの何が問題なのか - 境界線の虹鱒

                                                                        したがってここでの課題は、あらゆる新しい可能性を可能性として愛でることではなく、すでに文化の領域のなかに存在しているけれども、文化的に理解不能とか、存在不能とされていた可能性を、記述しなおしていくことである。(ジュディス・バトラー『ジェンダー・トラブル』*1) はじめに 二次元の女性キャラクターを性的に描いた創作物(「萌え絵」と呼ばれることもある)は、しばしば女性(や子ども)を性的モノ化するものとして非難される*2。しかしこのような非難は、「二次元(キャラクター)」と「三次元(人間)」との存在論的差異をあらかじめ無意味なものと決めつけており、人間に対するセクシュアリティ(=対人性愛)とは異なる「二次元に対する非対人性愛」の存在を抹消してしまっている*3。さらにそこには、フェミニズムやクィアスタディーズの観点からもいくつかの問題がある。本稿ではこのことを素描していく*4。 目次 はじめに 目

                                                                          二次元美少女の性的表現を「女性(や子ども)の性的モノ化」と非難することの何が問題なのか - 境界線の虹鱒
                                                                        • スマホの充電器から“人間のような音声”を発声、音声アシスタントにこっそり入力するサイバー攻撃

                                                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 中国の上海交通大学と浙江大学の研究者らが発表した論文「Remote Attacks on Speech Recognition Systems Using Sound from Power Supply」は、遠隔から操作してスマートフォンの充電器などから人間のような音声を発声させ、音声アシスタントを攻撃する研究報告である。 スマートフォンの充電器やノートPC用アダプター、デスクトップPC、液晶テレビなど、さまざまな電化製品には、スイッチング電源(SMPS、Switched-Mode Power Supply)という安定した直流電流を供給するための電源装

                                                                            スマホの充電器から“人間のような音声”を発声、音声アシスタントにこっそり入力するサイバー攻撃
                                                                          • Microsoft 生成AI活用事例と評価方法について

                                                                            生成AIの旅は続く 人工知能 機械学習 深層 学習 生成 AI 1956 人工知能 人間の知能を複製または超えることができるインテリジェントな機械の作成を 目指すコンピューターサイエンスの分野。 1997 機械学習 機械が既存のデータから学習し、そのデータを改善して意思決定や予測を行 うことを可能にするAIのサブセット。 2012 ディープラーニング ニューラルネットワークの層を使用してデータを処理し、決定。 2021 ジェネレーティブAI プロンプトまたは既存のデータに基づいて、新しい文字、視覚、および聴覚の コンテンツを作成します。 Microsoft と OpenAI のパートナーシップ Ensure that artificial general intelligence (AGI) benefits humanity 汎用人工知能(AGI)が人類に利益をもた らすようにする Em

                                                                              Microsoft 生成AI活用事例と評価方法について
                                                                            • OpenAIの音声認識モデルWhisperを利用し音声からテキストを書き起こしてくれるMacアプリ「MacWhisper (Whisper Transcription)」がリリース。

                                                                              OpenAIの音声認識モデルWhisperを利用し音声をテキストへ書き起こしてくれるMacアプリ「MacWhisper (Whisper Transcription)」がリリースされています。詳細は以下から。 ChatGPTやGPT-3などを開発しているOpenAIは2022年09月、Web上から収集した68万時間にも及ぶ音声データを利用し学習させた自動音声認識(ASR: Automated speech recognition)システムWhisperを公開しましたが、その音声認識モデルを利用して音声ファイルをテキストへ変換(書き起こし)してくれるMacアプリ「MacWhisper (Whisper Transcription)」が新たにリリースされています。 Quickly and easily transcribe audio files into text with OpenAI’s

                                                                                OpenAIの音声認識モデルWhisperを利用し音声からテキストを書き起こしてくれるMacアプリ「MacWhisper (Whisper Transcription)」がリリース。
                                                                              • 文学解釈における価値最大化理論|スティーヴン・デイヴィス「作者の意図、文学の解釈、文学の価値」(2006) - obakeweb

                                                                                Davies, Stephen (2006). Authors' Intentions, Literary Interpretation, and Literary Value. British Journal of Aesthetics 46 (3):223-247. [PDF] スティーヴン・デイヴィスによるBJAの論文「作者の意図、文学の解釈、文学の価値」のまとめです。*1 「作者の意図と文学解釈」というホット・トピックにおいて、「価値最大化説」を定式化した重要論文です。同様の立場はそれ以前のDavies (1982)でも提唱されているが、その後出てきた諸ライバル理論を踏まえて書かれたのが本論文。この手の話題で参照されないことはない程度には定番の一本です。 〜〜ここまでのあらすじ〜〜 ウィムザット&ビアズリー(1946)「作者の意図はいりませーん!」【反意図主義】 バルト「作者は死ん

                                                                                  文学解釈における価値最大化理論|スティーヴン・デイヴィス「作者の意図、文学の解釈、文学の価値」(2006) - obakeweb
                                                                                • AppleがiPhoneで15分のトレーニングをするだけで「自分に似た合成音声」で他人と会話できる機能を発表

                                                                                  Appleが視覚・聴覚・認知・モビリティのアクセシビリティを向上するためのソフトウェア機能をiPhoneやMacに導入すると、2023年5月16日に発表しました。その中でも特に目玉となる機能が、iPhoneやiPadに声を吹き込むだけで、自分の声を再現した音声を合成し、コミュニケーションに応用できるという「Live Speech」です。 Apple previews Live Speech, Personal Voice, and more new accessibility features - Apple https://www.apple.com/newsroom/2023/05/apple-previews-live-speech-personal-voice-and-more-new-accessibility-features/ Live SpeechはiPhone・iPad・

                                                                                    AppleがiPhoneで15分のトレーニングをするだけで「自分に似た合成音声」で他人と会話できる機能を発表