「speech」を検索 - はてなブックマーク

241 - 280 件 / 26177件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

speechの検索結果241 - 280 件 / 26177件

AmazonやAppleの音声認識アルゴリズムに「黒人の声を上手く聞き取ることができない」問題があると研究者が指摘
- 46 users
- gigazine.net
- テクノロジー
- 2020/04/19
音声認識アルゴリズムはスマートスピーカーやスマートフォンなど、さまざまなデバイスやアプリケーションに採用されており、もはや日常の一部となっています。ところが、AppleやAmazon、Google、IBM、Microsoftなどの音声認識アルゴリズムを使った実験で、「音声認識アルゴリズム白人の声と比較して黒人の声を上手く認識できない」問題があることが判明しました。 Racial disparities in automated speech recognition | PNAS https://www.pnas.org/content/117/14/7684 There Is a Racial Divide in Speech-Recognition Systems, Researchers Say - The New York Times https://www.nytimes.com/
【雑記】雪が……。 - 昭和PRIDE
- 45 users
- mr-anpontan2020.hatenablog.com
- 世の中
- 2022/02/10
皆さんこんにちは☀️ いつもあんぽんたんのブログをお読みいただきありがとうございます🙇‍♂️ 「※当ブログはアフィリエイト広告を利用し商品を紹介しています。」久々の更新になってしまいました😅 ちょっと熱量がなくなってしまいまして…笑それより、今年の冬は雪がハンパじゃないです（ ; ; ）自分の車がわからなくなるほどです。皆様もニュースでご存知のこととは思いますが… JR北海道では3日間で2113本が雪害による運休。今は少しずつ運行しています。とにかくもう、めちゃくちゃです😅 私の住む地域でも除雪が追いつかず、ゴミの収集も後回しになっています。復旧や除雪に携わる方々、本当にご苦労様です！最近はロクなことがなくて、ちょっと腹が立ってます笑理由は私の勤務する会社内のことですw 全て落ち着き、面白いネタに出来ればブログで書いてみようと思います👍 今回はただの日記、雑記で
メンタルヘルス×機械学習まとめ
- 45 users
- medium.com
- 暮らし
- 2021/07/14
近年、精神疾患の患者数は増加し続けています。厚生労働省が3年毎に行っている患者調査を見ても、以下の図からも見られる通り精神疾患の患者数は平成11年の204万人から平成26年の392万人と、15年間でおよそ2倍に増えています。 https://www.mhlw.go.jp/file/05-Shingikai-12201000-Shakaiengokyokushougaihokenfukushibu-Kikakuka/0000108755_12.pdfより引用また、最近ではコロナの影響もあり、自粛などによる生活の変化への不安が人々の精神状態の悪化に拍車をかけています。一方で、近年のテクノロジーの進展は目覚ましいものがあり、認知行動療法のデジタル化などが近年国内でも取り組まれており、精神疾患の治療にIT技術を役立てようという動きも出てきています。これらの流れを踏まえた上で、本記事では機械学習
「シノギ」を英語で言うと何？主人公の春日一番の名前はローカライズすると“ナンバーワン”？『龍が如く』欧米版ローカライズプロデューサーに日本文化、極道世界をどう翻訳したのかを聞いてみた
- 45 users
- news.denfaminicogamer.jp
- アニメとゲーム
- 2021/04/28
「シノギ」を英語で言うと何？主人公の春日一番の名前はローカライズすると“ナンバーワン”？『龍が如く』欧米版ローカライズプロデューサーに日本文化、極道世界をどう翻訳したのかを聞いてみた東京の架空の街「神室町」を舞台に、熱い人間ドラマが描かれる『龍が如く』シリーズ。シリーズの累計出荷本数は全世界で1400万本を超え、日本のみならず海外でも人気を博している。海外ではアジア地域、北米、スペインで人気が高く、RPGにジャンルが刷新されたシリーズ最新作『龍が如く7 光と闇の行方』も『Yakuza： Like a Dragon』というタイトルで発売。レビュー集積サイトMetacriticでは84と高スコアを記録しており、英語圏でも人気の高さが見て取れる。ただ、ご存知のとおり、『龍が如く』は極道世界に生きる人々の生き様が描かれているタイトル。日本独特のカルチャーをどのようにローカライズしたのか？
- 言語
- game
- ヤクザ
- 文化
- ゲーム
- 翻訳
- 世界
- english
- Culture
- 英語
早期英語教育とは？メリット・デメリットを徹底検証効率的な英語学習法のヒントは？？ - ポリグロットライフ | 言語まなび∞ラボ
- 45 users
- www.sunafuki.com
- 学び
- 2022/09/04
はじめに今回は早期英語教育とは？というテーマで小学校英語教育について改めて考えてみました。ここ数年早期英語教育熱が高まっているので、そのメリット・デメリットや問題点などの現状を徹底的に考えていきたいと思います。理論面では、早期英語教育をめぐる2大論点を外観しながら、小学校英語教育法を解説していきます。最後に、子供への効率的な英語学習方法を考えていきます。 ↓↓英語学習動画も随時追加するので、登録よろしくお願いします。 www.youtube.com 日本の小学校英語教育小学校英語教育とは？小学校英語教育導入の背景日本の英語教育の歴史文明開花と実学英語英語教育改革と英語排斥運動大衆英語コミュニケーション英語と外国語必修化早期英語教育をめぐる2大論点言語の臨界期 2言語共有説小学校英語必修化必修科の背景と歴史新学習指導要領の変更点小学校英語教育法英語教授法 CLT
権力者の“特別扱い”を止めよ：ソーシャルメディアによるトランプ大統領アカウントの遮断・凍結についてのEFFの考え方 | p2ptk[.]org
- 45 users
- p2ptk.org
- 政治と経済
- 2021/01/10
権力者の“特別扱い”を止めよ：ソーシャルメディアによるトランプ大統領アカウントの遮断・凍結についてのEFFの考え方投稿者: heatwave_p2p 投稿日: 2021/1/102021/1/10 Electronic Frontier Foundation EFFは、米国及び世界中の多くの人々と同様に、水曜の米国議会議事堂の襲撃にショックを受け、嫌悪感を抱いている。我々は、憲法と法の支配を守るべく尽力するすべての人々を支持し、数時間におよぶロックダウンに耐え、憲法上の義務を果たすために再結集した政治家、職員らに感謝の意を表したい。 Twitter、Facebook、Instagram、Snapchatなどが、自社プラットフォームにおけるトランプ大統領のコミュニケーションを一時凍結・遮断した決定は、修正第一条及び（通信品位法）第230条における自社サイトをキュレーションする権利を行使したに
- 表現
- 政治
- web
- USA
Elasticsearch の reindex をするために試行錯誤して分かったこと - Uzabase for Engineers
- 45 users
- tech.uzabase.com
- テクノロジー
- 2022/04/18
こんにちは。NewsPicksでエンジニアやっております崔（チェ）です。現在は Data / Algorithm チームで検索エンジン開発を担当しております。弊社は、検索エンジンとして Elasticsearch を Amazon EC2 に乗せて構築しておりますが、メンテナンスに消極的だった部分があり、これからはマネージド化や検索精度向上など積極的に取り組んでいきたいと考えております（伸びしろしかない！）。今回は、その中でも色んなタスクのボトルネックだったアルゴリズムを変更した話をしたいと思います。ただ、アルゴリズムの詳細よりもそれの変更のために行ったインフラ的な内容にフォーカスしております。ご興味ある方は是非読んでいただけると嬉しいです。はじめにちょっとまって、reindex とは？本題に戻り reindex の実験実験環境づくりそもそも Elasticsearch のシステ
グーグルが選ぶ、2023年のお気に入り「Chrome」拡張機能--AI関連が多数
- 45 users
- japan.cnet.com
- テクノロジー
- 2023/12/27
自分に合ったブラウザー拡張機能を見つけるのはなかなか難しい。興味のあるものを検索して見つけるだけでなく、実際に追加して使い勝手をひとつずつ試してみる必要があるからだ。 Googleが先頃発表した、2023年のお気に入り「Chrome」拡張機能をチェックすれば、そうした手間が少し省けるかもしれない。 Googleはまず、「Get tasks done faster」（タスクを迅速に終える）というカテゴリーで同社お気に入りの5つの拡張機能を挙げている。これらはいずれも人工知能（AI）を活用したものだ。「Scribe」はAIを用いてユーザーのワークフローを文書化することで、職場でのさまざまなプロセスの訓練を実施するためのガイド作成を支援してくれる。「DeepL翻訳」はウェブページの内容を即座にさまざまな言語に翻訳する拡張機能だ。「QuillBot」は、文章作成時（電子メールの作成や返信）におけ
ケンモFMの配信バックエンド :: ラジオ番組の制作からライブ配信、Podcast化までを全自動化 - Qiita
- 45 users
- qiita.com/kenmofm
- テクノロジー
- 2021/01/14
ケンモFMとは 5ちゃんねる嫌儲板で、コロナ感染者を適当に予測したスレが立ち、明確なソースが貼られないまま「ソースはラジオで聴いた」などの一文が添えられていました。それを揶揄し、「ケンモFMかよ」のようなレスが付いたのが元ネタです。せっかくなので、fmドメインを取得した上で、スレタイ（スレッドのタイトルのことです）を自動で読み上げるサイトを作ったのが https://kenmo.fm です。YouTubeにも同時配信しており、 https://www.youtube.com/channel/UCHBucrED96_pdOCvIs6jNSQ/live で聴けます。とりあえずサイトにて自動で生成される音声を聴いてみてください。システム構成現状はこのようになっています。ほぼTypeScriptで書かれており、所々にBashも使用しています。順に解説します。 1 スクレイピングこの項
VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデート
- 45 users
- www.publickey1.jp
- テクノロジー
- 2024/03/06
VSCodeで日本語の音声入力が可能に、Copilotがコードに合った変数名を提案など新機能。2024年2月のアップデートコードエディタのVisual Studio Code（以下、VSCode）は2024年2月のアップデートで、音声入力やCopilotによる変数名の提案などの新機能が追加されました。 More developer goodness in the February update of @code Use your voice to write code (in your language!) Code faster with multi-cursor suggestions Renaming gets easier (because it's AI powered) Release notes: https://t.co/zwokiQvbPU Download: http
- vscode
- ai
- あとで読む
- software
- development
- neta
スクウェア・エニックスによる、リアルな「架空言語」音声の作り方。Text-to-speechの機械学習モデルで生成した没入感の高いボイスコンテンツ【CEDEC+KYUSHU 2022】
- 45 users
- gamemakers.jp
- テクノロジー
- 2023/02/14
3年振りのリアル開催となった福岡で例年行われるゲーム開発者向けのカンファレンス「CEDEC+KYUSHU 2022」が、2022年11月12日（土）に開催されました。スクウェア・エニックス AI部のAIリサーチャー森友亮氏が登壇し、『意味が分からないからこそ、リアル～「架空言語」音声合成による、没入感の高いボイス付きコンテンツの実現～』と題した講演が行われました。見慣れた母国語のテキストから聞いたことのない架空言語の音声を生成する手法について語られた本講演をレポートします。 TEXT / じく EDIT / 酒井理恵
- 音声
- AI
- 機械学習
- 言語
- あとで読む
- コンテンツ
- techfeed
東京都水道局、コールセンターに「IBM Watson」導入　問い合わせ内容をテキスト化、回答の候補を提案
- 45 users
- www.itmedia.co.jp
- テクノロジー
- 2020/02/19
東京都水道局、コールセンターに「IBM Watson」導入　問い合わせ内容をテキスト化、回答の候補を提案日本アイ・ビー・エム（IBM）は2月18日、東京都水道局に「IBM Watson」の音声認識機能と情報検索機能を提供したと発表した。同局は19日から、コールセンターの電話対応業務に両機能を採り入れ、オペレーターの負担軽減とサービス向上に取り組んでいるという。東京都水道局が導入した機能は、ディープラーニングによって音声の特徴を認識し、発話内容をテキストに書き起こす「IBM Watson Speech to Text」と、問い合わせ内容から情報を抽出し、関連する文書を呼び出す「IBM Watson Discovery」。いずれもクラウドサービス「IBM Cloud」経由で利用する。同局では今後、消費者から電話で問い合わせがあった際は、IBM Watsonが内容をリアルタイムで書き起こし
- Watson
- あとで読む
- AI
- news
DEEP LEARNING · Deep Learning
- 44 users
- atcold.github.io
- テクノロジー
- 2020/05/16
Description This course concerns the latest techniques in deep learning and representation learning, focusing on supervised and unsupervised deep learning, embedding methods, metric learning, convolutional and recurrent nets, with applications to computer vision, natural language understanding, and speech recognition. The prerequisites include: DS-GA 1001 Intro to Data Science or a graduate-level
GitHub - isletennos/MMVC_Trainer: AIを使ったリアルタイムボイスチェンジャー(Trainer)
- 44 users
- github.com/isletennos
- テクノロジー
- 2022/03/28
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- 音声
- 機械学習
- github
- MachineLearning
- あとで読む
- AI
- Software
Metaが日本語音声を入力するだけで文字起こしなどが可能なAI「SeamlessM4T」の改良版「SeamlessM4T v2」をリリース
- 44 users
- gigazine.net
- テクノロジー
- 2023/12/02
Metaが2023年8月に公開したAI「SeamlessM4T」は、音声を入力するだけで文字起こしや別言語への翻訳、別言語への吹き替えが可能です。さらにMetaは2023年11月30日に、SeamlessM4Tの改良版となる「SeamlessM4T v2」を発表しました。この「SeamlessM4T V2」では、SeamlessM4Tのパフォーマンスを向上させているだけでなく、感情やスタイルを維持しながら、別の言語へ吹き替えを行うことも可能です。 Introducing a suite of AI language translation models that preserve expression and improve streaming https://ai.meta.com/blog/seamless-communication/ Seamless Communication T
- 人工知能
- AI
- Meta
- techfeed
- 日本語
スマホが高性能ICレコーダーに！使ってわかったLINEの無料AI音声認識アプリ「CLOVA Noteβ」の実力｜@DIME アットダイム
- 44 users
- dime.jp
- テクノロジー
- 2022/08/20
ビジネスパーソンに必須といえる〝会議〟。会議には議事録がつきものですが、できることなら機械に任せたいもの。しかし、音声認識をして文字起こしするソフトやサービスは昔からありましたが、高額かつ低認識率のものも多かったです。そんな中、奇跡のスマホアプリが出現しました。まだベータ版（試用版）ですがいずれ正式版がリリースされるはずです。それでは、LINEの無料AI音声認識アプリ「CLOVA Noteβ」についてご紹介します。楽するだけではない！　議事録を書かなくて済むメリットとは？「CLOVA Noteβ」は、録音しながらまずは話の概要をざっくり聞き、録音・文字認識が完了した二周目に「CLOVA Noteβ」で音声を「耳」で聞きます。そして自動文字起こしされた「文字情報」を目で確認できるのです。つまり、会議の内容を熟考できて知識が深まるのが最大のメリットです。「CLOVA Noteβ」を
- app
- あとで読む
- tool
VSCodeへ「Hey Code!」と呼びかけ、Copilot Chatが起動する新機能。2024年1月のアップデート
- 43 users
- www.publickey1.jp
- テクノロジー
- 2024/02/02
VSCodeへ「Hey Code!」と呼びかけ、Copilot Chatが起動する新機能。2024年1月のアップデートコードエディタのVisual Studio Code（以下、VSCode）は2024年1月のアップデートで、「Hey Code!」と音声で呼びかけると、Copilot Chatが起動する新機能が追加されたことが明らかになりました。 The January release of @code is here! Check out what's new: Per-window zoom levels "Hey Code" voice command Triggered breakpoints ... & much more! Release notes: https://t.co/ourbLiwakw Download: https://t.co/1CSkQpMbwd pic.
- vscode
- techfeed
- ai
- software
- あとで読む
OpenAIが自動応答するコールセンターを作ってみよう📲
- 43 users
- zenn.dev/yusu29
- テクノロジー
- 2024/02/11
概要今回はAzure Communication ServiceとAzure OpenAI Serviceを使って、コールセンターを作ってみたいと思います。全体アーキテクチャは以下のようになります。全体の流れは以下の通りです。ユーザーが Azure Communication Service に登録された電話番号に架電する。 Azure Communication Servicce の Incoming Call をトリガーとしてサーバーサイドアプリケーションの API に Webhook を実行する。 Webhook 要求にサーバーサイドアプリケーションが応答する。ユーザー発話内容に基づいて Azure Cognitive Service が Speech-to-Text、Azure OpenAI Service からの応答内容に基づいて Text-to-Speech を実行す
Google Cloud Next '22で発表された全 123 項目 | Google Cloud 公式ブログ
- 43 users
- cloud.google.com
- テクノロジー
- 2022/10/21
※この投稿は米国時間 2022 年 10 月 15 日に、Google Cloud blog に投稿されたものの抄訳です。今週、世界中の都市で Google Cloud Next '22を開催し、皆様に重要なニュースやお知らせをご紹介できたことを嬉しく思います。ニューヨーク市の開会基調講演から 24 時間のライブ配信が始まり、その後西海岸に移動し、カリフォルニア州サニーベールの Google Cloud 本社から「Top 10 Cloud Predictions」のデベロッパー基調講演が行われました。Next '22はその後太平洋を渡り、東京（日本）、バンガロール（インド）へと移り、ミュンヘン（ドイツ）で終了しました。グローバルなイベント、Innovators Hive にご参加いただいた何千人ものデベロッパーの皆様に感謝いたします。ぜひ、すべてのブレイクアウトセッションをご確認くださ
中国政府の「拘束中の作家に言論の自由賞を与えるな」という脅迫をスウェーデン首相が一蹴
- 43 users
- gigazine.net
- 世の中
- 2019/11/20
By TheDigitalArtist スウェーデンの文化団体が中国で拘束中の作家・桂民海(グイ・ミンハイ)氏に対して言論の自由を称える賞を授与しました。授与に対して在スウェーデン中国大使館は「重大な過ち」だと抗議しましたが、スウェーデン首相は「この種の脅迫に屈するつもりはない」と回答しました。 PEN International — Sweden: Tucholsky Award fitting tribute to… https://pen-international.org/news/sweden-tucholsky-award-fitting-tribute-to-gui-minhai Swedish PM hits back at China over literature prize threat - The Local https://www.thelocal.se/2019
- funny
- 中国
- 国際
- 政治
- あとで読む
The 100 Best, Worst, and Strangest Sherlock Holmes Portrayals of All-Time, Ranked
- 43 users
- crimereads.com
- エンタメ
- 2022/07/03
The 100 Best, Worst, and Strangest Sherlock Holmes Portrayals of All-Time, Ranked Once you eliminate the least compelling Sherlock Holmes performances, whatever remains, no matter how improbable, must be the best. We’re ranking Sherlock Holmes performances. One hundred of them. Not Sherlock Holmes adaptations, but the representations within them of Sherlock Holmes himself. Now, you might think tha
イーロン・マスクいわくTwitterで「シス」「シスジェンダー」という単語は誹謗中傷とみなされる、ハリポタ作者も同調
- 43 users
- gigazine.net
- テクノロジー
- 2023/06/22
イーロン・マスク氏が2023年6月21日に「このプラットフォーム(Twitter)では『シス』および『シスジェンダー』という単語は誹謗(ひぼう)中傷とみなされる」とツイートしました。ハリー・ポッターの作者であるJ・K・ローリング氏もマスク氏に同調する意見をツイートしています。 Repeated, targeted harassment against any account will cause the harassing accounts to receive, at minimum, temporary suspensions. The words “cis” or “cisgender” are considered slurs on this platform.— Elon Musk (@elonmusk) シスジェンダーとは生物学的性と性自認が一致する人を指す比較的新しい言葉で、
- シス
- twitter
- LGBT
- 差別
- 社会
- 人権
- ことば
Markdown の Table 記法を CSS で実現する | blog.jxck.io
- 42 users
- blog.jxck.io
- テクノロジー
- 2022/03/06
Intro 本ブログは Markdown で原稿を書き、それを HTML に変換して表示している。このとき、 CSS を用いて Markdown のシンタックスに似せた Style を適用している。例えば以下のように h2::before に content: '##' を指定するといった具合だ。しかし、これまで <table> だけはうまく Markdown 記法を再現する CSS が書けないでいた。そこで、周りの CSS 強者に実現できないか聞いてみたところ、@shqld, @araya, @yoshiko 達の協力を得て、かなりの完成度にすることができた。実現方法を記録する。 Before 実現したいのは以下のような記法だ。 | file type | size | ratio | |:----------|-----:|------:| | .webp | 9474 | 100
- markdown
- css
- あとで読む
- techfeed
- article
- javascript
緒方貞子さんが亡くなった。｜よしログ
- 42 users
- note.com/yoshilog
- 世の中
- 2019/10/29
緒方貞子さんが亡くなった。国連で最初の仕事を始めた時、冷戦構造が崩壊し、あちこちで内戦が勃発していた。そんな時に新米の挨拶に数分の時間をさいてくれた。プロが必要だ、キャッチフレーズは役に立たないとよく仰っていた。やがて彼女の講演会のパネルや対談や調査に呼ばれるようになったが、 — yoshilog (@yoshilog) October 29, 2019 The English version is at the bottom.＊　＊　＊緒方貞子さんが亡くなった。国連で最初の仕事を始めた時、冷戦構造が崩壊し、あちこちで内戦が勃発していた。そんな時に新米の挨拶に数分の時間をさいてくれた。プロが必要だ、キャッチフレーズは役に立たないとよく仰っていた。やがて彼女の講演会のパネルや対談や調査に呼ばれるようになったが、いつまでも経っても公の会議でもヨシと呼ぶので外務省の人達は怪訝な顔を
- 訃報
- social
- 人生
- 国際
- *あとで読む
TechCrunch | Startup and Technology News
- 42 users
- jp.techcrunch.com
- テクノロジー
- 2020/05/16
Welcome to Week in Review: TechCrunch’s newsletter recapping the week’s biggest news. This week Apple unveiled new iPad models at its Let Loose event, including a new 13-inch display for…
- 国際
- フランス
- 社会
- web2.0
Introducing Whisper
- 42 users
- openai.com
- 学び
- 2022/09/22
Whisper is an automatic speech recognition (ASR) system trained on 680,000 hours of multilingual and multitask supervised data collected from the web. We show that the use of such a large and diverse dataset leads to improved robustness to accents, background noise and technical language. Moreover, it enables transcription in multiple languages, as well as translation from those languages into Eng
- AI
- Audio
右翼過激派がイーロン・マスクを利用してTwitterから反ファシズム運動家と左翼系ジャーナリストを追放する運動を行っている
- 41 users
- gigazine.net
- 世の中
- 2022/12/02
by Eden, Janine and Jim 約440億ドル(約6兆円)でTwitterを買収したイーロン・マスク氏は自らTwitterのCEOに就任し、実際にユーザーからの直接要請を受けてアカウント凍結や強制非表示(シャドウバン)を解除したり、野放しになっている規約違反のアカウントを停止したりといった処分を行っています。そんな中、極右思想を持つことで知られる作家のアンディ・ンゴ氏が、自らが批判する反ファシスト一派のANTIFA関連のアカウントを利用規約違反だとしてマスクCEOに報告し、アカウント停止に追い込んでいると報じられています。 Twitter Thrills Far-Right Trolls by Silencing Left-Wing Voices https://theintercept.com/2022/11/29/elon-musk-twitter-andy-ngo-a
GitHub - ggerganov/whisper.cpp: Port of OpenAI's Whisper model in C/C++
- 41 users
- github.com/ggerganov
- テクノロジー
- 2022/11/07
Stable: v1.5.4 / Roadmap | F.A.Q. High-performance inference of OpenAI's Whisper automatic speech recognition (ASR) model: Plain C/C++ implementation without dependencies Apple Silicon first-class citizen - optimized via ARM NEON, Accelerate framework, Metal and Core ML AVX intrinsics support for x86 architectures VSX intrinsics support for POWER architectures Mixed F16 / F32 precision 4-bit and 5
- whisper
- C++
- speech
- 音声
- voice
- C
- AI
Twitterが投稿禁止例からトランスジェンダーに関する記述を削除するポリシー改悪を実施
- 41 users
- gigazine.net
- 世の中
- 2023/04/19
Twitterは、暴力的言動や差別的言動に関するポリシーを作成しており、人種や民族、性的指向、性別などを理由にした他者への攻撃を禁じています。ところが、2023年4月頃に当該ポリシーからトランスジェンダーに関する言及が削除されたことが明らかになりました。 GLAAD Responds To Twitter’s Roll-Back of Long-Standing LGBTQ Hate Speech Policy | GLAAD https://www.glaad.org/releases/glaad-responds-twitters-roll-back-long-standing-lgbtq-hate-speech-policy 暴言や脅迫、差別的言動に対するTwitterのポリシー | Twitterヘルプ https://help.twitter.com/ja/rules-and-p
Shinzo Abe: Japan ex-leader assassinated while giving speech
- 41 users
- www.bbc.com
- 政治と経済
- 2022/07/08
A man has admitted to shooting the former PM during a campaign event in the city of Nara, police say.
無料のAI音声認識アプリ「CLOVA Note β（クローバ・ノート）」本日より提供開始！ | ニュース | LINE株式会社
- 41 users
- linecorp.com
- テクノロジー
- 2022/05/24
LINEの音声認識AIによるテキスト変換機能を無料提供複数名の話者分離を可能とした会議の議事録作成や書き起こしにマルチデバイスで対応 LINE株式会社（本社：東京都新宿区、代表取締役社長：出澤剛）は、LINEのAIテクノロジーブランド「LINE CLOVA」より、「会話を目で見る」ことができる無料のAI音声認識アプリ「CLOVA Note（クローバ・ノート）」のβ版の提供を本日5月24日（火）より開始しましたので、お知らせいたします。「CLOVA Note」は、LINE CLOVAのAI技術である「CLOVA Speech（音声認識）」の音声認識AIによって、録音した声をテキストに変換するAI音声認識アプリです。アプリをインストールし、スマートフォンやタブレットの録音ボタンを押すだけで、誰でも簡単にご利用いただけます。学校での授業やセミナーなどの書き起こしメモだけでなく、録音時の複数
- AI
- LINE
- 文字起こし
- text
- 人工知能
- あとで読む
- app
- アプリ
[速報]OpenAI DevDayの発表内容をまとめる！GPT VisionのAPI提供やGPT-4 turboのリリースなど | DevelopersIO
- 41 users
- dev.classmethod.jp
- テクノロジー
- 2023/11/07
2023年11月6日にOpenAIが初めての開発者向けのイベントであるOpenAI DevDayを開催しました。Youtubeにてオンライン中継が行われたため内容をまとめていきます。この記事は速報記事であり、英語での発表を日本語で記載するため、内容に誤りがある可能性があります。今後、誤りが見つかった場合は適宜更新していくためご容赦ください。既にOpenAIの公式でもリリース情報が記載されています。より正確な情報が知りたい方は以下をご覧ください。 https://openai.com/blog/new-models-and-developer-products-announced-at-devday まずは一年の振り返りからイベントは始まりました。この一年で、GPT3.5 / GPT4のリリースや音声への対応、画像生成としてDalle3、エンタープライズプランのリリース、Visionが追
- openai
- AI
- chatgpt
- あとで読む
- 人工知能
- 機械学習
- event
Metaがすべての言語をリアルタイムで翻訳するAI「バベルフィッシュ」を開発中
- 41 users
- gigazine.net
- テクノロジー
- 2022/02/24
メタバース事業に注力するMetaが、あらゆる言語を瞬時に翻訳する独自AI「Babelfish(バベルフィッシュ)」を開発中であると発表しました。 Meta announces plans to build an AI-powered ‘universal speech translator’ - The Verge https://www.theverge.com/2022/2/23/22947368/meta-facebook-ai-universal-speech-translation-project Meta AI: company builds translation engine for the metaverse - Protocol https://www.protocol.com/bulletins/meta-ai-translation-metaverse-babelf
- Meta
- 言語
- あとで読む
- GIGAZINE
- 人工知能
- tech
OpenAIがわずか15秒の音声からクローン音声を生成できるAIモデル「Voice Engine」をリリース
- 41 users
- gigazine.net
- テクノロジー
- 2024/04/01
OpenAIがわずか15秒の音声サンプルから合成音声を作成できるAIモデル「Voice Engine」への限定的なアクセスを提供開始しました。Voice Engineは、合成音声を作成する際に使用した音声サンプルと同じ言語だけでなく、さまざまな言語で入力したテキストを音声読み上げすることができるというテキスト音声生成ツールです。 Navigating the Challenges and Opportunities of Synthetic Voices https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices OpenAI built a voice cloning tool, but you can’t use it… yet | TechCrunch https://
二次元美少女の性的表現を「女性（や子ども）の性的モノ化」と非難することの何が問題なのか - 境界線の虹鱒
- 40 users
- mtwrmtwr.hatenablog.com
- 世の中
- 2023/02/26
したがってここでの課題は、あらゆる新しい可能性を可能性として愛でることではなく、すでに文化の領域のなかに存在しているけれども、文化的に理解不能とか、存在不能とされていた可能性を、記述しなおしていくことである。（ジュディス・バトラー『ジェンダー・トラブル』*1）はじめに二次元の女性キャラクターを性的に描いた創作物（「萌え絵」と呼ばれることもある）は、しばしば女性（や子ども）を性的モノ化するものとして非難される*2。しかしこのような非難は、「二次元（キャラクター）」と「三次元（人間）」との存在論的差異をあらかじめ無意味なものと決めつけており、人間に対するセクシュアリティ（＝対人性愛）とは異なる「二次元に対する非対人性愛」の存在を抹消してしまっている*3。さらにそこには、フェミニズムやクィアスタディーズの観点からもいくつかの問題がある。本稿ではこのことを素描していく*4。目次はじめに目
- 創作
- gender
- 批評
- あとで読む
- 考察
スマホの充電器から“人間のような音声”を発声、音声アシスタントにこっそり入力するサイバー攻撃
- 40 users
- www.itmedia.co.jp
- テクノロジー
- 2023/05/23
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: ＠shiropen2 中国の上海交通大学と浙江大学の研究者らが発表した論文「Remote Attacks on Speech Recognition Systems Using Sound from Power Supply」は、遠隔から操作してスマートフォンの充電器などから人間のような音声を発声させ、音声アシスタントを攻撃する研究報告である。スマートフォンの充電器やノートPC用アダプター、デスクトップPC、液晶テレビなど、さまざまな電化製品には、スイッチング電源（SMPS、Switched-Mode Power Supply）という安定した直流電流を供給するための電源装
Microsoft 生成AI活用事例と評価方法について
- 40 users
- speakerdeck.com/daikikanemitsu
- テクノロジー
- 2024/02/16
生成AIの旅は続く人工知能機械学習深層学習生成 AI 1956 人工知能人間の知能を複製または超えることができるインテリジェントな機械の作成を目指すコンピューターサイエンスの分野。 1997 機械学習機械が既存のデータから学習し、そのデータを改善して意思決定や予測を行うことを可能にするAIのサブセット。 2012 ディープラーニングニューラルネットワークの層を使用してデータを処理し、決定。 2021 ジェネレーティブAI プロンプトまたは既存のデータに基づいて、新しい文字、視覚、および聴覚のコンテンツを作成します。 Microsoft と OpenAI のパートナーシップ Ensure that artificial general intelligence (AGI) benefits humanity 汎用人工知能(AGI)が人類に利益をもたらすようにする Em
- AI
- あとで読む
- microsoft
- プログラム
- 学習
- service
OpenAIの音声認識モデルWhisperを利用し音声からテキストを書き起こしてくれるMacアプリ「MacWhisper (Whisper Transcription)」がリリース。
- 40 users
- applech2.com
- テクノロジー
- 2023/02/03
OpenAIの音声認識モデルWhisperを利用し音声をテキストへ書き起こしてくれるMacアプリ「MacWhisper (Whisper Transcription)」がリリースされています。詳細は以下から。 ChatGPTやGPT-3などを開発しているOpenAIは2022年09月、Web上から収集した68万時間にも及ぶ音声データを利用し学習させた自動音声認識(ASR: Automated speech recognition)システムWhisperを公開しましたが、その音声認識モデルを利用して音声ファイルをテキストへ変換(書き起こし)してくれるMacアプリ「MacWhisper (Whisper Transcription)」が新たにリリースされています。 Quickly and easily transcribe audio files into text with OpenAI’s
- Whisper
- AI
- OpenAI
- mac
- audio
- あとで読む
- 人工知能
- idea
文学解釈における価値最大化理論｜スティーヴン・デイヴィス「作者の意図、文学の解釈、文学の価値」（2006） - obakeweb
- 40 users
- obakeweb.hatenablog.com
- 学び
- 2020/11/02
Davies, Stephen (2006). Authors' Intentions, Literary Interpretation, and Literary Value. British Journal of Aesthetics 46 (3):223-247. [PDF] スティーヴン・デイヴィスによるBJAの論文「作者の意図、文学の解釈、文学の価値」のまとめです。*1 「作者の意図と文学解釈」というホット・トピックにおいて、「価値最大化説」を定式化した重要論文です。同様の立場はそれ以前のDavies (1982)でも提唱されているが、その後出てきた諸ライバル理論を踏まえて書かれたのが本論文。この手の話題で参照されないことはない程度には定番の一本です。〜〜ここまでのあらすじ〜〜ウィムザット＆ビアズリー（1946）「作者の意図はいりませーん！」【反意図主義】バルト「作者は死ん
- 美学
- 文学
- あとで読む
- 論文
AppleがiPhoneで15分のトレーニングをするだけで「自分に似た合成音声」で他人と会話できる機能を発表
- 40 users
- gigazine.net
- テクノロジー
- 2023/05/17
Appleが視覚・聴覚・認知・モビリティのアクセシビリティを向上するためのソフトウェア機能をiPhoneやMacに導入すると、2023年5月16日に発表しました。その中でも特に目玉となる機能が、iPhoneやiPadに声を吹き込むだけで、自分の声を再現した音声を合成し、コミュニケーションに応用できるという「Live Speech」です。 Apple previews Live Speech, Personal Voice, and more new accessibility features - Apple https://www.apple.com/newsroom/2023/05/apple-previews-live-speech-personal-voice-and-more-new-accessibility-features/ Live SpeechはiPhone・iPad・
- AI
- apple
- iPhone
- mobile
- あとで読む
- *あとで読む