並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 22060件

新着順 人気順

speechの検索結果41 - 80 件 / 22060件

  • RAGのSurvey論文からRAG関連技術を俯瞰する - 元生技のデータサイエンティストのメモ帳

    大規模言語モデル (LLM) の学習データに含まれない知識(各社の特有の書類など)を踏まえてLLMに回答させる際に最早必須となってきたRAG (Retrieval-Augumented Generation)。 今回はそんなRAGのSurvey論文を元に、RAGの変遷や構成要素、新たに出てきた技術を俯瞰していきます。 Survey論文へのリンクはこちら arxiv.org RAGとは LLMはそれ単体で回答させると、質問によってはハルシネーションや学習時のデータにはなかった情報を生成時に加味できないといった問題から正しくない回答を生成することが多々あります。例えば世間一般に公開されていない自社の就業規則や業務標準についてをChatGPTに質問しても、正しい回答は得られません。 そのような問題への対応としてRAGが使われます。 「LLM単体で適切な回答を生成できないなら、ユーザーの質問を元に

      RAGのSurvey論文からRAG関連技術を俯瞰する - 元生技のデータサイエンティストのメモ帳
    • OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka

      以下の記事が面白かったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。 開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

        OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
      • 英語ネイティブとの発音の違いを深層学習で可視化 ソニーCSLが開発

        Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 ソニーコンピュータサイエンス研究所(ソニーCSL)京都研究室の研究チームが開発した「A Language Acquisition Support System that Presents Differences and Distances from Model Speech」は、非母国語の学習において、学習者の発話とネイティブスピーカーの発話の差異を深層学習を用い分析し、視覚的に提示するシステムだ。学習者はこの差異を埋めようと繰り返し発話することで、ネイティブに近い発話を習得できるようになると期待できる。 (a)練習したい英語の文章と、ネイティブスピーカーの音声が与えられる。(b)学習者の

          英語ネイティブとの発音の違いを深層学習で可視化 ソニーCSLが開発
        • アップル、iPhoneやMacが自分そっくりのAI生成声で話す「Personal Voice」発表。学習もローカルで完結(CloseBox) | テクノエッジ TechnoEdge

          AIを活用して声を学習し、本人そのままの高精度な声で生成する技術がここ数カ月で大きく進化しています。 RVCというAIボイスチェンジャー機能は、岸田首相の声真似を本人の前でデモするまでになり、AIフェイクボイスの問題が一部で取り沙汰されるようにもなりました。 そんな中、アップルがAIを使った人声の学習・生成機能「Personal Voice」を今年下半期のOSアップデートで提供すると発表しました。 iPhone、iPad、そしてAppleシリコンを搭載したMacで15分、ランダムに表示される150の文章を読み上げるだけで自分の声を学習することができ、テキストをタイプすると自分そっくりな声で相手に伝えることが可能になります。ただし、当初は英語のみです。 テキストした文章を音声化する機能(TTS、Text To Speech)をアップルは「Live Speech」という新機能で提供。これまでは

            アップル、iPhoneやMacが自分そっくりのAI生成声で話す「Personal Voice」発表。学習もローカルで完結(CloseBox) | テクノエッジ TechnoEdge
          • フェミニズムと表現規制についてのざっくり覚書(1) 反表現規制フェミニストが語る、フェミニズム史概観|ヤヤネヒロコ

            世間で「フェミニスト」を名乗る皆さんの主張が多様すぎて訳わかんなくなっているひとをけっこう見かけるので、表現規制問題を軸にざっくりと整理する記事を書いてみようと思った。話題を追いかけている人には今更な内容が多いし、ざっくりといっても8000字弱あるけど…… ## フェミニストと性表現検閲と真のフェミニスト フェミニズムは、「女性解放」「女権拡張」「男女平等」など、多様に訳される。フェミニストもアンチ・フェミニストも「真のフェミニスト」を定義したがるが、表現規制問題を軸にする場合、これを定義するのはかなり難しい。 フェミニストのフェミニストによる反検閲・表現の自由論として著名な「ポルノグラフィ防衛論(原題:Defending Pornography: Free Speech, Sex and the Fight for Women's Rights、ナディーン・ストロッセン著)」の序文には、

              フェミニズムと表現規制についてのざっくり覚書(1) 反表現規制フェミニストが語る、フェミニズム史概観|ヤヤネヒロコ
            • セックスワーカーを危険に晒す反ポルノ戦争 | p2ptk[.]org

              以下の文章は、openDemocracy の「How a war on porn is endangering US sex workers」という2023年1月11日に公開された記事を翻訳したものである。以前、この記事内容に関連する話をうぐいすリボンのTwitterスペースでお話したので、興味ある方はどうぞ。 今週、セックスワーカーを危険に晒しているとして非難される米国「人身売買防止法」の公聴会が開催される。 2018年に成立した「オンライン性的人身売買仲介防止法(FOSTA)」と「性的人身売買防止法(SESTA)」は、売春や性的人身売買を促進・助長するウェブサイトに責任を負わせるものとして喧伝されてきた。 だが、この法律が実際には人身売買を増やし、セックスワーカーと表現の自由を脅かしていると批判する声もある。 この法律では、ユーザが売春や性的人身売買について言及すると、それをホストする

                セックスワーカーを危険に晒す反ポルノ戦争 | p2ptk[.]org
              • AWS 認定 ソリューションアーキテクト – プロフェッショナル(AWS Certified Solutions Architect – Professional)の学習方法 - NRIネットコムBlog

                小西秀和です。 この記事は「AWS認定全冠を維持し続ける理由と全取得までの学習方法・資格の難易度まとめ」で説明した学習方法を「AWS 認定 ソリューションアーキテクト – プロフェッショナル(AWS Certified Solutions Architect – Professional)」に特化した形で紹介するものです。 重複する内容については省略していますので、併せて元記事も御覧ください。 また、現在投稿済の各AWS認定に特化した記事へのリンクを以下に掲載しましたので興味のあるAWS認定があれば読んでみてください。 ALL Networking Security Database Analytics ML SAP on AWS Alexa DevOps Developer SysOps SA Pro SA Associate Cloud Practitioner 「AWS 認定 ソリュ

                  AWS 認定 ソリューションアーキテクト – プロフェッショナル(AWS Certified Solutions Architect – Professional)の学習方法 - NRIネットコムBlog
                • 3kbpsという低いビットレートでも高音質を実現するコーデック「Lyra」をGoogleが開発

                  2021年2月25日、Googleが3kbpsという低いビットレートでも、元音声と遜色ないほどの音質を維持できるコーデック「Lyra」を開発したと発表しました。 Google AI Blog: Lyra: A New Very Low-Bitrate Codec for Speech Compression https://ai.googleblog.com/2021/02/lyra-new-very-low-bitrate-codec-for.html ほとんどのコーデックでは音声信号をサンプルごとに圧縮して送信することで高音質を実現するモデルを使用していますが、このモデルでは低いビットレートで元の音質を再現することができません。しかしGoogleが新しく開発したモデルは、最小限のデータを使用して音声を再生成できるようになっているとのこと。 低いビットレートでも元の音質を再現できるのは、

                    3kbpsという低いビットレートでも高音質を実現するコーデック「Lyra」をGoogleが開発
                  • ニュージーランドで内戦が勃発するかもしれない

                    昨日はニュージーランドの重要な祝日の一つワイタンギ・デーだった。 これはニュージーランドに入植してきたイギリス人と原住民であるマオリ族との間で取り交わされた条約であり、イギリスのインチキ外交の一つとして語られるべきものでもある。 なぜこれがインチキなのか、といえば、条約である以上英語版とマオリ語版が作られるのだが、お互いに特に重要なポイントが違っている。 マオリ語版はニュージーランドを共同統治すると書いていたが英語版は英国王室が主権者となっている、マオリ語におけるとある単語がマオリ語ではかなり広い意味の単語なのにも関わらず英語版では限定的な意味合いになっている、マオリ族は小規模な部族があちこちにあるのだが、締切に間に合わずに条約に調印していない部族がいる、などだ。 そもそもなぜこの条約を締結しようとしたかというと、入植者がマオリから土地をだまし取ることが横行したからだと記憶しているのだが、

                      ニュージーランドで内戦が勃発するかもしれない
                    • 求人で良さそうなところあったのに、朝礼前に1分間スピーチあるって書いてて応募するの辞めた→経験者の声や肯定派の意見など色々集まる

                      おいも🍠 @oimoga_daisuki 求人で良さそうなところあったのに、朝礼前に1分間スピーチあるって書いてて応募するの辞めた。そんなん業務の1つにして何になるんやろ?小学生かよ。

                        求人で良さそうなところあったのに、朝礼前に1分間スピーチあるって書いてて応募するの辞めた→経験者の声や肯定派の意見など色々集まる
                      • これは便利! HTMLはdiv要素一つ、あとはCSSをコピペするだけで100種類のツールチップを簡単に実装できる -CSS Tooltips & Speech Bubbles

                        HTMLはdiv要素一つだけ、あとはCSSをコピペするだけで約100種類のールチップとスピーチバブルを実装できるCSS Tooltips & Speech Bubblesを紹介します。 このツールチップって実装すると、けっこう面倒ですよね。ベタ塗りのツールチップをはじめ、グラデーションの枠、しっぽの位置、しっぽの形状など、さまざまなデザインが、ここを見ればコピペで簡単に実装できます。 CSS Tooltips & Speech Bubbles CSS Tooltips & Speech Bubblesを作成したのは以前紹介したCSS Loaders(紹介記事)やCSS Ribbon Shapes(紹介記事)と同じ作者で、前回はCSSで実装されたローダーとリボンでしたが、今回は100種類のツールチップとスピーチバブルです。

                          これは便利! HTMLはdiv要素一つ、あとはCSSをコピペするだけで100種類のツールチップを簡単に実装できる -CSS Tooltips & Speech Bubbles
                        • 【2022年】AWS全サービスまとめ | DevelopersIO

                          こんにちは。サービスグループの武田です。このエントリは、2018年から公開しているAWS全サービスまとめの2022年版です。 こんにちは。サービスグループの武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2022年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2021年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 223個 です。 まとめるにあ

                            【2022年】AWS全サービスまとめ | DevelopersIO
                          • スティーヴン・ピンカーに対する除名請願運動とその顛末 - shorebird 進化心理学中心の書評など

                            7月の上旬にアメリカ言語学会(LSA)に対して「ピンカーの言動はLSAの代表にふさわしくなく,LSAの目的からいって受け入れられないものであり,『アカデミックフェロー』や『メディアエキスパート』の地位からの除名を求める」という請願が行われるという騒動が勃発している. このブログではピンカーの著書や講義について紹介してきており,またこのような「キャンセル・カルチャー」について,アメリカのアカデミアの雰囲気についてのルキアノフとハイトの本やミラーの徳シグナリングの本の書評も載せてきたこともあり,私も無関心ではいられない.簡単に紹介しておこう. 請願 docs.google.com 7月1日付で600名弱の署名付き公開書簡がLSA宛てに出されている. これは言語学者のメンバーによる公開書簡であり,スティーヴン・ピンカーをLSAの『アカデミックフェロー』や『メディアエキスパート』の地位からの除名を

                              スティーヴン・ピンカーに対する除名請願運動とその顛末 - shorebird 進化心理学中心の書評など
                            • Playストアからの削除警告について - Subway Tooter blog

                              Subway Tooterの概要 Subway Tooter は分散マイクロブログサービスであるMastodonのAPIを利用するクライアントアプリケーションです。 このアプリはMastodon APIと十分な互換性のある任意のサーバにアクセスできます。接続先のサーバを運営しているのはSubway Tooterではないことに注意してください。 Mastodonの概要 Mastodonは分散マイクロブログの製品名です。Webやメールと同様に、世界中に何千ものサーバが存在します。それらのサーバはそれぞれ異なるポリシーを持ち、全体が緩く連合しています。サーバやユーザは他のサーバやユーザを自由にブロックできます。 Googleからのメール Subway Tooter だけでなく、Fedilab, Husky, MastoPane なども同様の削除警告を受け取っています。 From: Google

                                Playストアからの削除警告について - Subway Tooter blog
                              • ローマ教皇 長崎 広島でのスピーチ(全文) | NHKニュース

                                教皇の日本司牧訪問 教皇のスピーチ 核兵器についてのメッセージ 長崎・爆心地公園 2019年11月24日 愛する兄弟姉妹の皆さん。 この場所は、わたしたち人間が過ちを犯しうる存在であるということを、悲しみと恐れとともに意識させてくれます。近年、浦上教会で見いだされた被爆十字架とマリア像は、被爆なさったかたとそのご家族が生身の身体に受けられた筆舌に尽くしがたい苦しみを、あらためて思い起こさせてくれます。 人の心にあるもっとも深い望みの一つは、平和と安定への望みです。核兵器や大量破壊兵器を所有することは、この望みへの最良のこたえではありません。それどころか、この望みをたえず試みにさらすことになるのです。わたしたちの世界は、手に負えない分裂の中にあります。それは、恐怖と相互不信を土台とした偽りの確かさの上に平和と安全を築き、確かなものにしようという解決策です。人と人の関係をむしばみ、相互の対話を

                                  ローマ教皇 長崎 広島でのスピーチ(全文) | NHKニュース
                                • 口パクで音声入力、喉に小型センサーで 東大とソニーCSLが技術開発

                                  Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 東京大学大学院情報学環とソニーコンピュータサイエンス研究所(CSL)の研究チームが開発した「Derma」は、喉周辺の皮膚にセンサーを張り付け、口パク(無声発話)を音声入力に変換する深層学習を用いたサイレントスピーチインタラクション(Silent Speech Interaction、SSI) だ。 話者の唇や顎(あご)周辺を指で触れ、発話を読み取ろうとする、視聴覚障害者のためのTadoma(触診リップリーディング)法から発想を得ている。Tadoma法では主に唇周辺の皮膚を触って発話を認識しているが、今回の研究ではそれを機械学習により自動化した。さらにウェアラブルでの利用を想定し、より目立ち

                                    口パクで音声入力、喉に小型センサーで 東大とソニーCSLが技術開発
                                  • チャット機能を搭載した新しいBingが使えるようになったので早速試してみた2|IT navi

                                    昨日(2023年2月10日)、「チャット機能を搭載した新しいBingが使えるようになったので早速試してみた」という記事を公開しましたが、ほかにも色々と試してみましたので、前回の続きとして報告します。 新しいBingの概要などが知りたい方は、以下の記事を参考にしてください。 1.ショートストーリーの作成 Bingにショートストーリーを作成してもらいました。1行指示するだけで、簡単にこんな物語を作成してくれます。 問 かわいいシーズーの子犬が活躍する物語を作って 答 こんにちは、こちらはBingです。かわいいシーズーの子犬が活躍する物語を作りますね。😊 以下が私が作った物語です。楽しんでください。 シーズーの子犬のモコは、いつも元気で好奇心旺盛な子でした。彼は飼い主のリカと一緒に暮らしていましたが、リカは仕事が忙しくてあまり遊んでくれませんでした。そこでモコは、リカが仕事に出かけた後に、家の

                                      チャット機能を搭載した新しいBingが使えるようになったので早速試してみた2|IT navi
                                    • 経済学はどこまで信用できるのか『経済学のどこが問題なのか』

                                      経済学が、うさんくさい。 ネットで見かける経済学者の態度が偉そうだとか、オレサマ経済理論を振りかざす連中の断定口調が気に入らないとか、そういうのをさっ引いても、経済学そのものに不信感がある。何か騙されているような感覚がつきまとう。 この記事では、『経済学のどこが問題なのか』(ロバート・スキデルスキー、名古屋大学出版会、2022)をダシに、経済学そのものが抱える問題について、以下の構成で考察する。 ・自然科学の体裁としての数式・モデル ・現実との乖離の埋め方 ・経済学の何が問題か ・経済学のうさんくささ、クルーグマンは知っていた ・もし経済学者が馬だったら ・行動経済学の罪 ・経済学者への処方箋 ・経済学者は謝ったら死ぬのか 自然科学のフリをする経済学 例えば、経済学者が説明するグラフやモデルだ。 数式やパラメーターが出てくるので、自然科学の体(てい)を成しているように見える。パラメーターを

                                        経済学はどこまで信用できるのか『経済学のどこが問題なのか』
                                      • 早川書房の某著著者、James Lindsayのユダヤ人差別が尋常じゃないので記事にしてみた―"文化的マルクス主義陰謀論"とは?|アズロのデンジャラスゾーン

                                        (2023年1月20日、一部表現を推敲しました。) 〈白人至上主義者、ナチス、大量銃殺事件、差別など、刺激の強い内容です。必要に応じて読むのをお控えください。〉 アメリカの右派内での反ユダヤ主義的な論調は、ここ数年で勢いを増し続けています。特に(保守)共和党の議員は、"Globalist""International Banks"といった表現で、遠回しにユダヤ人を示唆する、ということをしています。(こうした隠れた差別表現のことを犬笛と呼びます。)ユダヤ系のジョージ・ソロス氏を、社会運動の黒幕だと主張することなどもそうです。ドナルド・トランプでさえこうした発言を行っています。(https://www.heyalma.com/a-list-of-antisemitic-dogwhistles-used-by-donald-trump/) こうした動きは、ナチスなどを敬愛する、オルト・ライト(ほ

                                          早川書房の某著著者、James Lindsayのユダヤ人差別が尋常じゃないので記事にしてみた―"文化的マルクス主義陰謀論"とは?|アズロのデンジャラスゾーン
                                        • 「ロシアのインターネットからの排除」要請に関するICANNからウクライナ副首相への回答 | p2ptk[.]org

                                          「ロシアのインターネットからの排除」要請に関するICANNからウクライナ副首相への回答投稿者: heatwave_p2p 投稿日: 2022/3/112022/3/11 2022年3月2日 副首相兼デジタル・トランスフォーメーション担当大臣 ムィハーイロ・フョードロフ 親愛なる副首相 2022年2月28日にいただいたご要望に返答するために、この書簡をしたためております。まず、この紛争の渦中にある貴国国民の幸福について、個人的な懸念を表明させてください。ICANNとそのグローバルコミュニティは、貴国の痛ましい犠牲を認識し、憂慮しております。 貴殿はICANNに対し、ロシア国内で運営されている特定の国別コードトップレベルドメインの取り消し、それらドメイン内で発行されたSSL証明書の取り消し、およびロシアのルートサーバサブセットの停止により、ロシアのインターネットへのアクセスを制限するよう要請し

                                            「ロシアのインターネットからの排除」要請に関するICANNからウクライナ副首相への回答 | p2ptk[.]org
                                          • 子供にアプリを作る - cockscomblog?

                                            3歳の息子にiPad Proを与えている。2018年の11インチのiPad Proで、僕のお下がりだ。Apple Pencilも与えてあるが、こちらは1歳になったばかりの娘が狙っているため、恐れた息子はApple Pencilをなるべく片付けておく。 自由に使っていい iPad Proを与えたからといって、3歳の息子がそれで何か大層なことをするということはない。退屈なときにYouTube Kidsで何かを見ていることが多い。ときどきGarageBandとiRig Keys 2で音を出して遊んだり、ProcreateとApple Pencilで謎の絵を描いたりしている。こういうのは大人も一緒にやってあげると喜ぶ。Smart Keyboardをくっつけて「ブログを書いてる」と宣ったりもする。あとは週末に祖父母とFaceTimeをする。 とにかくiPadを自由に使わせている。自由に使えない道具に

                                              子供にアプリを作る - cockscomblog?
                                            • WEB開発に役に立つAPI一覧+API毎に関連するQiita記事を分類 ! - Qiita

                                              前回: Qiita APIで記事からYoutube動画を集めてみた 🎬 、Qiita APIを使って、Qiita記事を取得してYoutube動画のURLを抽出することができました。 今回は、特定APIに関連したQiita記事を取得して、API毎に分類、タグを集計してドーナツグラフ化することでAPIの特徴を表してみました。 最新のAPI一覧はこちら API一覧 | DOGAKIITAA! ~ APIごとにQiita記事を分類 ~ Google系 Cloud Vision API https://cloud.google.com/vision/docs/quickstart 📝 機械学習を使用して画像を解析します。画像ラベリング、顔やランドマークの検出、光学式文字認識(OCR)、不適切なコンテンツへのタグ付けなどができます。 Cloud Vision APIの凄さを伝えるべくRasPi b

                                                WEB開発に役に立つAPI一覧+API毎に関連するQiita記事を分類 ! - Qiita
                                              • “ゆっくりボイス”でお馴染みの「SofTalk」から、ゆっくりボイスが消える。ライセンスとフリーソフトの複雑な関係 - AUTOMATON

                                                国内のソフトウェア個人開発者であるCNCC氏は7月23日、音声読み上げソフト「SofTalk」において、音声合成ミドルウェア「AquesTalk」への対応を中止することを発表した。また、同氏はしばらくSofTalkの開発自体を休止する意向を示している。 「SofTalk」は、CNCC氏が開発する音声読み上げフリーソフトウェア。テキストを入力すると合成音声を出力してくれる仕組みで、実況動画の音声などに広く用いられてきた。代表的なのは、一頭身化された「東方Project」キャラクターが掛け合いを繰り広げる動画での利用。いわゆる「ゆっくりボイス」だろう。同ソフトは複数の合成音声ライブラリに対応しており、ユーザー側で切り替えが可能。ライブラリの種類で声質も変化する。ゆっくりボイスとして認知されている声は、国内企業AQUEST(アクエスト)が開発する音声合成ミドルウェア「AquesTalk」シリーズ

                                                  “ゆっくりボイス”でお馴染みの「SofTalk」から、ゆっくりボイスが消える。ライセンスとフリーソフトの複雑な関係 - AUTOMATON
                                                • 作家の竹田恒泰氏の講演、妨害予告で中止 富山・朝日町:朝日新聞デジタル

                                                  富山県朝日町教育委員会は11日、町内で13日に開催予定だった作家の竹田恒泰氏の講演を中止すると発表した。開催を妨害するとの予告連絡があり、会場の安全確保に支障があると判断したという。 予定では、町立朝日中学と県立泊高校の生徒らの活動発表の後に、「日本はなぜ世界でいちばん人気があるのか」とのテーマで竹田氏が講演することになっていた。町によると、先週から竹田氏の講演に対する意見が電話やメールで多い日には数十件届いた。10日には妨害を予告する連絡があった。活動発表は会場を変更して行うという。 ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- B

                                                    作家の竹田恒泰氏の講演、妨害予告で中止 富山・朝日町:朝日新聞デジタル
                                                  • 【2023年版】キャンセル・カルチャーのなにが問題か - 道徳的動物日記

                                                    (6/14追記:トークイベントをやりましたのでよかったら視聴(※チケット購入)してください) #左からのキャンセル・カルチャー論 無事終了!!🙌 あいちトリエンナーレの件から 小山田圭吾事件、あらゆる差別問題… 様々な角度から “キャンセル・カルチャー”に ついて議論しました🤔 (たっぷり150分!!) アーカイブ6/27まで残ります ぜひご視聴ください👀https://t.co/0kDi3cqSHb pic.twitter.com/H8Mtb9ZCOA — 阿佐ヶ谷ロフトA (@AsagayaLoftA) 2023年6月13日 twitcasting.tv www.loft-prj.co.jp 本日開催の「左からのキャンセル・カルチャー論」に備えた、要約・メモ的な記事。もっと早く書きたかったんだけど、開催数時間前とかなりギリギリの公開になってしまった。 1・(法律的な)手続きを無視

                                                      【2023年版】キャンセル・カルチャーのなにが問題か - 道徳的動物日記
                                                    • Twitterはいよいよ限界?もう引っ越ししかない?2023年のSNSとの付き合い方を考える|FINDERS

                                                      CULTURE | 2023/01/03 Twitterはいよいよ限界?もう引っ越ししかない?2023年のSNSとの付き合い方を考える Photo by Shutterstock 【連載】幻想と創造の大国、アメリカ(32) 渡辺由佳里 Yukari... 渡辺由佳里 Yukari Watanabe Scott エッセイスト、洋書レビュアー、翻訳家、マーケティング・ストラテジー会社共同経営者 兵庫県生まれ。多くの職を体験し、東京で外資系医療用装具会社勤務後、香港を経て1995年よりアメリカに移住。2001年に小説『ノーティアーズ』で小説新潮長篇新人賞受賞。翌年『神たちの誤算』(共に新潮社刊)を発表。『ジャンル別 洋書ベスト500』(コスモピア)、『トランプがはじめた21世紀の南北戦争』(晶文社)など著書多数。翻訳書には糸井重里氏監修の『グレイトフル・デッドにマーケティングを学ぶ』(日経ビジネ

                                                        Twitterはいよいよ限界?もう引っ越ししかない?2023年のSNSとの付き合い方を考える|FINDERS
                                                      • Introducing ChatGPT and Whisper APIs

                                                        Developers can now integrate ChatGPT and Whisper models into their apps and products through our API. ChatGPT and Whisper models are now available on our API, giving developers access to cutting-edge language (not just chat!) and speech-to-text capabilities. Through a series of system-wide optimizations, we’ve achieved 90% cost reduction for ChatGPT since December; we’re now passing through those

                                                          Introducing ChatGPT and Whisper APIs
                                                        • 2022年の深層学習ハイライト - Qiita

                                                          はじめに 2023年になって日が経ってしまいましたが、今年も深層学習の個人的ハイライトをまとめたいと思います。今回は研究論文5本と応用事例4つを紹介します。他におもしろいトピックがあれば、ぜひコメントなどで教えて下さい。 AIの研究動向に関心のある方には、ステート・オブ・AIガイドの素晴らしい年間レビューもおすすめします。また、私が過去に書いた記事(2021年、2020年、2019年)もよろしければご覧ください。 * 本記事は、私のブログにて英語で書いた記事を翻訳し、適宜加筆修正したものです。元記事の方も拡散いただけると励みになります。 ** 記事中の画像は、ことわりのない限り対象論文からの引用です。 研究論文 Block-NeRF: Scalable Large Scene Neural View Synthesis 著者: Matthew Tancik, Vincent Casser,

                                                            2022年の深層学習ハイライト - Qiita
                                                          • 「OK」って何の略か知ってる?【2023年回顧】

                                                            日本語でもたくさんの言葉が略されるように、英語もたくさんの略語で溢れている。その中には「OMG」(Oh My God)や「VIP」(Very Important Person)のように明らかなものもあるが、日常的に使っているのに何の略かあまり知られていない言葉もある。 例えば、「a.m.」や「p.m.」が何の略語か聞かれても、答えられない人も多いだろう。(ラテン語で「正午前」を意味するante meridiemと「正午後」を意味するpost meridiemの略だ) では、多くの人が1日に何度も使う「OK」という言葉はどうだろう?何の略語か、あなたはご存知か? 私たちは通常、同意、合意、受諾を意味するためにOKを使う。また、形容詞や副詞として何かが十分であることを示唆したり、動詞や名詞として承認や許可を表したりもする。 OKは今や、日本も含め、世界中の数えきれないほどの言語で使われている。

                                                              「OK」って何の略か知ってる?【2023年回顧】
                                                            • 2019-nCoVについてのメモとリンク

                                                              リンク集目次 国内外の状況 政府機関・国際機関等 学術情報 疫学論文 分子生物学/ウイルス学論文 臨床論文 インフォデミック関係 ワクチン関係 変異株関係 時系列メモ目次 新型コロナウイルス(2020年1月6日,11日) インペリグループによる患者数推定(2020年1月18日) 患者数急増,西浦さんたちの論文(2020年1月20日,23日) WHOはPHEIC宣言せず(2020年1月23-24日) 絶対リスクと相対リスク(2020年1月26日) 研究ラッシュが起こるかも(2020年1月27日) なぜ新感染症でなく指定感染症なのか? なぜ厚労省令でなく閣議決定なのか?(2020年1月27日) コロナウイルスに対する個人防御(2020年1月27日) 国内ヒト=ヒト感染発生(2020年1月28日) フォローアップセンター設置,緊急避難等(2020年1月29日) PHEICの宣言(2020年1月3

                                                              • 心の中の声が聴こえない?「無内言症」とその影響 - ナゾロジー

                                                                「内なる声」なしで生きる人々がいる内なる声、または内言(inner speech)は、私たちが心の中で行う自己対話のことを指し、他人とコミュニケーションをとるために発する言葉は「外言」として区別されています。 マンガにおいては「吹き出し」として表記される言葉が外言、心の声(モノローグ)として記載される部分が内言と言えるでしょう。 認知科学において内言は計画、問題解決、自己反省、感情の調整など、多くの認知活動に関与し、私たちが日常生活で意思決定を行い、感情を整理し、社会的状況に適応するのを助けてくれていると考えられています。 また、外国語をコミュニケーションに使用するためには、一定期間内なる声を用いて練習する必要があり、この内なる声が効果的に使えるようになって初めて、第二言語の習得が進むと言われています。 これまでの内なる声に関する研究でも、内なる声は前頭前野と側頭葉の特定の領域で生成される

                                                                  心の中の声が聴こえない?「無内言症」とその影響 - ナゾロジー
                                                                • ブラウザ上で3Dキャラクターと会話できる「ChatVRM」をオープンソースで公開しました - pixiv inside

                                                                  こんにちは、VRoid部のkeshigomuです。 普段は主にVRoid Hubのフロントエンドエンジニアとして、3Dキャラクターを表示するビューワーの開発に携わっています。また@pixiv/three-vrmという、Web上で3Dモデルを使ったコンテンツを開発するためのOSSライブラリの運用も行っています。 今回、ブラウザで簡単に3Dキャラクターと会話できる技術デモ「ChatVRM」とそのコードをオープンソースで公開しました。 「ChatVRM」は、テキスト・口頭で話しかけた言葉にキャラクターがフルボイスで回答してくれる「キャラクターと会話できる」デモです。WEBブラウザ上で動作でき、3Dキャラクターのインポート・切り替え、キャラクターに併せて声を調整することもできます。 (2023/07/10追記) 読み上げ音声の生成に使用していたKoeiro APIの提供終了に伴い、以前のデモとコー

                                                                    ブラウザ上で3Dキャラクターと会話できる「ChatVRM」をオープンソースで公開しました - pixiv inside
                                                                  • writeout.ai

                                                                    Transcribe and translate any audio file. Upload your audio file and get a transcript in seconds. Writeout.ai is a free online transcription service.

                                                                      writeout.ai
                                                                    • 商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生|DTMステーション

                                                                      ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語でテキストを入力すると、非常にリアルで自然な声で、そして高音質なサウンドで喋り声が生成されることです。VOICEPEAKやVOICEVOX、A.I.Voice、CoeFont……などなど、ここ数年で急速に進化し、数々のソフトが出てきたTTS=Text to Speech(音声読み上げソフト)の世界にSOUND FORGEが殴り込みをかけてきた格好です。しかも単なるTTSに留まらず、翻訳機能も搭載。これによって最大100言語へ翻訳して喋らせることも可能になっているため、グローバルなコンテンツ制作も可能になっています。 さらにStoryblocksという音素

                                                                        商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生|DTMステーション
                                                                      • 五野井郁夫先生の『世界』論文「キャンセルカルチャーはデモクラシーを窒息させるのか」の出典なんかおかしい気がする | 江口某の不如意研究室

                                                                        毎日新聞での「キャンセルカルチャー」擁護記事で五野井郁夫先生という方が話題になっていたので、その記事の元ネタらしき『世界』2023年6月号の五野井郁夫「キャンセルカルチャーはデモクラシーを窒息させるのか」という論文をめくってみました。『世界』とかのいわゆる論壇・総合雑誌に載ってる文章こそ「論文」だっていう感じがありますよね。重大な社会的問題を論じるのだ!って感じ。 さてこの文章いろいろ問題があると思いました。いちいち書けないのですが、奴隷商エドワード・コルストンやレオポルド二世の像なんかが「21世紀の公共空間には不要」で「芸術的価値や資料的価値をことさらに強調したいのであれば、人目につかない倉庫で保管すればよいだけの話」であり、「大っぴらに他者を傷つけたいとの願望は自身の脳内に収めて」おけ、といった文章には驚きましたが、それより次の文章ですね。 思想信条の自由とは、J・S・ミルが『自由論』

                                                                        • 月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita

                                                                          何をした? Youtube上に公開されている動画の音声から、ディープラーニング技術を用いた音声合成ツールを構築しました。 今回対象にしたのは、バーチャルユーチューバー・にじさんじの委員長こと 月ノ美兎 さん(Youtubeチャンネル) です。 ※選出理由は、単純に私がYoutube上で一番推している方だからです。 成果 動画から抽出した音声と、音声を文章に起こしたテキストの組み合わせのデータセット約50分ぶんを教師データとして学習した結果 ※学習に必要なデータ量は最低でも1時間程度と言われているので、まだまだ足りていません… 月ノ美兎さんの音声合成ツールを作ってみた https://t.co/YVdWW9vREb via @YouTube — K2 (@K2ML2) May 29, 2020 発話内容が不明瞭な箇所がありますが、一応ご本人の声に近い音声を作成することができているかと思います

                                                                            月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita
                                                                          • YouTuberが4chanでAIを訓練して「ヘイトスピーチマシン」を生み出しネットに放流してしまう、AI研究者は困惑と懸念を表明

                                                                            世界最大規模の画像掲示板である4chanは、多くの匿名ユーザーによりサブカルチャーから政治まで幅広いトピックの会話が交わされていますが、比較的検閲が緩いため過激な言論やヘイトスピーチの温床にもなっています。YouTuberのYannic Kilcher氏が、4chanの中でも特に物議を醸す「/pol/(Politically Incorrect板、政治的非中立/政治的に正しくない/非ポリコレ板)」から抽出した330万件のスレッドで訓練したAI「GPT-4chan」を作ったところ、過激で人種差別的な発言をまき散らす「ヘイトスピーチマシン」が誕生してしまったとのことです。 This is the worst AI ever - YouTube AI Trained on 4Chan Becomes ‘Hate Speech Machine’ https://www.vice.com/en/ar

                                                                              YouTuberが4chanでAIを訓練して「ヘイトスピーチマシン」を生み出しネットに放流してしまう、AI研究者は困惑と懸念を表明
                                                                            • マスク氏がTwitterのCEOとCFOを解雇、「Twitterを参加自由の地獄絵図にはしない」と言論に制限を設ける構え

                                                                              Twitterのパラグ・アグラワルCEOとネッド・シーガルCFO(最高財務責任者)が会社を去ったと、CNBCが報じました。 Elon Musk now in charge of Twitter, CEO and CFO have left, sources say https://www.cnbc.com/2022/10/27/elon-musk-now-in-charge-of-twitter-ceo-and-cfo-have-left-sources-say.html Elon Musk: Twitter won't become "a free-for-all hellscape" https://www.axios.com/2022/10/27/elon-musk-twitter-free-speech-advertisers CNBCのニュースアナリストであるデビッド・フェイバー

                                                                                マスク氏がTwitterのCEOとCFOを解雇、「Twitterを参加自由の地獄絵図にはしない」と言論に制限を設ける構え
                                                                              • 「現時点で完全回復の予定なし」 Google Cloudのパリリージョンで障害 データセンター浸水 発生から27時間

                                                                                クラウドサービス「Google Cloud」のパリリージョン(europe-west9)で、4月26日午前11時ごろ(日本時間)から障害が発生している。データセンターに水が浸入したといい、一部のサービスを除いて27日午後3時41分時点で障害が続いている。障害は長引く見込みで「現時点では、リージョンの運用が完全に回復する予定はない」(米Google Cloud)としている。 仮想マシンを立ち上げる「Google Compute Engine」(GCE)、ストレージサービス「Google Cloud Storage」(GCS)、音声認識サービス「Speech-to-Text」など複数のサービスが影響を受けた。このうちGCSなど4サービスはリージョン全体で復旧済み。GCEなど3サービスはリージョン内の一部ゾーンで復旧したという。 ただし、他のサービスは障害の影響が続いている。Google Clo

                                                                                  「現時点で完全回復の予定なし」 Google Cloudのパリリージョンで障害 データセンター浸水 発生から27時間
                                                                                • 俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ

                                                                                  こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。 麻雀を始めるときに一番の障壁になるのは点数計算ではないでしょうか? 特に符計算が初心者の関門のようです。一方私のような初中級者でも突然のレアな点数申告にまごつくことがあります。 そこで、今回はその人に合った麻雀の点数計算問題(主に符計算が焦点となる問題)を生成して、自分で点数計算&点数申告の練習をする方法を探求したのでその紹介をします。麻雀用語が少しだけ登場するので、対象読者は麻雀を少しでもかじったことのあるエンジニアの方です。 Overview 麻雀の点数計算の難しさ 現状の点数計算の練習

                                                                                    俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ