並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 2602件

新着順 人気順

speechの検索結果1 - 40 件 / 2602件

  • 令和5年度東京大学学部入学式 祝辞(グローバルファンド 保健システム及びパンデミック対策部長 馬渕 俊介 様) | 東京大学

    新入生の皆さん、そしてご家族、ご親族の皆さま、おめでとうございます。 私自身も東大の卒業生ですので、入学時の受験戦争からの解放感、新しい学生生活を始めるわくわく感は、今もよく覚えています。 長い受験勉強が終わって、ついに自由。たくさん遊んで、恋人作って、ガンガンやっていいと思います。 同時に、大学の4年間は、「自分で創り、自分で切り拓く、自分の人生」のスタート地点です。そしてこれからの皆さんの人生の中で、一番自由に、自分の器を広げ、自分の夢を探して突き進める時期でもあります。 私は東大卒業後、発展途上国を日本の立場から支援する国際協力機構JICA、民間の経営コンサルティング会社のマッキンゼーの日本オフィスと南アフリカオフィス、世界銀行、それからビル・ゲイツがマイクロソフトを辞めて、途上国の保健医療の問題を解決するために作ったゲイツ財団で、世界の貧困や感染症に立ち向かう仕事をやってきました。

      令和5年度東京大学学部入学式 祝辞(グローバルファンド 保健システム及びパンデミック対策部長 馬渕 俊介 様) | 東京大学
    • 【英会話独学】英語学習ロードマップ 第二言語習得研究と行動科学に基づく英語を話す方法 - ポリグロットライフ | 言語まなび∞ラボ

      はじめに 今回は英語を話す方法の完全英語学習ロードマップを丁寧に解説していきます。私の第二言語習得研究の知見と行動科学(私自身の語学学習の経験を観察して得られた実証結果・多言語話者に取材をして気づいた彼らに共通した行動の特徴)に基づく学習マップを始めから丁寧に解説していきます。英会話の完全独学ができますので、今回のブログをしっかり理解して英語を話せるようになりましょう。 「ポリィの英語講義」というYoutubeチャンネルも開設致しましたので、ぜひこちらもチェックしみてください。こちらのチャンネルでは、今後英語学習ロードマップの実践動画をアップしていきたいと思います。 www.youtube.com 英語学習ロードマップ Phase1 学習方略に基づく学習計画(公開済み) Phase2 発音と単語で気づきを促す(公開済み) Phase3 浅い理解を深い理解に転換(公開済み) Phase4 英

        【英会話独学】英語学習ロードマップ 第二言語習得研究と行動科学に基づく英語を話す方法 - ポリグロットライフ | 言語まなび∞ラボ
      • 村井純教授の1月16日最終講義全文書き起こし

        Ruby on Rails, Web Services, Software Development, Startups 概要 「日本のインターネットの父」と呼ばれる慶応大環境情報学部教授の村井純さん(64)が定年を迎え、16日、最終講義があった。村井さんは「インターネットに国境はない。国や政府が分断したり規制しようとしたりする試みは続くだろうが、若い人たちで守ってほしい」と呼びかけた。 https://www.asahi.com/ 村井先生の最終講義。16年ぶりに村井先生の講義を聞いて懐かしくなりました。せっかく良いことをたくさんおっしゃっていたので人力で書き起こしをしました。(Amazonウィッシュリスト) 講義全文 共同授業担当 佐藤特任准教授(以下教員): そろそろ始めましょうか。 村井: はい。それでは皆さん、こんにちは。インターネットの、2019年秋学期の最終回ということで集まっ

          村井純教授の1月16日最終講義全文書き起こし
        • AIにコードまるごと解説してもらうと、界王拳100倍すぎる件|深津 貴之 (fladdict)

          最近、見つけた技。知らない言語でコードかくときChatGPTが神すぎる。 そのテクはなんと「プログラミングまるごとを、ChatGPTに突っ込む」というもの。 え、そんなの動くの!? と思うんですが、動くんですそんなの。直球すぎて盲点だった。 試してみよう たとえば、下記はGoogleサービス使って、リアルタイムにマイク音声を文字起こしするサンプル。 こいつをチャットAIで音声会話をやろうと、軽く読んでみたのですが…うん、よくわからん。 Pythonだし、Streamingだし、音声の操作だし、普段つかわない技術が満載すぎてわからん。 雑にコードを突っ込むと人生が解決こういう時は 以下のコードを、わかりやすく説明して。 <以下、上記コードをそのままコピペ>とすると……  こうなる。 このコードは、Google Cloud Speech-to-Text APIを使用して、マイクからの音声をリア

            AIにコードまるごと解説してもらうと、界王拳100倍すぎる件|深津 貴之 (fladdict)
          • 【2020年】AWS全サービスまとめ | DevelopersIO

            このエントリは、2018年、2019年に公開したAWS全サービスまとめの2020年版です。これまではいくつかに分割して公開していましたが、1エントリにまとめてほしいという要望をもらっていたため、今年は1エントリに集約してみました。 こんにちは。サービスグループの武田です。 このエントリは、2018年、2019年に公開した AWS全サービスまとめの2020年版 です。これまではいくつかに分割して公開していましたが、1エントリにまとめてほしいという要望をもらっていたため、今年は1エントリに集約してみました。どちらがいいのか正直わからないので、フィードバックなどあれば参考にさせていただきます。 2020-01-08 リクエストがあったためAmazon Mechanical Turkを追加。 2018年まとめ 【2018年】AWS全サービスまとめ その1(コンピューティング、ストレージ、データベー

              【2020年】AWS全サービスまとめ | DevelopersIO
            • 《形容詞A if 形容詞B》の構造, awkwardの語義(バラク・オバマの回想録と時事通信の誤訳) - Hoarding Examples (英語例文等集積所)

              【後日追記】この件についてのエントリはカテゴリでまとめて一覧できるようにしてあります。【追記ここまで】 今回の実例は、予定を変更して、今日まさにTwitterで話題になっている件について。 米国のバラク・オバマ前大統領が回想録を出したとかで、今週は英語圏の各メディアでもロング・インタビューを出すなどしていた。BBCも(ドナルド・トランプがぎゃあぎゃあ言ってるのをよそに)オバマのインタビューをトップニュースにしていた。それがトップニュースになっているときのキャプチャは取っていないが、記事はこちら: www.bbc.com 回想録そのものについては、BBCに出てるのはこれだけかな: www.bbc.com ほかの媒体のサイトを見るなどすれば、回想録についての記事はたっぷり出てくるだろう。今回の本題はそれではない。 この回想録について、日本語圏でも日本語で「報道」がなされている。そして、その日本

                《形容詞A if 形容詞B》の構造, awkwardの語義(バラク・オバマの回想録と時事通信の誤訳) - Hoarding Examples (英語例文等集積所)
              • 小池百合子が「えー」を巧みに操っている - nomolkのブログ

                都知事選ではけっきょく小池百合子氏が圧勝した。 この結果が良かったか悪かったかという話はここではしない。とにかくテレビでニュースを見ていると投票終了の8時の時点でもう当選確実、続投が決まった小池百合子氏へのインタビューが流れていた。夕食を食べながらそれをなんとなく聴いていて、あることに気づいた。 小池百合子見てると「休業要請を、おー、行うかは、あー」みたいな感じで普通の人が「えー」を入れるところを前の音節の母音に合わせて変えてるんだけど、これ同時通訳の人とかにも見られる特徴的なしゃべり方で、キャスター時代に覚えた喋りのプロの技法なのかなと思う— メルセデスベン子 (@nomolk) 2020年7月5日 先に言っておくと、小池百合子氏が言葉によく詰まるとか、「えー」で話を引き延ばしがちだとかいうことは言っていない。(そういうreplyが多数来たが) 上記ツイート中の例文は140字の中で説明す

                  小池百合子が「えー」を巧みに操っている - nomolkのブログ
                • Rubyプログラマが中学校で情報モラル講演会をしてきたよ - give IT a try

                  はじめに 先日、Rubyプログラマが本職である僕が、なぜか地元・兵庫県西脇市の中学校で情報モラル教育に関する講演をしてきました。 このエントリではなんでそんなことになったのか、そしてどんなことを話したのか、といった話を書いていきます。 【もくじ】 はじめに 講演を依頼されたいきさつ 去年の情報モラル講演会は本当にひどかった 今年は誰かな〜? → えっ、僕!? 当日使用したスライド この講演で伝えたかったこと 「スマホやSNSは怖い」だけでは終わらせない トラブルに遭遇したら大人に頼る(一人で解決しようとしない) リスクを語るときは、必ず予防策と対処法をセットで伝える テクニカルな解決策(設定の変更等)は重視しない 大人だって失敗したり、ちゃんとできてなかったりすることを伝える 生徒さんたちの感想 その他の裏話等 「経験がない&時間がない」で、かなり準備が大変だった 信頼が置ける専門家の方た

                    Rubyプログラマが中学校で情報モラル講演会をしてきたよ - give IT a try
                  • 商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション

                    本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由

                      商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース|DTMステーション
                    • Python自然言語処理テクニック集【基礎編】

                      自分がよく使用する日本語自然言語処理のテンプレをまとめたものです。 主に自分でコピペして使う用にまとめたものですが、みなさんのお役に立てれば幸いです。 環境はPython3系、Google Colaboratory(Ubuntu)で動作確認しています。 Pythonの標準機能とpipで容易にインストールできるライブラリに限定しています。 機械学習、ディープラーニングは出てきません!テキストデータの前処理が中心です。 前処理系 大文字小文字 日本語のテキストにも英語が出てくることはあるので。 s = "Youmou" print(s.upper()) # YOUMOU print(s.lower()) # youmou 全角半角 日本語だとこちらのほうが大事。 全角半角変換のライブラリはいくつかありますが、自分はjaconv派。 MIT Licenseで利用可能です。 import jaco

                      • Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)

                        こんな簡単なコマンドで、Windowsは「しゃべって」くれる。画面キャプチャーでは声をお聞かせすることはできないが、お手元のWindows PowerShellで試してほしい スクリプトを作るとき、ちょっとユーザーの気を引きたくなることがある。たとえば、少し時間のかかる処理をするときに、終わったことを通知したい場合などだ。あるいは、実行後にすこし時間が経過してからエラーを通知するような場合にも、気を引きたくなることがある。 こんなとき昔のコンピューターならベル音やビープ音を鳴らすのが一般的だった。端末装置からコンピューターを使っていた頃、Ctrl+Gを出力するとベル音が鳴った。マイクロプロセッサが使われ始め、パソコンの原型ができあがった頃、BEEPと呼ばれる機能ができた。プログラムでビットをオンオフし、これをスピーカーに接続することで音を出していた。今もマザーボード上には、そのための小さな

                          Windows 10は好きな文章を合成音声で簡単に喋らせることができる (1/2)
                        • Assassination of Shinzo Abe

                          Assassination of Shinzo Abe Using video images and expert analysis, Reuters chronicles apparent lapses in Abe’s security and examines the possible motive of a killing that shocked a nation unused to gun crime. Former Prime Minister Shinzo Abe, the longest-serving leader in modern Japan, was fatally shot from close range during a campaign rally on July 8, two days before a parliamentary election. W

                            Assassination of Shinzo Abe
                          • 30分で完全理解するTransformerの世界

                            はじめに 初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。 深層学習界隈では、2017年に衝撃的なタイトル(Attention Is All You Need)の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transformer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。 今回はそんなTransformerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transformers に倣いつつ、適宜、2023年2月上旬現在ま

                              30分で完全理解するTransformerの世界
                            • イチロー、流暢な英語で5分間のスピーチ。「全選手に覚えてほしい」と語った野球の極意とは?(動画・全文)

                              イチロー、流暢な英語で5分間のスピーチ。「全選手に覚えてほしい」と語った野球の極意とは?(動画・全文)

                                イチロー、流暢な英語で5分間のスピーチ。「全選手に覚えてほしい」と語った野球の極意とは?(動画・全文)
                              • 高校生が作った有料サービスがちょっと儲かったのでいろいろ書く

                                Discordの有料読み上げBotを運営している高校3年生です。公開2年目で月に12kほど利益が出ています。 最大4つのボイスチャットで読み上げ可能 可用性99% Webダッシュボード などの機能があります。Discordを使っている方がいれば、ぜひ導入していただけるとうれしいです。 コミュニティの宣伝 未踏ジュニアに採択された採択者で、未踏ジュニアに挑戦したい方向けのコミュニティを始めました!約12人の採択者と話をしたり、質問できます!ぜひ共有していただけると幸いです🙏 なぜ作ることにしたのか? 昔(4年前)頃から無料のDiscordの読み上げBotは存在していましたが、どれも使う人数が多すぎて制限があったり、読み上げが遅くなったりするという問題がありました。そこで、有料の読み上げBotを運営することにしました。 料金体系 一律で月500円/20万文字のサブスクリプションにしました。g

                                  高校生が作った有料サービスがちょっと儲かったのでいろいろ書く
                                • 動画の雑音をほぼ消す技術、米国などのチームが開発 声のみが強調されすぎてアフレコみたいな結果に

                                  Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Dolby LaboratoriesとスペインのUniversitat Pompeu Fabraの研究チームが開発した「Universal Speech Enhancement With Score-based Diffusion」は、収録した映像のバックグラウンドノイズ(背景雑音)を強力に除去する技術だ。動画撮影した雑音を消し去り、話す声だけをくっきり残すことができる。強力すぎるため、映像がアフレコを挿入したみたいな仕上がりになってしまう。 実世界で録音した音声には必然的に背景の雑音や残響が含まれ、不快感や明瞭度の妨げになるためノイズ除去が行われる。最近では深層学習の登場によりノイズ除

                                    動画の雑音をほぼ消す技術、米国などのチームが開発 声のみが強調されすぎてアフレコみたいな結果に
                                  • AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場

                                    自分の声を美少女ボイスやイケメンボイスに変換してくれるボイスチェンジャーは、ライブ配信やムービー投稿の際にありがたい存在です。しかし、ボイスチェンジャーによって変換できる音声は固定されており、自分好みの音声に変換できるボイスチェンジャーを見つけるのは困難です。天王洲アイル氏は、この問題をAIを用いて解決する方法について解説し、さらにAIの力で自分の声を好みの声にリアルタイム変換できるボイスチェンジャー「MMVC」を公開しています。 VRChatなどの登場によって誰でも好きなアバターを使って好きなキャラクターになりきることが可能となりました。また、自分の声を美少女ボイスやイケメンボイスに変換できるボイスチェンジャーも多くの種類が存在しています。しかし、既存のボイスチェンジャーには「理想的な結果を得るためにはボイスチェンジャーに合わせた発声練習が必要」「リアルタイム変換が不可能なため、会話やラ

                                      AIの力で自分の声を好きな声にリアルタイム変換できるボイスチェンジャー「MMVC」が登場
                                    • イーロン・マスクがTwitter買ってからやったことまとめ

                                      イーロン・マスクがTwitter買ってからやったことまとめ2022.11.02 20:00205,229 satomi 洗面台もって水曜初出社のイーロン・マスク。 27日木曜深夜には買収が成立してツイートに、粛清に、マスコミ対応にと大忙しです。1週間の主な動きをまとめてみました。 トップを解任買収成立後真っ先にやったのがトップの解任です。具体的にはパラグ・アグラヴァル最高経営責任者(CEO)、ネド・シーガル最高財務責任者(CFO)、ショーン・エジェット最高法務責任者(GC)、ヴィジャヤ・ガッデ信頼&安全最高責任者が27日深夜のうちに一斉解任となりました。 ゴールデンパラシュート(巨額退職金)の金額については、 解任理由を明示することで計2億~6億ドル(約30億~89億円)もの巨額退職金の支払いを回避しようとしており、粛清された幹部たちが対抗手段を検討中です。 取締役会を解散してCEOに就任

                                        イーロン・マスクがTwitter買ってからやったことまとめ
                                      • 国会の「丁寧に説明」を可視化する - 日直地獄

                                        「丁寧に説明する」や「丁寧な説明を心がける」の印象がとにかく悪い。というのも、偉い人がこういうだけで、特に丁寧な説明が行われた試しがないと感じるからだ。誰も彼も「丁寧に説明」と言うだけで、それを履行しないというメソッドがはびこっている印象があるのだ。これをデータで確認したい。 「丁寧な説明」の運用と私が持っているイメージ データの作り方 「丁寧な説明」発言ダッシュボード 見どころ 与党は丁寧に説明しがち 第二次安倍政権は丁寧に説明しがち 安倍さんと岸田さん 「丁寧な説明」メソッドを発明したのは誰だったのか 注意事項 「丁寧な説明」の運用と私が持っているイメージ 最近もこういう感じで「丁寧な説明」が出現していた。 まあこれは組織として動け、みたいな観点での批判を入れたいのでちょっと違う気がするが、各議員から丁寧な説明がされてるとは感じない。 「丁寧な説明」というと安倍さんが連発していたイメー

                                          国会の「丁寧に説明」を可視化する - 日直地獄
                                        • This is The Entire Computer Science Curriculum in 1000 YouTube Videos

                                          This is The Entire Computer Science Curriculum in 1000 YouTube Videos In this article, we are going to create an entire Computer Science curriculum using only YouTube videos. The Computer Science curriculum is going to cover every skill essential for a Computer Science Engineer that has expertise in Artificial Intelligence and its subfields, like: Machine Learning, Deep Learning, Computer Vision,

                                            This is The Entire Computer Science Curriculum in 1000 YouTube Videos
                                          • SF界の文化戦争「パピーゲート事件」について - 100光年ダイアリー

                                            はじめに ヒューゴー賞についての基本 2013年――始まり 2014年――サッド・パピーズ2 2014年――ゲーマーゲートと「SJW」 2014年――「悪の同盟」とジョン・C・ライト 2015年――サッド・パピーズ3とラビッド・パピーズの登場 ヴォックス・デイについて 2013年――SFWA性差別論争とデイの除名 2015年――ヒューゴー賞最終候補への影響 2015年――「該当作なし」が続出した授賞式 2015年――アルフィー賞、木星賞、不時着賞 あるパピーの視点から 事件に対する評など その後のヒューゴー賞 ドラゴン賞 コミックスゲートとデイ キャンベル新人賞の改名 おわりに――SFF読者と作家の男女比など 謝辞 注釈に載せた以外の参照先 追記1 追記2 はじめに ケン・バーンサイド(Ken Burnside)によるエッセイ The Hot Equations: Thermodynami

                                              SF界の文化戦争「パピーゲート事件」について - 100光年ダイアリー
                                            • 【完全独学】中国語の話し方 第二言語習得研究を活かした中国語学習ロードマップ - ポリグロットライフ | 言語まなび∞ラボ

                                              はじめに 今回は中国語の話し方を紹介します。私がどうやって中国語を身につけたのか、第二言語習得研究を活かした中国語学習ロードマップを解説していきます。ぜひ注目されている中国語をマスターしてキャリアを広げていきましょう。 ↓↓こちらもぜひチャンネル登録お願いします www.youtube.com 第二言語習得研究で中国語を完全習得 第二言語習得研究とは 言語習得の仕組み 言語習得の4つのプロセス 言語知識の自動化 中国語の言語的特徴 形態論と語順 簡体字と繁体字 四声 拼音 難易度 発音 発音の落とし穴 四声&拼音 おすすめ発音テキスト 単語学習 セルフ音読はNG おすすめ単語学習テキスト キクタン中国語シリーズ 起きてから寝るまで中国語単語帳 HSK基本語彙 中国語文法 フレーズと単語を結合する中国語文法 細かい文法よりも伝わり方 仕上げとしてのパターンプラクティス おすすめ文法テキスト

                                                【完全独学】中国語の話し方 第二言語習得研究を活かした中国語学習ロードマップ - ポリグロットライフ | 言語まなび∞ラボ
                                              • ファミマ入店音の装置 パナソニックの「メロディサインW」EC5527W いつの間にか中身がリニューアルしてた件について - honeylab's blog

                                                てれれれれれーーん てれれれれーーん この音、わかりますよね。ファミマの入店音。 実は、ファミマの入店音ではなくて、パナソニックの「メロディサイン」という装置をファミマが導入しているため、この音がしているんです。 パナソニック メロディサイン 2種音 ホワイト 中 EC5227W パナソニック(Panasonic) Amazon 全く関係ないですが、ゆゆうたの才能が憎らしいです。 www.youtube.com で、この音を出してる機械、好きな人は好きなようで、自分で買って手元に置いて居たり、改造(サーキットベンディング)していろいろな音を出したりしてる人がいるほどなじみのある音で、実は機器の初回発売日はなんと 1980年! https://www2.panasonic.biz/scvb/a2A/opnItemDetail?contents_view_flg=1&item_cd=EC522

                                                  ファミマ入店音の装置 パナソニックの「メロディサインW」EC5527W いつの間にか中身がリニューアルしてた件について - honeylab's blog
                                                • 隣の部屋をミリ波で盗聴 防音の壁でも喉元の皮膚振動を捉え音声復元

                                                  Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 中国の浙江大学と米State University of New York at Buffaloによる研究チームが開発した「Wavesdropper: Through-wall Word Detection of Human Speech via Commercial mmWave Devices」は、ミリ波(mmWave)を用い、防音環境で守られている部屋内を外部から盗聴するシステムだ。被害者が発話した際の喉元付近の皮膚振動をミリ波で捉え、音声(単語)を復元する。 壁に防音材を配置すれば、音波の伝搬を利用した攻撃などからは守れるが、音源(例えば、人間の話者)からの直接漏えいを保証すること

                                                    隣の部屋をミリ波で盗聴 防音の壁でも喉元の皮膚振動を捉え音声復元
                                                  • 【2021年】AWS全サービスまとめ | DevelopersIO

                                                    こんにちは。サービスグループの武田です。このエントリは、2018年から公開しているAWS全サービスまとめの2021年版です。 こんにちは。サービスグループの武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2021年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2020年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 205個 です。 まとめるにあ

                                                      【2021年】AWS全サービスまとめ | DevelopersIO
                                                    • 「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売

                                                      「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売 インプレスグループでIT関連メディア事業を展開する株式会社インプレス(本社:東京都千代田区、代表取締役社長:小川 亨)は、「音源分離」技術の基礎から実装までを解説した書籍『Pythonで学ぶ音源分離 機械学習実践シリーズ』を2020年8月24日(月)に発売いたします。 ■身近なものにも活用される技術「音源分離」の基礎と実装を解説する一冊 近年、AIスピーカをはじめとした、人が話した音声を理解する音声認識システムがさまざまな場面で使われています。一般的に音声認識システムは、1人の声を聞き取ることを想定しており、聞きたい声以外の音が入ってきたときには、聞きたい声を正確に聞き取ることが難しくなります。「音源分離」とはこのようにさまざまな音が混ざった中から、欲しい音だけを抽出する技術で

                                                        「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売
                                                      • 【胸糞注意】アメリカでもっともリベラルなオハイオ大学を取材した結果

                                                        まうり塩🍊 FREEDOM OF SPEECH!!!!! @anaiscalico 今日は以前からずっと翻訳したかった動画を紹介。これは私には衝撃の動画だったんです、いろんな意味で。 かなり聞き取りづらく、悪口ばかりだし、複数人が同時に喋るので、翻訳は「意訳」がかなりあるという事をご了承下さい。雰囲気掴んで頂ければ十分です。 リベラルの姿を、とくとご覧あれ。 pic.twitter.com/GkEldNjfD2 2020-09-28 22:50:13 まうり塩🍊 FREEDOM OF SPEECH!!!!! @anaiscalico そして、長いです。全部で16本、36分。でもこの動画は最初から最後まで見てほしい。そして多分見たらあっという間です。 「人の選択を尊重しろ。人に寛容であれ。対話が大事」というリベラルの本性が剥き出しになっている動画です。気分が悪くなると思いますが、最後まで

                                                          【胸糞注意】アメリカでもっともリベラルなオハイオ大学を取材した結果
                                                        • How to implement Japanese full-text search in Elasticsearch

                                                          全文検索は一般的に知られていますが、検索エクスペリエンスで非常に重要な役割を果たしています。ただし、日本語など、一部の言語では、全文検索を実装するのが難しい場合があります。このブログでは、日本語で全文検索を実装する際の課題を探り、Elasticsearchでこれらの課題を解決する方法をいくつか示します。 全文検索とは? Wikipediaより、下記が定義となります。 全文検索とは、コンピュータにおいて、複数の文書(ファイル)から特定の文字列を検索すること。「ファイル名検索」や「単一ファイル内の文字列検索」と異なり、「複数文書にまたがって、文書に含まれる全文を対象とした検索」という意味で使用される。 全文検索は、現在多くのデジタル体験を強化するものです。全文検索は、データセット内に隠れている可能性のある単語やフレーズを見つけようとしてくれます。例えば、ネットショッピングして「phone」を検

                                                            How to implement Japanese full-text search in Elasticsearch
                                                          • 読書中に頭の中で「声」が聞こえるのは良いことなのか悪いことなのか?

                                                            小説やマンガなど物語を読んでいるときや、勉強のために難しい本を読んでいるときなど、口には出さなくても頭の中で文字を読み上げる「声」が聞こえるという人がいます。過去に行われた調査では、8割以上の人が「読書中に声が聞こえる」と主張していましたが、そもそも黙読しているのに頭の中で「声」が聞こえることが良いことなのか悪いことなのかという点について、心理学者が解説しています。 What is that voice in your head when you read? https://theconversation.com/what-is-that-voice-in-your-head-when-you-read-203379 2016年に発表された研究では、「読書中に文章を読み上げる声が頭の中で聞こえるかどうか」について英語圏最大のQ&Aサイトに2006年から2014年の間で寄せられた合計136件

                                                              読書中に頭の中で「声」が聞こえるのは良いことなのか悪いことなのか?
                                                            • デ・ニーロ、受賞スピーチを検閲されたとアップル非難。壇上で気付き「消された部分」を読み上げ喝采受ける | テクノエッジ TechnoEdge

                                                              ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 映画俳優のロバート・デ・ニーロ氏が、2023年度のゴッサム・インディペンデント映画賞の授賞式におけるスピーチに登壇した際、読み上げるスピーチ原稿から当初予定していた記述が削除されていたことに関して、アップルと映画賞主催者を非難しました。 問題のスピーチはゴッサム賞のなかの一部門を受賞した作品を紹介するため、デ・ニーロ氏が用意したものでした。 事前の原稿は冒頭部分で「前大統領は在任中の4年間に3万回以上も嘘をつき、現在の報復キャンペーンでもそのペースを維持しています。しかし、その嘘の数々をもってしても、その本心を隠すことはできません。弱者を叩き、自然の恵みを破壊し、例えば『ポカホンタス』を差別的な言葉として使う

                                                                デ・ニーロ、受賞スピーチを検閲されたとアップル非難。壇上で気付き「消された部分」を読み上げ喝采受ける | テクノエッジ TechnoEdge
                                                              • OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能

                                                                画像生成AI「DALL・E 2」や文章生成AI「GPT-3」といった高性能AIを開発してきたAI開発組織のOpenAIが、新たに音声を超高精度で認識して文章に書き起こせるAI「Whisper」を発表しました。発表と同時に公開されたサンプルでは「早口のセールストーク」や「ハイテンポな曲の歌詞」などの音声でも問題なく文字起こしできる性能の高さが示されています。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper Whisperはインターネット上から収集された合計68万時間におよぶ音声データでトレーニングされた文字起こしAIです。OpenAIのブログ記事には「早口のセールストーク」「K-POPの曲」「フランス語」「独特なアクセン

                                                                  OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能
                                                                • 驚異の高精度AIリアルタイムボイチェン「RVC」で友人になりすまして本人と会話したときの反応(CloseBox) | テクノエッジ TechnoEdge

                                                                  高精度でリアルタイム処理も可能なAI声質変換ソフト(ボイスチェンジャー)「RVC」の記事が大変な反響を呼びました。Stable DiffusionやChatGPTなど生成系AIがメジャー化する中、世間からはそれほど大きな注目を浴びているわけではありませんが、音声AIも驚くべき速度で進化を遂げています。 AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge 記事中でデモとしてお聞かせしたのは、筆者の妻の歌声を高精度に再現するもので、それはこのソフトのおそらく最大の特徴を生かしたものではありません。そこで、また実験をしてみることにしました。 今回は、ポッドキャストbackspace.fmを10年近く一緒にやっている友人であるドリキンのAIモデルをRVCで作ってみました。 backsp

                                                                    驚異の高精度AIリアルタイムボイチェン「RVC」で友人になりすまして本人と会話したときの反応(CloseBox) | テクノエッジ TechnoEdge
                                                                  • フロントエンドコーディング時に便利なジェネレーターサイト(随時更新) - Qiita

                                                                    更新履歴 追加 2024/04/01 「Epic Easing」を掲載しました 2024/03/07 「Filter Blend」を掲載しました 2024/03/04 「Tooltips & Speech Bubbles」を掲載しました 2023 2023/07/04 「CSS Box Shadows Generator」を掲載しました 2023/06/29 「Regulex」を掲載しました 2023/04/05 「Colorable」を掲載しました 2023/03/09 「Scrollbar.app」を掲載しました 2022 2022/10/04 「CSS Shadow Palette Generator」を掲載しました 2022/09/07 「Wayback Machine」を掲載しました 2022/05/31 「Min-Max-Value Interpolation」を掲載しました

                                                                      フロントエンドコーディング時に便利なジェネレーターサイト(随時更新) - Qiita
                                                                    • CoeFont

                                                                      10,000種類以上の豊富な音声ナレーターやアナウンサー、声優、著名人など老若男女の幅広い音声を提供

                                                                        CoeFont
                                                                      • Elasticsearchで日本語検索を扱うためのマッピング定義 - ZOZO TECH BLOG

                                                                        こんにちは、検索基盤部 検索基盤ブロックの渡です。私は検索基盤ブロックで、主にZOZOTOWNの検索周りのシステム開発に従事しています。 以前の記事では、Elasticsearchのマッピング設定の最適化について取り上げました。そして、今回は日本語による形態素解析を実現するまでの手順をご紹介します。 techblog.zozo.com 目次 目次 はじめに Elasticsearchで全文検索を実現させる手順 全文検索のためのマッピング定義 Analyzerの構造 日本語対応のAnalyzer 日本語対応のためのプラグイン追加 kuromoji Analyzerを指定したマッピング定義の例 kuromojiプラグイン機能 カスタムしたAnalyzerのマッピング定義 Analyzerの動作確認 modeを選択した場合のマッピング定義の例 Analyzer適用の注意点 kuromoji以外の

                                                                          Elasticsearchで日本語検索を扱うためのマッピング定義 - ZOZO TECH BLOG
                                                                        • オンライン投票は現時点でも予見可能な未来でも「実現不可能」である | p2ptk[.]org

                                                                          先日投開票が行われた総選挙でデジタル権に関連した各党の公約をまとめていて、いわゆる「インターネット投票」や「オンライン投票」の実現を掲げる党が少なくないことに驚いた。私自身その実現を望んでいるが、これまでオンライン投票の実現を阻んできた種々の問題が解決したとは寡聞にして知らない。 2013年の公職選挙法改正で「ネット選挙」が解禁され、ネット上での選挙運動こそできるようにはなったが、候補者・政党への投票は現在も紙ベースで行われている。 確かに投票が自分のスマートフォンやパソコンからできればラクでいいし、遠隔地にいるだとか投票所まで行く負担が大きいという人にとっては非常にありがたいのもわかる。投票率の向上が見込めるので、有権者の声がより反映されることにもなるだろう。 だがメリットが大きい一方で、リスクはさらに大きい。一番に思いつくところでは、投票の秘密が守られないこと(その結果として生じる投票

                                                                            オンライン投票は現時点でも予見可能な未来でも「実現不可能」である | p2ptk[.]org
                                                                          • クレジットカード会社による経済的検閲を容認・歓迎してはならない | p2ptk[.]org

                                                                            Electronic Frontier Foundation Pornhubがユーザからアップロードされた膨大な動画を削除している。この措置は、Pornhubが未成年者や不同意女性の性的ビデオをホストしているとニューヨーク・タイムズ紙のコラムで批判された後に着手されたものだ。このタイムズ紙の記事を受けて、VisaとMastercardはPornhubとの関係を絶った。その結果、Pornhubは暗号通貨以外の決済方法を失うことになった。 性的搾取は、資源、教育、被害者支援、そして法の執行を必要とする社会的惨事である。だが、VisaとMastercardはこの問題に対応すべき当事者ではない。VisaとMastercardは、デジタルスピーチの複雑な問題を判断するスキルや専門知識を持ち合わせてはいないのだ。どのようなコンテンツがオンラインに存在すべきか、あるいはモデレーション・ポリシーが意図せず

                                                                              クレジットカード会社による経済的検閲を容認・歓迎してはならない | p2ptk[.]org
                                                                            • 音声だけで完全な長文が書ける技術、東大教授が開発 ささやき声で“改行”や“修正”などコマンドを入力

                                                                              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 ソニーコンピュータサイエンス研究所(CSL)フェロー・副所長であり東京大学大学院情報学環の暦本純一教授が開発した「DualVoice: A Speech Interaction Method Using Whisper-Voice as Commands」は、キーボードやマウスなどを使用せず、音声入力だけで長い文章が書ける技術だ。文字入力以外のコマンド入力と音声認識ミスによる修正は、通常の声とは別に「ささやき声」で操作する。通常の声とささやき声を使い分ける方法で、ハンズフリーの完全な音声入力を実現する。 音声による文字入力はタイピングに比べて格段に速いため、アイデアを書き留めたり、原稿を素

                                                                                音声だけで完全な長文が書ける技術、東大教授が開発 ささやき声で“改行”や“修正”などコマンドを入力
                                                                              • イーロン・マスクを社内Slackで批判した社員約20人がクビに、理由は「最近の行動は会社のポリシー違反」

                                                                                イーロン・マスクCEOのもと、大規模な人員整理が進むTwitterで、社内で用いられているSlackでマスクCEOを批判した社員約20名が「会社のポリシーに違反している」として解雇されたことがわかりました。 Scoop: another ~10 Twitter employees who made sassy or critical remarks about Twitter's current leadership on a Twitter internal Slack channel have been terminated overnight. Several were respected sw engineers. One person was told they are let go "for recent behaviour".— Gergely Orosz (@Gergely

                                                                                  イーロン・マスクを社内Slackで批判した社員約20人がクビに、理由は「最近の行動は会社のポリシー違反」
                                                                                • OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka

                                                                                  以下の記事が面白かったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。 開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

                                                                                    OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka