並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 26206件

新着順 人気順

speechの検索結果361 - 400 件 / 26206件

  • 【全文書き起こし】トヨタの章男社長が年頭挨拶で語ったこと コネクテッドシティ?AI自動運転?

    トヨタの豊田章男社長の年頭挨拶がYouTube動画で公開された。冒頭、静岡・東富士に建設する「コネクティッド・シティ」についての構想を紹介し、今後の自動運転をはじめとしたスマートシティへの取り組みについて熱く述べている。その年頭挨拶の全文を書き起こした。 ■「新しいモビリティの文化を作り上げていく時代」に皆さん、あけましておめでとうございます。本年もまた、健やかに新しい年を迎えることができましたこと、皆さんとともに喜びたいと思います。これもすべて、仕入先さん、販売店さんをはじめとするあらゆる取引先の皆さま、行政、地域社会の方々、すべての関係者の皆さま、そして何より、私たちの製品をご愛用いただいている世界中のお客様のおかげだと感謝しております。 さて、本日は「令和」の時代になって初めての年頭挨拶となります。「令和」には「人々が美しく心寄せ合う中で文化は花開く」という意味が込められていると聞き

      【全文書き起こし】トヨタの章男社長が年頭挨拶で語ったこと コネクテッドシティ?AI自動運転?
    • 著作権法は憲法修正第1条「匿名での言論保護」を覆すことはないと裁判所の判決が下る

      著作権侵害を理由に気に入らない匿名のインターネットユーザーを裁判所に呼び出そうとする要請に対し、「デジタルミレニアム著作権法(DMCA)は、アメリカ合衆国憲法修正第1条による『言論の自由保護』を無効にする効力はない」とカリフォルニア州の合衆国地方裁判所が判決を下しました。著作権侵害の疑いがあるユーザーの身元開示を求めた下級裁判官の判断を覆す判決となり、インターネットにおける匿名性での言論保護について重要な判決だと見られています。 In re DMCA Sec. 512(h) Subpoena to Twitter - Order Granting Motion to Quash | Electronic Frontier Foundation https://www.eff.org/document/re-dmca-sec-512h-subpoena-twitter-order-grant

        著作権法は憲法修正第1条「匿名での言論保護」を覆すことはないと裁判所の判決が下る
      • VALL-E

        Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers [Paper] Chengyi Wang*,   Sanyuan Chen*,   Yu Wu*,   Ziqiang Zhang,   Long Zhou,   Shujie Liu, Zhuo Chen,   Yanqing Liu,   Huaming Wang,   Jinyu Li,   Lei He,   Sheng Zhao,   Furu Wei Microsoft Abstract. We introduce a language modeling approach for text to speech synthesis (TTS). Specifically, we train a neural codec language m

        • Rustによる自然言語処理ツールの実装: 形態素解析器「sudachi.rs」 - Qiita

          2021-07-07 UPDATE: Sudachi公式チームへレポジトリを委譲しました。公式版が改めて公開される予定です (cf. https://github.com/WorksApplications/sudachi.rs, 日本語形態素解析器 SudachiPy の 現状と今後について - Speaker Deck) sorami/sudachi.rs - GitHub TL;DR 🍋 形態素解析器「Sudachi」の非公式Rust実装「sudachi.rs」をつくっている 🦀 自然言語処理ではPythonやJuliaが主流だが、一部のツールにはRustは良いかも 注: 著者は、Sudachiの開発元であるワークス徳島人工知能NLP研究所に所属していますが、「sudachi.rs」は個人的にRustの勉強を兼ねて作っている趣味プロダクトです。 🍋 形態素解析器「Sudachi

            Rustによる自然言語処理ツールの実装: 形態素解析器「sudachi.rs」 - Qiita
          • GitHub - flashlight/flashlight: A C++ standalone library for machine learning

            Flashlight is a fast, flexible machine learning library written entirely in C++ from the Facebook AI Research and the creators of Torch, TensorFlow, Eigen and Deep Speech. Its core features include: Total internal modifiability including internal APIs for tensor computation. A small footprint, with the core clocking in at under 10 MB and 20k lines of C++. High-performance defaults featuring just-i

              GitHub - flashlight/flashlight: A C++ standalone library for machine learning
            • Twitterと相互運用性:巨大プラットフォームではなくインターネットを修正せよ | p2ptk[.]org

              Twitterと相互運用性:巨大プラットフォームではなくインターネットを修正せよ投稿者: heatwave_p2p 投稿日: 2021/2/112021/2/11 Electronic Frontier Foundation 2019年の終わりに、Twitterのジャック・ドーシーCEOは、“Project Blue Sky”を打ち出した。これは、Twitterシステムに参加するユーザ(ないしユーザの代理となるツール)に現在よりも強力なコントローラビリティを与える、相互運用化・連合化・標準化されたTwitterのプランであった。我々は興奮した。これが相互運用可能な分散型ソーシャルメディアの世界への大きな飛躍を意味していたからだ。特に、ドーシーがマイク・マズニックの優れた論文「Protocols, Not Products」を引用していることに興奮が止まらなかった。 あれから1年以上が経ち、

                Twitterと相互運用性:巨大プラットフォームではなくインターネットを修正せよ | p2ptk[.]org
              • リアルな人間っぽい合成音声を生成するAI 「えー」「あぁ」「うん」なども再現 YouTubeやPodcastで学習

                Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 米カーネギーメロン大学に所属する研究者らが発表した論文「A Vector Quantized Approach for Text to Speech Synthesis on Real-World Spontaneous Speech」は、より人間に近い会話の音声合成を生成できる学習モデルを提案した研究報告である。 テキストから音声合成を生成するText-to-Speech(TTS)システムは、合成した音声の品質を大幅に向上させた。しかし、TTSシステムのトレーニングに使用する標準コーパスは、ほとんどの場合、制御された環境で録音した読み上げや演技の音声

                  リアルな人間っぽい合成音声を生成するAI 「えー」「あぁ」「うん」なども再現 YouTubeやPodcastで学習
                • ディクトグロスとは?  おすすめの教材やアプリ・やり方も丁寧に解説 英語学習の効果とは? - ポリグロットライフ | 言語まなび∞ラボ

                  はじめに 今回はディクトグロスについて考えていきます。まずはディクトグロスの言葉の定義やディクテーションとの違いを確認し、実践方法を丁寧に解説していきます。実はディクトグロスを実践することでバランスの取れたリスニングをすることができるようになり、知識を浅い理解から深い理解に転換させてくれます。英語学習への高い効果が期待できるので、ぜひディクトグロスに挑戦してみてください。 ディクトグロスとは? 言葉の定義・意味 ディクテーションとの違いは? ディクトグロスの英語学習の効果 リスニング過程モデル 浅い理解から深い理解へ変換 ディクトグロスのやり方(4ステップ) Preparation(準備) Dictation(書き取り) Reconstruction(再構築) Analysis(分析) ディクトグロスにおすすめの教材やアプリ News in Levels(初級者向け) BBC Learni

                    ディクトグロスとは?  おすすめの教材やアプリ・やり方も丁寧に解説 英語学習の効果とは? - ポリグロットライフ | 言語まなび∞ラボ
                  • 【re-Imagination】まだ山上の安部暗殺事件はテロじゃないっていってるアホがい..

                    【re-Imagination】まだ山上の安部暗殺事件はテロじゃないっていってるアホがいる話以下の記事は過去記事になります。はてなー達よ!私は帰ってきた! 山上の安部暗殺事件はテロじゃないっていってるアホがいる話 https://anond.hatelabo.jp/20220910005727 続まだ山上の安部暗殺事件はテロじゃないっていってるアホがいる話 https://anond.hatelabo.jp/20220910153218 新まだ山上の安部暗殺事件はテロじゃないっていってるアホがいる話 https://anond.hatelabo.jp/20220911020227 最後のまだ山上の安部暗殺事件はテロじゃないっていってるアホがいる話 https://anond.hatelabo.jp/20220912010626 なんで一日も経たないうちにすぐ帰ってきたの?いやなんかブコメ読

                      【re-Imagination】まだ山上の安部暗殺事件はテロじゃないっていってるアホがい..
                    • イーロン・マスクが「Xの広告売上不振の原因はユダヤ人団体」だとして訴訟を起こすと脅迫

                      イーロン・マスク氏が2022年にX(当時はTwitter)を買収して以来、主要広告主の多くがXへの出稿を停止し同社の広告収入が低迷するなど、Xは主要な収益源である広告事業での苦戦が続いています。そんな中、CEOの職を退きXのCTO兼任取締役となったマスク氏が、広告収入の低迷の原因はユダヤ人団体であるとして、告訴を示唆する発言をXに投稿しました。 Elon Musk blames Anti-Defamation League for ad sales slump, threatens lawsuit https://www.axios.com/2023/09/04/elon-musk-anti-defamation-league-x-ad-sales-slump Elon Musk 'likes' trending #BanTheADL posts as white supremacist

                        イーロン・マスクが「Xの広告売上不振の原因はユダヤ人団体」だとして訴訟を起こすと脅迫
                      • ソフトウェア業界におけるパターン・ランゲージの受容についての覚書:「付録C」を待ちながら - こまぶろ

                        ※本稿はあくまで覚書です。大事なことなので本文にも書きました。筆者はアレグザンダーの著作を限られた範囲でしか読んでいないことを予め表明しておきます。また、XP やスクラムについても書籍で得られる知識しか持ち合わせていません。専門家によるアレグザンダーについての分析は長坂一郎『クリストファー・アレグザンダーの思考の軌跡―デザイン行為の意味を問う』を、ソフトウェア業界における受容についての分析は江渡浩一郎『パターン、Wiki、XP ―― 時を超えた創造の原則 WEB+DB PRESS plus』をそれぞれご参照することをお勧めします。 追記(最終更新:2020/05/10) 同様のテーマについての(個人的には重要な)記事を忘れていたのでリンクを記載しておきます。 上記記事で取り上げられているエヴァンスのDDDを本記事で取り上げられなかったことの反省文です。 関心が違うというのは間違いで、自分の

                          ソフトウェア業界におけるパターン・ランゲージの受容についての覚書:「付録C」を待ちながら - こまぶろ
                        • 40+ Modern Tutorials Covering All Aspects of Machine Learning - DataScienceCentral.com

                          Home » Uncategorized40+ Modern Tutorials Covering All Aspects of Machine Learning CapriGranville733December 10, 2019 at 3:30 am This list of lists contains books, notebooks, presentations, cheat sheets, and tutorials covering all aspects of data science, machine learning, deep learning, statistics, math, and more, with most documents featuring Python or R code and numerous illustrations or case st

                            40+ Modern Tutorials Covering All Aspects of Machine Learning - DataScienceCentral.com
                          • Meta、4000言語の話し言葉を理解する多言語LLM「MMS」をオープンソース化

                            米Metaは5月22日(現地時間)、4000以上の音声言語を識別できる多言語大規模言語モデル「Massively Multilingual Speech」(MMS)のモデルとを研究コミュニティにオープンソースで公開したと発表した。 MMSプロジェクトでは、自己教師あり学習モデルの「wav2vec 2.0」、1100以上のラベル付き言語データ、約4000のラベルなし言語データのデータセットを使ってモデルを構築したという。4000以上の音声言語識別は既存技術の40倍の能力だとしている。 言語の音声データ収集に当たっては、多くの言語に翻訳されている聖書などの宗教文書の音声録音を活用した。1100以上の言語で新約聖書の朗読のデータセットを作成することで、言語ごとに平均32時間のデータを用意した。 プロジェクトの詳細については公式ブログを参照されたい。 「われわれの目標は、人々が好きな言語で情報に簡

                              Meta、4000言語の話し言葉を理解する多言語LLM「MMS」をオープンソース化
                            • スマホで“口パク入力”を気軽にできるアプリ 東大とソニーCSLが「LipLearner」開発

                              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 東京大学とソニーコンピュータサイエンス研究所(CSL)に所属する研究者らが発表した論文「LipLearner: Customizable Silent Speech Interactions on Mobile Devices」は、口パク(無声発話)を検出し、スマートフォンの入力に使用できるモバイルアプリケーションを提案した研究報告である。 事前設定として、使用前にスマートフォンに声を出してコマンドを登録するところから始める。そして、電車などの公共の場でそのコマンドをスマートフォンに向かって無声発話すると、検出して指定した動きが発動する。

                                スマホで“口パク入力”を気軽にできるアプリ 東大とソニーCSLが「LipLearner」開発
                              • OpenAI Dev Dayで発表されたこと15選【プロンプトエンジニア必見 | 和訳 | まとめ】

                                Context Windowとは、「最大の入出力の合計トークン数」を表します。 たとえば、Context Windowが8Kの場合は、4Kのトークン数が入力された場合、出力は4Kのトークン数の長さに制限されます。 トークン数について詳しく知りたい方は、こちらをご参照ください。 ちなみに、128KのContext Windowは、PDF約300ページ以上のテキストに相当するため、かなり感動的ですね! これまで、プロンプトエンジニアの多くは、Context Windowの制約に悩まされていたと思います。 この技術的な問題に対応するために、RAGを使用したり、Map ReduceやMap RerankやRefineを使用したり、Fine-tuningを駆使したりしていたと思います。 それに加えて、GPT-4は、API利用料金がGPT-3.5に比べて、かなり高価格であることが問題としてありました。

                                  OpenAI Dev Dayで発表されたこと15選【プロンプトエンジニア必見 | 和訳 | まとめ】
                                • Using AI to compress audio files for quick and easy sharing

                                  Compression is an important part of the internet today, because it enables people to easily share high-quality photos, listen to audio messages, stream their favorite shows, and so much more. Even when using today’s state-of-the-art techniques, enjoying these rich multimedia experiences requires a speedy internet connection and plenty of storage space. For current and future experiences — like the

                                    Using AI to compress audio files for quick and easy sharing
                                  • イーロン・マスク Twitter買収 の「本当の狙い」なぜ彼は6兆円でTwitterを買ったか その理由を解説:秋山大志のそれとりあえず作ってみようか。:オルタナティブ・ブログ

                                    Twitterが10月末にイーロン・マスクに買収されてから約2週間が過ぎた。 CEOになったイーロン・マスク、早速幹部全員を首にし、11月4日には全従業員の7500人の半数を対象にしたリストラを敢行した。 もちろん、日本法人も例外ではなく、広報チームはチーム毎クビになったという話もある。 それだけの人間をクビにして会社が、サービスが回らなくなるのではないか?という心配を他所にTwitterのタイムラインは今日も以前と変わらずに流れている。 変わったところで気付いたところといえば、Twitterの検索タブにあったキュレーションコンテンツの更新が止まり、ここ数日でとうとう表示されなくなり、機械的に掲載できるトレンドキーワードやランキングのみの表示になったところや、シャドウバンのようなユーザーに見え難いペナルティが鳴りを潜めたことだ。 Twitter上では、クビになった人たちは本当に要らない人た

                                      イーロン・マスク Twitter買収 の「本当の狙い」なぜ彼は6兆円でTwitterを買ったか その理由を解説:秋山大志のそれとりあえず作ってみようか。:オルタナティブ・ブログ
                                    • 合成音声を使ってboard(SaaS)のチュートリアル動画を制作した話(VOICEPEAKとGoogle Cloud Text-to-Speech) - ヴェルク - IT起業の記録

                                      boardというSaaSのチュートリアル動画を合成音声を使って制作しているので、その話を書いていきます。 個別相談会のデモとチュートリアル動画 以前書いた board(SaaS)個別相談会の変遷 の中で少し触れたのですが、2021年に、個別相談会の中でやっていたデモをベースに、チュートリアル動画を制作しました。 個別相談会では、業務の流れに沿って基本的な操作を一通り説明していくデモを行っていたのですが、途中に質問が挟まることも多く、そうすると、全体で30〜40分ほどかかってしまうことも多くありました。 個別相談会は1時間枠なので、そのうち40分をデモで使うのは、時間の使い方としてもったいないなという課題感がありました。また、弊社は営業など外向けに活動するメンバーがいないため個別相談会はすべて僕がやっており、個別相談会を開催できる回数にも限りがありました。 一方で「お試しする前にとりあえずデ

                                        合成音声を使ってboard(SaaS)のチュートリアル動画を制作した話(VOICEPEAKとGoogle Cloud Text-to-Speech) - ヴェルク - IT起業の記録
                                      • 【英検1級二次試験スピーキング対策】面接で高得点を取るための学習方法【留学なしでも大丈夫】 - 崖っぷち舞台役者が婚活を始めたら英語がペラペラになりました

                                        こんにちは。 語彙問題編から始まった英検1級パート別対策記事も、ついにラストとなりました。今回は英検1級の最後の砦、二次試験のスピーキング編です。 先日からお知らせしているように、私、2019年第2回の英検1級において、一発合格を果たしました。しかも一次試験は英検バンド+12、二次試験は+3と、どちらも好成績で突破することができました。 英語学習を始めて4年、コツコツ頑張った成果が出て嬉しかったです! www.inspire-english.net www.inspire-english.net スピーキングテストで特に辛かったのは、2分間のスピーチです。英検1級というと、英語圏で生活していないと合格が難しいと思い込んでいらっしゃる方もいるようですが、そんなことはありません。わたしには留学や海外滞在の経験はありません。英語ではもちろん、日本語でもスピーチをしたことがなかったので、一次試験か

                                          【英検1級二次試験スピーキング対策】面接で高得点を取るための学習方法【留学なしでも大丈夫】 - 崖っぷち舞台役者が婚活を始めたら英語がペラペラになりました
                                        • グーグルがビデオ会議のイライラを解消、音声の途切れをAIで補完

                                          対面でのやり取りにビデオ通話を使う人が多くなった現在、接続が途切れ途切れになり、以前にも増してイライラさせられるようになった。そこで、個々の話者の話し方を模倣して発言のスニペット(断片)を生成し、小さな隙間を埋めることで、途切れをスムーズにしてくれる人工知能(AI)が登場した。グーグルのチームが開発したこのテクノロジーは現在、同社のビデオ通話アプリ「デュオ(Duo)」で使われている。 オンライン通話中、私たちの声はたくさんの小さな断片に切り刻まれ、パケットと呼ばれるデータブロックの形でインターネット上を通り抜けていく。パケットは多くの場合、相手方にごちゃごちゃになって到着するので、ソフトウェアでそれらを並べ替える必要がある。しかし、まったく届かないパケットもあり、それが原因で会話に不具合や途切れが生じる。これは通話状態がもっともよい時でさえ起こる。グーグルによると、デュオでの通話の99%で

                                            グーグルがビデオ会議のイライラを解消、音声の途切れをAIで補完
                                          • 「原神」の未公開情報をリークしたユーザーの情報開示をX(旧Twitter)が拒否

                                            人気オープンワールドRPG「原神」のアップデート情報を正式発表に先駆けてリークするユーザーについて、ゲーム運営元のCognosphereがX(旧Twitter)に対して情報開示請求したところ拒否されていたことがわかりました。両者は話し合いを行ったものの解決には至らず、裁判所での紛争解決手続きに入っています。 X Corp. Fights 'Genshin Impact' Subpoena, Defends Alleged Leakers' "Anonymous Speech" * TorrentFreak https://torrentfreak.com/x-corp-fights-genshin-impact-subpoena-defends-alleged-leakers-anonymous-speech-240123/ 「原神」は6週間に1回の大規模アップデートにより、新たなプレイア

                                              「原神」の未公開情報をリークしたユーザーの情報開示をX(旧Twitter)が拒否
                                            • Professional Machine Learning Engineer試験対策マニュアル - G-gen Tech Blog

                                              G-gen の佐々木です。当記事では Google Cloud(旧称 GCP)の認定資格の一つである、Professional Machine Learning Engineer 試験の対策や出題傾向について解説します。 基本的な情報 Professional Machine Learning Engineer とは 難易度 試験対策 機械学習の一般的な知識 代表的な機械学習アルゴリズム 評価指標 回帰問題における評価指標 分類問題における評価指標 ヒューリスティック 機械学習モデルの開発、運用における課題の解決 データの前処理 欠損値の処理 カテゴリカル変数の扱い 不均衡データの対策 過学習の対策 正則化 早期停止 トレーニングの改善 ハイパーパラメータの調整 トレーニング時間の改善 交差検証 モデルのモニタリングと改善 スキューとドリフト モデルの軽量化手法 Google Cloud

                                                Professional Machine Learning Engineer試験対策マニュアル - G-gen Tech Blog
                                              • セックスワーカー主導の決済プラットフォームが閉鎖へ、金融界から性産業界への風当たりはまだまだ強いことが判明

                                                アダルト業界の暗号通貨決済プラットフォーム「SpankPay」が、2023年3月20日に閉鎖することを発表しました。一般的な決済手段を使えないセックスワーカーのためのプラットフォームとして活用されていましたが、規制の高まりの中で継続していくことが困難になった旨が明らかにされています。 After a long and difficult consideration, we have decided to close down SpankPay, our crypto payment processor that we built as a safe haven for our community. Rest assured your money is safe and we’ll get it to you as soon as possible.— SpankPay (@SpankPay

                                                  セックスワーカー主導の決済プラットフォームが閉鎖へ、金融界から性産業界への風当たりはまだまだ強いことが判明
                                                • What developers need to know about generative AI

                                                  EngineeringEnterpriseOpen SourceWhat developers need to know about generative AIGenerative AI has been dominating the news lately—but what exactly is it? Here’s what you need to know, and what it means for developers. By now, you’ve heard of generative artificial intelligence (AI) tools like ChatGPT, DALL-E, and GitHub Copilot, among others. They’re gaining widespread interest thanks to the fact t

                                                    What developers need to know about generative AI
                                                  • WebKit Features in Safari 17.0

                                                    Sep 18, 2023 by Jen Simmons and the Safari / WebKit Team Today’s the day for Safari 17.0. It’s now available for iOS 17 and iPadOS 17. [Update September 26th] And now, Safari 17.0 is available for macOS Ventura, and macOS Monterey, and macOS Sonoma. Safari 17.0 is also available in the vision OS Simulator, where you can test your website by downloading the latest beta of Xcode 15, which supports t

                                                      WebKit Features in Safari 17.0
                                                    • 今スグ使える生きた英語!第8回【特盛回】英語ネイティブ頻出言い回し集 - 或る物書きの英語喉と小説まみれのジャズな日々

                                                      誰も教えてくれない「英語ネイティブスピーカーが普段よく使う言い回し」を、筆者MASAの100人を超えるネイティブとの交流経験を元にセレクトして紹介するシリーズだ。今回は3回分ぐらいの内容を詰め込んだ特盛回でもある。 イラスト:作 雪猫さん(ブログ仲間) Contents I'm like   ~ It's called ~ Let's extremely be able to ~ There is this 〜 For one to 〜 And ~ try to  ~ basically  ~ at least  ~ Suppose ~ ~ NOT ~ I'm  ~ing Maybe Sponsored Link Advertising I'm like   ~ 「私はこんな感じかな」と言って感想とかリアクションを言う・・・みたいな感じで、自分の感じてることや過去に感じたことを表現する場合

                                                        今スグ使える生きた英語!第8回【特盛回】英語ネイティブ頻出言い回し集 - 或る物書きの英語喉と小説まみれのジャズな日々
                                                      • Elon Musk on Twitter: "The Twitter Files on free speech suppression soon to be published on Twitter itself. The public deserves to know what really happened …"

                                                        The Twitter Files on free speech suppression soon to be published on Twitter itself. The public deserves to know what really happened …

                                                          Elon Musk on Twitter: "The Twitter Files on free speech suppression soon to be published on Twitter itself. The public deserves to know what really happened …"
                                                        • End-to-End 音声認識のレスポンスを高速化する最小遅延学習

                                                          ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは。音声認識技術の研究開発を担当している篠原です。 皆さんはスマートフォンで音声による検索を使ったことがあるでしょうか? 音声認識は入力された音声をテキストに変換する技術で音声検索などさまざまなアプリで使われています。最近「End-to-End 音声認識」というニューラルネットに基づく革新的な方式が登場して驚くようなスピードで技術が発展しているところです。この記事ではヤフーにおける End-to-End 音声認識の研究成果の一例として「最小遅延学習」と呼ばれるレスポンス高速化の新技術を紹介します。 なお、本研究は米国カーネギーメロン大学の渡部晋治准教授との共同研究として実施したものです。また、この技術の詳細は先週開催された

                                                            End-to-End 音声認識のレスポンスを高速化する最小遅延学習
                                                          • Text2Landscape: Visualize a Text in Multiple Spaces with R — Force-directed networks, Biofabric, Word Embeddings, Principal Component Analysis and Self-Organizing Maps

                                                            First Visualizations: Frequencies Let us first visualize word frequencies. We can get these frequencies with the quanteda package, which implies transforming the column of lemmas (text.lemmas$lemma) into a quanteda tokens object, then to a document-feature matrix. Doing so, we only retain significant parts of phrases (nous, proper nouns, verbs and adjectives). This only partially spares us the tas

                                                              Text2Landscape: Visualize a Text in Multiple Spaces with R — Force-directed networks, Biofabric, Word Embeddings, Principal Component Analysis and Self-Organizing Maps
                                                            • 「言論検閲なしSNS」を謳うParler(パーラー)は必然的に配信停止に陥った|結城東輝(とんふぃ)

                                                              [追記: 2021年1月12日19時40分] AWSのメール文章とParler内でどのような投稿があったのかが米国で報道されているため、その点文末に追記しました。 [追記終了] トランプ支持者を始めとして多くの保守系のユーザーが利用していたParlerというSNSがGoogle, Appleのアプリストアから配信を停止させられ、さらにはAmazonからもウェブホスティングサービスの利用を停止させられたため、2020年1月10日現在、一切サービスを利用することはできなくなってしまいました。 6日に起きた国会議事堂での暴動に端を発して、TwitterやFacebookはトランプ大統領が引き続き違法な暴力を煽る危険性が高いとしてそのアカウントを永久停止しましたが、本件もそれに連なる同じ動きのように見られている節があります。当然ながら発端は同じですが、Parlerのサービス停止の根底にある問題は全

                                                                「言論検閲なしSNS」を謳うParler(パーラー)は必然的に配信停止に陥った|結城東輝(とんふぃ)
                                                              • 【英語スピーチの振り返り】日本で初開催のCakeFest 2019での登壇、スポンサーしました - BASEプロダクトチームブログ

                                                                こんにちは、はじめまして、お久しぶりです!BASE BANK株式会社にてソフトウェアエンジニアをしている東口(@hgsgtk)です。2019年11月7日(木)〜11月10日(日)にCakePHPの国際カンファレンス CakeFest 2019 が、日本で開催されました。私は、スピーカーとして参加したのですが、初めて30分強、国際カンファレンスで話す機会となったので、発表のために準備したことや反省点も踏まえて、参加レポートをお届けします。 CakeFest 2019 CakeFest 2019とは、PHP製ウェブフレームワークの一つであるCakePHPの国際カンファレンスです。年に1回開催されており、今回は初めて日本での開催となりました。 cakefest.org CakeFest 2019は、Workshop dayが2日、Conference dayが2日の合計4日間でした。Worksh

                                                                  【英語スピーチの振り返り】日本で初開催のCakeFest 2019での登壇、スポンサーしました - BASEプロダクトチームブログ
                                                                • SynapseML: A simple, multilingual, and massively parallel machine learning library - Microsoft Research

                                                                  Simplifying distributed ML through a unified API Writing fault-tolerant distributed programs is complex and a process that’s prone to errors. For example, consider the distributed evaluation of a deep network. The first step is to send a multi-GB model to hundreds of worker machines without overwhelming the network. Then, data readers must coordinate to ensure that all data is queued for processin

                                                                    SynapseML: A simple, multilingual, and massively parallel machine learning library - Microsoft Research
                                                                  • ayaka|Speech Pathologist 🧠 on Twitter: "本当に。logical (論理的) の 対義語はemotional (感情的) ではなくて illogical (非論理的)。そもそもロジカルと感情的は二分される関係性にない。 感情を出しながら話す人の発言がロジックに欠けていると… https://t.co/HaKGX8QfDN"

                                                                    本当に。logical (論理的) の 対義語はemotional (感情的) ではなくて illogical (非論理的)。そもそもロジカルと感情的は二分される関係性にない。 感情を出しながら話す人の発言がロジックに欠けていると… https://t.co/HaKGX8QfDN

                                                                      ayaka|Speech Pathologist 🧠 on Twitter: "本当に。logical (論理的) の 対義語はemotional (感情的) ではなくて illogical (非論理的)。そもそもロジカルと感情的は二分される関係性にない。 感情を出しながら話す人の発言がロジックに欠けていると… https://t.co/HaKGX8QfDN"
                                                                    • 英語音声をテキスト化して翻訳する方法 - Qiita

                                                                      コンバートされた flac ファイルをダウンロード 自分のパソコン等に test.flac をダウンロードしておきます。 GCP の初期設定 Cloud Console で Project を作成 Cloud Speech-to-Text API を有効に(検索窓より、Speech-to-Textで検索) Google Cloud Storage(GCS)に、flac ファイルをアップロード GCS でバケットを作成(フォルダのようなもの。今回は0228-speech というバケットを作成しました。)バケットを作成する際にいくつか聞かれますが、バケットの名前だけいれて、後は、続行 ➡️ 続行 ➡️ 続行 ➡️ 続行 ➡️ 作成で進めてください。 test.flac ファイルをアップロード flac ファイルをテキスト化 Cloud Console から、[Cloud Shell を有効にす

                                                                        英語音声をテキスト化して翻訳する方法 - Qiita
                                                                      • 【2023年版】デザインに使えるAIツールまとめ(レビュー付き)|Goodpatch Blog グッドパッチブログ

                                                                        ジェネレーティブAI技術の進歩などによって、デザインに活用できるAIツールが次々と誕生しています。AIを業務に組み込むことで、今後デザイナーの働き方も大きく変わっていくでしょう。 そこで本記事では、さまざまなAIツールの中からデザイン業務に活用できそうなものをピックアップし、ワークフローのシーン別にご紹介します。主要なツールについては使ってみた感想(レビュー)も記載したので、デザイナー観点でAI活用をどう感じたかをお伝えできれば嬉しいです。 はじめに:AIデザインツールの原理 そもそもデザインに使えるAIツールとはなんでしょうか?AIの分野で重要な役割を果たす3つのキーワードについて、簡単に解説します。 ニューラルネットワーク クリエイティブな仕事をサポートまたは代替してくれるAI技術は、数十年にわたる技術開発の上に成り立っています。その基本的な仕組みの1つとして挙げられるのがニューラルネ

                                                                          【2023年版】デザインに使えるAIツールまとめ(レビュー付き)|Goodpatch Blog グッドパッチブログ
                                                                        • What does “Please Notice Me, Senpai” Mean?

                                                                          Few Japanese words dominate otaku lingo as the word senpai. Senpai, also spelled as sempai, sometimes appears more as punctuation to speech than a proper honorific. It also has a distinctive submissive flavor. Senpai (せんぱい  or 先輩) is an honorific used to address someone who is superior to you in status. Honorifics are parts of speech used to denote relationship and social status relative to the sp

                                                                            What does “Please Notice Me, Senpai” Mean?
                                                                          • The Great Firewall Cracked, Briefly. A People Shined Through. (Published 2021)

                                                                            For years, the Chinese government has prevented its 1.4 billion people from speaking freely online. A digital wall separated them from the rest of the world. Then, for a precious few days, that wall was breached. Clubhouse, a new social media app that emerged faster than the censors could block it, became a place for Mandarin Chinese speakers from the mainland and anywhere else to speak their mind

                                                                              The Great Firewall Cracked, Briefly. A People Shined Through. (Published 2021)
                                                                            • 【記事更新】私のブックマーク「言語処理分野におけるAdversarial Example」 – 人工知能学会 (The Japanese Society for Artificial Intelligence)

                                                                              佐藤 元紀 (株式会社Preferred Networks) はじめに ニューラルネットワークは、時として僅かな入力の違いによって大きく異なる挙動になることが知られています。 図1 画像分野におけるAdversarial Example の(出典 : [Goodfellow et al.]より抜粋) 有名な例に [Goodfellow et al.] の図1があります。 左側の画像 x に対して、微小なノイズ(Adversarial Perturbation; 敵対的摂動)を足し合わせた結果が、右側の画像になっています。 左側の画像をCNNによる画像認識器に入力した時には正しく「パンダ (“panda”)」と予測されるものの、右側の画像を入力すると「テナガザル (“gibbon”)」と予測されています。 同じ見た目の画像にもかかわらず、ニューラルネットワークが誤認識するこのような事例は A

                                                                              • https://www.elle.com/jp/culture/celebgossip/a33631261/michelle-obama-dnc-speech-20-0818/

                                                                                  https://www.elle.com/jp/culture/celebgossip/a33631261/michelle-obama-dnc-speech-20-0818/
                                                                                • Conformer:Transformerを音声認識に応用!? GoogleによるTransformer×CNNが凄すぎる!!

                                                                                  3つの要点 ✔️ TransformerとCNNを組み合わせたモデル,Conformerを音声認識に応用 ✔️ 畳み込みモジュールがConformerにおいて最も重要であることがわかった ✔️ 既存の音声認識研究の中でも最高の精度を確認 Conformer: Convolution-augmented Transformer for Speech Recognition written by Anmol Gulati, James Qin, Chung-Cheng Chiu, Niki Parmar, Yu Zhang, Jiahui Yu, Wei Han, Shibo Wang, Zhengdong Zhang, Yonghui Wu, Ruoming Pang (Submitted on 16 May 2020) Comments: Accepted at Interspeech20

                                                                                    Conformer:Transformerを音声認識に応用!? GoogleによるTransformer×CNNが凄すぎる!!