並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 2457件

新着順 人気順

speechの検索結果321 - 360 件 / 2457件

  • Yann LeCun’s Deep Learning Course at CDS is Now Fully Online & Accessible to All

    CDS is excited to announce the release of all materials for Yann LeCun’s Deep Learning, DS-GA 1008, co-taught in Spring 2020 with Alfredo Canziani. This unique course material consists of a mix of close captioned lecture videos, detailed written overviews, and executable Jupyter Notebooks with PyTorch implementations. The course covers the latest techniques in both deep learning and representation

      Yann LeCun’s Deep Learning Course at CDS is Now Fully Online & Accessible to All
    • イーロン・マスクが「Twitter」から「X」に名称を変更した理由を語る、金融取引を含む包括的アプリになるため「Twitter」の名前はそぐわないと主張

      2023年7月24日、長らく「Twitter」の名称で運営されてきたSNSの名称が「X」に変更され、ユーザーの間に戸惑いが広がりました。「X」のアイコンを見慣れた「青い鳥」に戻す拡張機能をリリースするユーザーも現れる中、Twitterを買収したイーロン・マスク氏が「社名を変更した企業」の一覧に「X: Twitter」と付け加えた投稿へのリプライで、「Twitterの名称をXに変更した理由」について説明しています。 Twitter was acquired by X Corp both to ensure freedom of speech and as an accelerant for X, the everything app. This is not simply a company renaming itself, but doing the same thing. The Twi

        イーロン・マスクが「Twitter」から「X」に名称を変更した理由を語る、金融取引を含む包括的アプリになるため「Twitter」の名前はそぐわないと主張
      • Microsoft社のアーキテクトが説く、LLM実装の最前線 登場から今までを振り返って、予想する未来像

        登壇者の自己紹介 蒲生弘郷氏:「ChatGPTの10ヶ月と開発トレンドの現在地」というタイトルで、蒲生から発表します。よろしくお願いいたします。 ちょっと私の自己紹介です。Azure OpenAI Champという立場で、外部発信などをやっています。いっぱい自己紹介をしていきたいところですが、本日はあまり時間もないので省略して、次にいきたいと思います。 今回は、けっこう開発者向けの発展的な内容を扱っていきますが、もし基本的な内容から確認していきたいという場合には、「Azure OpenAI 大全」というものを公開していて、リンクを貼っておくので、そちらの資料を併せてご確認いただければと思います。 「ChatGPT」の登場から今までを振り返る では、本日のテーマとして「ChatGPT」の登場から10ヶ月(※登壇当時)ということで、2022年11月から登場したChatGPTに関する技術について

          Microsoft社のアーキテクトが説く、LLM実装の最前線 登場から今までを振り返って、予想する未来像
        • State of GUI 2022 - KAS blog

          Rust: state of GUI, December 2022 There was a recent call for blogs about Rust GUI. So, Are we GUI yet? Contents: Categorised listing of toolkits State of KAS State of GUI Categorised listing of toolkits Lets start by categorising entries from Are we GUI yet, ignoring those which appear abandoned or not very functional. Bindings Wrappers around platform-specific toolkits: Mac OS / iOS - cacao - Ru

          • GPT-4oがどれぐらい早くなったのかコールセンターに導入して試してみた話 - APC 技術ブログ

            gpt-4o はじめに こんにちは、ACS事業部の佐竹です。 今回のMicrosoft Buildで発表されたGPT-4oについて、どの程度レスポンスが良くなったか是非触ってみたく、今回の記事を書くことにしました。 1.1.5.Azure OpenAI Serviceの主なAIの進化 news.microsoft.com 以前、Azure Communication ServiceとAzure OpenAI Serviceを使って、コールセンターを作ってみたのですが、そこにGPT-4oを組み込む形でGPT-4-32kとの速度比較を行いました。 techblog.ap-com.co.jp 上記の記事はハンズオン形式で記載しておりますので、お手隙の際に是非手を動かしていただけますと幸いです。 概要 全体アーキテクチャは以下のようになります。 アーキテクチャ図 全体の流れは以下の通りです。 ユー

              GPT-4oがどれぐらい早くなったのかコールセンターに導入して試してみた話 - APC 技術ブログ
            • What We Learned from a Year of Building with LLMs (Part I)

              Join the O'Reilly online learning platform. Get a free trial today and find answers on the fly, or master something new and useful. Learn more It’s an exciting time to build with large language models (LLMs). Over the past year, LLMs have become “good enough” for real-world applications. The pace of improvements in LLMs, coupled with a parade of demos on social media, will fuel an estimated $200B

                What We Learned from a Year of Building with LLMs (Part I)
              • 面倒な仕事やサイト作成がたった2日でマスター可能!人気のPythonやWordPressでスキルアップできる「Udemy」初夏のビッグセール

                「新たなスキルを身につけて年収UPを目指したい」「プログラミングで仕事を自動化して楽に稼ぎたい」と日々思っている人は少なくないはず。しかし、いざ学習を始めようとしても忙しい毎日の中から時間を確保するのは難しいものです。ちょうど講座をムービー形式で受講できる学習プラットフォームの「Udemy」が5月27日(木)まで初夏のビッグセールを行っており、丁寧で分かりやすい解説講座が1270円~受講可能とのことで、忙しい毎日を送っていても週末の2日間だけで学習を完了できそうな短期集中型の講座をピックアップしてみました。外出がおっくうになる梅雨の季節や、ステイホームをうまく活用するために、この機会に買いだめしておくのがオススメです。 オンラインコース -世界最大級のオンライン学習プラットフォーム- Udemy https://www.udemy.com/ ・目次 ◆1:WordPressの使い方を習得し

                  面倒な仕事やサイト作成がたった2日でマスター可能!人気のPythonやWordPressでスキルアップできる「Udemy」初夏のビッグセール
                • End-to-End音声認識の計算量を削減した話

                  ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、音声処理黒帯(黒帯はヤフー内のスキル任命制度)の藤田です。今日のブログでは、音声認識技術の研究開発におけるヤフーの最新の取り組みを紹介します。 特に、近年注目されているTransformerという手法に基づく、End-to-End音声認識の計算量を削減した研究を紹介します。この研究は、難関国際会議IEEE ICASSP2020に投稿し、採択されました。また、arXivでプレプリントを公開しています。そして、ESPnetというEnd-to-Endモデルのツールキット上でソースコードも公開しています。興味のある方はぜひ、こちらもご参照ください。 音声認識で用いられるEnd-to-Endモデルとは? 音声認識技術は音声をテキ

                    End-to-End音声認識の計算量を削減した話
                  • 「日本人のフォロワーが沢山だ!」再び大拡散した感動的なスピーチ、論破劇が爽快

                    「日本人のフォロワーが沢山だ!」再び大拡散した感動的なスピーチ、論破劇が爽快ウィリアムソンさんの論破劇が爽快すぎ。ユーモアもあるけど、シンプルかつ1番重要なことをしっかりと伝えていて、何度も聞きたくなるスピーチです。👏 2013年にニュージーランドの議会で行われた「ビッグ・ゲイ・レインボー演説」が再び、日本のSNS上で話題を呼んでいます。 モーリス・ウィリアムソン議員(当時)が、同性婚を認める法案に賛成を訴える演説でした。 5月20日、与党・自民党でLGBTなど性的マイノリティーに対する理解増進に向けた法案の審査が行われました。しかし、様々な理由で法案に反対する議員が多く、議論はまとまりませんでした。中には「道徳的にLGBTは認められない」と発言した出席者もいると報じられています。 こうした政治の動きをうけて、ウィリアムソン元議員の演説が国内で改めて注目されるようになり、趣旨に賛同する人

                      「日本人のフォロワーが沢山だ!」再び大拡散した感動的なスピーチ、論破劇が爽快
                    • リリースされたGPT-4oを使って動画のサマリー生成をしてみる! - Qiita

                      概要 GPT-4oが発表されました。 GPT-4oについては以下のツイートによくまとまっています。 使用している映像は以下でまとめられています。 非常に優秀でAI系のプロダクトがまた何個か死んだと思いますが、それはさておき使っていきましょう。 APIではすでに利用可能になっております。 今回は以下のcookbookにある動画要約をgradioに移植します。 https://cookbook.openai.com/examples/gpt4o/introduction_to_gpt4o デモ 以下の Huggingface Space を作りました。APIキーと動画を貼り付けて試用することができます。 1分間の動画で0.1ドル / 60秒くらいかかります。API使用料に注意してください。 現状のGPT-4o APIの制限 動画はそのままアップロードできません これは将来的にもできるとされてい

                        リリースされたGPT-4oを使って動画のサマリー生成をしてみる! - Qiita
                      • Machine Learning Trends You Need to Know - Gradient Flow

                        Insights and trends that will help you navigate the AI landscape. By Assaf Araki and Ben Lorica. Automation and democratization are on the rise AutoML tools are designed to automate the process of training and deploying machine learning. Such tools have progressed to the point where they can produce adequate models for many use cases. Moreover, in domains where model hubs and foundation models (e.

                          Machine Learning Trends You Need to Know - Gradient Flow
                        • Amazon Is Booting Parler Off Of Its Web Hosting Service

                          Amazon notified Parler that it would be cutting off the social network favored by conservatives and extremists from its cloud hosting service Amazon Web Services, according to an email obtained by BuzzFeed News. The suspension, which will go into effect on Sunday just before midnight, means that Parler will be unable to operate and will go offline unless it can find another hosting service. People

                            Amazon Is Booting Parler Off Of Its Web Hosting Service
                          • 【CSS】吹き出しデザインをCSSで作ってみる! - Tech.log

                            今回は、吹き出しデザインをCSSで作る方法を紹介したいと思います! 最初に、ベースとなるコードを紹介した後、簡単なカスタムパターンをいくつか紹介していきたいと思います。 目次 ベースコード 使い方 カスタムパターン 吹き出しの色を変えてみる! 吹き出しの方向を変更してみる! 角丸表示にしてみる! 影付きの吹き出しを表示してみる! まとめ ベースコード 吹き出しデザインは以下のようなCSSで、実現することができます。 .speech-bubble { position: relative; display: inline-block; margin-bottom: 13px; padding: 1rem 1rem; min-width: 60px; max-width: 20rem; color: #929292; font-size: 16px; background: #d5f1a9;

                              【CSS】吹き出しデザインをCSSで作ってみる! - Tech.log
                            • トランプの娘イヴァンカも始めた、右派「検閲なし」SNSの人気が急上昇

                              Ivanka the Latest Trump to Join Parler, As 'Free Speech' App CEO Defends Users' Right to Say 'Crazy Things' <「自由な発言」の検閲を拒否するソーシャルメディアアプリ「パーラー」に、右派の政治家や活動家が続々集結中> アメリカの保守派の政治家や支持者の間で人気が急上昇しているSNS「パーラー」に、最近ドナルド・トランプ米大統領の長女イヴァンカがアカウントを開設した。 大統領上級顧問で実業家でもあるイヴァンカ・トランプは17日、自分のツイッターの1000万人のフォロワーに対して、パーラーでアカウントを作ったことを告知した。パーラーは、iOSとアンドロイドの両方で、アメリカ国内の11月のアプリダウンロードランキングのトップになっている。 18日時点で、イヴァンカはまだパーラーのアカウントに

                                トランプの娘イヴァンカも始めた、右派「検閲なし」SNSの人気が急上昇
                              • ML and NLP Research Highlights of 2020

                                The selection of areas and methods is heavily influenced by my own interests; the selected topics are biased towards representation and transfer learning and towards natural language processing (NLP). I tried to cover the papers that I was aware of but likely missed many relevant ones—feel free to highlight them in the comments below. In all, I discuss the following highlights: Scaling up—and down

                                  ML and NLP Research Highlights of 2020
                                • 米国VCが好む起業家の7つの特徴(その1)|原健一郎 | Kenichiro Hara

                                  自己紹介DCMベンチャーズというシリコンバレーのベンチャーキャピタルで、スタートアップに投資をしている原です。 思い立ってNoteを始めることにしました。文章にするなら最初は好きな起業家の話にしようと思ったので、その起業家の特徴と具体例について書きます。趣味で海外のVCとか起業家のインタビューを見るのが好きで、彼らがよく話す"成功する起業家の特徴"からまとめて絞り込みました。それぞれの特徴と僕が投資実施前から深く関わっている起業家の方をご紹介させてください。 はじめに読んでいただきたいこと抜け漏れ: このリストは300-500くらい見たり聞いた起業家やVCのインタビューから成功する起業家の条件をリストアップして、それをカテゴリにまとめて、DCMでの経験から優先順位を付け絞りこんでいます。なので抜け漏れはありますし、この特徴に全く当てはまらなくても成功する起業家の方もたくさんいると思います。

                                    米国VCが好む起業家の7つの特徴(その1)|原健一郎 | Kenichiro Hara
                                  • if-then-else/if-then-else.md at master · e-n-f/if-then-else

                                    Video Hi, I'm Eric. I'm here to talk about what seems like an absurd idea: that if-then-else had to be invented. If-then-else is how we talk about conditions in programming languages: if something is true, then do a thing, else do a different thing. That's just English, right? Except that it isn't. I can't use "else" as a conjunction in normal speech, only in computer programs. Where did this else

                                      if-then-else/if-then-else.md at master · e-n-f/if-then-else
                                    • AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                      2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第22回目は、AIが不得意とする指の数を修正する技術やStability AIの動画生成モデルなど、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップ人間が話すような音声合成でテキストを読み上げるTTSモデル「StyleTTS 2」 コロンビア大の研究者ら開発 Stability AI、画像から動画を生成するモデル「Stable Video Diffusion」発表 画像と動画を同時に扱う大規模視覚言語モデル「Video-LLaVA」 北京大などが開発 テキストから3Dモデルを生成する新型モデル「LucidDreamer」 他に影響を与えず表情や年齢

                                        AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                      • Donald Trump 日本語訳 退任演説全文

                                        2024-05 « 12345678910111213141516171819202122232425262728293031 » ドナルド・J・トランプ大統領 全国への、最後の挨拶 ホワイトハウスにて 2021年1月20日 親愛なるアメリカ国民諸君 「われわれの国家を再建し、その魂を甦えらせ、そして国民への奉仕の心を、政府に取り戻させる」 われらすべての国民が、この壮大な事業を開始したのは、4年前のことになる。 すなわち我々は、すべてのアメリカ国民にとり、アメリカを再び偉大にする、その事業に着手したのである。 第45代アメリカ大統領としての任期を終える今、私は諸君の前にいて、我々がともに成し遂げたことを、実に誇りに思っている。 我々はここに来たときやるべきだった仕事、そしてそれ以上の成果をあげた。 今週、わが国には新しい政権が発足する。アメリカを安全で繁栄する国にするため、新政府の成功を

                                        • LINEのAIサービスの音声認識技術を支えるチームを紹介します

                                          LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog LINEの開発組織のそれぞれの部門やプロジェクトについて、その役割や体制、技術スタック、今後の課題やロードマップなどを具体的に紹介していく「Team & Project」シリーズ。今回は、LINEの提供するAI関連のソリューションやプロダクトに実装されている、音声認識技術の開発を担当しているチームを紹介します。 Speechチームの木田祐介、坂本渚、芦川博人に話を聞きました。 Speechチームの皆さん まず、自己紹介をお願いします。 木田:AIカンパニーにて音声認識技術の開発を行っているSpeechチームのマネージャーをしています。1年ほど前にエンジニアとしてSpeechチームにジョインして、今年の1月からマネージャーを務め

                                            LINEのAIサービスの音声認識技術を支えるチームを紹介します
                                          • 音声認識モデル Whisper の推論をほぼ倍速に高速化した話 - Qiita

                                            本記事は MIXI DEVELOPERS Advent Calendar 2022 の4日目の記事です。 TL;DR Romi チームでは自然言語処理をメインでやりつつ、最近は音声系も手を出しつつあるよ 2022年末現在の音声認識最強モデル Whisper を高速化 重みの fp16 化 TorchScript 化 認識の長さを30秒ごとから10秒ごとに 結果処理速度が約2倍に ソースコード: https://github.com/projectlucas/efficient_whisper 実験結果: https://github.com/projectlucas/efficient_whisper/blob/main/notebooks/efficient_whisper.ipynb はじめに こんにちは株式会社 MIXI Romi 事業部 Engineering Manager の

                                              音声認識モデル Whisper の推論をほぼ倍速に高速化した話 - Qiita
                                            • 100+ Best GitHub Repositories For Machine Learning

                                              There are millions of GitHub repos and filtering them is an insane amount of work. It takes a huge time, effort, and a lot more. We have done this for you. In this article, we’ll share a curated list of 100+ widely-known, recommended, and most popular repositories and open source GitHub projects for Machine Learning and Deep Learning. So without further ado, Let’s see all the hubs created by exper

                                                100+ Best GitHub Repositories For Machine Learning
                                              • こどもの発達障害を理解した言葉かけで変わる育児

                                                発達特性がわかるまでの特徴今現在、4歳になる息子は、2歳2か月の時、発達障害の疑いがあると言われました。 その時の息子は2語文が話せなかったのです。 話せる言葉も少なかったのですが、男の子は話せるようになるのは遅いほうだと聞いていたので、あまり気にしていませんでした。 その時は疑いがあるということだけ、まだ2歳だし、断定するのも早いということで経過観察になりました。 3歳5か月の定期健診。やっとこ2語文が話せるようになったのですが、他の子に比べると全然。 5本の指に入るほどの2語文しか、まだ話せませんでした。 ほかにも犬や猫、果物、乗り物、言われたことに対し、何一つ答えることが出来ませんでした。 落ち着きもなく、目を離すと、すぐどっか行ってしまい、そこら中に唾を吐いたり、気に入らないとすぐ怒り出し、かんしゃくもひどかったです。 どうしていけないことなのか説明しても理解できず、物を投げたり、

                                                  こどもの発達障害を理解した言葉かけで変わる育児
                                                • 無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと

                                                  無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと:PCでもスマホでも使える!(1/2 ページ) 会議などの議事録を作成したり、プレゼンテーションの内容を後から確認したりするため、音声を録音したいこともあるだろう。そのような場合、数年前まではICレコーダーを利用するのが一般的だったように思うが、最近ではスマートフォン単体で録音できるアプリも増えてきた。 また、そうして録音した内容を文字起こしするのは、以前は人力で行うのが当たり前だったが、今では自動で文字起こしまで行ってくれるものも出てきている。そのような自動で文字起こしを行ってくれるLINEのアプリ「CLOVA Note」を実際に利用したので、どの程度使えるものなのか簡単に紹介しよう。 β版として無料提供 アプリでもファイルのアップロードでも利用可能 CLOVA Noteは、LINEがこの5月からβ版として無料で提供

                                                    無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと
                                                  • Inside the Ukrainian Counterstrike That Turned the Tide of the War

                                                    WorldUkraineInside the Ukrainian Counterstrike That Turned the Tide of the War It would be easy to underestimate Valeriy Zaluzhny. When not in uniform, the general prefers T-shirts and shorts that match his easygoing sense of humor. When he first heard from aides to Ukrainian President Volodymyr Zelensky in late July 2021 that he was being tapped to lead the country’s armed forces, his stunned res

                                                      Inside the Ukrainian Counterstrike That Turned the Tide of the War
                                                    • シャドーイングとは? 英語学習への効果や必要な時間・正しいやり方を丁寧に解説 - ポリグロットライフ | 言語まなび∞ラボ

                                                      はじめに 今回はシャドーイングについて考えていきます。シャドーイングとはそもそもどのようなトレーニングなのか?英語学習への効果や、必要な時間も丁寧に解説していきます。シャドーイングをするには事前の準備が大切です。英語の音声規則や変化も知っておく必要があります。シャドーイングの効果的な正しいやり方をステップごとに丁寧に説明していきますので、ぜひ参考にしてください。おすすめの教材やYoutubeなどもご紹介していきます。 シャドーイングとは シャードーイングの歴史 シャドーイングの効果 自動化の促進 インプット効果 必要なトレーニング時間や到達度 ディクテーションとの違いは? シャドーイングは難しい? 初心者でも成功する方法とは? シャードイングをする前に必要なこと チャンク学習 スラッシュリーディング 発音規則のルール(フォニックス) 音声変化の規則 連結 同化 脱落 レベルに合った教材の準

                                                        シャドーイングとは? 英語学習への効果や必要な時間・正しいやり方を丁寧に解説 - ポリグロットライフ | 言語まなび∞ラボ
                                                      • 岸田首相の「ジョブ型」 - hamachanブログ(EU労働法政策雑記帳)

                                                        岸田首相がニューヨークの証券取引所で「ジョブ型」と口走ったという新聞報道を見て、官邸ホームページに見に行ったところ、なるほどこのように喋っておりました。 https://www.kantei.go.jp/jp/101_kishida/statement/2022/0922speech.html 日本の五つの優先課題を紹介する。 第1に、「人への投資」だ。 デジタル化・グリーン化は経済を大きく変えた。これから、大きな付加価値を生み出す源泉となるのは、有形資産ではなく無形資産。中でも、人的資本だ。 だから、人的資本を重視する社会を作り上げていく。 まずは労働市場の改革。日本の経済界とも協力し、メンバーシップに基づく年功的な職能給の仕組みを、個々の企業の実情に応じて、ジョブ型の職務給中心の日本に合ったシステムに見直す。 これにより労働移動を円滑化し、高い賃金を払えば、高いスキルの人材が集まり、そ

                                                          岸田首相の「ジョブ型」 - hamachanブログ(EU労働法政策雑記帳)
                                                        • Ball et al.「アメリカのインフレ率:離陸確実か?」(2021年5月7日)

                                                          [Laurence Ball, Gita Gopinath, Daniel Leigh, Prachi Mishra, Antonio Spilimbergo, “US inflation: Set for take-off?” VoxEU, May 7, 2021] いまアメリカで進行中の財政拡大はどこまでインフレを押し上げると見込まれるだろうか? 本コラムでは,次のことを示す新たな証拠を提示する――すなわち,COVID-19 危機がはじまって以降,これまでのところ,消費者物価指数 (CPI) の基調(加重中央値)は安定して下がってきている.これは,歴史的なフィリップス曲線の関係からおおむね予測されるとおりだ.一部の論者が予測するように進行中の財政拡大によって失業率が 1.5%~3.5% に下がったら,2023年までにインフレ率の基調は約 2.5%~3% にまで上がりうる.財政拡大が一時

                                                            Ball et al.「アメリカのインフレ率:離陸確実か?」(2021年5月7日)
                                                          • https://jp.techcrunch.com/2021/07/08/2021-07-07-wellsaid-attracts-10m-a-round-for-higher-quality-synthetic-speech/

                                                              https://jp.techcrunch.com/2021/07/08/2021-07-07-wellsaid-attracts-10m-a-round-for-higher-quality-synthetic-speech/
                                                            • Deep Learningの各種タスクにおけるベンチデータセットとデータ数をまとめた - Qiita

                                                              ABEJAアドベントカレンダー2020の19日目の記事です。 この記事は何? 結局AIって何個データ必要なの?ってよく聞かれると思います。 そんなん知るか この記事では、ある程度精度が出ている既存のタスクにおいて、どんなデータを、どのくらいの量与えているかを調べた結果です。ちなみに、僕自身、すべてのタスクを扱ったことがあるわけでは無いので、ほぼ一部適当な部分もあるかと思いますが、ご容赦ください。あと、このデータが入ってないよ!ってツッコミも歓迎です。 あと、技術は常に進んでいるので、ちゃんと最新技術を追っておけば、より少ないデータで良い結果を出すことが出来ないこともない。が、最新技術とはいえ銀の弾丸ではないのが通常で、例えlightweightGANがでたからと言って、100枚で学習できます!とか勝手に広がると困っちゃう。色んなタスクにおいて、まぁ大体どんなタスクも一般的にはこんなもんよっ

                                                                Deep Learningの各種タスクにおけるベンチデータセットとデータ数をまとめた - Qiita
                                                              • トランプ大統領が嫌っているのは「プラットフォームの偏向」ではなく「表現の自由」そのものである | p2ptk[.]org

                                                                トランプ大統領が嫌っているのは「プラットフォームの偏向」ではなく「表現の自由」そのものである投稿者: heatwave_p2p 投稿日: 2020/12/142020/12/14 Electronic Frontier Foundation トランプ大統領はこのところ、第230条の撤廃規定を盛り込まないのであれば、国防権限法(NDAA)に「拒否権を発動する」と脅しを掛けている。彼が大統領として仕掛けるネット上の表現の自由への最後の攻撃になるかもしれないが、少なくとも最初の攻撃ではないのは確かだ。NDAAは議会が毎年通過させる「最優先」法案の1つである。トランプ大統領はオンラインの表現の自由を保護する最も重要な法律を殺すために、この法案をブザービーターとして利用しようとしているというのだから始末に負えない。議会は230条に反対するトランプ大統領の攻撃を断固拒絶しなくてはならない。 230条で

                                                                  トランプ大統領が嫌っているのは「プラットフォームの偏向」ではなく「表現の自由」そのものである | p2ptk[.]org
                                                                • Web Neural Network API

                                                                  Web Neural Network API W3C Candidate Recommendation Draft, 5 September 2024 More details about this document This version: https://www.w3.org/TR/2024/CRD-webnn-20240905/ Latest published version: https://www.w3.org/TR/webnn/ Editor's Draft: https://webmachinelearning.github.io/webnn/ Previous Versions: https://www.w3.org/TR/2024/CRD-webnn-20240830/ History: https://www.w3.org/standards/history/web

                                                                  • silentと日本手話|rhetorico

                                                                    去年も大人気であっという間に埋まってしまったので、今年は日本語学会でもお世話になったまつーら先生にいち早くお声がけいただき、#言語学な人々 アドベントカレンダーに参加。今日は私の誕生日である。 さて、聞こえないことをテーマに、手話がよく出てくる木曜ドラマ #silent は、今季一番流行ってるドラマだという。来週最終回! 最近、手話を扱うドラマが立て続けに何本か出ている(佐藤健のNetflixドラマ「初恋」とか・・・ 未見)。映画だと盲ろう者の福島先生の母役を小雪が演じている「桜色の風が吹く」もやってる。エンターテインメント界が、障害をタブーではなく題材として使うようになってきているのは、悪いことでは無いと思うが、ドラマチックな展開を求めるが故に、かなり事実と異なる世界観になってしまうのもよくある話だ。silentはここまでのところ、そこまで逆鱗に触れずに、当事者や手話をよく知る関係者に違

                                                                      silentと日本手話|rhetorico
                                                                    • AI歌声合成を実現するCeVIO AIが年内発売。IA、ONEに加え、結月ゆかり、flowerなどもCeVIO AIに対応|DTMステーション

                                                                      AI歌声合成の世界が、一気に活気づいてきています。今年2月にNEUTRINOがフリーウェアとしてリリースされ、AIきりたんが話題になり、現在その第2弾となる東北イタコのクラウドファンディングが実施中なのは先日も記事にしたとおりです。さらに6月26日にはAI歌声合成と従来の歌声合成のハイブリッドというSynthesizer Vが発表され、7月30日に発売が開始されます。 そこに来て、CeVIOの新ラインナップであるCeVIO AIが登場し、年内に発売されることが本日発表されました。CeVIO AIでの歌声合成は、従来の歌声合成とは一線を画すもので、AI技術を利用することでまさに人間が歌っているかのようなリアルな歌い方を実現するもの。そしてそのCeVIO AIで利用可能なソングボイス(歌わせるためのデータベースライブラリ)・トークボイス(しゃべらせるためのデータベースライブラリ)として、これま

                                                                        AI歌声合成を実現するCeVIO AIが年内発売。IA、ONEに加え、結月ゆかり、flowerなどもCeVIO AIに対応|DTMステーション
                                                                      • NVIDIAが対話型AIのフレームワーク「Jarvis」の提供を開始

                                                                        2021年4月12日、NVIDIAが、対話型AIの構築が可能になるソフトウェアフレームワーク「Jarvis」の提供を開始したことを発表しました。Jarvisは膨大なデータによってトレーニングされているとのことで、「開発者は高精度な自動音声認識や言語理解能力を備えた対話型AIエージェントを開発可能になる」とNVIDIAは述べています。 NVIDIA Announces Availability of Jarvis Interactive Conversational AI Framework | NVIDIA Newsroom https://nvidianews.nvidia.com/news/nvidia-announces-availability-of-jarvis-interactive-conversational-ai-framework NVIDIA Jarvis: Worl

                                                                          NVIDIAが対話型AIのフレームワーク「Jarvis」の提供を開始
                                                                        • Google Cloud Speech-to-Text APIをいろいろ調査してみる - OPTiM TECH BLOG

                                                                          こんにちは、2020年新卒入社予定の山口です!修論と引越し準備とアルバイトで慌ただしい日々を過ごしています。今日は業務で触った、Google製API Google Cloud Speech-to-Text API について皆さんと共有できればと思います。 Google Cloud Speech-to-Text API とは APIを導入していく GCP側 PC側 実際に試してみる 認識モデルを変更してみる マルチチャンネルで試してみる ファイル形式・サンプリング周波数を比較してみる ナレーション音声(「本日は〜」の音声です。) 走れメロス_朗読 おわりに Google Cloud Speech-to-Text API とは Google Cloud Speech-to-Text API は名前の通り、音声データから文字起こしをするAPIです。この音声データは私たちが日頃聞いているような音声

                                                                            Google Cloud Speech-to-Text APIをいろいろ調査してみる - OPTiM TECH BLOG
                                                                          • AWS Cloud QuestのMachine Learningをやってみた | DevelopersIO

                                                                            お疲れさまです。とーちです。 みなさんAWS Skill Builderはご存知でしょうか? AWS Skill Builder は、AWS に関する知識を講義形式の教材などを使ってオンラインで学習できるサービスとなっており、無料のコンテンツとサブスクリプションに登録することで使えるようになるコンテンツがあります。 AWS Skill Builder のサブスクリプションについて、詳細はこちらをご参照ください。 今回はこのサブスクリプションに含まれている"AWS Cloud Quest"の追加コンテンツ "Machine Learning" をやってみたいと思います。 この記事の対象者 AWS Skill Builder のサブスクリプション登録で使える様になるコンテンツに興味がある方 AWS Cloud Quest とは? AWS Cloud Quest は、AWS のサービスを使った学

                                                                              AWS Cloud QuestのMachine Learningをやってみた | DevelopersIO
                                                                            • The architecture of today's LLM applications

                                                                              We want to empower you to experiment with LLM models, build your own applications, and discover untapped problem spaces. That’s why we sat down with GitHub’s Alireza Goudarzi, a senior machine learning researcher, and Albert Ziegler, a principal machine learning engineer, to discuss the emerging architecture of today’s LLMs. In this post, we’ll cover five major steps to building your own LLM app,

                                                                                The architecture of today's LLM applications
                                                                              • 【2020年】GCPのAI/ML系のサービスまとめてみた | DevelopersIO

                                                                                こんにちは、Mr.Moです。 Google Cloud Platform(GCP)にはたくさんの優れたサービスがありますがAI/ML系のサービスも熱いですね!Updateもガンガン来ているようなので現時点で情報をまとめておきたいと思います。 GCPのAI/ML系のサービス GCPでは多くのAI/ML系のサービスがリリースされていますが、今は大きく下記の2つで区別されているようです。 AI Building Blocks AI Platform AI Building Blocks AI Building Blocksには、カスタムモデルと事前トレーニング済みモデルの 2 種類があり、開発者は視覚認識能力、言語能力、会話能力、構造化データをアプリケーションに簡単に組み込めます。 事前トレーニング済みモデル 事前トレーニング済みのモデルをAPI経由で利用できるサービス群です。汎用的な機能でも良

                                                                                  【2020年】GCPのAI/ML系のサービスまとめてみた | DevelopersIO
                                                                                • テキストデータのかさましを実装する - 一休.com Developers Blog

                                                                                  はじめに データサイエンス部の平田です。 ディープラーニングのモデルを作る際、学習データが少ないことが原因で精度が上がらない場合、データのかさまし(augmentation)を行うことがあります。 画像の場合は、オリジナルに対して回転させたりノイズを少し加えることで同じラベル付けがされている別の画像を作り出すことができ、それを学習データに加えることで頑健なモデルになります。 ただし、テキストの場合は回転させると意味不明になるのでどういう操作をしてかさましするかというのを考える必要があります。 そこで、EDA(Easy Data Augmentation)というものが考案されました。参考 Synonym Replacement:文中の単語の内n個、同義語に置き換える Random Insertion:文中の単語をランダムに選んで同義語にしてランダムな場所にinsert、n回繰り返す Rand

                                                                                    テキストデータのかさましを実装する - 一休.com Developers Blog