Amazon Web Services(AWS)が米ラスベガスで開催中のイベント「AWS re:Invent 2024」で、基調講演にAmazon CEOのアンディ・ジャシー氏が登壇。同社が開発した新しい基盤モデルである「Amazon Nova」を発表しました。 Amazon Novaは複数のモデルから構成されています。 Amazon Nova Micro 低コストかつ小さなレイテンシでテキストのみを処理するモデル Amazon Nova Lite 低コストかつ高速な、画像、動画、テキストによる入力に対応したマルチモーダルなモデル Amazon Nova Pro 精度、スピード、コストの最適な組み合わせで幅広いタスクに対応する高性能なマルチモーダルモデル Amazon Nova Premier 同社のマルチモーダルモデルの中で最も複雑な推論タスクに対応し、カスタムモデルを抽出するための教師
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 皆さんは日々の業務でAIを利活用しておりますでしょうか。 生成AIの進化は凄まじく、プログラミングの経験が浅い人でも、簡単なアプリケーションくらいなら作れてしまうほどです。すごい時代ですよね。 私自身、要件定義は自身で行い、コーディングはAIに任せるような場面も多いです。 しかし、生成AIを扱う上で常に意識すべきことは、「AIは常に完璧ではない」ということです。 AIの精度は日々進化を続けていますが、それでもハルシネーションが完全に改善できているわけではありません。 ハルシネーションとは? ハルシネーション(Hallucina
オンライン表現の自由のチョークポイント――なぜインフラの検閲はプラットフォームの検閲よりも深刻なのか投稿者: heatwave_p2p 投稿日: 2021/1/142021/1/14 Electronic Frontier Foundation 先週、トランプ大統領の支持者が連邦議会議事堂に侵入・破壊行為を行った暴動を受けて、FacebookとTwitterは大統領を追い出す決定を下した。両社がこれまで、トランプ大統領を世界の政治指導者の一人としてコンテンツモデレーションのルールの大半を免除する立場をとってきたことを考えれば、踏み込んだ決断を下したといえる。大統領のフォロワーの多くは、すぐさまParlerに乗り換えた。だが今週、この動きは新たな展開を見せている。Amazon Web Service(AWS)やGoogleのAndroid・AppleのiOSのアプリストアなど、技術的「スタッ
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米University at Buffalo, State University of New York、米ノースウェスタン大学、米ワシントン大学、米コロラド大学の研究チームが開発した「EarCommand: “Hearing” Your Silent Speech Commands In Ear」は、口パク(無声発話)で音声入力できるイヤフォンだ。口を動かした際の耳穴の変化を取得して入力を区別する。 音声を発することなく口の動きだけでモバイル機器を操作するサイレントスピーチインタラクション(Silent Speech Interaction、SSI)が広く研究されている。音声入力による情
2023年7月24日、長らく「Twitter」の名称で運営されてきたSNSの名称が「X」に変更され、ユーザーの間に戸惑いが広がりました。「X」のアイコンを見慣れた「青い鳥」に戻す拡張機能をリリースするユーザーも現れる中、Twitterを買収したイーロン・マスク氏が「社名を変更した企業」の一覧に「X: Twitter」と付け加えた投稿へのリプライで、「Twitterの名称をXに変更した理由」について説明しています。 Twitter was acquired by X Corp both to ensure freedom of speech and as an accelerant for X, the everything app. This is not simply a company renaming itself, but doing the same thing. The Twi
CDS is excited to announce the release of all materials for Yann LeCun’s Deep Learning, DS-GA 1008, co-taught in Spring 2020 with Alfredo Canziani. This unique course material consists of a mix of close captioned lecture videos, detailed written overviews, and executable Jupyter Notebooks with PyTorch implementations. The course covers the latest techniques in both deep learning and representation
VoiSona公式 @VoiSonaOfficial AI技術でリアルな歌声を再現する音声創作ソフト「VoiSona」(旧CeVIO Pro)公式です。 音声創作ソフト「CeVIO」姉妹ブランド。 ▼運営会社:株式会社テクノスピーチ(@techno_speech) ※本アカウントは告知・宣伝用の為、個別のご意見ご質問は下記公式サイトCONTACT宛にお寄せ下さいませ。 voisona.com VoiSona公式 @VoiSonaOfficial 【NEWS】 AI歌唱ソフト「VoiSona」新規ボイスライブラリ、「機流音」&「AiSuu」をリリースしました!! 機流音(CV:鬼龍院翔<ゴールデンボンバー>) voisona.com/artist/kirune_… AiSuu(CV:すぅ<SILENT SIREN>) voisona.com/artist/aisuu_j… #VoiSona
2024年4月1日に、スコットランドで「ヘイトクライムと公共の秩序法(Hate Crime and Public Order Act)」が施行されました。インターネットの書き込みを含め、スコットランドで読めるものならすべて「ヘイト」となり得るこの法律は、言論の自由への影響が懸念されています。 Scotland's Hate Speech Act and Abuse of Process - Craig Murray https://www.craigmurray.org.uk/archives/2024/03/scotlands-hate-speech-act-and-abuse-of-process/ Scotland’s new hate crime law: what does it cover and why is it controversial? | Scotland | Th
Rust: state of GUI, December 2022 There was a recent call for blogs about Rust GUI. So, Are we GUI yet? Contents: Categorised listing of toolkits State of KAS State of GUI Categorised listing of toolkits Lets start by categorising entries from Are we GUI yet, ignoring those which appear abandoned or not very functional. Bindings Wrappers around platform-specific toolkits: Mac OS / iOS - cacao - Ru
gpt-4o はじめに こんにちは、ACS事業部の佐竹です。 今回のMicrosoft Buildで発表されたGPT-4oについて、どの程度レスポンスが良くなったか是非触ってみたく、今回の記事を書くことにしました。 1.1.5.Azure OpenAI Serviceの主なAIの進化 news.microsoft.com 以前、Azure Communication ServiceとAzure OpenAI Serviceを使って、コールセンターを作ってみたのですが、そこにGPT-4oを組み込む形でGPT-4-32kとの速度比較を行いました。 techblog.ap-com.co.jp 上記の記事はハンズオン形式で記載しておりますので、お手隙の際に是非手を動かしていただけますと幸いです。 概要 全体アーキテクチャは以下のようになります。 アーキテクチャ図 全体の流れは以下の通りです。 ユー
「新たなスキルを身につけて年収UPを目指したい」「プログラミングで仕事を自動化して楽に稼ぎたい」と日々思っている人は少なくないはず。しかし、いざ学習を始めようとしても忙しい毎日の中から時間を確保するのは難しいものです。ちょうど講座をムービー形式で受講できる学習プラットフォームの「Udemy」が5月27日(木)まで初夏のビッグセールを行っており、丁寧で分かりやすい解説講座が1270円~受講可能とのことで、忙しい毎日を送っていても週末の2日間だけで学習を完了できそうな短期集中型の講座をピックアップしてみました。外出がおっくうになる梅雨の季節や、ステイホームをうまく活用するために、この機会に買いだめしておくのがオススメです。 オンラインコース -世界最大級のオンライン学習プラットフォーム- Udemy https://www.udemy.com/ ・目次 ◆1:WordPressの使い方を習得し
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、音声処理黒帯(黒帯はヤフー内のスキル任命制度)の藤田です。今日のブログでは、音声認識技術の研究開発におけるヤフーの最新の取り組みを紹介します。 特に、近年注目されているTransformerという手法に基づく、End-to-End音声認識の計算量を削減した研究を紹介します。この研究は、難関国際会議IEEE ICASSP2020に投稿し、採択されました。また、arXivでプレプリントを公開しています。そして、ESPnetというEnd-to-Endモデルのツールキット上でソースコードも公開しています。興味のある方はぜひ、こちらもご参照ください。 音声認識で用いられるEnd-to-Endモデルとは? 音声認識技術は音声をテキ
登壇者の自己紹介蒲生弘郷氏:「ChatGPTの10ヶ月と開発トレンドの現在地」というタイトルで、蒲生から発表します。よろしくお願いいたします。 ちょっと私の自己紹介です。Azure OpenAI Champという立場で、外部発信などをやっています。いっぱい自己紹介をしていきたいところですが、本日はあまり時間もないので省略して、次にいきたいと思います。 今回は、けっこう開発者向けの発展的な内容を扱っていきますが、もし基本的な内容から確認していきたいという場合には、「Azure OpenAI 大全」というものを公開していて、リンクを貼っておくので、そちらの資料を併せてご確認いただければと思います。 「ChatGPT」の登場から今までを振り返るでは、本日のテーマとして「ChatGPT」の登場から10ヶ月(※登壇当時)ということで、2022年11月から登場したChatGPTに関する技術について少し
「日本人のフォロワーが沢山だ!」再び大拡散した感動的なスピーチ、論破劇が爽快ウィリアムソンさんの論破劇が爽快すぎ。ユーモアもあるけど、シンプルかつ1番重要なことをしっかりと伝えていて、何度も聞きたくなるスピーチです。👏 2013年にニュージーランドの議会で行われた「ビッグ・ゲイ・レインボー演説」が再び、日本のSNS上で話題を呼んでいます。 モーリス・ウィリアムソン議員(当時)が、同性婚を認める法案に賛成を訴える演説でした。 5月20日、与党・自民党でLGBTなど性的マイノリティーに対する理解増進に向けた法案の審査が行われました。しかし、様々な理由で法案に反対する議員が多く、議論はまとまりませんでした。中には「道徳的にLGBTは認められない」と発言した出席者もいると報じられています。 こうした政治の動きをうけて、ウィリアムソン元議員の演説が国内で改めて注目されるようになり、趣旨に賛同する人
Insights and trends that will help you navigate the AI landscape. By Assaf Araki and Ben Lorica. Automation and democratization are on the rise AutoML tools are designed to automate the process of training and deploying machine learning. Such tools have progressed to the point where they can produce adequate models for many use cases. Moreover, in domains where model hubs and foundation models (e.
今回は、吹き出しデザインをCSSで作る方法を紹介したいと思います! 最初に、ベースとなるコードを紹介した後、簡単なカスタムパターンをいくつか紹介していきたいと思います。 目次 ベースコード 使い方 カスタムパターン 吹き出しの色を変えてみる! 吹き出しの方向を変更してみる! 角丸表示にしてみる! 影付きの吹き出しを表示してみる! まとめ ベースコード 吹き出しデザインは以下のようなCSSで、実現することができます。 .speech-bubble { position: relative; display: inline-block; margin-bottom: 13px; padding: 1rem 1rem; min-width: 60px; max-width: 20rem; color: #929292; font-size: 16px; background: #d5f1a9;
カリフォルニア大学バークレー校の卒業式に、卒業生でアップル共同創業者のスティーブ・ウォズニアック氏が登壇しました。小学生時代からIQ200を超えていたと言われる天才エンジニアの同氏。大学時代のエピソードやジョブスとの出会い、コンピュータ・エンジニアになると決意したきっかけなどを振り返りました。本記事では、大学時代に導いた人生の「幸せの方程式」について語りました。 Apple共同創業者・ウォズニアック氏が登壇スティーブ・ウォズニアック氏:私は、人生の中で常に年上よりも若い人たちを尊重してきました。まあとにかく、今日は(大学から)「簡潔(ブリーフ)に、おもしろく」と頼まれたので、ローブの下にはブリーフ (パンツ)を履いて来ました。 (会場笑い) ありがとう。よく、「人生で一番誇らしい瞬間は何ですか?」と聞かれます。それに対して私は「カリフォルニア大学バークレー校を卒業したことだ」と断言します。
Ivanka the Latest Trump to Join Parler, As 'Free Speech' App CEO Defends Users' Right to Say 'Crazy Things' <「自由な発言」の検閲を拒否するソーシャルメディアアプリ「パーラー」に、右派の政治家や活動家が続々集結中> アメリカの保守派の政治家や支持者の間で人気が急上昇しているSNS「パーラー」に、最近ドナルド・トランプ米大統領の長女イヴァンカがアカウントを開設した。 大統領上級顧問で実業家でもあるイヴァンカ・トランプは17日、自分のツイッターの1000万人のフォロワーに対して、パーラーでアカウントを作ったことを告知した。パーラーは、iOSとアンドロイドの両方で、アメリカ国内の11月のアプリダウンロードランキングのトップになっている。 18日時点で、イヴァンカはまだパーラーのアカウントに
ML and NLP Research Highlights of 2020 This post summarizes progress in 10 exciting and impactful directions in ML and NLP in 2020. The selection of areas and methods is heavily influenced by my own interests; the selected topics are biased towards representation and transfer learning and towards natural language processing (NLP). I tried to cover the papers that I was aware of but likely missed m
Video Hi, I'm Eric. I'm here to talk about what seems like an absurd idea: that if-then-else had to be invented. If-then-else is how we talk about conditions in programming languages: if something is true, then do a thing, else do a different thing. That's just English, right? Except that it isn't. I can't use "else" as a conjunction in normal speech, only in computer programs. Where did this else
Amazon notified Parler that it would be cutting off the social network favored by conservatives and extremists from its cloud hosting service Amazon Web Services, according to an email obtained by BuzzFeed News. The suspension, which will go into effect on Sunday just before midnight, means that Parler will be unable to operate and will go offline unless it can find another hosting service. People
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第22回目は、AIが不得意とする指の数を修正する技術やStability AIの動画生成モデルなど、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップ人間が話すような音声合成でテキストを読み上げるTTSモデル「StyleTTS 2」 コロンビア大の研究者ら開発> Stability AI、画像から動画を生成するモデル「Stable Video Diffusion」発表 画像と動画を同時に扱う大規模視覚言語モデル「Video-LLaVA」 北京大などが開発 テキストから3Dモデルを生成する新型モデル「LucidDreamer」 他に影響を与えず表情や年
2025-01 « 12345678910111213141516171819202122232425262728293031 » ドナルド・J・トランプ大統領 全国への、最後の挨拶 ホワイトハウスにて 2021年1月20日 親愛なるアメリカ国民諸君 「われわれの国家を再建し、その魂を甦えらせ、そして国民への奉仕の心を、政府に取り戻させる」 われらすべての国民が、この壮大な事業を開始したのは、4年前のことになる。 すなわち我々は、すべてのアメリカ国民にとり、アメリカを再び偉大にする、その事業に着手したのである。 第45代アメリカ大統領としての任期を終える今、私は諸君の前にいて、我々がともに成し遂げたことを、実に誇りに思っている。 我々はここに来たときやるべきだった仕事、そしてそれ以上の成果をあげた。 今週、わが国には新しい政権が発足する。アメリカを安全で繁栄する国にするため、新政府の成功を
Join the O'Reilly online learning platform. Get a free trial today and find answers on the fly, or master something new and useful. Learn more It’s an exciting time to build with large language models (LLMs). Over the past year, LLMs have become “good enough” for real-world applications. The pace of improvements in LLMs, coupled with a parade of demos on social media, will fuel an estimated $200B
Web Neural Network API W3C Candidate Recommendation Draft, 4 December 2024 More details about this document This version: https://www.w3.org/TR/2024/CRD-webnn-20241204/ Latest published version: https://www.w3.org/TR/webnn/ Editor's Draft: https://webmachinelearning.github.io/webnn/ Previous Versions: https://www.w3.org/TR/2024/CRD-webnn-20241128/ History: https://www.w3.org/standards/history/webn
LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog LINEの開発組織のそれぞれの部門やプロジェクトについて、その役割や体制、技術スタック、今後の課題やロードマップなどを具体的に紹介していく「Team & Project」シリーズ。今回は、LINEの提供するAI関連のソリューションやプロダクトに実装されている、音声認識技術の開発を担当しているチームを紹介します。 Speechチームの木田祐介、坂本渚、芦川博人に話を聞きました。 Speechチームの皆さん まず、自己紹介をお願いします。 木田:AIカンパニーにて音声認識技術の開発を行っているSpeechチームのマネージャーをしています。1年ほど前にエンジニアとしてSpeechチームにジョインして、今年の1月からマネージャーを務め
本記事は MIXI DEVELOPERS Advent Calendar 2022 の4日目の記事です。 TL;DR Romi チームでは自然言語処理をメインでやりつつ、最近は音声系も手を出しつつあるよ 2022年末現在の音声認識最強モデル Whisper を高速化 重みの fp16 化 TorchScript 化 認識の長さを30秒ごとから10秒ごとに 結果処理速度が約2倍に ソースコード: https://github.com/projectlucas/efficient_whisper 実験結果: https://github.com/projectlucas/efficient_whisper/blob/main/notebooks/efficient_whisper.ipynb はじめに こんにちは株式会社 MIXI Romi 事業部 Engineering Manager の
無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと:PCでもスマホでも使える!(1/2 ページ) 会議などの議事録を作成したり、プレゼンテーションの内容を後から確認したりするため、音声を録音したいこともあるだろう。そのような場合、数年前まではICレコーダーを利用するのが一般的だったように思うが、最近ではスマートフォン単体で録音できるアプリも増えてきた。 また、そうして録音した内容を文字起こしするのは、以前は人力で行うのが当たり前だったが、今では自動で文字起こしまで行ってくれるものも出てきている。そのような自動で文字起こしを行ってくれるLINEのアプリ「CLOVA Note」を実際に利用したので、どの程度使えるものなのか簡単に紹介しよう。 β版として無料提供 アプリでもファイルのアップロードでも利用可能 CLOVA Noteは、LINEがこの5月からβ版として無料で提供
WorldUkraineInside the Ukrainian Counterstrike That Turned the Tide of the War It would be easy to underestimate Valeriy Zaluzhny. When not in uniform, the general prefers T-shirts and shorts that match his easygoing sense of humor. When he first heard from aides to Ukrainian President Volodymyr Zelensky in late July 2021 that he was being tapped to lead the country’s armed forces, his stunned res
岸田首相がニューヨークの証券取引所で「ジョブ型」と口走ったという新聞報道を見て、官邸ホームページに見に行ったところ、なるほどこのように喋っておりました。 https://www.kantei.go.jp/jp/101_kishida/statement/2022/0922speech.html 日本の五つの優先課題を紹介する。 第1に、「人への投資」だ。 デジタル化・グリーン化は経済を大きく変えた。これから、大きな付加価値を生み出す源泉となるのは、有形資産ではなく無形資産。中でも、人的資本だ。 だから、人的資本を重視する社会を作り上げていく。 まずは労働市場の改革。日本の経済界とも協力し、メンバーシップに基づく年功的な職能給の仕組みを、個々の企業の実情に応じて、ジョブ型の職務給中心の日本に合ったシステムに見直す。 これにより労働移動を円滑化し、高い賃金を払えば、高いスキルの人材が集まり、そ
はじめに 今回はシャドーイングについて考えていきます。シャドーイングとはそもそもどのようなトレーニングなのか?英語学習への効果や、必要な時間も丁寧に解説していきます。シャドーイングをするには事前の準備が大切です。英語の音声規則や変化も知っておく必要があります。シャドーイングの効果的な正しいやり方をステップごとに丁寧に説明していきますので、ぜひ参考にしてください。おすすめの教材やYoutubeなどもご紹介していきます。 シャドーイングとは シャードーイングの歴史 シャドーイングの効果 自動化の促進 インプット効果 必要なトレーニング時間や到達度 ディクテーションとの違いは? シャドーイングは難しい? 初心者でも成功する方法とは? シャードイングをする前に必要なこと チャンク学習 スラッシュリーディング 発音規則のルール(フォニックス) 音声変化の規則 連結 同化 脱落 レベルに合った教材の準
[Laurence Ball, Gita Gopinath, Daniel Leigh, Prachi Mishra, Antonio Spilimbergo, “US inflation: Set for take-off?” VoxEU, May 7, 2021] いまアメリカで進行中の財政拡大はどこまでインフレを押し上げると見込まれるだろうか? 本コラムでは,次のことを示す新たな証拠を提示する――すなわち,COVID-19 危機がはじまって以降,これまでのところ,消費者物価指数 (CPI) の基調(加重中央値)は安定して下がってきている.これは,歴史的なフィリップス曲線の関係からおおむね予測されるとおりだ.一部の論者が予測するように進行中の財政拡大によって失業率が 1.5%~3.5% に下がったら,2023年までにインフレ率の基調は約 2.5%~3% にまで上がりうる.財政拡大が一時
ABEJAアドベントカレンダー2020の19日目の記事です。 この記事は何? 結局AIって何個データ必要なの?ってよく聞かれると思います。 そんなん知るか この記事では、ある程度精度が出ている既存のタスクにおいて、どんなデータを、どのくらいの量与えているかを調べた結果です。ちなみに、僕自身、すべてのタスクを扱ったことがあるわけでは無いので、ほぼ一部適当な部分もあるかと思いますが、ご容赦ください。あと、このデータが入ってないよ!ってツッコミも歓迎です。 あと、技術は常に進んでいるので、ちゃんと最新技術を追っておけば、より少ないデータで良い結果を出すことが出来ないこともない。が、最新技術とはいえ銀の弾丸ではないのが通常で、例えlightweightGANがでたからと言って、100枚で学習できます!とか勝手に広がると困っちゃう。色んなタスクにおいて、まぁ大体どんなタスクも一般的にはこんなもんよっ
Xがカリフォルニア州で成立した「Defending Democracy from Deepfake Deception Act of 2024(ディープフェイクの偽りから民主主義を守る法案2024:AB-2655)」の差止めを求めて裁判所に提訴しました。 Musk’s X Sues to Block California’s Deepfake Deception Act - Bloomberg https://www.bloomberg.com/news/articles/2024-11-15/musk-s-x-sues-to-block-california-s-deepfake-deception-act Elon Musk's X sues California over AI law targeting deepfakes, deceptive election content -
トランプ大統領が嫌っているのは「プラットフォームの偏向」ではなく「表現の自由」そのものである投稿者: heatwave_p2p 投稿日: 2020/12/142020/12/14 Electronic Frontier Foundation トランプ大統領はこのところ、第230条の撤廃規定を盛り込まないのであれば、国防権限法(NDAA)に「拒否権を発動する」と脅しを掛けている。彼が大統領として仕掛けるネット上の表現の自由への最後の攻撃になるかもしれないが、少なくとも最初の攻撃ではないのは確かだ。NDAAは議会が毎年通過させる「最優先」法案の1つである。トランプ大統領はオンラインの表現の自由を保護する最も重要な法律を殺すために、この法案をブザービーターとして利用しようとしているというのだから始末に負えない。議会は230条に反対するトランプ大統領の攻撃を断固拒絶しなくてはならない。 230条で
December 18, 2024 by Burke Holland, @burkeholland We're excited to announce an all new free plan for GitHub Copilot, available for everyone today in VS Code. All you need is a GitHub account. No trial. No subscription. No credit card required. Enable GitHub Copilot Free You can click on the link above or just enable GitHub Copilot right from within VS Code like so... With GitHub Copilot Free you g
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く