「speech」を検索 - はてなブックマーク

321 - 360 件 / 2386件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

speechの検索結果321 - 360 件 / 2386件

ドイツ・ヒップホップの歴史
- 36 users
- julyoneone.wordpress.com
- エンタメ
- 2024/11/08
ドイツ・ヒップホップの歴史・目次・始めに・世界第4の存在「ドイツ・ヒップホップ」・ドイツ・ヒップホップ略史・ドイツ・ヒップホップの歴史・1980年代・前半：ドイツ・ヒップホップ黎明期・GLS・ユナイテッド『ラッパーズ・ドイチュ』（1980）・後半：英語ラップかドイツ語ラップか・ロック・ダ・モスト『ユーズ・ザ・ポッシ』（1988）・エレクトリック・ビート・クルー『ヒア・ウィ・カム』（1989 ・フレッシュ・ファミリー『アフメット・ギュンドゥズ』（1989）・1990年代・前半：ドイツ・ヒップホップのメジャー化・反文化帝国主義とヒップホップのドイツ化・コンピレーション『クラウツ・ウィズ・アティチュード』（1991）・英語路線の最末期・ジャーマン・ラップ・メタル：あり得たかもしれない成功？・トルコ語ラップの黎明・キング・サイズ・テラー『ビア・ヤバンチニン・ハ
- hiphop
- あとで読む
- 音楽
- music
- history
- あとで
https://www.waseda.jp/top/assets/uploads/2022/04/2204_speech_koreeda.pdf
- 36 users
- www.waseda.jp
- 暮らし
- 2022/04/10
- memo
- あとで読む
［速報］Amazon、自社開発の基盤モデル「Amazon Nova」発表。テキストから画像や動画の生成、マルチモーダルまで対応
- 36 users
- www.publickey1.jp
- テクノロジー
- 2024/12/04
Amazon Web Services（AWS）が米ラスベガスで開催中のイベント「AWS re:Invent 2024」で、基調講演にAmazon CEOのアンディ・ジャシー氏が登壇。同社が開発した新しい基盤モデルである「Amazon Nova」を発表しました。 Amazon Novaは複数のモデルから構成されています。 Amazon Nova Micro 低コストかつ小さなレイテンシでテキストのみを処理するモデル Amazon Nova Lite 低コストかつ高速な、画像、動画、テキストによる入力に対応したマルチモーダルなモデル Amazon Nova Pro 精度、スピード、コストの最適な組み合わせで幅広いタスクに対応する高性能なマルチモーダルモデル Amazon Nova Premier 同社のマルチモーダルモデルの中で最も複雑な推論タスクに対応し、カスタムモデルを抽出するための教師
- aws
- AI
- あとで読む
- amazon
- software
生成AIを信用しすぎてハルシネーションに引っかかった話 - Qiita
- 36 users
- qiita.com/suzuyu0115
- テクノロジー
- 2024/09/01
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに皆さんは日々の業務でAIを利活用しておりますでしょうか。生成AIの進化は凄まじく、プログラミングの経験が浅い人でも、簡単なアプリケーションくらいなら作れてしまうほどです。すごい時代ですよね。私自身、要件定義は自身で行い、コーディングはAIに任せるような場面も多いです。しかし、生成AIを扱う上で常に意識すべきことは、「AIは常に完璧ではない」ということです。 AIの精度は日々進化を続けていますが、それでもハルシネーションが完全に改善できているわけではありません。ハルシネーションとは？ハルシネーション（Hallucina
litagin/moe-speech · Datasets at Hugging Face
- 36 users
- huggingface.co
- テクノロジー
- 2024/01/24
Not-For-All-Audiences This repository has been marked as containing sensitive content and may contain potentially harmful and sensitive information. View dataset card
Actions
- 36 users
- sindresorhus.com
- テクノロジー
- 2022/02/07
The app provides lots of powerful extra actions for the Shortcuts app on macOS, iOS, and visionOS. These actions make it significantly easier to create shortcuts. Restart your device if the actions do not show up in the Shortcuts app. Also try setting a different device language and then back. If you have any questions about how to use the different actions or for what, try asking the Actions GPT
- mac
- iPhone
- macOS
- app
- iOS
- ツール
- あとで読む
- tool
- アプリ
オンライン表現の自由のチョークポイント――なぜインフラの検閲はプラットフォームの検閲よりも深刻なのか | p2ptk[.]org
- 36 users
- p2ptk.org
- 学び
- 2021/01/15
オンライン表現の自由のチョークポイント――なぜインフラの検閲はプラットフォームの検閲よりも深刻なのか投稿者: heatwave_p2p 投稿日: 2021/1/142021/1/14 Electronic Frontier Foundation 先週、トランプ大統領の支持者が連邦議会議事堂に侵入・破壊行為を行った暴動を受けて、FacebookとTwitterは大統領を追い出す決定を下した。両社がこれまで、トランプ大統領を世界の政治指導者の一人としてコンテンツモデレーションのルールの大半を免除する立場をとってきたことを考えれば、踏み込んだ決断を下したといえる。大統領のフォロワーの多くは、すぐさまParlerに乗り換えた。だが今週、この動きは新たな展開を見せている。Amazon Web Service（AWS）やGoogleのAndroid・AppleのiOSのアプリストアなど、技術的「スタッ
- law
- あとで読む
- ネット
- 企業
Yann LeCun’s Deep Learning Course at CDS is Now Fully Online & Accessible to All
- 35 users
- nyudatascience.medium.com
- テクノロジー
- 2020/10/09
CDS is excited to announce the release of all materials for Yann LeCun’s Deep Learning, DS-GA 1008, co-taught in Spring 2020 with Alfredo Canziani. This unique course material consists of a mix of close captioned lecture videos, detailed written overviews, and executable Jupyter Notebooks with PyTorch implementations. The course covers the latest techniques in both deep learning and representation
イーロン・マスクが「Twitter」から「X」に名称を変更した理由を語る、金融取引を含む包括的アプリになるため「Twitter」の名前はそぐわないと主張
- 35 users
- gigazine.net
- テクノロジー
- 2023/07/26
2023年7月24日、長らく「Twitter」の名称で運営されてきたSNSの名称が「X」に変更され、ユーザーの間に戸惑いが広がりました。「X」のアイコンを見慣れた「青い鳥」に戻す拡張機能をリリースするユーザーも現れる中、Twitterを買収したイーロン・マスク氏が「社名を変更した企業」の一覧に「X: Twitter」と付け加えた投稿へのリプライで、「Twitterの名称をXに変更した理由」について説明しています。 Twitter was acquired by X Corp both to ensure freedom of speech and as an accelerant for X, the everything app. This is not simply a company renaming itself, but doing the same thing. The Twi
- GIGAZINE
- Twitter
- ネット
- IT
- business
- 経済
- news
- *あとで読む
「こんなに感情移入した曲はない…！」鬼龍院翔さん、自身とGACKTさんの格付けチェックをテーマにしたボカロ曲を絶賛
- 35 users
- togetter.com
- おもしろ
- 2022/12/20
VoiSona公式 @VoiSonaOfficial AI技術でリアルな歌声を再現する音声創作ソフト「VoiSona」（旧CeVIO Pro）公式です。音声創作ソフト「CeVIO」姉妹ブランド。 ▼運営会社：株式会社テクノスピーチ（@techno_speech） ※本アカウントは告知・宣伝用の為、個別のご意見ご質問は下記公式サイトCONTACT宛にお寄せ下さいませ。 voisona.com VoiSona公式 @VoiSonaOfficial 【NEWS】 AI歌唱ソフト「VoiSona」新規ボイスライブラリ、「機流音」＆「AiSuu」をリリースしました！！機流音（CV：鬼龍院翔<ゴールデンボンバー>） voisona.com/artist/kirune_… AiSuu（CV：すぅ<SILENT SIREN>） voisona.com/artist/aisuu_j… #VoiSona
スコットランドのトランスジェンダーを不愉快にしたら地球のどこに居ても犯罪者になる「ヘイトクライム法」が施行される
- 35 users
- gigazine.net
- 世の中
- 2024/04/14
2024年4月1日に、スコットランドで「ヘイトクライムと公共の秩序法(Hate Crime and Public Order Act)」が施行されました。インターネットの書き込みを含め、スコットランドで読めるものならすべて「ヘイト」となり得るこの法律は、言論の自由への影響が懸念されています。 Scotland's Hate Speech Act and Abuse of Process - Craig Murray https://www.craigmurray.org.uk/archives/2024/03/scotlands-hate-speech-act-and-abuse-of-process/ Scotland’s new hate crime law: what does it cover and why is it controversial? | Scotland | Th
State of GUI 2022 - KAS blog
- 35 users
- kas-gui.github.io
- テクノロジー
- 2022/12/14
Rust: state of GUI, December 2022 There was a recent call for blogs about Rust GUI. So, Are we GUI yet? Contents: Categorised listing of toolkits State of KAS State of GUI Categorised listing of toolkits Lets start by categorising entries from Are we GUI yet, ignoring those which appear abandoned or not very functional. Bindings Wrappers around platform-specific toolkits: Mac OS / iOS - cacao - Ru
- GUI
- Rust
- あとで読む
参院選当選の暴露系YouTuber「ガーシー」、SNSをマストドンに立てる
- 35 users
- www.itmedia.co.jp
- 政治と経済
- 2022/07/15
NHK党から参議院選に出馬し当選した暴露系YouTuber（現在チャンネルは停止中）のガーシーこと東谷義和さんが7月13日、独自のSNSを立ち上げた。プラットフォームとしては分散型SNSのマストドンを採用。動画サービスのFC2の元社長である高橋理洋さんがバックアップする形で独自SNS「GAAC2 FREE SPEECH」を立ち上げた。
- Mastodon
- SNS
- ネット
- ITmedia
- -
- あとで読む
- society
- politics
GPT-4oがどれぐらい早くなったのかコールセンターに導入して試してみた話 - APC 技術ブログ
- 35 users
- techblog.ap-com.co.jp
- テクノロジー
- 2024/05/26
gpt-4o はじめにこんにちは、ACS事業部の佐竹です。今回のMicrosoft Buildで発表されたGPT-4oについて、どの程度レスポンスが良くなったか是非触ってみたく、今回の記事を書くことにしました。 1.1.5.Azure OpenAI Serviceの主なAIの進化 news.microsoft.com 以前、Azure Communication ServiceとAzure OpenAI Serviceを使って、コールセンターを作ってみたのですが、そこにGPT-4oを組み込む形でGPT-4-32kとの速度比較を行いました。 techblog.ap-com.co.jp 上記の記事はハンズオン形式で記載しておりますので、お手隙の際に是非手を動かしていただけますと幸いです。概要全体アーキテクチャは以下のようになります。アーキテクチャ図全体の流れは以下の通りです。ユー
- GPT
- あとで読む
- 人工知能
- service
- communication
- 技術
- ブログ
End-to-End音声認識の計算量を削減した話
- 35 users
- techblog.yahoo.co.jp
- テクノロジー
- 2020/06/29
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、音声処理黒帯（黒帯はヤフー内のスキル任命制度）の藤田です。今日のブログでは、音声認識技術の研究開発におけるヤフーの最新の取り組みを紹介します。特に、近年注目されているTransformerという手法に基づく、End-to-End音声認識の計算量を削減した研究を紹介します。この研究は、難関国際会議IEEE ICASSP2020に投稿し、採択されました。また、arXivでプレプリントを公開しています。そして、ESPnetというEnd-to-Endモデルのツールキット上でソースコードも公開しています。興味のある方はぜひ、こちらもご参照ください。音声認識で用いられるEnd-to-Endモデルとは？音声認識技術は音声をテキ
Microsoft社のアーキテクトが説く、LLM実装の最前線　登場から今までを振り返って、予想する未来像 | ログミーBusiness
- 35 users
- logmi.jp
- テクノロジー
- 2023/11/03
登壇者の自己紹介蒲生弘郷氏：「ChatGPTの10ヶ月と開発トレンドの現在地」というタイトルで、蒲生から発表します。よろしくお願いいたします。ちょっと私の自己紹介です。Azure OpenAI Champという立場で、外部発信などをやっています。いっぱい自己紹介をしていきたいところですが、本日はあまり時間もないので省略して、次にいきたいと思います。今回は、けっこう開発者向けの発展的な内容を扱っていきますが、もし基本的な内容から確認していきたいという場合には、「Azure OpenAI 大全」というものを公開していて、リンクを貼っておくので、そちらの資料を併せてご確認いただければと思います。「ChatGPT」の登場から今までを振り返るでは、本日のテーマとして「ChatGPT」の登場から10ヶ月（※登壇当時）ということで、2022年11月から登場したChatGPTに関する技術について少し
- LLM
- ChatGPT
- あとで読む
- AI
口パクで音声入力できるイヤフォン　口を動かした際の耳穴の変形から予測　米国チームが開発
- 35 users
- www.itmedia.co.jp
- テクノロジー
- 2022/08/15
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。米University at Buffalo, State University of New York、米ノースウェスタン大学、米ワシントン大学、米コロラド大学の研究チームが開発した「EarCommand: “Hearing” Your Silent Speech Commands In Ear」は、口パク（無声発話）で音声入力できるイヤフォンだ。口を動かした際の耳穴の変化を取得して入力を区別する。音声を発することなく口の動きだけでモバイル機器を操作するサイレントスピーチインタラクション（Silent Speech Interaction、SSI）が広く研究されている。音声入力による情
「日本人のフォロワーが沢山だ！」再び大拡散した感動的なスピーチ、論破劇が爽快
- 34 users
- www.buzzfeed.com
- 政治と経済
- 2021/06/04
「日本人のフォロワーが沢山だ！」再び大拡散した感動的なスピーチ、論破劇が爽快ウィリアムソンさんの論破劇が爽快すぎ。ユーモアもあるけど、シンプルかつ1番重要なことをしっかりと伝えていて、何度も聞きたくなるスピーチです。👏 2013年にニュージーランドの議会で行われた「ビッグ・ゲイ・レインボー演説」が再び、日本のSNS上で話題を呼んでいます。モーリス・ウィリアムソン議員（当時）が、同性婚を認める法案に賛成を訴える演説でした。 5月20日、与党・自民党でLGBTなど性的マイノリティーに対する理解増進に向けた法案の審査が行われました。しかし、様々な理由で法案に反対する議員が多く、議論はまとまりませんでした。中には「道徳的にLGBTは認められない」と発言した出席者もいると報じられています。こうした政治の動きをうけて、ウィリアムソン元議員の演説が国内で改めて注目されるようになり、趣旨に賛同する人
【CSS】吹き出しデザインをCSSで作ってみる！ - Tech.log
- 34 users
- pcat.hatenablog.com
- テクノロジー
- 2020/06/25
今回は、吹き出しデザインをCSSで作る方法を紹介したいと思います！最初に、ベースとなるコードを紹介した後、簡単なカスタムパターンをいくつか紹介していきたいと思います。目次ベースコード使い方カスタムパターン吹き出しの色を変えてみる！吹き出しの方向を変更してみる！角丸表示にしてみる！影付きの吹き出しを表示してみる！まとめベースコード吹き出しデザインは以下のようなCSSで、実現することができます。 .speech-bubble { position: relative; display: inline-block; margin-bottom: 13px; padding: 1rem 1rem; min-width: 60px; max-width: 20rem; color: #929292; font-size: 16px; background: #d5f1a9;
Apple共同創業者スティーブ・ウォズニアック氏の「幸せの方程式」　自分自身を「良い人間」にするための工夫 | ログミーBusiness
- 34 users
- logmi.jp
- 学び
- 2023/06/29
カリフォルニア大学バークレー校の卒業式に、卒業生でアップル共同創業者のスティーブ・ウォズニアック氏が登壇しました。小学生時代からIQ200を超えていたと言われる天才エンジニアの同氏。大学時代のエピソードやジョブスとの出会い、コンピュータ・エンジニアになると決意したきっかけなどを振り返りました。本記事では、大学時代に導いた人生の「幸せの方程式」について語りました。 Apple共同創業者・ウォズニアック氏が登壇スティーブ・ウォズニアック氏：私は、人生の中で常に年上よりも若い人たちを尊重してきました。まあとにかく、今日は（大学から）「簡潔（ブリーフ）に、おもしろく」と頼まれたので、ローブの下にはブリーフ　(パンツ）を履いて来ました。 (会場笑い) ありがとう。よく、「人生で一番誇らしい瞬間は何ですか？」と聞かれます。それに対して私は「カリフォルニア大学バークレー校を卒業したことだ」と断言します。
トランプの娘イヴァンカも始めた、右派「検閲なし」SNSの人気が急上昇
- 34 users
- www.newsweekjapan.jp
- 世の中
- 2020/11/20
Ivanka the Latest Trump to Join Parler, As 'Free Speech' App CEO Defends Users' Right to Say 'Crazy Things' ＜「自由な発言」の検閲を拒否するソーシャルメディアアプリ「パーラー」に、右派の政治家や活動家が続々集結中＞アメリカの保守派の政治家や支持者の間で人気が急上昇しているSNS「パーラー」に、最近ドナルド・トランプ米大統領の長女イヴァンカがアカウントを開設した。大統領上級顧問で実業家でもあるイヴァンカ・トランプは17日、自分のツイッターの1000万人のフォロワーに対して、パーラーでアカウントを作ったことを告知した。パーラーは、iOSとアンドロイドの両方で、アメリカ国内の11月のアプリダウンロードランキングのトップになっている。 18日時点で、イヴァンカはまだパーラーのアカウントに
- world
- あとで読む
- 政治
- sns
- ダジャレ
- アメリカ
面倒な仕事やサイト作成がたった2日でマスター可能！人気のPythonやWordPressでスキルアップできる「Udemy」初夏のビッグセール
- 34 users
- gigazine.net
- テクノロジー
- 2021/05/18
「新たなスキルを身につけて年収UPを目指したい」「プログラミングで仕事を自動化して楽に稼ぎたい」と日々思っている人は少なくないはず。しかし、いざ学習を始めようとしても忙しい毎日の中から時間を確保するのは難しいものです。ちょうど講座をムービー形式で受講できる学習プラットフォームの「Udemy」が5月27日(木)まで初夏のビッグセールを行っており、丁寧で分かりやすい解説講座が1270円～受講可能とのことで、忙しい毎日を送っていても週末の2日間だけで学習を完了できそうな短期集中型の講座をピックアップしてみました。外出がおっくうになる梅雨の季節や、ステイホームをうまく活用するために、この機会に買いだめしておくのがオススメです。オンラインコース -世界最大級のオンライン学習プラットフォーム- Udemy https://www.udemy.com/ ・目次 ◆1：WordPressの使い方を習得し
ML and NLP Research Highlights of 2020
- 33 users
- www.ruder.io
- テクノロジー
- 2021/01/19
ML and NLP Research Highlights of 2020 This post summarizes progress in 10 exciting and impactful directions in ML and NLP in 2020. The selection of areas and methods is heavily influenced by my own interests; the selected topics are biased towards representation and transfer learning and towards natural language processing (NLP). I tried to cover the papers that I was aware of but likely missed m
Machine Learning Trends You Need to Know - Gradient Flow
- 33 users
- gradientflow.com
- テクノロジー
- 2022/06/06
Insights and trends that will help you navigate the AI landscape. By Assaf Araki and Ben Lorica. Automation and democratization are on the rise AutoML tools are designed to automate the process of training and deploying machine learning. Such tools have progressed to the point where they can produce adequate models for many use cases. Moreover, in domains where model hubs and foundation models (e.
- 機械学習
- ***
- あとで読む
- AI
if-then-else/if-then-else.md at master · e-n-f/if-then-else
- 33 users
- github.com/e-n-f
- テクノロジー
- 2020/12/14
Video Hi, I'm Eric. I'm here to talk about what seems like an absurd idea: that if-then-else had to be invented. If-then-else is how we talk about conditions in programming languages: if something is true, then do a thing, else do a different thing. That's just English, right? Except that it isn't. I can't use "else" as a conjunction in normal speech, only in computer programs. Where did this else
Amazon Is Booting Parler Off Of Its Web Hosting Service
- 33 users
- www.buzzfeednews.com
- テクノロジー
- 2021/01/10
Amazon notified Parler that it would be cutting off the social network favored by conservatives and extremists from its cloud hosting service Amazon Web Services, according to an email obtained by BuzzFeed News. The suspension, which will go into effect on Sunday just before midnight, means that Parler will be unable to operate and will go offline unless it can find another hosting service. People
AIが間違えやすい「指の数」を修正する技術、Stability AIの動画生成AI「Stable Video Diffusion」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
- 33 users
- www.techno-edge.net
- テクノロジー
- 2023/11/27
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第22回目は、AIが不得意とする指の数を修正する技術やStability AIの動画生成モデルなど、生成AI最新論文の概要5つをお届けします。生成AI論文ピックアップ人間が話すような音声合成でテキストを読み上げるTTSモデル「StyleTTS 2」　コロンビア大の研究者ら開発> Stability AI、画像から動画を生成するモデル「Stable Video Diffusion」発表画像と動画を同時に扱う大規模視覚言語モデル「Video-LLaVA」　北京大などが開発テキストから3Dモデルを生成する新型モデル「LucidDreamer」他に影響を与えず表情や年
- AI
- 画像生成AI
- 技術
- 人工知能
- techfeed
- あとで読む
- 論文
- 言語
- video
Donald Trump 日本語訳退任演説全文
- 33 users
- trumpwatching.blog.fc2.com
- 政治と経済
- 2021/01/22
2025-04 « 123456789101112131415161718192021222324252627282930 » ドナルド・J・トランプ大統領　全国への、最後の挨拶ホワイトハウスにて　2021年1月20日親愛なるアメリカ国民諸君「われわれの国家を再建し、その魂を甦えらせ、そして国民への奉仕の心を、政府に取り戻させる」われらすべての国民が、この壮大な事業を開始したのは、4年前のことになる。すなわち我々は、すべてのアメリカ国民にとり、アメリカを再び偉大にする、その事業に着手したのである。第45代アメリカ大統領としての任期を終える今、私は諸君の前にいて、我々がともに成し遂げたことを、実に誇りに思っている。我々はここに来たときやるべきだった仕事、そしてそれ以上の成果をあげた。今週、わが国には新しい政権が発足する。アメリカを安全で繁栄する国にするため、新政府の成功を祈る
- 米国
- 歴史
- 政治
- english
- アメリカ
- politics
- 国際
- あとで読む
What We Learned from a Year of Building with LLMs (Part I)
- 33 users
- www.oreilly.com
- テクノロジー
- 2024/05/30
Join the O'Reilly online learning platform. Get a free trial today and find answers on the fly, or master something new and useful. Learn more It’s an exciting time to build with large language models (LLMs). Over the past year, LLMs have become “good enough” for real-world applications. The pace of improvements in LLMs, coupled with a parade of demos on social media, will fuel an estimated $200B
Web Neural Network API
- 33 users
- www.w3.org
- テクノロジー
- 2020/10/02
Web Neural Network API W3C Candidate Recommendation Draft, 4 December 2024 More details about this document This version: https://www.w3.org/TR/2024/CRD-webnn-20241204/ Latest published version: https://www.w3.org/TR/webnn/ Editor's Draft: https://webmachinelearning.github.io/webnn/ Previous Versions: https://www.w3.org/TR/2024/CRD-webnn-20241128/ History: https://www.w3.org/standards/history/webn
- 機械学習
- api
- MachineLearning
- web
- network
LINEのAIサービスの音声認識技術を支えるチームを紹介します
- 33 users
- engineering.linecorp.com
- テクノロジー
- 2021/07/26
LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog LINEの開発組織のそれぞれの部門やプロジェクトについて、その役割や体制、技術スタック、今後の課題やロードマップなどを具体的に紹介していく「Team & Project」シリーズ。今回は、LINEの提供するAI関連のソリューションやプロダクトに実装されている、音声認識技術の開発を担当しているチームを紹介します。 Speechチームの木田祐介、坂本渚、芦川博人に話を聞きました。 Speechチームの皆さんまず、自己紹介をお願いします。木田：AIカンパニーにて音声認識技術の開発を行っているSpeechチームのマネージャーをしています。1年ほど前にエンジニアとしてSpeechチームにジョインして、今年の1月からマネージャーを務め
- AI
- あとで読む
- 学習
- 技術
音声認識モデル Whisper の推論をほぼ倍速に高速化した話 - Qiita
- 33 users
- qiita.com/halhorn
- テクノロジー
- 2022/12/05
本記事は MIXI DEVELOPERS Advent Calendar 2022 の4日目の記事です。 TL;DR Romi チームでは自然言語処理をメインでやりつつ、最近は音声系も手を出しつつあるよ 2022年末現在の音声認識最強モデル Whisper を高速化重みの fp16 化 TorchScript 化認識の長さを30秒ごとから10秒ごとに結果処理速度が約2倍にソースコード： https://github.com/projectlucas/efficient_whisper 実験結果： https://github.com/projectlucas/efficient_whisper/blob/main/notebooks/efficient_whisper.ipynb はじめにこんにちは株式会社 MIXI Romi 事業部 Engineering Manager の
無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと
- 32 users
- www.itmedia.co.jp
- テクノロジー
- 2022/08/02
無料で自動文字起こしが可能な「CLOVA Note」を試して分かったこと：PCでもスマホでも使える！（1/2 ページ）会議などの議事録を作成したり、プレゼンテーションの内容を後から確認したりするため、音声を録音したいこともあるだろう。そのような場合、数年前まではICレコーダーを利用するのが一般的だったように思うが、最近ではスマートフォン単体で録音できるアプリも増えてきた。また、そうして録音した内容を文字起こしするのは、以前は人力で行うのが当たり前だったが、今では自動で文字起こしまで行ってくれるものも出てきている。そのような自動で文字起こしを行ってくれるLINEのアプリ「CLOVA Note」を実際に利用したので、どの程度使えるものなのか簡単に紹介しよう。 β版として無料提供　アプリでもファイルのアップロードでも利用可能 CLOVA Noteは、LINEがこの5月からβ版として無料で提供
- LINE
- あとで読む
- web
画像AIの表現/構図のプロンプト集（効果ありのみ、画像あり著作権フリー）｜はいぱーさんかく
- 32 users
- note.com/vivid_walrus6061
- テクノロジー
- 2025/04/08
構図/表現のプロンプト(98個)をNoteに公開しました(URL次のリプ)。画像は著作権フリー。 Zipでダウンロード可モデルはwaiNSFWIllustrious_v100 BGM：BGMer #MangaEditorDesuプロンプト pic.twitter.com/EFUU1cDi0b — Sankaku@Manga Editor Desu (@hypersankaku2) April 7, 2025 漫画ネクタイがモーションブラー。NSFWなら相性良いプロンプト。Focusフレーム外効果構図範囲複数プロンプトリストBacklighting, 逆光 Bokeh, ボケ Chiaroscuro, 明暗法 Diffraction spikes, 回折スパイク Fake phone screenshot, 偽携帯スクリーンショット Fake scrollbar, 偽のスクロールバー H
- image
- あとで読む
- 人工知能
- ai
岸田首相の「ジョブ型」 - hamachanブログ(EU労働法政策雑記帳)
- 32 users
- eulabourlaw.cocolog-nifty.com
- 政治と経済
- 2022/09/24
岸田首相がニューヨークの証券取引所で「ジョブ型」と口走ったという新聞報道を見て、官邸ホームページに見に行ったところ、なるほどこのように喋っておりました。 https://www.kantei.go.jp/jp/101_kishida/statement/2022/0922speech.html 日本の五つの優先課題を紹介する。第１に、「人への投資」だ。デジタル化・グリーン化は経済を大きく変えた。これから、大きな付加価値を生み出す源泉となるのは、有形資産ではなく無形資産。中でも、人的資本だ。だから、人的資本を重視する社会を作り上げていく。まずは労働市場の改革。日本の経済界とも協力し、メンバーシップに基づく年功的な職能給の仕組みを、個々の企業の実情に応じて、ジョブ型の職務給中心の日本に合ったシステムに見直す。これにより労働移動を円滑化し、高い賃金を払えば、高いスキルの人材が集まり、そ
- economics
- 経済
- 労働
- ブログ
シャドーイングとは？英語学習への効果や必要な時間・正しいやり方を丁寧に解説 - ポリグロットライフ | 言語まなび∞ラボ
- 32 users
- www.sunafuki.com
- 学び
- 2020/12/06
はじめに今回はシャドーイングについて考えていきます。シャドーイングとはそもそもどのようなトレーニングなのか？英語学習への効果や、必要な時間も丁寧に解説していきます。シャドーイングをするには事前の準備が大切です。英語の音声規則や変化も知っておく必要があります。シャドーイングの効果的な正しいやり方をステップごとに丁寧に説明していきますので、ぜひ参考にしてください。おすすめの教材やYoutubeなどもご紹介していきます。シャドーイングとはシャードーイングの歴史シャドーイングの効果自動化の促進インプット効果必要なトレーニング時間や到達度ディクテーションとの違いは？シャドーイングは難しい？初心者でも成功する方法とは？シャードイングをする前に必要なことチャンク学習スラッシュリーディング発音規則のルール（フォニックス）音声変化の規則連結同化脱落レベルに合った教材の準
- language
- 言語
- 学習
- あとで読む
- 英語
Ball et al.「アメリカのインフレ率：離陸確実か？」（2021年5月7日）
- 32 users
- econ101.jp
- 学び
- 2021/05/16
[Laurence Ball, Gita Gopinath, Daniel Leigh, Prachi Mishra, Antonio Spilimbergo, “US inflation: Set for take-off?” VoxEU, May 7, 2021] いまアメリカで進行中の財政拡大はどこまでインフレを押し上げると見込まれるだろうか？本コラムでは，次のことを示す新たな証拠を提示する――すなわち，COVID-19 危機がはじまって以降，これまでのところ，消費者物価指数 (CPI) の基調（加重中央値）は安定して下がってきている．これは，歴史的なフィリップス曲線の関係からおおむね予測されるとおりだ．一部の論者が予測するように進行中の財政拡大によって失業率が 1.5%～3.5% に下がったら，2023年までにインフレ率の基調は約 2.5%～3% にまで上がりうる．財政拡大が一時
LLMモジュールの普通ではない使い方
- 32 users
- zenn.dev/fairydevices
- テクノロジー
- 2025/03/31
それはある日のことある日のこと、社内Slackに吉川部長からこんな投稿がありました。「伊達さんがXでリポストしてたアリババクラウドのオープンソースLLMって、オフラインでLLMが動く小さいモジュールなのかしら？オフラインでLLMが使える可能性があるなら試してみたい感じではあります。」これは、M5Stack社のLLMモジュールの発売案内に関するポストでした。 LLMモジュールが面白いのは、AI対話アプリケーションをハードウエア単体だけで実現しているところです。高価なGPUを積んだPCであれば単体で実現するのは比較的容易なのですが、安価な基板１つだけで音声対話型AIを実現してしまうのは、ちょっとびっくりする技術です。一般的に、音声対話型のAIを実現するためには、以下の４つの技術が必要になります。キーワード検出　KWS（Keyword Spotting）：特定のキーワードやフレーズを音
- LLM
- 電子工作
- 人工知能
- あとで読む
- ai
Deep Learningの各種タスクにおけるベンチデータセットとデータ数をまとめた - Qiita
- 32 users
- qiita.com/peisuke
- テクノロジー
- 2020/12/23
ABEJAアドベントカレンダー2020の19日目の記事です。この記事は何？結局AIって何個データ必要なの？ってよく聞かれると思います。そんなん知るかこの記事では、ある程度精度が出ている既存のタスクにおいて、どんなデータを、どのくらいの量与えているかを調べた結果です。ちなみに、僕自身、すべてのタスクを扱ったことがあるわけでは無いので、ほぼ一部適当な部分もあるかと思いますが、ご容赦ください。あと、このデータが入ってないよ！ってツッコミも歓迎です。あと、技術は常に進んでいるので、ちゃんと最新技術を追っておけば、より少ないデータで良い結果を出すことが出来ないこともない。が、最新技術とはいえ銀の弾丸ではないのが通常で、例えlightweightGANがでたからと言って、100枚で学習できます！とか勝手に広がると困っちゃう。色んなタスクにおいて、まぁ大体どんなタスクも一般的にはこんなもんよっ
https://jp.techcrunch.com/2021/07/08/2021-07-07-wellsaid-attracts-10m-a-round-for-higher-quality-synthetic-speech/
- 32 users
- jp.techcrunch.com
- テクノロジー
- 2021/07/08
- ロボット
- あとで読む
- AI
- ツール
- development
- 企業
- 開発