「speech」を検索 - はてなブックマーク

1 - 40 件 / 394件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

speechの検索結果1 - 40 件 / 394件

【完全独学】中国語の話し方　第二言語習得研究を活かした中国語学習ロードマップ - ポリグロットライフ | 言語まなび∞ラボ
- 437 users
- www.sunafuki.com
- 政治と経済
- 2023/10/09
はじめに今回は中国語の話し方を紹介します。私がどうやって中国語を身につけたのか、第二言語習得研究を活かした中国語学習ロードマップを解説していきます。ぜひ注目されている中国語をマスターしてキャリアを広げていきましょう。 ↓↓こちらもぜひチャンネル登録お願いします www.youtube.com 第二言語習得研究で中国語を完全習得第二言語習得研究とは言語習得の仕組み言語習得の4つのプロセス言語知識の自動化中国語の言語的特徴形態論と語順簡体字と繁体字四声拼音難易度発音発音の落とし穴四声&拼音おすすめ発音テキスト単語学習セルフ音読はNG おすすめ単語学習テキストキクタン中国語シリーズ起きてから寝るまで中国語単語帳 HSK基本語彙中国語文法フレーズと単語を結合する中国語文法細かい文法よりも伝わり方仕上げとしてのパターンプラクティスおすすめ文法テキスト
- 中国語
- あとで読む
- 学習
- 言語
- 中国
- 語学
- 教育
- language
ファミマ入店音の装置　パナソニックの「メロディサインW」EC5527W いつの間にか中身がリニューアルしてた件について - honeylab's blog
- 412 users
- honeylab.hatenablog.jp
- 政治と経済
- 2023/08/04
てれれれれれーーん　てれれれれーーんこの音、わかりますよね。ファミマの入店音。実は、ファミマの入店音ではなくて、パナソニックの「メロディサイン」という装置をファミマが導入しているため、この音がしているんです。パナソニックメロディサイン 2種音ホワイト中 EC5227W パナソニック(Panasonic) Amazon 全く関係ないですが、ゆゆうたの才能が憎らしいです。 www.youtube.com で、この音を出してる機械、好きな人は好きなようで、自分で買って手元に置いて居たり、改造（サーキットベンディング）していろいろな音を出したりしてる人がいるほどなじみのある音で、実は機器の初回発売日はなんと１９８０年！ https://www2.panasonic.biz/scvb/a2A/opnItemDetail?contents_view_flg=1&item_cd=EC522
- 技術
- あとで読む
- Panasonic
- 音楽
- hardware
- ガジェット
- ネタ
- ファミマ
- technology
- 製品
デ・ニーロ、受賞スピーチを検閲されたとアップル非難。壇上で気付き「消された部分」を読み上げ喝采受ける | テクノエッジ TechnoEdge
- 348 users
- www.techno-edge.net
- テクノロジー
- 2023/11/30
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他映画俳優のロバート・デ・ニーロ氏が、2023年度のゴッサム・インディペンデント映画賞の授賞式におけるスピーチに登壇した際、読み上げるスピーチ原稿から当初予定していた記述が削除されていたことに関して、アップルと映画賞主催者を非難しました。問題のスピーチはゴッサム賞のなかの一部門を受賞した作品を紹介するため、デ・ニーロ氏が用意したものでした。事前の原稿は冒頭部分で「前大統領は在任中の4年間に3万回以上も嘘をつき、現在の報復キャンペーンでもそのペースを維持しています。しかし、その嘘の数々をもってしても、その本心を隠すことはできません。弱者を叩き、自然の恵みを破壊し、例えば『ポカホンタス』を差別的な言葉として使う
- 映画
- Apple
- アメリカ
- 政治
- あとで読む
- movie
- 表現規制
- 歴史
- これはひどい
OpenAI DevDay で発表された新モデルと新開発ツールまとめ｜npaka
- 269 users
- note.com/npaka
- テクノロジー
- 2023/11/07
以下の記事が面白かったので、かるくまとめました。・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造
- ChatGPT
- あとで読む
- AI
- OpenAI
- GPT
- 開発
- 人工知能
- API
- LLM
- まとめ
RAGのSurvey論文からRAG関連技術を俯瞰する - 元生技のデータサイエンティストのメモ帳
- 265 users
- sue124.hatenablog.com
- テクノロジー
- 2024/07/03
大規模言語モデル (LLM) の学習データに含まれない知識（各社の特有の書類など）を踏まえてLLMに回答させる際に最早必須となってきたRAG (Retrieval-Augumented Generation)。今回はそんなRAGのSurvey論文を元に、RAGの変遷や構成要素、新たに出てきた技術を俯瞰していきます。 Survey論文へのリンクはこちら arxiv.org RAGとは LLMはそれ単体で回答させると、質問によってはハルシネーションや学習時のデータにはなかった情報を生成時に加味できないといった問題から正しくない回答を生成することが多々あります。例えば世間一般に公開されていない自社の就業規則や業務標準についてをChatGPTに質問しても、正しい回答は得られません。そのような問題への対応としてRAGが使われます。「LLM単体で適切な回答を生成できないなら、ユーザーの質問を元に
- RAG
- LLM
- AI
- あとで読む
- 論文
- 検索
- 自然言語処理
- 技術
セックスワーカーを危険に晒す反ポルノ戦争 | p2ptk[.]org
- 252 users
- p2ptk.org
- 世の中
- 2024/06/04
以下の文章は、openDemocracy の「How a war on porn is endangering US sex workers」という2023年1月11日に公開された記事を翻訳したものである。以前、この記事内容に関連する話をうぐいすリボンのTwitterスペースでお話したので、興味ある方はどうぞ。今週、セックスワーカーを危険に晒しているとして非難される米国「人身売買防止法」の公聴会が開催される。 2018年に成立した「オンライン性的人身売買仲介防止法（FOSTA）」と「性的人身売買防止法（SESTA）」は、売春や性的人身売買を促進・助長するウェブサイトに責任を負わせるものとして喧伝されてきた。だが、この法律が実際には人身売買を増やし、セックスワーカーと表現の自由を脅かしていると批判する声もある。この法律では、ユーザが売春や性的人身売買について言及すると、それをホストする
- 表現の自由
- あとで読む
- ポルノ
- 宗教
- 表現規制
- 社会
- アメリカ
- 差別
- 風俗
- 表現
ニュージーランドで内戦が勃発するかもしれない
- 243 users
- anond.hatelabo.jp
- 政治と経済
- 2024/02/08
昨日はニュージーランドの重要な祝日の一つワイタンギ・デーだった。これはニュージーランドに入植してきたイギリス人と原住民であるマオリ族との間で取り交わされた条約であり、イギリスのインチキ外交の一つとして語られるべきものでもある。なぜこれがインチキなのか、といえば、条約である以上英語版とマオリ語版が作られるのだが、お互いに特に重要なポイントが違っている。マオリ語版はニュージーランドを共同統治すると書いていたが英語版は英国王室が主権者となっている、マオリ語におけるとある単語がマオリ語ではかなり広い意味の単語なのにも関わらず英語版では限定的な意味合いになっている、マオリ族は小規模な部族があちこちにあるのだが、締切に間に合わずに条約に調印していない部族がいる、などだ。そもそもなぜこの条約を締結しようとしたかというと、入植者がマオリから土地をだまし取ることが横行したからだと記憶しているのだが、
これは便利！ HTMLはdiv要素一つ、あとはCSSをコピペするだけで100種類のツールチップを簡単に実装できる -CSS Tooltips & Speech Bubbles
- 243 users
- coliss.com
- テクノロジー
- 2024/03/06
HTMLはdiv要素一つだけ、あとはCSSをコピペするだけで約100種類のールチップとスピーチバブルを実装できるCSS Tooltips & Speech Bubblesを紹介します。このツールチップって実装すると、けっこう面倒ですよね。ベタ塗りのツールチップをはじめ、グラデーションの枠、しっぽの位置、しっぽの形状など、さまざまなデザインが、ここを見ればコピペで簡単に実装できます。 CSS Tooltips & Speech Bubbles CSS Tooltips & Speech Bubblesを作成したのは以前紹介したCSS Loaders（紹介記事）やCSS Ribbon Shapes（紹介記事）と同じ作者で、前回はCSSで実装されたローダーとリボンでしたが、今回は100種類のツールチップとスピーチバブルです。
- css
- html
- あとで読む
- web制作
- ツール
- 便利
- デザイン
- 簡単
- ui
求人で良さそうなところあったのに、朝礼前に1分間スピーチあるって書いてて応募するの辞めた→経験者の声や肯定派の意見など色々集まる
- 239 users
- togetter.com
- 政治と経済
- 2024/04/16
おいも🍠 @oimoga_daisuki 求人で良さそうなところあったのに、朝礼前に1分間スピーチあるって書いてて応募するの辞めた。そんなん業務の１つにして何になるんやろ？小学生かよ。 2024-04-15 15:29:55
- togetter
- 会社
- 労働
- 仕事
- あとで読む
- コミュニケーション
- 就職
- work
「OK」って何の略か知ってる？【2023年回顧】
- 188 users
- www.huffingtonpost.jp
- 世の中
- 2023/12/18
日本語でもたくさんの言葉が略されるように、英語もたくさんの略語で溢れている。その中には「OMG」（Oh My God）や「VIP」（Very Important Person）のように明らかなものもあるが、日常的に使っているのに何の略かあまり知られていない言葉もある。例えば、「a.m.」や「p.m.」が何の略語か聞かれても、答えられない人も多いだろう。（ラテン語で「正午前」を意味するante meridiemと「正午後」を意味するpost meridiemの略だ）では、多くの人が1日に何度も使う「OK」という言葉はどうだろう？何の略語か、あなたはご存知か？私たちは通常、同意、合意、受諾を意味するためにOKを使う。また、形容詞や副詞として何かが十分であることを示唆したり、動詞や名詞として承認や許可を表したりもする。 OKは今や、日本も含め、世界中の数えきれないほどの言語で使われている。
- 英語
- 言葉
- english
- あとで読む
- language
- 言語
- ことば
心の中の声が聴こえない？「無内言症」とその影響 - ナゾロジー
- 180 users
- nazology.net
- 学び
- 2024/05/19
「内なる声」なしで生きる人々がいる内なる声、または内言（inner speech）は、私たちが心の中で行う自己対話のことを指し、他人とコミュニケーションをとるために発する言葉は「外言」として区別されています。マンガにおいては「吹き出し」として表記される言葉が外言、心の声（モノローグ）として記載される部分が内言と言えるでしょう。認知科学において内言は計画、問題解決、自己反省、感情の調整など、多くの認知活動に関与し、私たちが日常生活で意思決定を行い、感情を整理し、社会的状況に適応するのを助けてくれていると考えられています。また、外国語をコミュニケーションに使用するためには、一定期間内なる声を用いて練習する必要があり、この内なる声が効果的に使えるようになって初めて、第二言語の習得が進むと言われています。これまでの内なる声に関する研究でも、内なる声は前頭前野と側頭葉の特定の領域で生成される
- 言語
- あとで読む
- 研究
- 心理学
- 脳
- こころ
- medical
- 人
商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生｜DTMステーション
- 172 users
- www.dtmstation.com
- テクノロジー
- 2024/05/31
ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語でテキストを入力すると、非常にリアルで自然な声で、そして高音質なサウンドで喋り声が生成されることです。VOICEPEAKやVOICEVOX、A.I.Voice、CoeFont……などなど、ここ数年で急速に進化し、数々のソフトが出てきたTTS＝Text to Speech（音声読み上げソフト）の世界にSOUND FORGEが殴り込みをかけてきた格好です。しかも単なるTTSに留まらず、翻訳機能も搭載。これによって最大100言語へ翻訳して喋らせることも可能になっているため、グローバルなコンテンツ制作も可能になっています。さらにStoryblocksという音素
- AI
- あとで読む
- DTM
- 音声合成
- sound
- 人工知能
- DAW
- 音声
- tool
- ソフト
俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ
- 159 users
- www.m3tech.blog
- テクノロジー
- 2023/12/01
こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。麻雀を始めるときに一番の障壁になるのは点数計算ではないでしょうか？特に符計算が初心者の関門のようです。一方私のような初中級者でも突然のレアな点数申告にまごつくことがあります。そこで、今回はその人に合った麻雀の点数計算問題(主に符計算が焦点となる問題)を生成して、自分で点数計算&点数申告の練習をする方法を探求したのでその紹介をします。麻雀用語が少しだけ登場するので、対象読者は麻雀を少しでもかじったことのあるエンジニアの方です。 Overview 麻雀の点数計算の難しさ現状の点数計算の練習
OpenAIのGPT-4oを日本語OCRとして使ってみる
- 143 users
- zenn.dev/tomioka
- テクノロジー
- 2024/05/14
昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成（Text To Speech）の表現力について非常に興味を持っています。私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ
- AI
- あとで読む
- ChatGPT
- 日本語
- OCR
- GPT
- 人工知能
- api
スマホでの録音を無効化するツール、中・米の研究者らが開発　部屋内での会話を収録不可に
- 138 users
- www.itmedia.co.jp
- テクノロジー
- 2023/10/10
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 中国の浙江大学や米マサチューセッツ大学アマースト校などに所属する研究者らが発表した論文「Cancelling Speech Signals for Speech Privacy Protection against Microphone Eavesdropping」は、マイクによる録音を無効化する手法についての研究報告である。この手法を用いると、隠し持ったスマートフォンや録音機で録音しても、その部屋での会話を収録することはできなくなる。スマートフォンや音声アシスタントのようなデバイスは、盗聴のリスクを増加させている。この問題への対策として
- 技術
- 研究
- あとで読む
- セキュリティ
- スマホ
- ツール
- 開発
- technology
- 会話
- 論文
GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること
- 131 users
- www.gizmodo.jp
- テクノロジー
- 2023/11/08
GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること2023.11.08 17:009,334 Maxwell Zeff・Gizmodo US ［原文］（ mayumine ）これは嬉しい進化です。 OpenAIの開発者向けカンファレンス｢DevDay｣で、サム・アルトマンCEOよりGPT-4 Turboの公開が発表されました（こちらの記事もどうぞ）。いちばん大きなアップデートは、今回で扱えるトークン数が128Kになって、従来の16倍となる300ページを超える長い文書を1つのプロンプトに入れられるように。本をまるごと一冊読み込ませられるようになったということです。長い文章を要約させたり、気になる箇所を教えてもらったりできるようになったことで、活用の幅はさらに大きく広がると思います。さらにGPT-4 Turboでは、JSONモードが実装され、JS
- AI
- あとで読む
- ChatGPT
- 人工知能
- 文章
- techfeed
「表現の自由」の名のもとに誰かの表現が抑圧されるなら、それは「自由な表現環境」と言えるのだろうか | p2ptk[.]org
- 129 users
- p2ptk.org
- テクノロジー
- 2024/06/07
以下の文章は、電子フロンティア財団の「Speaking Freely: Ethan Zuckerman」という記事を翻訳したものである。 Electronic Frontier Foundation インタビュアー：ジリアン・ヨークイーサン・ザッカーマンはマサチューセッツ大学アマースト校の教授で、公共政策、コミュニケーション、情報学を担当している。彼は現在、Institute for Digital Public Infrastructureという新しい研究センターの立ち上げを進めている。長年にわたり、彼はテックスタートアップ（Tripod.com）や非営利団体の創設者（Geekcorps.org）、共同創設者（Globalvoices.org）として活動し、その間一貫してブロガーでもあった。 ※ このインタビューは、長さと明瞭さのために編集された。ヨーク：あなたにとって、表現の自由や
ドラマ「Fallout」の主人公が「何レベルに到達したか」熱心に分析される。“メインクエばかり”、“Mod入れてそう”などゲーム目線でドラマを解体 - AUTOMATON
- 127 users
- automaton-media.com
- アニメとゲーム
- 2024/04/16
Amazon.comのプライム会員向け動画配信サービスPrime Videoにて4月11日、実写ドラマ「フォールアウト（Fallout）」が配信開始された。同ドラマの主人公ルーシーについて、視聴者たちが「ゲーム『Fallout』だったら何レベルに到達したか」と盛んに推察している。本稿には、ドラマ「フォールアウト」のネタバレが含まれるため、留意してほしい。「フォールアウト」は、RPG『Fallout』シリーズの実写ドラマ版だ。同ドラマではウェイストランドを舞台に、文明崩壊後の危険はびこる世界を生きる人々の物語が描かれる。本作では複数のメインキャラの運命が交差する。なかでも、Vault 33居住者のルーシーがVaultの外へと踏み出して歩む旅路がストーリーの軸となっている。本作は現在シーズン1全8話が公開中で、シーズン2も制作中だ。そして現在、同ドラマの視聴者やシリーズファンの間で「シーズ
- ドラマ
- game
- ゲーム
- あとで読む
- amazon
- 研究
【X】広告出稿を取りやめたのはApple、IBMだけでなくディズニー、ワーナー・ブラザース、パラマウントなども - ネタフル
- 123 users
- netafull.net
- エンタメ
- 2023/11/21
イーロン・マスク氏の反ユダヤ主義的な発言を受け、Twitter改め「X」の広告をAppleとIBMが停止したことをお伝えしていましたが、TechCrunchのAdvertiser exodus expected to deeply impact X ad revenue, analysis indicatesによれば、他にもディズニー、ワーナー・ブラザース、パラマウントなども停止しているということです。 Among the brands who have since stopped advertising on X are Apple, Comcast/NBCU, Disney, Warner Bros., IBM, Paramount, Lionsgate and the European Commission. 「X」への広告掲載を中止したブランドには、アップル、コムキャスト／NBCU
- 広告
- twitter
- トラブル
- あとで読む
- ad
1988年「ロックの殿堂」授賞式におけるザ・ビートルズの紹介役、ミック・ジャガーのスピーチ
- 104 users
- www.udiscovermusic.jp
- エンタメ
- 2023/10/28
YouTube: Rock & Roll Hall of Fame / Mick Jagger Inducts The Beatles into the Rock & Roll Hall of Fame | 1988 Induction ザ・ビートルズ（The Beatles）が、“最後のビートルズ・ソング”「Now And Then」、そして1973年に発売された2つのベストアルバム『The Beatles 1962-1966』（通称：赤盤）と『The Beatles 1967-1970』（通称：青盤）の2023年ヴァージョンをリリースすることが発表となった。この発売を記念して、ザ・ビートルズやザ・ビートルズのメンバーが“ロックの殿堂入り”を果たした際の授賞式でのスピーチの翻訳を連続してご紹介。本記事では、ザ・ビートルズがロックの殿堂入りを果たした1988年の授賞式におけるザ・ビート
- 歴史
- あとで読む
- 音楽
- music
- いい話
- ことば
「シオニスト」という言葉がヘイトスピーチになるかどうかMetaが検討中、イスラエル建国に反対する超正統派ユダヤ教徒からは批判の声
- 100 users
- gigazine.net
- テクノロジー
- 2024/02/14
シオニストとは、ユダヤ人としての国家をかつてユダヤ人の国家が存在した土地に建設しようとする近代的ユダヤ人の運動「シオニズム」を信奉する人々を指す言葉です。このシオニストという言葉がヘイトスピーチに該当するかどうかについて、FacebookやInstagramを運営するMetaが検討中であることが明らかになりました。 Meta Considering Increased Censorship of the Word “Zionist” https://theintercept.com/2024/02/08/facebook-instagram-censor-zionist-israel/ Inside Meta, a debate over when the word ‘Zionist’ is hate speech - The Washington Post https://www.was
- 差別
- イスラエル
- 国際
- meta
- あとで読む
- 表現規制
- 政治
プレイステーションの歴史を紐解く書籍「プレイステーションの舞台裏：元CTOが語る創造の16年」が発売。黎明期の成功と発展を内側の視点から振り返る
- 99 users
- news.denfaminicogamer.jp
- アニメとゲーム
- 2024/05/22
「プレイステーションの舞台裏：元CTOが語る創造の16年」を日本および海外14か国で書籍発売2024年12月に発売30周年を迎える世界的ゲームプラットフォーム事業創造と発展の舞台裏を「オフィスちゃたにパブリッシング」ブランドで上梓。英語版は6月以後海外にも展開予定。「創造」経営の実現を支援するオフィスちゃたに株式会社では、この度、コンテンツ出版事業を「オフィスちゃたにパブリッシング」ブランドで開始いたします。第1弾として、「プレイステーションの舞台裏：元CTOが語る創造の16年」（著者：茶谷公之）をリリース致しました。日本語版は、紙書籍版および電子書籍版となっております。紙書籍版： https://amzn.asia/d/ire58t1　（税込み価格 2,000円）電子書籍版：　https://amzn.asia/d/dmfjvM3　（税込み価格 1,000円）【出版の背景】19
- SONY
- あとで読む
- CTO
- PS
- game
- ゲーム
- 歴史
邦訳の刊行が期待される洋書を紹介しまくることにする（2024年版） - YAMDAS現更新履歴
- 98 users
- yamdas.hatenablog.com
- テクノロジー
- 2024/04/29
さて、私的ゴールデンウィーク恒例企画である「邦訳の刊行が期待される洋書を紹介しまくることにする」の季節である（過去回は「洋書紹介特集」カテゴリから辿れます）。以前から書いているが、このブログは一度の更新で5つのエントリを公開するのを通例としており、そうするとそのうちひとつくらいは洋書を紹介するエントリを紛れ込ませることができる。そのおかげで、この一年ブログで紹介してきた洋書をまとめるだけで、今回も全38冊（ワオ！）の洋書を紹介できるわけだ。ご存じの通りの円安の進行のせいで、これから翻訳書の刊行にブレーキがかかるのかもしれない。それは大きな損失だと思う。また先日ある場所で、日本のネットユーザがますます海外の情報に目を向けなくなったという話が出たのだが、翻訳書が減少したら、その傾向にも拍車がかかるかもしれない。面白そうな洋書を知ったら取り上げることで、その傾向に抗いたいのである。まぁ、こ
- 書籍
- あとで読む
- 本
- english
- tech
- technology
- society
- IT
- これはすごい
AI Webcam - ゆーすけべー日記
- 95 users
- yusukebe.com
- テクノロジー
- 2024/02/11
AI Webcamについて紹介します。 AI Webcam AI WebcamはWebcamでとった写真についてAIが音声で返答してくれるというものです。AIのキャラクターというか音声は指定可能です。また文章のプロンプトでどのように返答するかも指定できます。例えば、アメリカの若い女性「レイチェル」に自分の容姿を褒めてもらった時の大爆笑映像はこちらです。元ネタ実は元ネタがあって、Wes Bosというポドキャスターがやってたのを真似てます。コードも公開されているので、それを使わせてもらってます。みなさんもできます。 YAPCでLT あまりにも面白いので、先日のYAPC::HiroshimaのLTでこれを応用したものをデモしました。レイチェルだけを流しても尺が余るしインパクトにかけるので、YAPCっぽく「dankogai」さんと「papix」をAIにしました。 UIはこんな感じです。例え
- AI
- OpenAI
- yapchiroshima2024
- あとで読む
- ネタ
- 人工知能
- イベント
- 写真
Feedly + ChatGPTで、毎朝自分専用のポッドキャストを自動生成する仕組みを作った｜鈴木慎吾 / TSUMIKI INC.
- 94 users
- note.com/shingo2000
- テクノロジー
- 2024/01/18
毎朝、デザイン系の英語記事を10件ほどおすすめしてくれるSlackボットです。このボットは現在も問題なく稼働し続けていますが、毎朝のニュースは文字で読むよりも音声として聞いたほうが負担が少なく続けられそうです。そこで、このSlackボットを拡張して、毎朝デザインニュースのポッドキャストを自動生成する仕組みを作ることにしました。成果物はじめに成果物について。完成したポッドキャストは毎朝SpotifyとApple Podcastで配信しています。おおまかな処理の流れ開発前に想定した処理の流れは以下の通りです。毎朝ポッドキャストが自動で配信される理想的なフロー自分はコンテンツ制作者ではなく、あくまでリスナーというスタンスを取りたいため、ワークフローに自分が介在しない完全自動化が理想です。ところが、Sound Cloud APIの利用に必要なアプリケーション登録の受付が現在停止しているこ
- AI
- あとで読む
- 人工知能
- API
ファンタジーで美しいエルフ語を作る方法：人工言語の印象を決める要素が判明！ - ナゾロジー
- 84 users
- nazology.net
- 学び
- 2024/03/15
異世界の言語学です。ドイツのフンボルト大学ベルリン（HU Berlin）で行われた研究によって、ファンタジーやSFの世界で使われている人工言語のどんな要素が、美しさや邪悪さなどの音声的な印象に繋がっているかが調べられました。調査対象となった人工言語には、有名なフィクション作品で創作された優雅な響きを持つエルフ語や醜く凶悪なオークたちのオーク語、理知的な異星人たちのバルカン語、荒々しい戦闘民族の使うクリンゴン語など12種類が含まれています。本研究は、ファンタジーやSFの世界が好きな人たちならば、一度は考えたことがある異世界言語の音声学的な魅力を分析したものと言えるでしょう。研究内容の詳細は『Language and Speech』にて公開されています。 From Star Trek’s Klingon to Tolkien’s Orkish: Unraveling the audit
- 言語
- あとで読む
- language
- 音声
- 研究
- AI
- 心理
Metaが日本語音声を入力するだけで「文字起こし」「翻訳」「吹き替え」を実行できるAI「SeamlessM4T」を公開、英語や中国に翻訳可能で無料で使えるデモも公開されたので使ってみた
- 82 users
- gigazine.net
- テクノロジー
- 2023/08/23
Metaが音声を入力するだけで「文字起こし」「別言語への翻訳」「別言語への吹き替え」を実行できるAI「SeamlessM4T」を2023年8月22日(火)に公開しました。SeamlessM4Tは日本語音声の入力にも対応しており、日本語・英語・中国語・フランス語などを含む35言語への出力をサポートしているとのこと。誰でも使えるデモも公開されていたので、実際にデモを使ってどれだけの精度で文字起こしや吹き替えを実行できるのか試してみました。 Introducing SeamlessM4T, a Multimodal AI Model for Speech and Text Translations | Meta https://about.fb.com/news/2023/08/seamlessm4t-ai-translation-model/ Introducing a foundationa
- 人工知能
- あとで読む
- 日本語
- 無料
- AI
- communication
- 英語
X(Twitter)の偽情報率があまりにも高すぎるとしてEUが「関連法を順守しろ」と警告
- 77 users
- gigazine.net
- 政治と経済
- 2023/09/27
偽情報が投稿される割合が大規模なSNSの中で最も高かったとして、XがEUから警告を受けました。EUはオンラインの安全を守る(PDFファイル)デジタルサービス法(DSA)を2023年8月から施行しており、この法律に従うようXへ呼びかけています。 Statement on Code of Practice on Disinformation https://ec.europa.eu/commission/presscorner/detail/en/SPEECH_23_4645 Code of Practice on Disinformation: new reports available in the Transparency Centre | Shaping Europe’s digital future https://digital-strategy.ec.europa.eu/en/n
囲いなしでその場所だけ“防音化”　特定の人物の声だけを“消す・聞く”ができる小型音響ロボット群
- 75 users
- www.itmedia.co.jp
- テクノロジー
- 2023/10/03
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 米ワシントン大学と米Microsoftに所属する研究者らが発表した論文「Creating speech zones with self-distributing acoustic swarms」は、部屋内で話す人々の位置を特定し、その音声を分離するための小型の移動式音響ロボット群を提案した研究報告である。この技術は、多くの人が一度に話している部屋において、部屋の一部で音を消す領域「ミュートゾーン」や、周囲を気にせず対話できる領域「スピーチゾーン」を作り出すことに活用できる。また多数の人が話している中で、物理的に離れた位置にいても特定の人々
- ロボット
- あとで読む
- 音響
- audio
- robot
- ネタ
- 研究
- 技術
隣の防音部屋をミリ波で盗聴、瞬時にテキスト化する技術　中国の研究者らが開発
- 75 users
- www.itmedia.co.jp
- テクノロジー
- 2023/09/01
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 香港大学や清華大学に所属する研究者らが発表した論文「Radio2Text: Streaming Speech Recognition Using mmWave Radio Signals」は、ミリ波（mmWave）信号から音声を認識するストリーミング自動音声認識（ASR）システムを提案した研究報告である。このシステムは、周囲のノイズに強く、防音対策した部屋の外からでも取得でき、これまでと異なり長い文章をリアルタイムに認識する能力を提供する。無線センシングの進展に伴い、特にミリ波信号の注目が高まっている。なぜなら、音源のミリメートルレベルの
自己流で英語に伸び悩んでいる人は『最新の第二言語習得研究に基づく究極の英語学習法』を読むべし | DevelopersIO
- 70 users
- dev.classmethod.jp
- 学び
- 2023/10/31
学校・仕事・生活など様々な理由で英語を学びつつ、上達が今ひとつで今の勉強法を続けていいのかなぁと不安になっている人も多いのではないかと思います。タイパが重視される昨今だと、無駄なことはできるだけ避けたいですしねそんな人にピッタリの一冊が出版されたので紹介します。第二言語(いわゆる外国語)習得、特に、語彙習得が専門の立教大学中田達也教授による『最新の第二言語習得研究に基づく究極の英語学習法』です。本書の向いている読者層英語スキルを向上させたい英語を教えている子供の早期英語学習に頭を悩ませている本書の特徴現役の研究者が最新研究に基づいて納得感のある一般論を繰り返しており、安心して読めます。個人体験談(N=1)をしたためた本では有りません。本書の特徴は以下です 1. 対象読者は一般人対象読者はあくまでも一般人です。現役の研究者が書いてはいるものの、専門用語はなるだけ控
- 英語
- あとで読む
- 学習
- study
- english
- 本
- book
「イスラエルを非難した学生の顔」を印刷したトラックでハーバード大学周辺を走る晒し行為が発生
- 70 users
- gigazine.net
- 学び
- 2023/10/16
ハーバード大学の学生団体が「パレスチナ周辺で発生している暴力の責任はイスラエル政府にある」とする声明を発表した結果、声明に賛同した学生の顔写真を印刷したトラックがキャンパス周辺を走行する事態が発生しました。学生団体の声明に対しては複数の教員が否定的な意見を投げかけているほか、声明に賛同する学生の個人情報がインターネット上に公開される事態も発生しています。 As Students Face Retaliation for Israel Statement, a ‘Doxxing Truck’ Displaying Students’ Faces Comes to Harvard’s Campus | News | The Harvard Crimson https://www.thecrimson.com/article/2023/10/12/doxxing-truck-students-i
【2024年】AWS全サービスまとめ | DevelopersIO
- 69 users
- dev.classmethod.jp
- テクノロジー
- 2024/01/12
こんにちは。サービス開発室の武田です。このエントリは、2018年から毎年公開しているAWS全サービスまとめの2024年版です。こんにちは。サービス開発室の武田です。このエントリは、2018年から毎年公開している AWS全サービスまとめの2024年版です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの？」という疑問を自分なりに理解するためにまとめました。今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2023年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 247個です。まとめるにあ
- aws
- あとで読む
- まとめ
- techfeed
- サービス
- システム
- 技術
Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
- 65 users
- tech.mirrativ.stream
- テクノロジー
- 2024/03/04
こんにちはハタです。最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります構築していく上で色々試行錯誤したのでそれが紹介できればなと思っていますどんなものを作ったか前提知識: 配信基盤前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージまとめ We are hiring! どんなものを作ったか今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行うシス
New models and developer products announced at DevDay
- 62 users
- openai.com
- テクノロジー
- 2023/11/07
GPT-4 Turbo with 128K context and lower prices, the new Assistants API, GPT-4 Turbo with Vision, DALL·E 3 API, and more. Today, we shared dozens of new additions and improvements, and reduced pricing across many parts of our platform. These include: New GPT-4 Turbo model that is more capable, cheaper and supports a 128K context windowNew Assistants API that makes it easier for developers to build
ウェブ上でネイティブアプリ並の機能を実現するPWAで利用できる機能をまとめてテストできるサイト「What PWA Can Do Today」
- 56 users
- gigazine.net
- テクノロジー
- 2024/01/13
プログレッシブウェブアプリ(PWA)は、ウェブ上でネイティブアプリと同様の使い勝手を実現するための仕組みで、2015年に概念が提唱されて以来、徐々に機能が増加しています。「What PWA Can Do Today」は、PWAで利用できるさまざまな機能について実際に試せるサイトです。 What PWA Can Do Today https://whatpwacando.today/ サイトにアクセスするとこんな感じ。最初に「Install to home screen」をクリックし、サイトをアプリとしてインストールします。確認画面が表示されるので「インストール」をクリック。デスクトップにアプリが追加されました。初回は自動で起動しますが、次回以降はこのアイコンをダブルクリックして起動します。アプリを起動すると、さまざまな機能をテストできる画面が表示されました。「Media captur
GitHub Copilot Chat 舐めていた - ちなみに
- 55 users
- blog.nishimu.land
- テクノロジー
- 2024/06/12
marketplace.visualstudio.com GitHub Copilot と直接会話できる Copilot Chat 、皆さん使ってますか？私は最近まともに使い始めました。 Copilot と言えば補完だけだと思っている人、以前ちょっとだけ触れて使えないと思った人(僕です)、いまのバージョンをもう一度触ってみてください、めっちゃ便利になっている。 www.youtube.com この動画が出来ることを追いかけるのに良さそうなので見てください。ベースモデルがGPT-4に変わったりとかいろいろ変化はありますが、便利なのは Participant や Context の概念が入ったことだと思います。 Participantは @workspace みたいなやつで、Chat-GPTにおける GPTs みたいなやつ。例えば @workspace ならいま開いているプロジェクトについ
- copilot
- あとで読む
- GitHub
- ツール
- tool
- 技術
- 開発
- *あとで読む
Xboxにて“運転免許証”のような悪質プレイヤー取り締まり新システム発表。違反点数を累積、最大1年間オンラインから締め出す - AUTOMATON
- 54 users
- automaton-media.com
- アニメとゲーム
- 2023/08/16
マイクロソフトは8月16日、Xbox One/Xbox Series X|Sにおいて悪質なプレイヤーを取り締まる新システムを導入することを発表した。違反点数が累積されていく、運転免許証のような仕組みが採用されるそうだ。 As Xbox continues to foster a safe and inclusive environment, we are introducing an enforcement strike system to help players better understand how their actions on the platform impact their overall gaming experience. Learn more here: https://t.co/RLA19oYSli — Xbox Wire (@XboxWire) August
- Xbox
- microsoft
- game
- ゲーム
- あとで読む
声帯の損傷やマヒがある人でも話せるようになる「喉に貼るパッチ」が開発される
- 54 users
- gigazine.net
- テクノロジー
- 2024/03/13
by Jun Chen Lab at UCLA 咽喉がんの手術や声帯ポリープなどの影響で声帯が使えなくなってしまった人でも話せるようになる「喉に貼るパッチ」を、カリフォルニア大学ロサンゼルス校の研究チームが開発しました。このパッチは小さくて伸縮性があり、発話に伴う筋肉の動きのみで発電するためバッテリーやプラグも不要とのことです。 Speaking without vocal folds using a machine-learning-assisted wearable sensing-actuation system | Nature Communications https://www.nature.com/articles/s41467-024-45915-7 New throat patch can turn muscle movements into speech https:/
【LLMの研究者向け】400本を超えるLLMに関する論文のリストを公開・更新しています - Qiita
- 52 users
- qiita.com/shure___
- テクノロジー
- 2024/04/02
自身の研究のためにLLMに関する論文を表形式でまとめています。このレポジトリでは特にさまざまな分野の論文を表にする(Comprehensive)ことを目的としています。具体的には以下のキーワードに注目しています。 CoT / VLM / Quantization / Grounding / Text2IMG&VID / Prompt / Reasoning / Robot / Agent / Planning / RL / Feedback / InContextLearning / InstructionTuning / PEFT / RLHF / RAG / Embodied / VQA / Hallucination / Diffusion / Scaling / ContextWindow / WorldModel / Memory / ZeroShot / RoPE / Spe
- LLM
- RAG
- あとで読む
- 論文
- qiita
- github
- 考察
- 資料