「speech」を検索 - はてなブックマーク

281 - 320 件 / 2545件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

speechの検索結果281 - 320 件 / 2545件

AppleがiPhoneで15分のトレーニングをするだけで「自分に似た合成音声」で他人と会話できる機能を発表
- 40 users
- gigazine.net
- テクノロジー
- 2023/05/17
Appleが視覚・聴覚・認知・モビリティのアクセシビリティを向上するためのソフトウェア機能をiPhoneやMacに導入すると、2023年5月16日に発表しました。その中でも特に目玉となる機能が、iPhoneやiPadに声を吹き込むだけで、自分の声を再現した音声を合成し、コミュニケーションに応用できるという「Live Speech」です。 Apple previews Live Speech, Personal Voice, and more new accessibility features - Apple https://www.apple.com/newsroom/2023/05/apple-previews-live-speech-personal-voice-and-more-new-accessibility-features/ Live SpeechはiPhone・iPad・
- AI
- apple
- iPhone
- mobile
- あとで読む
- *あとで読む
OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る
- 39 users
- www.itmedia.co.jp
- テクノロジー
- 2024/03/30
米OpenAIは3月29日（現地時間）、人の声を再現できる生成AIモデル「Voice Engine」を発表した。テキスト入力と15秒分の音声サンプルで、元の話者によく似た自然な音声を生成できる。感情的なリアルな音声で、母国語以外の言語も話せる。 2022年から開発していたこのモデルは、既に同社の「Text-to-Speech API」や「ChatGPT」アプリの音声チャット機能、ChatGPTのテキスト読み上げ機能「Read Aloud」などで採用されている。 OpenAIは、こうした合成音声が悪用される可能性を認めており、広範囲にリリースをするかどうかを検討するために、慎重にテストを行っているという。スウェーデンSpotifyは昨年9月、このモデルを採用した新機能「Voice Translation」を発表した。これはPodcastをホスト自身の声で複数言語に吹き替えるものだ。 Ope
人には正しく聞こえるが“AIにはゆがんで聞こえる声”に変えるツール　合成音声に使われないために保護
- 39 users
- www.itmedia.co.jp
- テクノロジー
- 2023/12/11
音声合成技術の進歩は顕著であるが、人間や機械を欺くために悪用されることもある。これはディープフェイクと呼ばれ、例えば、詐欺師たちがCEOの声を合成して部下に連絡して大金を振り込ませた事件も起きている。影響力のある人物の声を合成して誤情報やヘイトスピーチを生成し、社会に広範な悪影響を及ぼす可能性もある。法整備も追い付いていない。（関連記事：「本人の声とそっくりな合成音声」の悪用に対して法的権利はあるか？　NTT社会情報研究所が調査）この脅威に対処するため、研究チームは「AntiFake」と呼ばれる新しい防御ツールを開発。このツールは従来のディープフェイクを後から検出する方法と異なり、被害者の声として合成されること自体を未然に防ぐ。被害者が音声データを外部（SNSやWebサイトなど）に公開する前に、録音した音声信号に最適化されたノイズ（敵対的摂動）を適用する。これにより、人間の耳には正し
なぜウェブサイトに年齢認証を義務づけるべきではないのか | p2ptk[.]org
- 39 users
- p2ptk.org
- テクノロジー
- 2023/03/26
Electronic Frontier Foundation 年齢認証システムは監視システムである。年齢認証の義務化、それに伴うID認証の義務化は、若者をオンラインで保護するアプローチとしては間違っている。これを制度化すれば、ウェブサイトは訪問者に政府発行の身分証明書等を提出させ、年齢を証明させることが義務づけられることになる。このスキームは、我々の個人データがデフォルトで収集・販売されるインターネットへの道をさらに舗装することになる。政府発行の身分証明書を持たない数千万人の米国人は、インターネットのかなりの部分にアクセスできなくなるかもしれない。さらに、匿名でのインターネットアクセスは不可能になることにもなりうる。年齢認証の義務化に反対する理由年齢認証を義務づける法律は、若者だけに影響を及ぼすのではない。特定の年齢層を排除するために、ウェブサイトの訪問者すべての年齢を確認しなくてはな
- Privacy
- あとで読む
- web
- 社会
- 子供
- データ
画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
- 39 users
- www.techno-edge.net
- テクノロジー
- 2023/12/04
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第23回目は、AIアニメーションを次の段階に進ませる技術と大きな脚光を浴びた「Animate Anyone」、3D Gaussian Splattingを使った新しい3D応用技術など、生成AI最新論文の概要5つをお届けします。生成AI論文ピックアップ画像内のキャラクターや写真内の人物を骨格動画に応じて動かせる「Animate Anyone」　アリババらが開発話した言葉をリアルタイム翻訳できるシステムMeta「Seamless」　話し方や感情なども忠実に再現リアルな動きを持つ高品質なアバターを生成するモデル「Animatable Gaussians」写真から3D
- AI
- 生成AI
- 画像
- あとで読む
脳波から「聞いていた音楽」を再構成することに成功、再構成した音楽を聴けるムービーもあり
- 38 users
- gigazine.net
- テクノロジー
- 2023/08/16
カリフォルニア大学バークレー校の研究チームが脳波を分析して「聞いていた音楽」を再構成する技術を開発しました。開発された技術では音階の変化やフレーズの一部を判別可能なほど鮮明に音楽を再構成できます。 Music can be reconstructed from human auditory cortex activity using nonlinear decoding models | PLOS Biology https://doi.org/10.1371/journal.pbio.3002176 Brain recordings capture musicality of speech — with help from Pink Floyd | Berkeley https://news.berkeley.edu/2023/08/15/releases-20230811 研究チームは
海外層VRCのアプデで激おこな理由｜ぽてと旅録
- 38 users
- note.com/potatovr
- 暮らし
- 2022/07/26
7月25日に発表されたVRCのベータ版アップデート内容。主にセキュリティーアップデートと謳い、ApexやFortnite等でおなじみの対チート対策システムEasyAntiCheatの導入が発表されました。公式バグ報告システムCannyのEAC関連の苦情発表直後からTwitterやVRCDiscord並びにバグ報告用システムCannyが大荒れ。トレンド入りしたりEAC導入反対のCannyが一万票を超えたりと騒がしい一日となりました。一体なぜここまで荒れたのか？それには色んな理由があるのでざっくりまとめてここに置いておきます。簡易目次：①MODとは、その仕組み ②海外層のプレイ形態 ③炎上の理由１：QOL、プレイ環境のクオリティーの低下 ④炎上の理由２：障がい者コミュニティーへの配慮が足りない ⑤炎上の理由３：悪質なユーザーへの対策にならない ⑥EAC自体の問題点 ⑦あとがき前置き：
- VRChat
- VR
- コミュニティ
- 海外
- PC
アメリカのジャーナリストたちと一緒に、Twitterアカウントを凍結された件について、経緯を詳しく書いておく。
- 38 users
- nofrills.seesaa.net
- 世の中
- 2022/12/19
中途半端な英語使いが英国からのニュースを東京で読み、あちこちふらふらうろうろ。時々嘘。はてブ = http://b.hatena.ne.jp/nofrills Twitter = http://twitter.com/nofrills Twitterのログ = http://twilog.org/nofrills ◆「なぜ、イスラム教徒は、イスラム過激派のテロを非難しないのか」という問いは、なぜ「差別」なのか。（2014年12月） ◆「陰謀論」と、「陰謀」について。そして人が死傷させられていることへのシニシズムについて。（2014年11月） ◆知らない人に気軽に話しかけることのできる場で、知らない人から話しかけられたときに応答することをやめました。また、知らない人から話しかけられているかもしれない場所をチェックすることもやめました。あなたの主張は、私を巻き込まずに、あなたがやってください
- SNS
- twitter
- net
- あとで読む
最新の深層学習技術による古典くずし字認識の現状と今後の展望 - May the Neural Networks be with you
- 38 users
- shunk031.hatenablog.com
- テクノロジー
- 2020/12/22
こんにちは。@shunk031 です。普段は最先端の技術が大好きなパソコンのオタクですが、京都へ旅行して古き良き日本の文化に感化されました。この記事は法政大応情 Advent Calendar 2020 21 日目の記事です。 From http://codh.rois.ac.jp/ 今回は日本古典籍の分類タスクについて取り組んでみようと考え、近年の日本古典籍における「くずし字認識」に着目して調査をしました *1。日本古典籍といった古文書に対して、OCR 等の文字認識技術によって文字情報をデジタル化し、それらの情報をもとに解析を行う流れは現代では自然だと考えています。しかしながら、一般的に OCR は難しく、また古文書を機械に解析させることはさらなる困難があるのは容易に想像できます。くずし字認識に対して、近年の取り組みでは ROIS-DS 人文学オープンデータ協働センターが K
【無料】高精度&爆速で文字起こしが終わるAIツール「Gladia」がスゴイ | 株式会社LIG(リグ)｜DX支援・システム開発・Web制作
- 38 users
- liginc.co.jp
- テクノロジー
- 2024/06/05
こんにちは、インハウスマーケティング部のかけるです。生成AIによってライティング業務の効率化が進むなかで、「文字起こし」は生成AIが得意とする領域の一つです。今回は数ある文字起こしAIのなかでも、実際に使ってみて良かった文字起こしAI「Gladia」について、その使い方や魅力をご紹介します！「Gladia」は精度が抜群 https://www.gladia.io/ まず前提として、Gladiaの文字起こしの技術には、OpenAIがオープンソースとして公開している文字起こしAI「Whisper」が活用されています。 Gladiaの大きな魅力は、なんといっても音声から文字を起こす（Speech-to-Text）際の精度の高さです。一般的に、音声認識の精度は「単語誤り率（WER）」という、その音声認識モデルが音声をテキストへ変換する際にどれぐらい間違えてしまったのかという評価尺度があり
- AI
- 音声
- あとで読む
- 動画
- ツール
- webサービス
村上春樹さん「常に卵の側に立つ」ガザ侵攻したイスラエルで伝えた、たった一つのメッセージ【改めて読みたい】
- 38 users
- www.huffingtonpost.jp
- 世の中
- 2023/10/25
村上春樹さん「常に卵の側に立つ」ガザ侵攻したイスラエルで伝えた、たった一つのメッセージ【改めて読みたい】
- 文学
- 戦争
- 人権
- 考え方
- 政治
- あとで読む
GitHub - google-research/tuning_playbook: A playbook for systematically maximizing the performance of deep learning models.
- 38 users
- github.com/google-research
- テクノロジー
- 2023/01/19
This document is for engineers and researchers (both individuals and teams) interested in maximizing the performance of deep learning models. We assume basic knowledge of machine learning and deep learning concepts. Our emphasis is on the process of hyperparameter tuning. We touch on other aspects of deep learning training, such as pipeline implementation and optimization, but our treatment of tho
pdf2audiobook - ぱたへね
- 38 users
- natsutan.hatenablog.com
- テクノロジー
- 2021/04/12
Twitter で気がついた佐藤さんのpdf読み上げシステムの動画を見ました。 Google I/Oが5/18 - 20にオンライン開催。私はpdf2audiobookデモ紹介とMLOps AMAで参加します！ #gcpja https://t.co/tLpBgTB4Xo— Kazunori Sato (@kazunori_279) 2021年4月7日 www.youtube.com PDFをテキストにして読み上げサービスを使用して音声ファイルに変換しています。このシステムで使用しているGoogleのテクノロジーです。ひとつひとつは聞いたことあります。 Cloud functions Cloud Storage OCR with Vision API AutoML Table Text to Speech ここで上手いなと思ったところがAutoML Tableによるtext（paragr
- pdf
- あとで読む
UI = f(statesⁿ)
- 38 users
- daverupert.com
- テクノロジー
- 2024/02/17
“UI is a function of state” is a pretty popular saying in the front-end world. In context (pun intended), that’s typically referring to application or component state. I thought I’d pull that thread a little further and explore all the states that can effect the UI layer… First-party application states Every application whether it’s a to-do list or a shopping cart or some radically complex app wil
Linux Audio is Dead | Non
- 37 users
- non.tuxfamily.org
- テクノロジー
- 2021/07/10
CENSORED Due to threats directed at TuxFamily from those behind the attack of this project and its author, the content of this post has been relocated to a platform more supportive of freedom of speech and freedom of information. Please click the link below to read this important message! https://archive.is/3Tggt
検閲の大部分は「自己検閲」で成り立っている――国家による検閲と個人の自己検閲／仲介者検閲 | p2ptk[.]org
- 37 users
- p2ptk.org
- テクノロジー
- 2024/04/17
以下の文章は、コリイ・ドクトロウの「The majority of censorship is self-censorship」という記事を翻訳したものである。 Pluralistic 私は多くの博識者を知っているが、エイダ・パーマーは別格だ。優れたSF作家であり、優れた歴史家であり、優れた脚本家であり、優れた歌手であり……。 – https://pluralistic.net/2022/02/10/monopoly-begets-monopoly/#terra-ignota パーマーは友人であり同僚だ。2018年、彼女とエイドリアン・ジョーンズ、そして私は、シカゴ大学歴史学部（エイダは宗教裁判とルネサンス期の禁忌の知識を専門とするテニュア教授）で「印刷機からインターネットまでの検閲、情報統制、情報革命」という大学院セミナーを共同で行った。 – https://ifk.uchicago.e
Japan’s Shift to the Right: Computational Propaganda, Abe Shinzō’s LDP, and Internet Right-Wingers (Netto Uyo) - The Asia-Pacific Journal: Japan Focus
- 37 users
- apjjf.org
- テクノロジー
- 2022/01/17
Abstract: In recent years, academic research and investigative reports have brought to light several cases of computational propaganda (i.e. orchestrated attempts to manipulate public opinion or the outcome of elections via social media), as well as proof that filter algorithms amplify right-wing conservative content on Japanese social media. Piecing together the scattered pieces of a puzzle, this
「CLOVA Note」は、なぜ高精度な音声認識を実現できるのか。Speechチームが語る開発秘話
- 37 users
- engineering.linecorp.com
- テクノロジー
- 2022/08/15
LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog 2022年5月24日より、LINE株式会社は「会話を目で見る」ことができる無料のAI音声認識アプリ「CLOVA Note」のβ版の提供を開始しました。「CLOVA Note」は、LINE CLOVAのAI技術である「CLOVA Speech（音声認識）」の音声認識AIを活用して、録音した声をテキストに変換します。アプリをインストールし、スマートフォンやタブレットの録音ボタンを押すだけで、誰でも簡単に利用可能です。「CLOVA Speech」は、近年注目を集めているSelf-Supervised Learning（自己教師あり学習）を利用した、最先端のEnd-to-End音声認識を採用しています。そして複数名の話者の区別を行う
ChatGPTのセキュリティへの影響 | Cloud Security Alliance Japan
- 37 users
- www.cloudsecurityalliance.jp
- テクノロジー
- 2023/06/23
© Copyright 2023, Cloud Security Alliance.All rights reserved. 1 Acknowledgements Authors: Kurt Seifried Sean Heide Bogdan Filip Vishwa Manral Lars Ruddigkeit Walter Dula Eric E. Cohen Billy Toney Supro Ghose Marina Bregkou Additional Staff: Stephen Lumpe (Cover illustration, with assistance from Midjourney) This is a Release Candidate version and is subject to change. © 2023 Cloud Security Allian
- ChatGPT
- security
- AI
- あとで読む
- pdf
- セキュリティ
litagin/moe-speech · Datasets at Hugging Face
- 37 users
- huggingface.co
- テクノロジー
- 2024/01/24
Not-For-All-Audiences This repository has been marked as containing sensitive content and may contain potentially harmful and sensitive information. View content
CeVIO Pro（仮）改めVoiSonaのβ版無料公開がスタート。VSTiに加えAudio Unitsにも対応し、M1にもネイティブ対応｜DTMステーション
- 37 users
- www.dtmstation.com
- エンタメ
- 2022/06/02
6月2日、テクノスピーチが最新のAI技術で人間の歌声をリアルに再現する歌声合成ソフト、VoiSona（ボイソナ）のβ版を無料で公開しました。これは、今年2月に「WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始」という記事で紹介したCeVIO Pro（仮）が名称を変更するとともに、β版へとアップグレードしたもので、ソングエディタとともに、デフォルトボイスライブラリとして女性シンガーである「知声」（読み：ちせい、英語表記：Chis-A）が付属している点も同様です。 CeVIO Pro（仮）でもWindowsとMacに対応するとともにスタンドアロンおよびVSTiプラグインとして動作する形になっていましたが、β版となったVoiSonaではMacのAudio Unitsプラグインにも対応。さらに、MacのM1プロセッサにもネ
スコットランドのトランスジェンダーを不愉快にしたら地球のどこに居ても犯罪者になる「ヘイトクライム法」が施行される
- 37 users
- gigazine.net
- 世の中
- 2024/04/14
2024年4月1日に、スコットランドで「ヘイトクライムと公共の秩序法(Hate Crime and Public Order Act)」が施行されました。インターネットの書き込みを含め、スコットランドで読めるものならすべて「ヘイト」となり得るこの法律は、言論の自由への影響が懸念されています。 Scotland's Hate Speech Act and Abuse of Process - Craig Murray https://www.craigmurray.org.uk/archives/2024/03/scotlands-hate-speech-act-and-abuse-of-process/ Scotland’s new hate crime law: what does it cover and why is it controversial? | Scotland | Th
Yann LeCun’s Deep Learning Course at CDS is Now Fully Online & Accessible to All
- 36 users
- nyudatascience.medium.com
- テクノロジー
- 2020/10/09
CDS is excited to announce the release of all materials for Yann LeCun’s Deep Learning, DS-GA 1008, co-taught in Spring 2020 with Alfredo Canziani. This unique course material consists of a mix of close captioned lecture videos, detailed written overviews, and executable Jupyter Notebooks with PyTorch implementations. The course covers the latest techniques in both deep learning and representation
https://www.waseda.jp/top/assets/uploads/2022/04/2204_speech_koreeda.pdf
- 36 users
- www.waseda.jp
- 暮らし
- 2022/04/10
- memo
- あとで読む
「こんなに感情移入した曲はない…！」鬼龍院翔さん、自身とGACKTさんの格付けチェックをテーマにしたボカロ曲を絶賛
- 36 users
- togetter.com
- おもしろ
- 2022/12/20
VoiSona公式 @VoiSonaOfficial AI技術でリアルな歌声を再現する音声創作ソフト「VoiSona」（旧CeVIO Pro）公式です。音声創作ソフト「CeVIO」姉妹ブランド。 ▼運営会社：株式会社テクノスピーチ（@techno_speech） ※本アカウントは告知・宣伝用の為、個別のご意見ご質問は下記公式サイトCONTACT宛にお寄せ下さいませ。 voisona.com VoiSona公式 @VoiSonaOfficial 【NEWS】 AI歌唱ソフト「VoiSona」新規ボイスライブラリ、「機流音」＆「AiSuu」をリリースしました！！機流音（CV：鬼龍院翔<ゴールデンボンバー>） voisona.com/artist/kirune_… AiSuu（CV：すぅ<SILENT SIREN>） voisona.com/artist/aisuu_j… #VoiSona
色々な生成AIモデルをColabで動かして今年を振り返る - ABEJA Tech Blog
- 36 users
- tech-blog.abeja.asia
- テクノロジー
- 2023/12/21
こんにちは、ラボで研究開発をしたりプロトタイプを作っている藤本(X(Twitter))です。ABEJAアドベントカレンダー2023の21日目の記事です。ここ近年、生成AIの勢いが凄いです。最近は一夜明けたら世界が変わっているみたいなことがしょっちゅう起きています。そんな状況なので、なかなか世の中についていくのが難しいのではないかと思います。そこで今回は、これまでに色々と出てきた生成モデルを振り返りつつ、ひたすら思いつく限りColabで動かしまくってみる企画をやってみようかと思います。流石に全部Colabで動かすのは大変でした・・・。まずは言語を対象として日本語モデルを含む様々なモデルを対象に推論実験を行います。続いて高速化の実験、更にSFTによるInstructionチューニングや、RLHFもやってみます。最後に、ソースコード生成もやってみましょう。次に、画像を対象として、言語同様に色々
参院選当選の暴露系YouTuber「ガーシー」、SNSをマストドンに立てる
- 36 users
- www.itmedia.co.jp
- 政治と経済
- 2022/07/15
NHK党から参議院選に出馬し当選した暴露系YouTuber（現在チャンネルは停止中）のガーシーこと東谷義和さんが7月13日、独自のSNSを立ち上げた。プラットフォームとしては分散型SNSのマストドンを採用。動画サービスのFC2の元社長である高橋理洋さんがバックアップする形で独自SNS「GAAC2 FREE SPEECH」を立ち上げた。
- Mastodon
- SNS
- ネット
- ITmedia
- あとで読む
- -
- society
- politics
What We Learned from a Year of Building with LLMs (Part I)
- 36 users
- www.oreilly.com
- テクノロジー
- 2024/05/30
Join the O'Reilly online learning platform. Get a free trial today and find answers on the fly, or master something new and useful. Learn more It’s an exciting time to build with large language models (LLMs). Over the past year, LLMs have become “good enough” for real-world applications. The pace of improvements in LLMs, coupled with a parade of demos on social media, will fuel an estimated $200B
- generative_model
- LLM
- IS
- あとで読む
- *あとで読む
- it
オンライン表現の自由のチョークポイント――なぜインフラの検閲はプラットフォームの検閲よりも深刻なのか | p2ptk[.]org
- 36 users
- p2ptk.org
- 学び
- 2021/01/15
オンライン表現の自由のチョークポイント――なぜインフラの検閲はプラットフォームの検閲よりも深刻なのか投稿者: heatwave_p2p 投稿日: 2021/1/142021/1/14 Electronic Frontier Foundation 先週、トランプ大統領の支持者が連邦議会議事堂に侵入・破壊行為を行った暴動を受けて、FacebookとTwitterは大統領を追い出す決定を下した。両社がこれまで、トランプ大統領を世界の政治指導者の一人としてコンテンツモデレーションのルールの大半を免除する立場をとってきたことを考えれば、踏み込んだ決断を下したといえる。大統領のフォロワーの多くは、すぐさまParlerに乗り換えた。だが今週、この動きは新たな展開を見せている。Amazon Web Service（AWS）やGoogleのAndroid・AppleのiOSのアプリストアなど、技術的「スタッ
- law
- あとで読む
- ネット
- 企業
口パクで音声入力できるイヤフォン　口を動かした際の耳穴の変形から予測　米国チームが開発
- 36 users
- www.itmedia.co.jp
- テクノロジー
- 2022/08/15
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。米University at Buffalo, State University of New York、米ノースウェスタン大学、米ワシントン大学、米コロラド大学の研究チームが開発した「EarCommand: “Hearing” Your Silent Speech Commands In Ear」は、口パク（無声発話）で音声入力できるイヤフォンだ。口を動かした際の耳穴の変化を取得して入力を区別する。音声を発することなく口の動きだけでモバイル機器を操作するサイレントスピーチインタラクション（Silent Speech Interaction、SSI）が広く研究されている。音声入力による情
イーロン・マスクが「Twitter」から「X」に名称を変更した理由を語る、金融取引を含む包括的アプリになるため「Twitter」の名前はそぐわないと主張
- 35 users
- gigazine.net
- テクノロジー
- 2023/07/26
2023年7月24日、長らく「Twitter」の名称で運営されてきたSNSの名称が「X」に変更され、ユーザーの間に戸惑いが広がりました。「X」のアイコンを見慣れた「青い鳥」に戻す拡張機能をリリースするユーザーも現れる中、Twitterを買収したイーロン・マスク氏が「社名を変更した企業」の一覧に「X: Twitter」と付け加えた投稿へのリプライで、「Twitterの名称をXに変更した理由」について説明しています。 Twitter was acquired by X Corp both to ensure freedom of speech and as an accelerant for X, the everything app. This is not simply a company renaming itself, but doing the same thing. The Twi
- GIGAZINE
- Twitter
- ネット
- IT
- business
- 経済
- news
- *あとで読む
Microsoft社のアーキテクトが説く、LLM実装の最前線　登場から今までを振り返って、予想する未来像
- 35 users
- logmi.jp
- テクノロジー
- 2023/11/03
登壇者の自己紹介蒲生弘郷氏：「ChatGPTの10ヶ月と開発トレンドの現在地」というタイトルで、蒲生から発表します。よろしくお願いいたします。ちょっと私の自己紹介です。Azure OpenAI Champという立場で、外部発信などをやっています。いっぱい自己紹介をしていきたいところですが、本日はあまり時間もないので省略して、次にいきたいと思います。今回は、けっこう開発者向けの発展的な内容を扱っていきますが、もし基本的な内容から確認していきたいという場合には、「Azure OpenAI 大全」というものを公開していて、リンクを貼っておくので、そちらの資料を併せてご確認いただければと思います。「ChatGPT」の登場から今までを振り返るでは、本日のテーマとして「ChatGPT」の登場から10ヶ月（※登壇当時）ということで、2022年11月から登場したChatGPTに関する技術について
- LLM
- ChatGPT
- あとで読む
- AI
State of GUI 2022 - KAS blog
- 35 users
- kas-gui.github.io
- テクノロジー
- 2022/12/14
Rust: state of GUI, December 2022 There was a recent call for blogs about Rust GUI. So, Are we GUI yet? Contents: Categorised listing of toolkits State of KAS State of GUI Categorised listing of toolkits Lets start by categorising entries from Are we GUI yet, ignoring those which appear abandoned or not very functional. Bindings Wrappers around platform-specific toolkits: Mac OS / iOS - cacao - Ru
- GUI
- Rust
- あとで読む
「表現の不自由展・その後」に足りなかった「他者のための自由」に向き合う覚悟 | p2ptk[.]org
- 35 users
- p2ptk.org
- 学び
- 2019/08/12
「表現の不自由展・その後」に足りなかった「他者のための自由」に向き合う覚悟投稿者: heatwave_p2p 投稿日: 2019/8/122019/8/12 8月3日土曜、「表現の不自由展・その後」を見てきた。翌日には展示が中止されてしまったので、現時点では最終日ということになる。この時点で、物議を醸すどころか狂騒とも言える状態に陥っていた。展示中止の方向で話が進んでいると報じられていたこともあり、会場前には長蛇の列ができていた。この展覧会をめぐっては、少女像や昭和天皇の写真を焼き踏んで火を消す映像の展示の是非、写真投稿禁止の是非、政治的中立性の問題、政治的介入の問題、文化行政のあり方、中止の是非、中止決定に至るプロセスの問題、あるいは批判のための粗探しなど、さまざまな論点から膨大な意見が噴出し、ハレーションを起こしている。だが、実際に見に行った者として、表現の自由を最重要のテーマとし
GPT-4oがどれぐらい早くなったのかコールセンターに導入して試してみた話 - APC 技術ブログ
- 35 users
- techblog.ap-com.co.jp
- テクノロジー
- 2024/05/26
gpt-4o はじめにこんにちは、ACS事業部の佐竹です。今回のMicrosoft Buildで発表されたGPT-4oについて、どの程度レスポンスが良くなったか是非触ってみたく、今回の記事を書くことにしました。 1.1.5.Azure OpenAI Serviceの主なAIの進化 news.microsoft.com 以前、Azure Communication ServiceとAzure OpenAI Serviceを使って、コールセンターを作ってみたのですが、そこにGPT-4oを組み込む形でGPT-4-32kとの速度比較を行いました。 techblog.ap-com.co.jp 上記の記事はハンズオン形式で記載しておりますので、お手隙の際に是非手を動かしていただけますと幸いです。概要全体アーキテクチャは以下のようになります。アーキテクチャ図全体の流れは以下の通りです。ユー
- GPT
- あとで読む
- 人工知能
- service
- communication
- 技術
- ブログ
面倒な仕事やサイト作成がたった2日でマスター可能！人気のPythonやWordPressでスキルアップできる「Udemy」初夏のビッグセール
- 35 users
- gigazine.net
- テクノロジー
- 2021/05/18
「新たなスキルを身につけて年収UPを目指したい」「プログラミングで仕事を自動化して楽に稼ぎたい」と日々思っている人は少なくないはず。しかし、いざ学習を始めようとしても忙しい毎日の中から時間を確保するのは難しいものです。ちょうど講座をムービー形式で受講できる学習プラットフォームの「Udemy」が5月27日(木)まで初夏のビッグセールを行っており、丁寧で分かりやすい解説講座が1270円～受講可能とのことで、忙しい毎日を送っていても週末の2日間だけで学習を完了できそうな短期集中型の講座をピックアップしてみました。外出がおっくうになる梅雨の季節や、ステイホームをうまく活用するために、この機会に買いだめしておくのがオススメです。オンラインコース -世界最大級のオンライン学習プラットフォーム- Udemy https://www.udemy.com/ ・目次 ◆1：WordPressの使い方を習得し
Amazon Is Booting Parler Off Of Its Web Hosting Service
- 35 users
- www.buzzfeednews.com
- テクノロジー
- 2021/01/10
Amazon notified Parler that it would be cutting off the social network favored by conservatives and extremists from its cloud hosting service Amazon Web Services, according to an email obtained by BuzzFeed News. The suspension, which will go into effect on Sunday just before midnight, means that Parler will be unable to operate and will go offline unless it can find another hosting service. People
End-to-End音声認識の計算量を削減した話
- 35 users
- techblog.yahoo.co.jp
- テクノロジー
- 2020/06/29
ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、音声処理黒帯（黒帯はヤフー内のスキル任命制度）の藤田です。今日のブログでは、音声認識技術の研究開発におけるヤフーの最新の取り組みを紹介します。特に、近年注目されているTransformerという手法に基づく、End-to-End音声認識の計算量を削減した研究を紹介します。この研究は、難関国際会議IEEE ICASSP2020に投稿し、採択されました。また、arXivでプレプリントを公開しています。そして、ESPnetというEnd-to-Endモデルのツールキット上でソースコードも公開しています。興味のある方はぜひ、こちらもご参照ください。音声認識で用いられるEnd-to-Endモデルとは？音声認識技術は音声をテキ
「日本人のフォロワーが沢山だ！」再び大拡散した感動的なスピーチ、論破劇が爽快
- 34 users
- www.buzzfeed.com
- 政治と経済
- 2021/06/04
「日本人のフォロワーが沢山だ！」再び大拡散した感動的なスピーチ、論破劇が爽快ウィリアムソンさんの論破劇が爽快すぎ。ユーモアもあるけど、シンプルかつ1番重要なことをしっかりと伝えていて、何度も聞きたくなるスピーチです。👏 2013年にニュージーランドの議会で行われた「ビッグ・ゲイ・レインボー演説」が再び、日本のSNS上で話題を呼んでいます。モーリス・ウィリアムソン議員（当時）が、同性婚を認める法案に賛成を訴える演説でした。 5月20日、与党・自民党でLGBTなど性的マイノリティーに対する理解増進に向けた法案の審査が行われました。しかし、様々な理由で法案に反対する議員が多く、議論はまとまりませんでした。中には「道徳的にLGBTは認められない」と発言した出席者もいると報じられています。こうした政治の動きをうけて、ウィリアムソン元議員の演説が国内で改めて注目されるようになり、趣旨に賛同する人
リリースされたGPT-4oを使って動画のサマリー生成をしてみる！ - Qiita
- 34 users
- qiita.com/sakasegawa
- テクノロジー
- 2024/05/14
概要 GPT-4oが発表されました。 GPT-4oについては以下のツイートによくまとまっています。使用している映像は以下でまとめられています。非常に優秀でAI系のプロダクトがまた何個か死んだと思いますが、それはさておき使っていきましょう。 APIではすでに利用可能になっております。今回は以下のcookbookにある動画要約をgradioに移植します。 https://cookbook.openai.com/examples/gpt4o/introduction_to_gpt4o デモ以下の Huggingface Space を作りました。APIキーと動画を貼り付けて試用することができます。 1分間の動画で0.1ドル / 60秒くらいかかります。API使用料に注意してください。現状のGPT-4o APIの制限動画はそのままアップロードできませんこれは将来的にもできるとされてい
- text
- api
- video
- あとで読む
- 動画