並び順

ブックマーク数

期間指定

  • から
  • まで

161 - 200 件 / 2394件

新着順 人気順

speechの検索結果161 - 200 件 / 2394件

  • ゼロからはじめるPython(84) 録り溜めたボイスメモをAI音声認識APIで一気にテキスト変換しよう

    家電量販店に行くと今でもボイスレコーダーのコーナーがあり人気だ。またスマートフォンにも必ずボイスメモアプリがある。筆者も一時期アイデアをボイスメモで録り溜めていた。しかし、ボイスメモは聞き直す必要があり管理が面倒という欠点もある。そこで、今回はPythonからMicrosoftのAPIを利用して自動的にボイスメモをテキストに変換する方法を紹介しよう。 WAVファイルを音声認識してテキストに変換したところ 音声認識APIを使ってみよう AI技術の進歩により音声認識の精度が向上している。これまでも音声認識の技術はあったものの精度が今一歩だった。そして個人ユーザーが気軽に活用できる感じではなかった。ところが、最近では、各社が競い合うように音声認識の精度向上に力を入れている。各社から発売されているAIスピーカーを積極的に活用している読者も多いことだろう。 そして、大きな点として、Microsoft

      ゼロからはじめるPython(84) 録り溜めたボイスメモをAI音声認識APIで一気にテキスト変換しよう
    • 女性の人権と安全を求める共同声明

      現在、LGBT関連新法の成立をめぐって、自民党案(通称「LGBT理解増進法案」)と野党案(性的指向又は性自認を理由とする差別の解消等の推進に関する法律案)とが競合しており、与野党間で法案のすり合わせが行なわれています。 この声明の賛同者の中には、与党案に賛成する者もいれば、与党案にも野党案にも賛成できないという者もいます。しかし、共通するのは、事実上、性自認(自分の性別をどのように認識しているか)だけによって、社会生活のルールをなす法的な性別変更ができるようになったり、男性の身体をした人が女性専用スペースに入ることが可能になったりすることに危惧を覚えていることです。 近年、けっしてすべての国でではありませんが世界的に、かつこの日本でも、「人は自分の望む性別に変更すれば、より自由に生きることができる。だから性別の変更は法的にも容易であればあるほど良く、手術で身体に変更を加えなくても望む性別で

      • 隣の防音部屋をミリ波で盗聴、瞬時にテキスト化する技術 中国の研究者らが開発

        このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 香港大学や清華大学に所属する研究者らが発表した論文「Radio2Text: Streaming Speech Recognition Using mmWave Radio Signals」は、ミリ波(mmWave)信号から音声を認識するストリーミング自動音声認識(ASR)システムを提案した研究報告である。このシステムは、周囲のノイズに強く、防音対策した部屋の外からでも取得でき、これまでと異なり長い文章をリアルタイムに認識する能力を提供する。 無線センシングの進展に伴い、特にミリ波信号の注目が高まっている。なぜなら、音源のミリメートルレベルの

          隣の防音部屋をミリ波で盗聴、瞬時にテキスト化する技術 中国の研究者らが開発
        • II-5 「思想と討論の自由」が守られなければならない理由

          いまわたしたちが直面している社会的諸問題の裏には、「心理学や進化生物学から見た、動物としての人間」と「哲学や社会や経済の担い手としての人間」のあいだにある「乖離」の存在がある。そこに横たわるギャップを埋めるにはどうしたらよいのか? ポリティカル・コレクトネス、優生思想、道徳、人種、ジェンダーなどにかかわる様々な難問に対する回答を、アカデミアや論壇で埋もれがちで、ときに不愉快で不都合でもある書物を紹介しながら探る論考、そのシーズン2の開始です。 「上」からではなく「下」からの制限 アメリカやヨーロッパでは、ポリティカル・コレクトネスやキャンセル・カルチャーの勢力が増していると同時に、その風潮に対する懸念や反対を表明する議論もなされている。そのなかでも特に目立つのが、ポリティカル・コレクトネスの風潮が学問の自由を侵害していることを批判する議論だ。 日本では、学問の自由に対する制限は「上」からや

            II-5 「思想と討論の自由」が守られなければならない理由
          • ReazonSpeech - Reazon Human Interaction Lab

            ReazonSpeech¶ ReazonSpeechは、世界最大のオープン日本語音声コーパスを構築するプロジェクトです。 日本語音声技術の推進を目的として、35,000時間の日本語音声コーパスを公開しています。 音声認識モデル・コーパス作成ライブラリをオープンソースライセンスで配布しています。

            • 囲いなしでその場所だけ“防音化” 特定の人物の声だけを“消す・聞く”ができる小型音響ロボット群

              このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米ワシントン大学と米Microsoftに所属する研究者らが発表した論文「Creating speech zones with self-distributing acoustic swarms」は、部屋内で話す人々の位置を特定し、その音声を分離するための小型の移動式音響ロボット群を提案した研究報告である。 この技術は、多くの人が一度に話している部屋において、部屋の一部で音を消す領域「ミュートゾーン」や、周囲を気にせず対話できる領域「スピーチゾーン」を作り出すことに活用できる。また多数の人が話している中で、物理的に離れた位置にいても特定の人々

                囲いなしでその場所だけ“防音化” 特定の人物の声だけを“消す・聞く”ができる小型音響ロボット群
              • Speech-to-Text Webcam Overlay

                *認識結果が確定したタイミングで反映されます。テキストの編集・コピーも可能です。 **認識中にEnterキーを押すと,認識を止めて文を区切ることができます。日本語の場合は文末に句点が付与されます。 よくある質問・ソースコード: GitHub 音声認識は Web Speech API を利用しています。 カメラやマイクが機能しないとき → ページの再読み込みや,ブラウザの設定を確認してください: Chrome ヘルプ 「ログをダウンロード」でダウンロードされるファイルは,アクセスしているユーザーのブラウザで生成されています。

                  Speech-to-Text Webcam Overlay
                • rinna/japanese-hubert-base · Hugging Face

                  rinna/japanese-hubert-base","children":[],"isValid":true,"title":"rinna/japanese-hubert-base"},{"id":"overview","label":"Overview","children":[],"isValid":true,"title":"Overview"},{"id":"how-to-use-the-model","label":"How to use the model","children":[],"isValid":true,"title":"How to use the model"},{"id":"how-to-cite","label":"How to cite","children":[],"isValid":true,"title":"How to cite"},{"id"

                    rinna/japanese-hubert-base · Hugging Face
                  • 彼らは警告を受けていた。なのに無視した。その結果がこのザマだ。クソったれが。 » p2ptk[.]org

                    彼らは警告を受けていた。なのに無視した。その結果がこのザマだ。クソったれが。投稿者: heatwave_p2p 投稿日: 2025/1/162025/1/16 Pluralistic 現実の真実は固定されたものではない。我々が世界について正しいと考えてきたことは変化し、「これまでずっとやってきた」ことも見直しを迫られることもある。たとえば、ラジウム坐薬の危険性を示す証拠が圧倒的になったとき、腸から速やかにラジウムを取り出して適切に処分する必要があったように。 https://pluralistic.net/2024/09/19/just-stop-putting-that-up-your-ass/#harm-reduction(邦訳記事) だからこそ、生活様式や経済規制、社会の仕組みについての既存の知恵やベストプラクティスを見直したいと考える人がいるのは、自然なことであり、正しい。だが、そ

                      彼らは警告を受けていた。なのに無視した。その結果がこのザマだ。クソったれが。 » p2ptk[.]org
                    • 自己流で英語に伸び悩んでいる人は『最新の第二言語習得研究に基づく 究極の英語学習法』を読むべし | DevelopersIO

                      学校・仕事・生活など様々な理由で英語を学びつつ、上達が今ひとつで今の勉強法を続けていいのかなぁと不安になっている人も多いのではないでしょうか。 タイパが重視される昨今だと、無駄なことはできるだけ避けたいですしね。 そんな人にピッタリの一冊が出版されたのでご紹介します。 第二言語(いわゆる外国語)習得、特に、語彙習得が専門の立教大学中田達也教授による『最新の第二言語習得研究に基づく 究極の英語学習法』です。 本書の向いている読者層 英語スキルを向上させたい方 英語を教えている方 子どもの早期英語学習に悩んでいる方 本書の特徴 現役の研究者が最新の研究に基づき、納得感のある一般論を繰り返し述べているため、安心して読むことができます。 個人体験談(N=1)をしたためた本では有りません。 本書の特徴は以下3点です 1. 対象読者は一般人 対象読者はあくまでも一般人です。 現役の研究者が書いてはいる

                        自己流で英語に伸び悩んでいる人は『最新の第二言語習得研究に基づく 究極の英語学習法』を読むべし | DevelopersIO
                      • 「イスラエルを非難した学生の顔」を印刷したトラックでハーバード大学周辺を走る晒し行為が発生

                        ハーバード大学の学生団体が「パレスチナ周辺で発生している暴力の責任はイスラエル政府にある」とする声明を発表した結果、声明に賛同した学生の顔写真を印刷したトラックがキャンパス周辺を走行する事態が発生しました。学生団体の声明に対しては複数の教員が否定的な意見を投げかけているほか、声明に賛同する学生の個人情報がインターネット上に公開される事態も発生しています。 As Students Face Retaliation for Israel Statement, a ‘Doxxing Truck’ Displaying Students’ Faces Comes to Harvard’s Campus | News | The Harvard Crimson https://www.thecrimson.com/article/2023/10/12/doxxing-truck-students-i

                          「イスラエルを非難した学生の顔」を印刷したトラックでハーバード大学周辺を走る晒し行為が発生
                        • Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog

                          こんにちは! 画像システムグループで機械学習エンジニアをやっている小島です。 この記事では、今ホットな「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイをしていきます。このために論文1000本に目を通し、70本程度を記事にしました。 Zero-shotやVision & Languageは、Stable Diffusionに代表される画像生成AIとも密接に関連している技術です。この記事を通して、Vision & Languageの奥深い世界を体感できるでしょう。 注意事項 この記事は非常に長いため、全部読むのに1時間以上かかる可能性があるので、休憩を取りながら、または必要な部分だけ読んでください。各セクションを個別に読んでも問題ありません。 また、文章中の画像は、特別な記載がない限り、引用元の論

                            Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog
                          • 【2024年】AWS全サービスまとめ | DevelopersIO

                            こんにちは。サービス開発室の武田です。このエントリは、2018年から毎年公開しているAWS全サービスまとめの2024年版です。 こんにちは。サービス開発室の武田です。 このエントリは、2018年から毎年公開している AWS全サービスまとめの2024年版 です。昨年までのものは次のリンクからたどってください。 AWSにはたくさんのサービスがありますが、「結局このサービスってなんなの?」という疑問を自分なりに理解するためにまとめました。 今回もマネジメントコンソールを開き、「サービス」の一覧をもとに一覧化しました。そのため、プレビュー版など一覧に載っていないサービスは含まれていません。また2023年にまとめたもののアップデート版ということで、新しくカテゴリに追加されたサービスには[New]、文章を更新したものには[Update]を付けました。ちなみにサービス数は 247個 です。 まとめるにあ

                              【2024年】AWS全サービスまとめ | DevelopersIO
                            • Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表

                              2023年4月18日にMicrosoft Research AsiaとMicrosoft Azureのカイ・シェン氏らの研究チームが拡散モデルを使用した小品質の音声合成システム(TTS)である「NaturalSpeech 2」を発表しました。NaturalSpeech 2では数秒の短い音声サンプルを利用する事で、人の声だけでなく歌声までも忠実にシミュレートすることが可能になっています。 [2304.09116] NaturalSpeech 2: Latent Diffusion Models are Natural and Zero-Shot Speech and Singing Synthesizers https://doi.org/10.48550/arXiv.2304.09116 NaturalSpeech 2 https://speechresearch.github.io/na

                                Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表
                              • Podbardというポッドキャストサイト構築ツールを作った | おそらくはそれさえも平凡な日々

                                https://github.com/Songmu/podbard 結果としてできたものはyattecastとHugoの間の子のようなモノになった。音声ファイルとそれに対応するエピソードファイルをfrontmatter付きのMarkdownで記述する。最終的に静的サイトとしてポッドキャストサイトを生成する。 podbard-starterというテンプレートリポジトリがあるので、ここからリポジトリを作ればすぐにポッドキャストサイトを作成できる。このテンプレートはGitHub Pagesにデプロイするモノだが、Cloudflare Pagesにデプロイする、podbard-cloudflare-starterや、それを応用してプライベートプッドキャストを構築する、podbard-private-podcast-starterというのも用意している。 まだ不十分だがドキュメントも以下に用意してあ

                                  Podbardというポッドキャストサイト構築ツールを作った | おそらくはそれさえも平凡な日々
                                • Free Text to Speech & AI Voice Generator | ElevenLabs

                                  The ElevenLabs voice generator can deliver high-quality, human-like speech in 32 languages. Perfect for audiobooks, video voiceovers, commercials, and more.

                                    Free Text to Speech & AI Voice Generator | ElevenLabs
                                  • 新世代AI読み上げソフトAivisSpeech、Style-Bert-VITS2とHeyGenアバターでレシピ動画を超簡単に料理してみた(CloseBox) | テクノエッジ TechnoEdge

                                    AIによる音声合成は、Diff-SVC、RVC、Vocoflex、Seed-VCなどのボイチェン方面で追いかけてきましたが、最近では商用サービスがTTS(Text To Speech)によるボイスクローニングを充実させてきたことに注目しています。 その一方で、オープンソース、フリーソフト側でもずいぶん進化しているのを見落としていました。そこに気づくきっかけとなったのは、「AivisSpeech」というソフトの登場です。 (▲AivisSpeech) ■AivisSpeechの登場AivisSpeechとは、日本で開発されたAI音声合成ソフトで、いくつかのプリセットボイスが使える推論用アプリがMac、Windows向けに提供されており、すぐに試すことができます。 既存のアプリに似た使いやすいユーザーインタフェースで、感情表現やアクセントの修正などが直感的にできる他、音声をトレーニングしてその

                                      新世代AI読み上げソフトAivisSpeech、Style-Bert-VITS2とHeyGenアバターでレシピ動画を超簡単に料理してみた(CloseBox) | テクノエッジ TechnoEdge
                                    • 新卒NLPエンジニアが取り組んだ音声合成システムにおける句境界予測モデルの導入

                                      LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog はじめに こんにちは、2020年4月に新卒としてLINE株式会社に入社した二又 航介です。テキスト音声合成システムの研究開発を担当するAI開発室 Voiceチームに所属し、音声合成システムにおけるテキスト処理部の研究開発やチームの機械学習基盤構築に取り組んでいます。 学生時代は機械翻訳や同時通訳に関連する研究に取り組んでいました。研究以外の活動としては、アルバイト・インターンでの対話システムや機械翻訳システムの研究開発、個人活動としてwebアプリケーション開発などを行っていました。このような活動を通じて、数多くのユーザーに利用される自然言語処理技術を活かしたサービスに携わりたいという思いからLINEを志望しました。学生時代は専

                                        新卒NLPエンジニアが取り組んだ音声合成システムにおける句境界予測モデルの導入
                                      • ついに来るのか!?拡散言語モデル|shi3z

                                        我々が単に「言語モデル」といった場合、それはTransformerモデルを指す。Transformerモデルは、ChatGPTやGemini、Claude-3、Command-R+などで使われている。 最近はMambaのような状態ステートマシンの言語モデルも出てきた。そしてもしかしたら今後はここに、拡散ディフュージョンモデルが加わるのかもしれない。 拡散モデルで有名なのは、StableDiffusionで、主に画像生成に使う。 実は画像生成は最初はTransformerだった。OpenAIのDALL-Eは、Transformerとして画像生成を行なった。しかしTransformerには明らかな欠点があり、それはあまりにも膨大な計算量が必要なことだ。 Transformerの事前学習プリトレーニングには、今でも天文学的な計算資源が必要だし、微調整ファインチューニングにも今なお膨大な計算機が必

                                          ついに来るのか!?拡散言語モデル|shi3z
                                        • Chrome 89で音声からリアルタイムに字幕を生成する「自動字幕起こし」機能が追加されたので使ってみた

                                          2021年3月3日にリリースされたデスクトップ版Google Chrome 89の安定版で、ブラウザ上で再生される音声やムービーからリアルタイムで字幕を生成する「自動字幕起こし」機能が追加されたことが明らかになったので、実際にどんな感じなのか使ってみました。 Google's Live Caption feature rolling out for Chrome desktop users https://www.xda-developers.com/google-chrome-live-caption-feature-rolls-out-transcribe-speech-videos/ Google's Live Caption is now rolling out to Chrome on desktop | Android Central https://www.androidce

                                            Chrome 89で音声からリアルタイムに字幕を生成する「自動字幕起こし」機能が追加されたので使ってみた
                                          • Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog

                                            こんにちは ハタ です。 最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います 音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります 構築していく上で色々試行錯誤したのでそれが紹介できればなと思っています どんなものを作ったか 前提知識: 配信基盤 前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージ まとめ We are hiring! どんなものを作ったか 今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行う シス

                                              Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
                                            • 英語のリエゾン(リンキング)とは?5つの音声変化と練習法を解説|ベルリッツ

                                              英語を勉強していると「ネイティブのスピードについていけない」「発音のせいで自分の英語が通じない」と悩んだことはありませんか? その悩みは、英語のリエゾンを学ぶことで解決できるかもしれません。 リエゾンのルールを学ぶと、今まで聞き取れなかった英語特有の音が聞こえるようになったり、ネイティブに近い発音ができるようになったりと、大きなメリットがあります。 リエゾンをマスターして、リスニング力やスピーキング力を鍛えていきませんか? それでは英会話教室のベルリッツが、リエゾンとは何か、そのルールと音の変化、さらにリエゾンを聞き取れるようになるための練習方法まで分かりやすく解説します。 英語のリエゾンとは? 英語のリエゾン (liaison) とは、子音と母音、単語と単語が連結するなどして音が変化することを指します。 もともとリエゾンはフランス語で「連結」を意味し、英語では “linking(リンキン

                                              • WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始|DTMステーション

                                                CeVIO Creative StudioやCeVIO AIなどのエンジン部分を開発してきた株式会社テクノスピーチが2月24日、新たな歌声合成ソフト、「CeVIO Pro (仮)」(チェビオプロ)を発表するとともに、正式版リリースへの準備段階としてα版の無償配布を開始しました。このCeVIO Pro (仮)は、WindowsだけでなくMacでも動作するソフトであり、スタンドアロンで動作するとともに、WindowsおよびMacのVSTiのプラグインとしても動作するものとなっています。 またCeVIO Pro (仮)にはソングエディタともに、デフォルトボイスライブラリとして女性シンガーである「知声」(読み:ちせい、英語表記:Chis-A)が付属。ここで合成された歌声の波形データは個人/法人、商用/非商用を問わず、原則、無料で利用することが可能となっています。実際どんなものなのか、試してみた一方

                                                  WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始|DTMステーション
                                                • データ分析はサービス競争力にどう貢献できるか? 大量のデータを扱うLINEのデータサイエンティストの役割 | ログミーBusiness

                                                  2020年6月24日に、LINEの「Data Labs」のオンライン採用説明会が開催されました。Data Labsは、データ分析や機械学習の活用によって、LINEのすべてのサービスの価値向上を目指す、データの分析・研究を行う専門の開発組織です。説明会の前半では、Data Labs室長の池邉智洋氏から組織についての説明があった後、Data Science1チーム/マネージャーの牟田博和氏よりデータサイエンティストの役割と仕事内容についての紹介が行われました。2記事目はこちら LINEのData Science and Engineeringセンターについて池邉智洋氏:よろしくお願いいたします。Data Labsの室長を担当しております執行役員の池邉と申します。 本日オンラインではありますが、大変多くの方にご視聴いただいているようで、本当にありがとうございます。私からはまずData Labsの

                                                    データ分析はサービス競争力にどう貢献できるか? 大量のデータを扱うLINEのデータサイエンティストの役割 | ログミーBusiness
                                                  • 環境運動から共産主義に"転向"して、COPから追放されたグレタ・トゥンベリ

                                                    メディアのアイドルである環境運動家のグレタ・トゥンベリ。今年ももてはやされたが、なぜかCOP26の国際会議場には呼ばれなかった(開催地:グラスゴーでのデモに参加)。一体なぜだろうか?彼女のスピーチをよく聞くと、その理由が分かってくる。 目次 メディアの寵児だったが 環境問題と共産主義の親和性 メディアの寵児だったが 今回のCOPでもスウェーデンの環境運動家のグレタ・トゥンベリがメディアでずいぶんと報道された。例えば産経新聞の記事では以下の通り。 via THE SANKEI NEWSよりキャプチャー メディアの記事の論調は殆どどれも判で押したように「環境危機を訴えた」「大人は口先だけで行動が伴っていない」「グリーンウオッシュのPR合戦に過ぎない(注:グリーンウオッシュとは、グリーンとホワイトウオッシュを組み合わせた造語である。ホワイトウオッシュとは白い色を塗ることで、転じてうわべだけを飾る

                                                      環境運動から共産主義に"転向"して、COPから追放されたグレタ・トゥンベリ
                                                    • 【個人開発】動画の字幕・テロップ入れをAIで自動化するWebサービスを作りました - Qiita

                                                      Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? こんにちは、2z(Twitter: @2zn01 )です。 趣味でWebサービスの個人開発をしており、以下のサービスを開発・運営しています! ■AIメーカー https://aimaker.io/ → 誰でも簡単にAIを作れるサービス ■ツイレポ https://twirepo.com/ → キーワードで話題のツイートを自動で収集したり、自動でリツイート・フォローができるサービス ■文字起こすくん https://text.aimaker.io/recognize-bot/ → 画像、音声、動画をアップするだけで簡単に文字起こし・書き起

                                                        【個人開発】動画の字幕・テロップ入れをAIで自動化するWebサービスを作りました - Qiita
                                                      • New models and developer products announced at DevDay

                                                        GPT-4 Turbo with 128K context and lower prices, the new Assistants API, GPT-4 Turbo with Vision, DALL·E 3 API, and more. Today, we shared dozens of new additions and improvements, and reduced pricing across many parts of our platform. These include: New GPT-4 Turbo model that is more capable, cheaper and supports a 128K context windowNew Assistants API that makes it easier for developers to build

                                                          New models and developer products announced at DevDay
                                                        • ElasticsearchとKibela APIを使ってSlackでのCSお問い合わせ対応業務を改善した話 - BASEプロダクトチームブログ

                                                          この記事はBASE Advent Calendar 2020の11日目の記事です。 devblog.thebase.in BASE株式会社 Data Strategy チームの@tawamuraです。 BASEではオーナーの皆様や購入者様のお問い合わせに対して、Customer Supportチームが主となって対応をしています。その中でもいくつかの技術的なお問い合わせに対しては、以下のようにSlackの専用チャンネルを通して開発エンジニアに質問を投げて回答を作成することになっています。 CSチームから調査を依頼されるお問い合わせの例 これらのCS問い合わせ対応は日々いくつも発生しており、CSお問い合わせ対応を当番制にして運用してみた話 でもあるように週ごとに持ち回り制で各部門のエンジニアが対応しているのですが、どうしても調査や対応に時間が取られてしまうという問題が発生していました。 dev

                                                            ElasticsearchとKibela APIを使ってSlackでのCSお問い合わせ対応業務を改善した話 - BASEプロダクトチームブログ
                                                          • 開会式で話題となった"長いスピーチ"、どうしてそう感じたのかをスピーチライターがガチ分析してみた

                                                            千葉 佳織 / 初著書『話し方の戦略』 @kaolly13 オリンピック開会式のバッハ会長のスピーチ、「長かった」との感想を多く目にしました。 みなさんの違和感の正体が、スピーチのどのような技術に由来するのか、スピーチライターの視点で分析してみました。 明日から使えるスピーチ・プレゼンのポイントも添えています。 pic.twitter.com/eTV12Q3fRh 2021-07-26 19:40:32 千葉 佳織 / 初著書『話し方の戦略』 @kaolly13 株式会社カエカ代表取締役、スピーチライター。話す力を数値化しあなたの課題を解決する話し方トレーニング「kaeka(@kaeka_official)」を運営。個人・企業・政治選挙にkaekaを提供。SFC→DeNA→kaeka。弁論全国大会3回優勝、内閣総理大臣賞、採用情報(https://t.co/O4P5SsjZ4d) kaek

                                                              開会式で話題となった"長いスピーチ"、どうしてそう感じたのかをスピーチライターがガチ分析してみた
                                                            • ChatGPTでユーザーインタビューの分析を爆速にする具体手法を解説 - PM x LLM STUDIO

                                                              今回は「ChatGPTなどの生成AIを活用してユーザーインタビューの分析を効率化する具体的な手法」をテーマにした記事です。 ユーザーリサーチの現場では、インタビュー後のログ整理や発言のファクト抽出、インサイトの可視化などに多くの時間がかかりがちです。しかし、近年の生成AI(ChatGPTなど)を賢く使えば、これまで数時間~数日かかっていた作業を短時間かつ高精度で実施できるようになっています。 ユーザーインタビューの基本的な流れや実施方法について復習したい場合は、以下の記事もあわせてご覧ください。 【ユーザーインタビューの始め方と具体的手順】 ChatGPT×ユーザーインタビュー分析の狙い ChatGPTなどの生成系AIは、大量のテキストから要約やテーマ抽出を高速に行うのが(なんなら我々人間よりも)得意。ユーザーインタビューのログを丸ごと入力すれば、以下のような場面で役立ちます。 要点・サマ

                                                                ChatGPTでユーザーインタビューの分析を爆速にする具体手法を解説 - PM x LLM STUDIO
                                                              • 呉座・オープンレター事件の対立軸――キャンセルカルチャーだったのか?/田中辰雄 - SYNODOS

                                                                1.はじめに 2021年、大学関係者の間で呉座・オープンレター事件が話題になった。本稿はこの事件で何が対立軸だったのかを、人々へのアンケート調査の形で調べることを目的としている。 事件のあらましを簡単に述べる。ベストセラー『応仁の乱』の作者である歴史学者、呉座勇一氏が鍵付きツイッターアカウントで、ある女性研究者を揶揄あるいは誹謗していることが明るみに出て、炎上する。呉座氏は謝罪し、NHKの大河ドラマの歴史考証役を降板した。その後、有識者よりこの事件を一般的な女性差別問題として広く世に問うオープンレターが出され、1300人もの学者らが署名する。半年後に呉座氏の所属機関は予定されていた呉座氏の採用を取り消した。 この事件はいろいろな角度から議論が可能で、すでに多くの記事が書かれている。オープンレターが出るころまでは呉座批判一色であったが、採用取り消しで呉座氏への同情論が出るようになり、最近では

                                                                  呉座・オープンレター事件の対立軸――キャンセルカルチャーだったのか?/田中辰雄 - SYNODOS
                                                                • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                                                                  無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                                                                    無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                                                                  • 「表現の自由」は差別・憎悪・暴力の扇動・抑圧を正当化する道具ではない » p2ptk[.]org

                                                                    以下の文章は、Access Nowの「Our rights are at stake: it’s time to reclaim freedom of expression」を翻訳したものである。 Access Now Access Nowは表現と意見の自由の権利を守り続けている。しかし昨今、世界中の極右政治勢力などが「表現の自由」を口実に、マイノリティグループやコミュニティへの暴力を扇動し、批判者の声を封じ込めようとする動きを強めている。我々はこうした権利への絶え間ない侵害と攻撃に反対する。表現の自由は、オンラインであれオフラインであれ、憎悪や暴力、敵意を煽る行為を正当化するものではない。ところがビッグテック企業は極右勢力を後押しし、自らの権力と影響力を強める目的で、彼らの運動と密接かつ公然と連携している。 2025年1月、Metaはコンテンツモデレーションの方針を大きく転換する懸念すべ

                                                                      「表現の自由」は差別・憎悪・暴力の扇動・抑圧を正当化する道具ではない » p2ptk[.]org
                                                                    • 協調フィルタリングとベクトル検索エンジンを利用した商品推薦精度改善の試み | メルカリエンジニアリング

                                                                      こんにちは、メルカリのレコメンドチームで ML Engineer をしている ML_Bear です。 以前の記事 [1] では、item2vecと商品メタデータを用いた、メルカリのホーム画面のレコメンド改善のお話をさせていただきました。今回は商品詳細画面でレコメンド改善を行ったお話をさせていただきます。商品詳細画面の例は図1の通りです。ユーザーはアイテムの詳細な説明を見たいときにこの画面に来訪するため、同様の商品を推薦する自然な接点として非常に重要です。 まず、私たちが商品詳細画面で行った改善の概要を示します。各部の詳細については次節以降で詳しく触れます。 日本有数の大規模ECサービスにおいてベクトル検索ベースの商品推薦アルゴリズムを実装し、推薦精度の大幅な改善を実現しました。 協調フィルタリングとニューラルネットワーク (以下、NN) を利用した商品推薦アルゴリズムを構築し、コールドスタ

                                                                        協調フィルタリングとベクトル検索エンジンを利用した商品推薦精度改善の試み | メルカリエンジニアリング
                                                                      • Very Short Introductionの邦訳まとめ - 清く正しく小賢しく

                                                                        (最終更新:2024/12/6) オックスフォード大学出版会のVery Short Introductionという有名な入門書シリーズがある。短くて内容も平易なので、まずはこの1冊という感じで推薦されることも多いシリーズだ。 さて、このシリーズは当然ながら邦訳もたくさん出ているのだが、複数の出版社がそれぞれの形で刊行しているため、どれがVery Short Introductionの邦訳なのか分からないという問題がある。 ありがたいことにオックスフォード大学出版会が以下のページに邦訳の一覧をエクセルのファイルで貼ってくれているが、ちょっと見にくい。*1*2 Very Short Introductions - Oxford University Press www.oupjapan.co.jp ということで、このページではVery Short Introductionの邦訳を一覧の形でまと

                                                                          Very Short Introductionの邦訳まとめ - 清く正しく小賢しく
                                                                        • 反AIさん、知識基盤のレベル合わせをしよう

                                                                          生成AIはAIじゃないーのやつ1.一般的に言われるAIは、狭義のAIすなわち完全自律自己成長型人工知能の事ではないよ 2.これをAIと認めないなら AI Act 筆頭に人工知能を対象とした規制は「生成AIはAIじゃないんで関係ないね」になるよ 3.「生成AI」はホニャララ生成モデルを包括した用語だから、当たり前に使ってる機能が実は生成AIに該当するという事もよくあるよ 生成型検索エンジンという発言を鵜呑みにしてるやつ1.テキストを入力したら入力通りの画像が生成表示されるText-to-Imageの様子を検索エンジンになぞらえただけのものだよ 2.本気で生成AIはAIじゃなくて検索エンジンだと思ってるのは君だけだよ AIはネット環境が必須だと思ってるやつ1.そういうのもあるし、そうじゃないものもあるよ 2.極端な話、個人のゲーミングパソコンで動く程度のAIはネットワーク不要だと思って差し支え

                                                                            反AIさん、知識基盤のレベル合わせをしよう
                                                                          • FOMO - Wikipedia

                                                                            今やスマートフォンは常時、公私にわたりネットワークにつながり続けることを可能にした。こうなると「何か見逃しているものはないか」とひっきりなしに更新やメッセージをチェックせずにいられなくなることもある[1]。 FOMO(英: fear of missing out、フォーモ、取り残されることへの恐れ)とは、「自分が居ない間に他人が有益な体験をしているかもしれない」、と言う不安に襲われることを指す言葉である[2]。 また、「自分が知らない間に何か楽しいことがあったのではないか」、「大きなニュースを見逃しているのではないか」と気になって落ち着かない状態も指すことから、 「見逃しの恐怖」とも言う。社会的関係がもたらすこの不安は[3]、「他人がやっている事と絶え間なくつながっていたい欲求」と言う点で特徴づけられる[2]。 FOMOはまた「後悔に対する恐れ」とも言え[4]、それは社会関係、画期的体験、

                                                                              FOMO - Wikipedia
                                                                            • 科学における「キャンセルカルチャー」論争 - わが忘れなば

                                                                              最近、英語圏において物理化学系の学術誌に発表されたあるエッセイを起点として、こんな専門誌を舞台に意外な、と思うほどの盛り上がりを見せた論争が起きた。それは、「キャンセルカルチャー」を巡るものなのだが、日本語圏ではこの論争についてほとんど紹介されていないようなので、今回の記事で簡単に紹介してみたい。 アンナ・クリロフ (Anna I. Krylov) が2021 年にアメリカ化学会が発行する物理化学の学術誌 The Journal of Physical Chemistry Letters に発表したエッセイ「科学を政治化することの危険 The Peril of Politicizing Science」*1は、左派的なイデオロギーが今日の科学界において検閲として働いていると指摘し、大きな評判を呼んだ。これに対して、同年フィリップ・ボール(Philip Ball)は、同誌において「科学はそも

                                                                                科学における「キャンセルカルチャー」論争 - わが忘れなば
                                                                              • NVIDIAが基調講演に使った「キッチンでしゃべるCEOの映像」が自社製ツールで作ったCGであることが明らかに

                                                                                NVIDIAが2021年4月に行った基調講演について、ジェン・スン・ファンCEOが登壇するシーンの一部や撮影現場として用いられたキッチンなどが、3Dデザインコラボレーションプラットフォーム「NVIDIA Omniverse」で作成されたCGだったと明かしました。 NVIDIA Omniverse Changes the Way Industries Collaborate | NVIDIA Blog https://blogs.nvidia.com/blog/2021/08/11/omniverse-making-of-gtc/ Nvidia Reveals Its CEO Was Computer Generated in Keynote Speech https://www.vice.com/en/article/88nbpa/nvidia-reveals-its-ceo-was-co

                                                                                  NVIDIAが基調講演に使った「キッチンでしゃべるCEOの映像」が自社製ツールで作ったCGであることが明らかに
                                                                                • オリパラの音楽担当になった小山田圭吾の悪評をredditに投稿しようと考えてる。

                                                                                  このグーグル翻訳を駆使した英文で大丈夫か教えてほしい。 (増田の仕様のせいで空行が入らないので読みにくいかも) 追記:ブコメですでに記事があるという指摘があったので、いまさら投稿しなくてもいいか。 なにかに流用したい人がいるかわからんが好きに使ってくれていい。 A creative member of the Tokyo Olympics opening ceremony music was found to have been a fierce bullying assailant in the past. Keigo Oyamada (born 1969) became a creative member of the Tokyo Olympics opening ceremony music. In an interview with a music magazine in the

                                                                                    オリパラの音楽担当になった小山田圭吾の悪評をredditに投稿しようと考えてる。