並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 5570件

新着順 人気順

Audioの検索結果241 - 280 件 / 5570件

  • ChatGPTは新しいゲームを作ることができるのか - ABAの日誌

    ChatGPTはいろんなことができるが、私が興味があるのは、ChatGPTは私のためにアクションミニゲームを作ってくれるのか、ということだ。 コンピュータに自動的にアクションミニゲームを作ってもらうための試みは、だいぶ前にやった。 ChatGPTの登場によって、今度は大規模言語モデルを使うという新しいアプローチが手軽に試せるようになった。モデルに新しいゲームのアイデアを考えてもらい、そのアイデアを実現するソースコードを実装してもらえばゲームの出来上がりだ。 だが、少なくとも現状のChatGPT(今のところ私はGPT-3.5でしか試していないが)では以下の問題があるように思える。 ChatGPTに、実装可能なアルゴリズムのレベルまで詳細化された、新しいゲームのアイデアを考えさせるのは難しい ChatGPTは、今までにない新しいアルゴリズムを、ソースコードとして実装することを不得意としている

      ChatGPTは新しいゲームを作ることができるのか - ABAの日誌
    • Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog

      こんにちは ハタ です。 最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います 音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります 構築していく上で色々試行錯誤したのでそれが紹介できればなと思っています どんなものを作ったか 前提知識: 配信基盤 前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージ まとめ We are hiring! どんなものを作ったか 今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行う シス

        Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
      • TensorFlow 事例: から揚げを認識して弁当箱に入れる Foodly

        .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

          TensorFlow 事例: から揚げを認識して弁当箱に入れる Foodly
        • Spotify API + Next.jsで作る選曲支援Webアプリ - Qiita

          概要 Spotify APIの楽曲レコメンド機能を使って、DJ Mix用のプレイリストを作成できるWebアプリケーションを開発しました。まずはそのアプリケーションの内容をご紹介します。 実装はTypeScript + Next.jsで行いVercelにデプロイする形にしたところ、非常に高い開発体験が得られました。後半はSpotify APIの使い方を含めて、Next.jsでの実装やVercel上での設定について書いていきます。 できたもの AUTOMISCE - Automate Your Mix with Spotify API 使い方 まず"Sign in with Spotify"ボタンでSpotifyにログインします。次に右側の検索欄で最初の曲を選んでプレイリストに追加します。するとその曲と似たテンポでかつテンション感が少し上の曲が"Upper Tracks"欄に、少し下の曲が"D

            Spotify API + Next.jsで作る選曲支援Webアプリ - Qiita
          • リモートワーク1年と半年近く、買ってよかったモノなど。

            2020年3月は遠い昔のようにさえ感じてしまうが、あのころ、僕たちは、ここまで長期的なリモートワーク・・・私の勤める会社ではWork from Homeと呼んでいるが・・・になるとは想像していなかった。 世の中には色々な職業、職種、仕事のスタイルがあるし、会社の方針もあるだろう。勤務先は、ほぼ全社員にWork from Homeを命じ、一時的な緩和はあったものの、2021年の夏も自宅から勤務している。 色々グッズを買ったので、聞いてくれ。また、違うオススメあったら書いてくれたら嬉しいです。 (追記)自分の作業や仕事、娯楽の資本となる投資なら、「欲しいな」と思うなら買っちゃった方がいいですよ。本当に必要なものなら、いつか買う筈です。なら先に買った方が価値があります。 良かった4KモニタU3219Q 31.5インチモニタを買いました。縦横比もいいし、広いし、4K映画も楽しめるし、いいことずくめ

              リモートワーク1年と半年近く、買ってよかったモノなど。
            • ピアノの演奏動画から楽譜を自動作成 ディープラーニングで 京大が技術開発

              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 京都大学の研究チームが開発した「Non-Local Musical Statistics as Guides for Audio-to-Score Piano Transcription」は、Web上のピアノ演奏動画の音声データから楽譜を作成する、深層学習(ディープラーニング)を用いた自動変換システムだ。 システムは、3段階で構成される。1段階目は、入力された動画の音の信号に対してMIDIシーケンスを深層学習ネットワークで推定(Multipitch detection)する。ピッチ解析用とベロシティ推定用のネットワークを別々で学習し、その出力を組み合わせてMIDIシーケンスを合成する。2段

                ピアノの演奏動画から楽譜を自動作成 ディープラーニングで 京大が技術開発
              • Chrome の User-Agent 文字列削減のオリジン トライアルと今後の計画について

                .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                  Chrome の User-Agent 文字列削減のオリジン トライアルと今後の計画について
                • 収益化も可能!「Audiostock」の楽曲 約1万曲がニコニコ内で無料使用可能になりました|ニコニコインフォ

                  世界最大級のロイヤリティフリーのストックミュージックサービス「Audiostock」が管理する約1万曲の楽曲について、「ニコニコ」への投稿作品に無料で使用可能になりました。 「Audiostock」は、映像制作会社やYouTuberなどの顧客に対して、全国の音楽クリエイターが制作したBGMや効果音等90万点以上の音楽作品を販売する世界最大級のストックミュージックサービスです。 Audiostockと楽曲原盤の使用に関する許諾契約を締結し「ニコニコ」が包括的に使用料を支払うことで、ユーザーは「Audiostock」で販売中の楽曲 約1万曲を、「ニコニコ」への投稿作品に無料で使用できるようになります。 また、「Audiostock」の楽曲を使用した投稿作品は、「ニコニコ」のクリエイター奨励プログラムを通じて収益化することも可能です。 ■ 概要【使用できる楽曲】「許諾原盤検索サービス」に掲載され

                    収益化も可能!「Audiostock」の楽曲 約1万曲がニコニコ内で無料使用可能になりました|ニコニコインフォ
                  • 「職人の技」の定量化を目指す TensorFlow

                    .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                      「職人の技」の定量化を目指す TensorFlow
                    • 「Opus」と「AAC」どっちが高音質? 周波数分析でコーデック比較した【藤本健のDigital Audio Laboratory】

                        「Opus」と「AAC」どっちが高音質? 周波数分析でコーデック比較した【藤本健のDigital Audio Laboratory】
                      • オーディオ業界の中の人が「原価率は30%以下」「自社工場を持つブランドはほとんどない」などの秘密を暴露

                        オーディオ機器は音や音楽を出すというシンプルな用途ながら、心配になるような激安で売られているものから目が飛び出るような値段が付いているものまで多種多様です。オーディオ関連企業に数年間勤めた経験があるというインターネットユーザーが、オーディオ機器レビュー向けのフォーラムに、業界についての裏話を投稿し話題になっています。 "Secrets" about the consumer audio business you may find interesting | Audio Science Review (ASR) Forum https://www.audiosciencereview.com/forum/index.php?threads/secrets-about-the-consumer-audio-business-you-may-find-interesting.37344/ kem

                          オーディオ業界の中の人が「原価率は30%以下」「自社工場を持つブランドはほとんどない」などの秘密を暴露
                        • 貴方の歌声が“ボカロ音声”に。新機能「VOCALO CHANGER」が面白い【藤本健のDigital Audio Laboratory】

                            貴方の歌声が“ボカロ音声”に。新機能「VOCALO CHANGER」が面白い【藤本健のDigital Audio Laboratory】
                          • AIを使った音声圧縮で従来の圧縮を超えた圧縮率と圧縮速度を「Encodec」が実現

                            ガブリエル・シナエーブ氏らによるMeta AIの研究チームが、インターネットにおける音声の「圧縮」に対してAIを用いることで従来の圧縮よりもさらなる圧縮が可能である、という研究を発表しました。AIを用いた圧縮により、豊かなマルチメディア体験を楽しむことができると説明しています。 Using AI to compress audio files for quick and easy sharing https://ai.facebook.com/blog/ai-powered-audio-compression-technique/ 今日のインターネットにおいて「圧縮」はなくてはならない要素で、圧縮により、高品質な画像やストリーミングが可能になります。しかし、現状の圧縮技術には高速なインターネット接続と十分なストレージ容量が必要になり、高品質で中断のないインターネットは一部の人しか体験できま

                              AIを使った音声圧縮で従来の圧縮を超えた圧縮率と圧縮速度を「Encodec」が実現
                            • 外部ユーザが安全かつ直接的に Amazon S3 へファイルをアップロードできるようにする方法 | Amazon Web Services

                              Amazon Web Services ブログ 外部ユーザが安全かつ直接的に Amazon S3 へファイルをアップロードできるようにする方法 このブログは 2022 年 3 月 24 日に Anderson Hiraoka (Solutions Architect) と、Rafael Koike (Principal Solutions Architect) によって執筆された内容を日本語化した物です。原文はこちらを参照して下さい。 企業では、ファイルや画像などのデジタル資産をリポジトリに保存することが求められることが多くあります。多くの場合、これらのファイルのソースは、社内システムに接続されていないパートナーまたは個人であり、ファイルをアップロードするためには、企業の認証が必要となります。お客様は従来、ファイルのアップロードを処理するためにサーバーを使用していましたが、大量のネットワー

                                外部ユーザが安全かつ直接的に Amazon S3 へファイルをアップロードできるようにする方法 | Amazon Web Services
                              • すべてが失われたLAの音楽コミュニティの現状——Stones Throw、KCRW、LA Philの関係者、アーティストPhotayらによるレポート - Always Listening by Audio-Technica(オーディオテクニカ)

                                おすすめ記事 | 2025.01.19 Sun すべてが失われたLAの音楽コミュニティの現状——Stones Throw、KCRW、LA Philの関係者、アーティストPhotayらによるレポート 2025年1月、ロサンゼルスを襲った大規模山火事は、アルタデナやイートン・キャニオンなどで活動してきたミュージシャン、アーティストのコミュニティに壊滅的な被害をもたらした。強風「サンタ・アナ」にあおられた火災は、恐るべきスピードで住宅地を焼き尽くし、多くの住民は荷物を持ち出す時間すらないまま避難を余儀なくされた。 被害は家屋などの単なる物理的な損失にとどまらない。豊かな自然と調和したコミュニティやアーティストたちが築いてきた創造的な暮らしの場となっていた歴史ある街並みは、火災による深刻な大気汚染にさらされ(南カリフォルニアの大気汚染レベルは6段階のうち最悪のレベル6に達した)、有毒な瓦礫の山が散

                                • Bluetoothも“ロスレス”が当然に!? クアルコム「Snapdragon Sound」がやってくる【藤本健のDigital Audio Laboratory】

                                    Bluetoothも“ロスレス”が当然に!? クアルコム「Snapdragon Sound」がやってくる【藤本健のDigital Audio Laboratory】
                                  • Google MeetのWebカメラを加工してみよう! - セキュアスカイプラス

                                    ごにょごにょごにょごにょ… ということでここまで約8時間、快適なオンラインビデオ会議について講義を行ってきましたが、理解できましたか?もうあなた方は立派にGoogle Meeeeetが使えます! というわけで、今日はGoogle Meetを少しだけ快適に使うハックの話をします。CTOの長谷川です。 Google Meetって? Google MeetはZoomやSkype、Teamsなどと同様にインターネット経由で手軽にビデオ会議が行える、Googleによるサービスです。過去にはサービス名が「Google ハングアウト」「Google ハングアウト Meet」だったこともあり、オンラインの記事ではあちこち旧称も混ざったりと表記が揺れてますが、この記事ではGoogle Meetに統一します(Meeeeetではないです)。 Google Meetと他のサービスを比べてみると、以下のような差異が

                                    • スタジオを自作! 低予算で防音/Dolby Atmos対応を実現する方法【藤本健のDigital Audio Laboratory】

                                        スタジオを自作! 低予算で防音/Dolby Atmos対応を実現する方法【藤本健のDigital Audio Laboratory】
                                      • 新生aiwa“誰でも演奏できちゃう”電子楽器「aiwa play RX01」って何モノ?【藤本健のDigital Audio Laboratory】

                                          新生aiwa“誰でも演奏できちゃう”電子楽器「aiwa play RX01」って何モノ?【藤本健のDigital Audio Laboratory】
                                        • 西川善司の3DGE:PS5 Proの実像をテクニカルプレゼンテーションから考察してみる

                                          西川善司の3DGE:PS5 Proの実像をテクニカルプレゼンテーションから考察してみる ライター:西川善司 Sony Interactive Entertainment(以下,SIE)は,2024年9月11日に,「PlayStation 5」の上位機にあたる「PlayStation 5 Pro」を2024年11月7日に発売すると発表した(関連記事)。 テクニカルプレゼンテーションの動画内で明かされた情報はそれほど多くはなかった。それでも重要なキーワードはいくつかあったので,そのあたりをヒントにして,筆者独自の考察も加えつつ,詳しく見ていくことにしたい。 Proモデルは「体験の進化」ではなく「映像のグレードアップ」 PlayStation 4を開発していた頃から,PSハードウェア仕様を監督する「リードアーキテクト」に就任したSIEのMark Cerny(マーク・サーニー)氏には,筆者も直接取

                                            西川善司の3DGE:PS5 Proの実像をテクニカルプレゼンテーションから考察してみる
                                          • The New CSS Reset

                                            Skip to the content. The New CSS Reset This new CSS reset is using the new CSS features: The global CSS reset keywords, ‘unset’ and ‘revert’ keywords. The new property of ‘all’ which can reset all properties combined. The :where() pseudo-class to remove specificity. The :not() pseudo-class with multi arguments. What the-new-css-reset is resetting? This CSS reset is built from the understanding we

                                            • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                                              無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                                                無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                                              • コロナ禍で苦しむミュージシャンの救世主となるか?ヤマハがネット越しのセッションツール、SYNCROOMをリリースする背景|DTMステーション

                                                4月9日、ヤマハから「ご自宅からでもみんなで合奏が楽しめる ヤマハ オンライン遠隔合奏サービス『SYNCROOM』 ベータ版公開中、2020年6月頃より正式公開予定」という報道発表がされ、プロ・アマ問わず多くのミュージシャンの間で大きな話題になっています。このSYNCROOM(シンクルーム)とは、自宅にいながらにして、まさにスタジオに入ったように仲間とセッションができるという画期的ツールで、6月にヤマハが無料でリリースするというものです。 SYNCROOMを使うことで、バンドメンバーで練習できるのはもちろんのこと、そのみんなでの演奏をそのままネット配信するといったことも可能だし、その演奏を16bit/48kHzもしくは16bit/44.1kHzの非圧縮の状態でレコーディングして作品を作っていくといったことも可能。外出や人と会うことが難しい今、まさにみんなが求めている夢のようなツールなのです

                                                  コロナ禍で苦しむミュージシャンの救世主となるか?ヤマハがネット越しのセッションツール、SYNCROOMをリリースする背景|DTMステーション
                                                • 新型AirPods Pro第2世代は大幅性能向上へ:USB-C・心拍数検出・聴覚補助・音質向上など詳細がリーク - こぼねみ

                                                  Appleが発売の準備を進めている新型「AirPods Pro」について。 第2世代となる新モデルに関する詳細情報を入手したとして52audioが伝えています。 それによると、新しい筐体、アップグレードされたSiPパッケージシステム、自己適応型アクティブノイズキャンセリングをサポートする新しいチップ、改良された「探す」機能など、多くのアップグレードをもたらします。また、心拍数検出、聴覚補助、USB-Cポート、高速充電の最適化などの新機能が搭載されています。 AirPods Pro第2世代のイメージ本体にについては、全体の外観はAirPods 3に類似しており、それにアクティブノイズキャンセリングのためのイヤーチップが追加されてような感じになるようです。 AirPods Pro第2世代のイメージ内部チップの面では、新しいApple H1パッケージングシステムは、より高い集積度と更に向上した製

                                                    新型AirPods Pro第2世代は大幅性能向上へ:USB-C・心拍数検出・聴覚補助・音質向上など詳細がリーク - こぼねみ
                                                  • Google DriveとLLMで議事録を自動生成する仕組みを作る

                                                    Google DriveとLLMで議事録を自動生成する仕組みを作る こんにちは。 株式会社エスマットでSREをしているbiosugar0です。 今回は私が社内向けに構築した Google Driveにアップロードされた音声・動画ファイルからLLMを使って自動的に議事録を生成するシステムを紹介します。Python製です。 数ある会議や電話、インタビュー音源を文字起こしし、要点をまとめる作業は非常に手間がかかりがちです。そこで、Google Cloud Run・Google Workflow・Whisper・gpt-4o などを活用して、書き起こしから最終的な議事録ドキュメントを作成するまでを自動化しました。Googleカレンダー情報の連携やSRT形式による動画連携、フォルダ名による処理分岐など、拡張性を持った仕組みを整えているので、そのポイントを順番に紹介していきます。 システム全体概要 全

                                                      Google DriveとLLMで議事録を自動生成する仕組みを作る
                                                    • アップル「子供ができる遊び、とりあえず30個集めたよ!」

                                                      アップル「子供ができる遊び、とりあえず30個集めたよ!」2020.04.10 21:2017,277 中川真知子 ( 中川真知子 ) 今までで一番助かるかもしれないアイディア集、きーーーーたーーーーー! 世界中の悩める保護者のみなさん、こんにちは! 子供の休学、大変ですよね。私もです! 私の息子の学校はオンライン授業してくれないから学業の進みが心配なのに、親も慣れないテレワークとかご飯の用意とか、除菌とか、ペットの世話とか、外出のたびのシャワーと洗濯とかでてんてこまい。十分に子供に時間をとってあげられない罪悪感で押しつぶされそうになりますよね。私は仕事が進まないイライラで「もうあっちいって一人で遊んでよ!!」と言っては、数秒後に「ごめん!!!!!」と謝ってて、自分の心に限界きてるなって思っています。 わかります、子供だってこの状況が辛い。そして何より、親から邪魔者扱いされているようで本当に

                                                        アップル「子供ができる遊び、とりあえず30個集めたよ!」
                                                      • title要素のSEO:サイト名やカテゴリをtitleから削除すると、検索トラフィックは増える? 減る?【衝撃の実験結果】 | Moz - SEOとインバウンドマーケティングの実践情報

                                                        あるいは、title要素に含める情報をむしろ減らすほうがSEOに役立つということはないだろうか?(少なくとも特定の状況では) いくつかの調査から、次のことがわかっている: title要素は一定の長さの方が高い効果を発揮する傾向がある Etsyのエンジニアチームによる今ではよく知られるようになった調査では、短いtitleタグの方が、長いtitleタグより効果があったという。SEO担当者らはその理由として、 title要素は短いほうがより対象を絞って関連性を高められる(コアキーワードに集中するため)クリック率を上げられる可能性があるといったものや、あるいは僕たちには想像できない他の理由があると推測している。 では、titleタグを短くするには、どうするか。文字や単語を削るしかないだろう。 ではtitle要素のどの部分を削って短くするか。間違いなく、削る対象として選ぶのは次のようなものだろう:

                                                          title要素のSEO:サイト名やカテゴリをtitleから削除すると、検索トラフィックは増える? 減る?【衝撃の実験結果】 | Moz - SEOとインバウンドマーケティングの実践情報
                                                        • 音楽に合わせて動くかっこいい映像を簡単に作れるサービスを公開しました

                                                          どんなサービス? デモ動画を見てもらうのが一番わかりやすいと思いますが、「音楽に合わせてウネウネ動く映像」を簡単に作成できます。 作った理由 僕はプログラミング以外に音楽製作もやっていて、SoundCloudなどにアップロードして公開したりしています。 活動していて感じたのが、いまどきは音楽だけで公開しても目立つことができないということです。Web 上のコンテンツはどんどんリッチになっているので、音声だけでは、例えば Twitter のタイムライン上で見過ごされてしまいがちです。 かといって、(僕のように)本気で音楽をやっているわけでもない人が、MV 製作までするのはかなり負担が大きいです。自分で作るにしても依頼するにしても、音楽制作とは全く関係のないスキルとコストが必要です。 一言でいうと、「作った音楽に、あまり労力をかけずに、それっぽい映像をつけてくれるサービスがあったらいいな」と思っ

                                                            音楽に合わせて動くかっこいい映像を簡単に作れるサービスを公開しました
                                                          • GitHub - vercel/virtual-event-starter-kit: Open source demo that Next.js developers can clone, deploy, and fully customize for events.

                                                            This virtual event starter kit was used to run Next.js Conf 2020, which had almost 40,000 live attendees. It includes the following features: Multiple stages - with the ability to add multiple sessions on each stage Each stage can be configured as - An embedded YouTube stream OR A live interactive audio-video experience powered by 100ms Sponsor expo, including individual virtual booths Career Fair

                                                              GitHub - vercel/virtual-event-starter-kit: Open source demo that Next.js developers can clone, deploy, and fully customize for events.
                                                            • 買ってよかったもの2024 - Really Saying Something

                                                              YAPC::Hakodate 2024のために買ったもの [RaoRanDang] ビジネスリュック 超薄型ンチノートPCバック 防水 軽量 多機能耐衝撃PCリュック ビジネス、通勤、出張、就職インタビュー、通学、に適したシンプルなデザイン 男女兼用 (ブラック) RaoRanDangAmazonYAPC::Hakodate 2024にスタッフとして参加した時に、当日の導線や予定のことを考えると「薄くてかさばらないけどPCと財布を肌身離さず持ち歩きたい」というスペックを満たせるリュックがないことに気づいて、慌ててAmazonで買ったバッグ。結果は大正解で、小さいミラーレス一眼カメラも突っ込めるし、意外といろいろなものが入るので、普段使いしています。 [CIE] シー GRID-3 BOTTLE SHOULDER BAG NAVY 軽量 防水素材 日本製 ショルダーバッグ CORDURA コ

                                                                買ってよかったもの2024 - Really Saying Something
                                                              • 音楽サブスクはどのように空間オーディオを提供しているのか – idomizu theatre

                                                                はじめに 最近、特に Amazon Music や Apple Music が空間オーディオを提供するようになってから、Dolby Atmos や 360 Reality Audio などを利用した楽曲が注目されている。 だが、それらはストリーミングサービスというクローズドな環境で提供される上に、Dolby Atmos に関しては Dolby のプロプライエタリなフォーマットを使用している。 そのため、それらのフォーマットで音楽制作する方法や再生する方法については様々なメディアで解説されているが、制作された音源がどのようにエンコードされ、視聴者のもとへ届けられ、そしてデコードされるかの「間」の部分に関しては、あまり知られていない。 この記事では、音楽サブスクを対象に、今まであまり触れられてこなかった空間オーディオの中間部分について解析し、解説していこうと思う。 サンレコのコラムで当記事が紹

                                                                  音楽サブスクはどのように空間オーディオを提供しているのか – idomizu theatre
                                                                • OBS on Azureで高速・堅牢なライブ配信環境を作る | SIOS Tech. Lab

                                                                  ◆ Live配信スケジュール ◆ サイオステクノロジーでは、Microsoft MVPの武井による「わかりみの深いシリーズ」など、定期的なLive配信を行っています。 ⇒ 詳細スケジュールはこちらから ⇒ 見逃してしまった方はYoutubeチャンネルをご覧ください 【4/18開催】VSCode Dev Containersで楽々開発環境構築祭り〜Python/Reactなどなど〜 Visual Studio Codeの拡張機能であるDev Containersを使ってReactとかPythonとかSpring Bootとかの開発環境をラクチンで構築する方法を紹介するイベントです。 https://tech-lab.connpass.com/event/311864/ OBSとは?昨今、テレワークの隆盛により、勉強会などのライブ配信に対する需要は高まるばかりです。オープンソースなライブ配信ソ

                                                                    OBS on Azureで高速・堅牢なライブ配信環境を作る | SIOS Tech. Lab
                                                                  • 「アストロシティミニ」発売目前! Hiro師匠&光吉猛修氏に聞く,FM音源に彩られた1980〜1990年代セガ・サウンドの裏側

                                                                    「アストロシティミニ」発売目前! Hiro師匠&光吉猛修氏に聞く,FM音源に彩られた1980〜1990年代セガ・サウンドの裏側 編集部:早苗月 ハンバーグ食べ男 カメラマン:永山 亘 12→ 2020年12月17日,セガトイズから「アストロシティミニ」が発売される。 本製品は,セガなどから1984〜1994年に発売されたアーケードゲーム36タイトルと,アストロシティのテスト用基板「ドットリクン」を収録したゲーム機だ。本体価格は1万2800円(税別),関連製品の「アストロシティミニ アーケードスティック」が1万2800円,「アストロシティミニ コントロールパッド」が2780円,「アストロシティミニ ゲームセンタースタイルキット」が3980円(各税別)。そのほかセガトイズ.com限定の「ピンクボタン限定バージョン」なども存在するので,詳しい製品形態および関連製品については公式サイトを参照してほ

                                                                      「アストロシティミニ」発売目前! Hiro師匠&光吉猛修氏に聞く,FM音源に彩られた1980〜1990年代セガ・サウンドの裏側
                                                                    • Jam

                                                                      Join this audio room

                                                                        Jam
                                                                      • OpenAI の Realtime API の使い方|npaka

                                                                        以下の記事が面白かったので、簡単にまとめました。 ・Realtime API 1. Realtime API「Realtime API」は、低遅延なマルチモーダル会話エクスペリエンスを構築するためのAPIです。現在、入出力の両方でテキスト・音声がサポートされており、Function Calling を利用することもできます。 特徴は次のとおりです。 ・ネイティブな音声合成 低遅延でニュアンスに富んだ出力が得られる ・自然で操作可能な音声 自然な抑揚を持ち、笑ったり、ささやいたり、トーンの指示に従うことができる ・同時マルチモーダル出力 テキストはモデレーションに役立ち、オーディオにより安定した再生が保証される 2. クイックスタート「Realtime API」は、「WebSocket」を介して通信するステートフルなイベントベースAPIです。 機能を紹介するデモアプリ「openai-real

                                                                          OpenAI の Realtime API の使い方|npaka
                                                                        • Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita

                                                                          こんにちは!逆瀬川 ( @gyakuse ) です! 今日は最近作った議事録文字起こしアプリに話者分離機能をくっつけたものを作っていきたいと思います。 ChatGPT APIの使い方、Whisper APIの使い方、Hugging Face Spacesへのデプロイ方法等を知りたい場合は以下の記事をぜひ! できたもの openai_keyにOpenAIのAPIキーを入れる メイン音声ファイルに会話音声 (wav, 25MB以内) を入れる 話者 (1) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる 話者 (1) の名前を入れる 話者 (2) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる 話者 (2) の名前を入れる 上記を行って送信ボタンを押すと処理が開始されます。なお、参考音声は10秒程度で大丈夫です。実装全体は以下で確認できます。 話者分離 (S

                                                                            Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita
                                                                          • 流行りの『Clubhouse』は「匿名ツイッター民に対する刺客」でしかない理由が恐怖に震える

                                                                            リンク App Store ‎Clubhouse: Drop-in audio chat ‎Hey! We're working hard to add people to Clubhouse as fast as we can, but right now you need an invite to sign up. Anyone can get one by joining the waitlist, or by asking an existing user for one. We really appreciate your patience and can't wait to wel 1 user 9608 ビットコ買う太郎 @bitcoinbuytaro すべての匿名twitter民へ、私からの遺言です。 Clubhouseをtwitterの名前でやりたいなら、メインの電話番号

                                                                              流行りの『Clubhouse』は「匿名ツイッター民に対する刺客」でしかない理由が恐怖に震える
                                                                            • 「100%の再現精度」を目指すスーパーファミコンのエミュレーターが抱える最後の課題とは?

                                                                              by Nicholas Wang 「bsnes」はスーパーファミコン、そして海外版のスーパーファミコンであるSuper Nintendo Entertainment System(SNES)の動作をPC上で再現するエミュレーターです。15年間にわたってbsnesを開発してきたBYUU氏が、エミュレーターを100%の再現度で完成させるために突き当たる「最後の壁」について解説しています。 How SNES emulators got a few pixels from complete perfection | Ars Technica https://arstechnica.com/gaming/2020/04/how-snes-emulators-got-a-few-pixels-from-complete-perfection/ 1990年11月に発売されたスーパーファミコンは2020年

                                                                                「100%の再現精度」を目指すスーパーファミコンのエミュレーターが抱える最後の課題とは?
                                                                              • ChatGPT, Python, Whisper APIを活用し、動画ファイルから議事録を自動生成 - Qiita

                                                                                はじめに 現在のデジタル社会では、Teamsなどのオンライン会議が日常的に行われています。 しかし、その議事録を取るのは容易ではありません。そこで、OpenAIのChatGPTとWhisperを使って、動画ファイルから議事録を自動生成する方法をご紹介します。 補足説明:ChatGPTについて ChatGPTは、OpenAIが開発した自然言語処理AIで、人間と自然に会話することが可能です。GPT-3、GPT-4という大規模な言語モデルをベースにしており、様々な文脈での文章生成が得意です。 補足説明:Whisperについて Whisperは、OpenAIが開発した自動音声認識(ASR)システムです。大量の音声とテキストデータで訓練されており、音声をテキストに変換するタスクを効率的に行います。 処理の流れ ここから、具体的に動画ファイルから議事録を生成するための具体的な手順を説明します。 1.

                                                                                  ChatGPT, Python, Whisper APIを活用し、動画ファイルから議事録を自動生成 - Qiita
                                                                                • WebKit Features in Safari 16.4

                                                                                  Mar 27, 2023 by Patrick Angle, Marcos Caceres, Razvan Caliman, Jon Davis, Brady Eidson, Timothy Hatcher, Ryosuke Niwa, and Jen Simmons ContentsWeb Push on iOS and iPadOSImprovements for Web AppsWeb ComponentsCSSHTMLJavaScript and WebAssemblyWeb APIImages, Video, and AudioWKWebViewDeveloper ToolingWeb InspectorSafari Web ExtensionsSafari Content BlockersNew Restrictions in Lockdown ModeMore Improve

                                                                                    WebKit Features in Safari 16.4