並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 5881件

新着順 人気順

Audioの検索結果321 - 360 件 / 5881件

  • OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog

    地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 【IIJ 2022 TECHアドベントカレンダー 12/8(木)の記事です】 Whisperの追加学習に挑む2022年の冬 2022年アドベントカレンダー企画だそうです。 いかがお過ごしでしょうか。 私はもう興味を引くものに没頭するしか楽しみがないもんで、PCに向かってぼんやり面白いネタはないかなーと探す日々です。 最近はすっかりディープラーニングにズブズブで、とうとう数式かくのが面倒なあまり手書き入力のためのペンタブレットを買いました。てへ。 今回は9月から10月にかけてStabl

      OpenAI Whisper に追加学習をさせる試み | IIJ Engineers Blog
    • 『THE FINALS』AIボイス採用の「収録が速い」との理由に現役声優が反論、議論に発展。人の表現力とAIの利便性のバランス - AUTOMATON

      ネクソン傘下のEmbark Studiosが手がけるチーム対戦FPS『THE FINALS』では、ゲーム内のボイスにAI技術を使用していることが公表されている。現在実施中のオープンベータテストを通じては、その声を実際に聴くことができるようになった。これを機に、本作でのAIボイス採用の背景に注目が集まり、現役声優も反応している。海外メディアPC Gamerが報じている。 『THE FINALS』は、基本プレイ無料で提供予定のチーム対戦FPSだ。プレイヤーは、バーチャル世界のアリーナで繰り広げられる戦闘ゲームショーの出場者となり、3人チームを組んでさまざまなゲームモードでの対戦を楽しめる。マップとなるアリーナには、実在のロケーションをモチーフにした環境も用意され、建物を丸ごと吹っ飛ばすなどできる本格的な環境破壊要素が特徴のひとつとなる。 ゲームモードには、4チームでコインを奪い合うコインダッシ

        『THE FINALS』AIボイス採用の「収録が速い」との理由に現役声優が反論、議論に発展。人の表現力とAIの利便性のバランス - AUTOMATON
      • Twilioを利用した障害時の自動連絡網システムについて - BASEプロダクトチームブログ

        この記事はBASE Advent Calendar 2020の5日目の記事です。 SRE Groupのngswです。 Eコマースプラットフォーム「BASE」における障害発生時に、社内関係者に連絡網に基づいて電話発信するシステムを構築しました。 このエントリでは、その導入までの経緯と具体的な当該システムの説明をします。 TL;DR 「BASE」で問題が発生した際に意思決定者に電話発信する周知システムを構築した 「導入前に考えたこと」をまず主題として書いた 参考URL記事のまま手順であるが、それでも導入時に詰まった事柄など落ち穂拾い的に追記した 謝辞 Twilio FunctionsとStudioを使って連続架電を行う - Qiita 大変わかりやすい記事であり、ほぼすべてを参考にさせていただいた。このQiita記事がなければ短期間で実現することは不可能であったと考える 導入に至る経緯 07月

          Twilioを利用した障害時の自動連絡網システムについて - BASEプロダクトチームブログ
        • 学習方略とは? 効率的な英語学習に必要なメタ認知・自律学習とは? - ポリグロットライフ | 言語まなび∞ラボ

          はじめに 今回は学習方略について考えていきます。学習方略とはその名の通り、学習効果を高める活動を指しますが、果たしたどのような方略、あるいは効果があるのでしょうか。英語学習の成功には学習方略を効果的に活用する必要があります。その鍵を握っているのが、メタ認知と自律学習です。そのほかにもやる気の正体や動機づけについても考え、最後に学習方略に基づく英語学習方法にも考えていきます。 www.sunafuki.com www.sunafuki.com www.sunafuki.com www.sunafuki.com www.sunafuki.com www.sunafuki.com 主な参考文献 「英語学習のメカニズム」 「英語の学び方入門」 「英単語学習の科学」 「英語教師のための学習ストラテジーハンドブック」 「やさしい発達と学習」 「勉強法の科学」 学習方略とは 学習方略の定義 学習方略の必

            学習方略とは? 効率的な英語学習に必要なメタ認知・自律学習とは? - ポリグロットライフ | 言語まなび∞ラボ
          • 約3年ぶりメインPC新調。スリムなAMDマシン「MINISFORUM」を導入した【藤本健のDigital Audio Laboratory】

              約3年ぶりメインPC新調。スリムなAMDマシン「MINISFORUM」を導入した【藤本健のDigital Audio Laboratory】
            • Amazon Linux 2023がGAされました | DevelopersIO

              抜粋 : Release cadence - Amazon Linux 2023 メジャーリリースとマイナーリリースの内容は以下AWS公式ドキュメントに記載されています。メジャーリリース時には互換性があるか十分に検証した上でアップデートしましょう。 Major version release— Includes new features and improvements in security and performance across the stack. The improvements might include major changes to the kernel, toolchain, Glib C, OpenSSL, and any other system libraries and utilities. Major releases of Amazon Linux ar

                Amazon Linux 2023がGAされました | DevelopersIO
              • Microsoft公式、WindowsでLinux GUIアプリを実行する「WSLg」をレビュー

                レポート Microsoft公式、WindowsでLinux GUIアプリを実行する「WSLg」をレビュー Windows 10でLinux GUIアプリケーション対応、プレビュー版登場 現在のWindows 10にはLinuxバイナリを実行する機能が搭載されており、Microsoft StoreからLinuxディストリビューションをインストールして使用できる。これを支えている技術がWSL (Windows Subsystem for Linux)だ。WSL 1とWSL 2という、異なる仕組みの実装系が存在しているが、今後はWSL 2のみが使われていくという認識でいればよいと思う。 Linuxがそのまま利用できるのは便利だが、これまでWSLはGUIアプリケーションをサポートしてこなかった。実行するための環境を自分でセットアップすれば、GUIアプリケーションを動作させることも可能だったが、正

                  Microsoft公式、WindowsでLinux GUIアプリを実行する「WSLg」をレビュー
                • ClubhouseをUXデザイナーが分析してみる|Katsuki Noda

                  こんにちは!のだかつきです。今日は、サービスの分析記事です。今大流行しているClubhouseを分析してみました! Clubhouseとは、ありそうでなかったコミュニティサービスClubhouseは、公式の定義によると Clubhouse is a new type of social network based on voice—where people around the world come together to talk, listen and learn from each other in real-time. Clubhouseは、音声中心のあたらしい形のSNSです。Clubhouseでは、世界中の人が集い、リアルタイムで「話し」「聴き」「学び合う」プラットフォームです。(やや意訳)とのことです。Clubhouseは、ドロップインオーディオチャット(drop-in aud

                    ClubhouseをUXデザイナーが分析してみる|Katsuki Noda
                  • ウェブのプライバシー強化: サードパーティ Cookie 廃止への道

                    .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                      ウェブのプライバシー強化: サードパーティ Cookie 廃止への道
                    • 「もし無人島にひとつだけ持ってくなら」の元ネタ探求をしましょうね い..

                      「もし無人島にひとつだけ持ってくなら」の元ネタ探求をしましょうね いくつかバリエーションがある 「無人島に[ジャンル無制限]をn個だけ持っていくなら?」 「無人島に[本]をn個だけ持っていくなら?」 「無人島に[レコード]をn個だけ持っていくなら?」 ……のような [本]の場合に「聖書」という回答が西洋でメジャーなことから、元ネタは日本以外なのだろうとあたりをつける 調査の初手はとりあえずこれ Desert Island Discs - Wikipedia Desert Island Discs is a radio programme broadcast on BBC Radio 4. It was first broadcast on the BBC Forces Programme on 29 January 1942.[1] Each week a guest, called a

                        「もし無人島にひとつだけ持ってくなら」の元ネタ探求をしましょうね い..
                      • パターンプラクティスとは?英語学習への効果・正しいやり方を丁寧に解説 瞬間英作文との違いとは!? - ポリグロットライフ | 言語まなび∞ラボ

                        はじめに 今回はパターンプラクティスについて考えていきます。パターンプラクティスとはどのようなトレーニングなのでしょうか。英語学習への効果や正しいやり方を丁寧に解説していきます。瞬間英作文との違いも整理しています。パターンプラクティスを正しく理解して、ぜひ実践してみてください。 ↓こちらでトレーニングができます www.youtube.com パターンプラクティスとは パターンプラクティスの歴史 オーラルメソッドの普及 アーミーメソッドの展開 オーディオリンガルメソッドの開発 よくある勘違い 文型学習(文法学習)を無視する 置換・転換・拡張トレーニングをしないで満足する パターンプラクティスだけで話せるようになる パターンプラクティスの目的 パターンプラクティスの効果・メリット 運用可能な文法知識の獲得 簡単な小説を訳を介せずにスラスラ読める 「話すための瞬間英作文」でパターンプラクティス

                          パターンプラクティスとは?英語学習への効果・正しいやり方を丁寧に解説 瞬間英作文との違いとは!? - ポリグロットライフ | 言語まなび∞ラボ
                        • ノーコードで自分専用ダッシュボードを作成&公開できる「Widget Board」を使ってみた! - paiza times

                          どうも、まさとらん(@0310lan)です! 今回は、誰でもお手軽に自分専用のダッシュボードを作成できるWebサービスをご紹介します! さまざまな機能をブロック化したウィジェットを画面にペタペタと配置していくだけで、タスク管理・情報収集・旅行計画・エンタメ…など、多彩な用途に活用できるボードを作成できるのが大きな特徴です。 自由にデザイン可能なダッシュボードにご興味ある方は、ぜひ参考にしてみてください! 【 Widget Board 】 ■ダッシュボードの作成例 「Widget Board」の詳しい使い方を解説する前に、まずはどのようなダッシュボードが作れるのかサンプル例をいくつか見てみましょう。 以下はToDoやカレンダーなどのウィジェットを組み合わせて、自分だけのタスク管理ボードを作成した例です。 他にも、時計・検索ボックス・テキストエディタなどのウィジェットも提供されているので、組み

                            ノーコードで自分専用ダッシュボードを作成&公開できる「Widget Board」を使ってみた! - paiza times
                          • What's New In DevTools (Chrome 94)  |  Blog  |  Chrome for Developers

                            Use DevTools in your preferred language Chrome DevTools now supports more than 80 languages, allowing you to work in your preferred language! Open Settings, then select your preferred language under the Preferences > Language dropdown and reload DevTools. Preferences" width="800" height="494"> Chromium issue: 1163928 New Nest Hub devices in the Device list You can now simulate the dimensions of Ne

                            • dmca/2020/10/2020-10-23-RIAA.md at master · github/dmca

                              October 23, 2020 GitHub Dear Sir or Madam: I am contacting you on behalf of the Recording Industry Association of America, Inc. (RIAA) and its member record companies. The RIAA is a trade association whose member companies create, manufacture or distribute sound recordings representing approximately eighty-five (85) percent of all legitimate recorded music consumption in the United States. Under p

                                dmca/2020/10/2020-10-23-RIAA.md at master · github/dmca
                              • 音楽用低遅延リモートコミュニケーションサービス - レイテンシー撲滅委員会|Takumin

                                このプロダクトを考えるにあたって、まず一番の敵を知らなければならない。戦う理由は何で、なぜそれが生じていて、どうやってそれを解決するのか。 プロダクト構想はこれ レイテンシーとの闘い「レイテンシー」= latency (遅延)とは、使われる場所によって意味が異なることもありますが、このプロダクトの開発で解決しようとしているレイテンシーとは、 インターネット経由で二人の演奏者がアンサンブルしようとしたときに、片方の演奏者が出した音がもう片方の演奏者に届くまでの時間と考えてください。 たとえば演奏者が隣にいるとこれはゼロ(厳密にはゼロじゃないけど、でもまあ感じない)。で、これがホールとかになると場合によっては数10ミリ(ミリは1,000分の1)秒となることもありますが、プロの演奏者は慣れてるのでなんとか合わせられる。 なぜホールだと数10ミリ秒かかるとかというと...音は1秒に340メートル(

                                  音楽用低遅延リモートコミュニケーションサービス - レイテンシー撲滅委員会|Takumin
                                • ”地球最後”はガチ。「OVO」を継ぐ最終フルデジタルUSBスピーカーの秘密【藤本健のDigital Audio Laboratory】

                                    ”地球最後”はガチ。「OVO」を継ぐ最終フルデジタルUSBスピーカーの秘密【藤本健のDigital Audio Laboratory】
                                  • 単体機では世界初! 爆音でも絶対音割れしない夢の32bit floatオーディオインターフェイス、UAC-232をZOOMが発売開始|DTMステーション

                                    昨年6月、ZOOMが32bit float対応のオーディオインターフェイス、UAC-232とUAC-432を発表し、大きな話題になりましたが、そのうちの2in2outのUAC-232が、ついに発売となりました。これは32bit floatに対応する単体のオーディオインターフェイスとしては世界初となる製品で、どんな爆音を入れても絶対にクリップしないという画期的な機材。まさにレコーディングにおける大革命ともいえるもので、従来のレコーディングの常識を根底から覆すもの。それだけに、10万円近くするのでは……と思っていたら、実売価格が税込み24,000円と、ちょっと拍子抜けしてしまうような価格で驚きました。 この価格設定だと、世間に誤解を与えるのでは……とちょっと心配になったほどですが、実際に試してみたところ期待通りの超強力なオーディオインターフェイスでした。サンプリングレート的にも44.1kHz~

                                      単体機では世界初! 爆音でも絶対音割れしない夢の32bit floatオーディオインターフェイス、UAC-232をZOOMが発売開始|DTMステーション
                                    • Amazon Connectでお問い合わせ内容をWhisper APIで文字起こしし、ChatGPTで要約して音声出力してみた(一次対応の無人化) | DevelopersIO

                                      Amazon Connectでお問い合わせ内容をWhisper APIで文字起こしし、ChatGPTで要約して音声出力してみた(一次対応の無人化) はじめに Amazon Connectを使用して、お問い合わせ内容をOpenAIのWhisper APIで文字起こしとChatGPTで要約し、通話中に音声出力する方法をまとめました。 Connectで無人対応の場合、顧客からの発話を聞き取る方法としては、チャットボットサービスであるAmazon Lexもしくは、Kinesis Video Stream(KVS)で音声のストリーミングなどがあります。 Amazon Lexを利用する場合は、1度に15秒以上は聞き取ることができない点や文字起こしにはAmazon Transcribeを利用する制約があります。 今回は、文字起こしにWhisper APIを利用し、ChatGPTで要約した内容をConne

                                        Amazon Connectでお問い合わせ内容をWhisper APIで文字起こしし、ChatGPTで要約して音声出力してみた(一次対応の無人化) | DevelopersIO
                                      • 自作 Markdown プロセッサベースの blog.jxck.io v2 リリース | blog.jxck.io

                                        Intro 本サイトは自作の Markdown ビルダを使っていたが、色々と気に食わない部分があったのでフルスクラッチで作り直し、それにともなってサイトの刷新を実施した。 必要だった要件や、意思決定を作業ログとして記す。 Markdown 本サイトは、一般に使われている Markdown -> HTML の変換結果では要件を満たせないため、最も都合の良い AST を吐く Kramdown のパーサから AST だけを取得し、それを Traverser でカスタマイズしてから自前でシリアライズしていた。 その実装を、微修正を繰り返しながら、継ぎ足し継ぎ足しで 5 年くらいイジってきたので、そろそろ自分がブログを書く上での要件も固まっており、記事中の Markdown のスタイルも固定してきた。 一方、 Kramdown の実装が原因でどうしてもワークアラウンドが必要だった部分に、フラストレー

                                          自作 Markdown プロセッサベースの blog.jxck.io v2 リリース | blog.jxck.io
                                        • MP3より高音質! YouTube/Discord採用の「Opus」コーデックを試した【藤本健のDigital Audio Laboratory】

                                            MP3より高音質! YouTube/Discord採用の「Opus」コーデックを試した【藤本健のDigital Audio Laboratory】
                                          • レベル調整不要!? ZOOM「F6」の32bit Float録音が革命的なワケ【藤本健のDigital Audio Laboratory】

                                              レベル調整不要!? ZOOM「F6」の32bit Float録音が革命的なワケ【藤本健のDigital Audio Laboratory】
                                            • レコードプレスに新風!? 高音質に挑む“最先端カッティング”とは【藤本健のDigital Audio Laboratory】

                                                レコードプレスに新風!? 高音質に挑む“最先端カッティング”とは【藤本健のDigital Audio Laboratory】
                                              • 透かしなし!完全無料で動画編集できるWebサービス「Kapwing」を使ってみた! - paiza times

                                                どうも、まさとらん(@0310lan)です! 今回は、ブラウザ上から誰でも手軽に動画編集ができる無料のWebサービスをご紹介します! 類似のサービスはいくつかありますが、すべての機能を完全無料で利用可能で「透かし」*1も入らない珍しいサービスなのが大きな特徴です。プロモーション動画やSNS・YouTube向けの動画なども手軽に作成できます。 動画編集にご興味ある方は、ぜひ参考にしてみてください! 【 Kapwing 】 ■「Kapwing」の使い方 それでは、まず最初に「Kapwing」をどのように使うのか詳しく見ていきましょう。 トップページにアクセスしたら青いボタンをクリックしてください。 試しに使うだけなら面倒なログインなどは不要で、すぐに編集用のエディタが表示されます。 「Kapwing」で動画編集をする方法として、以下の4パターンが提供されています。 それぞれの内容は以下のとおり

                                                  透かしなし!完全無料で動画編集できるWebサービス「Kapwing」を使ってみた! - paiza times
                                                • Chrome におけるスキームフル Same-Site の適用について

                                                  .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                    Chrome におけるスキームフル Same-Site の適用について
                                                  • A DX7 USB Dongle

                                                    The amazing Rene Stange added USB Gadget (i.e. device) support to the Circle bare metal Raspberry Pi environment a while ago so I’ve now incorporated that into MiniDexed. This allows MiniDexed to be used as a USB device – i.e. it can just be plugged into a PC and used via USB MIDI directly, as long as your Raspberry Pi supports USB Gadget mode and you have some means of audio output. This post loo

                                                      A DX7 USB Dongle
                                                    • 生成AI入門:議事録を答えるチャットAI(RAGアプリ)を作ってみよう【プログラミング不要】

                                                      生成AI入門:議事録を答えるチャットAI(RAGアプリ)を作ってみよう【プログラミング不要】:AI・データサイエンス超入門 生成系AIの導入が急速に広がる今、その有用性や活用法が気になる方へ。一例としてプログラミング不要で、“会議の議事録を基に質問に答えてくれる「独自のチャットAI」”の作成を試みます。社会人の目線で、実践的な生成系AIの雰囲気をつかみましょう! 連載目次 現在、企業への生成系AI*1の導入が急速に拡大しています。2023年10月23日に日本マイクロソフトが記者向けに発表した内容によれば、日本国内でAzure OpenAI Service(Microsoftが提供するクラウドAIサービス)を活用している企業は560社以上、全世界では1万1000社を突破しています。このような状況から、「うちの会社も生成系AIを導入すべきか?」「生成系AIが何の役に立つのか?」と気になっている

                                                        生成AI入門:議事録を答えるチャットAI(RAGアプリ)を作ってみよう【プログラミング不要】
                                                      • 超ハイコストパフォーマンスなMIDIキーボード&ソフトシンセのセット、Arturia MiniLab 3は全部込々で18,150円!?|DTMステーション

                                                        フランスのArturia(アートリア)が先日発売したMiniLab 3(ミニラボ3)は、ちょっと驚愕するほどのコストパフォーマンスを持った製品でした。実売価格が税込みで18,150円前後というこのMiniLab 3は25ミニ鍵のUSB-MIDIキーボードとAnalog Lab Introというソフトシンセ、さらにAbleton Live 11 Lite、さらにはNative Instrumentsのアップライトピアノ音源であるThe Gentleman、UVIのグランドピアノ音源であるMODEL D、キーボード&パッド学習ソフトであるMelodics、そしてサンプル&ドラムループ集であるLoopCloudをセットにした製品です。 キーボードには8つのノブと4つのフェーダー、8つのパッドなどが搭載されており、各種DAWと連携してコントローラとしても利用可能。圧巻なのはAnalog Lab I

                                                          超ハイコストパフォーマンスなMIDIキーボード&ソフトシンセのセット、Arturia MiniLab 3は全部込々で18,150円!?|DTMステーション
                                                        • PhobosLab

                                                          Introducing QOI — the Quite OK Image Format. It losslessly compresses RGB and RGBA images to a similar size of PNG, while offering a 20x-50x speedup in compression and 3x-4x speedup in decompression. All single-threaded, no SIMD. It's also stupidly simple. tl;dr: 300 lines of C, single header, source on github, benchmark results here. I want to preface this article by saying that I have no idea wh

                                                          • クラブミュージックの低音実務|Naco

                                                            こんにちは、Nacoです。 「ベースどうやってんの?」というふわっとした質問をされることがよくあります。というわけで、僕が気をつけていることで思いつく内容をまとめてみようと思います。制作の一助になれば幸いです。 僕は自分のレーベルで自分の音楽をよくリリースしています。知的好奇心を揺さぶる脳みそが喜ぶタイプのベースミュージックを作ってます。 https://85acid.bandcamp.com/ ○前提条件○ ・クラブでの利用を前提としたサウンドクリエイター向け ・DAW利用者 ・デジタルリリース想定 ・全て個人的な意見ーーーーー 低音を主軸に制作を進める低音は最初から気を遣ってあげないと、迷子になるケースがよくあります。そのため、低音を主軸に制作していく方法がシンプルで良いです。 空間(LとRの2ch)に詰められる音の量は決まっているため、まず低音をきれいに整える方法はとても効果的です。

                                                              クラブミュージックの低音実務|Naco
                                                            • GitHub - suno-ai/bark: 🔊 Text-Prompted Generative Audio Model

                                                              You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                GitHub - suno-ai/bark: 🔊 Text-Prompted Generative Audio Model
                                                              • 「鍵穴に鍵を挿した時の音」から合鍵を作られる危険があると研究者が警告

                                                                正規の鍵を持たない第三者がロックされた鍵を開ける方法としては、特殊な器具を用いて行われるピッキングなどがあるほか、写真に写った鍵の形から3Dプリンターで合鍵を作ることも可能です。新たに、シンガポール国立大学の研究チームが、「鍵穴に鍵を挿した時の音」から合鍵を作ることが可能であると報告しました。 Listen to Your Key : Towards Acoustics-based Physical Key Inference https://dl.acm.org/doi/abs/10.1145/3376897.3377853 Researchers Can Duplicate Keys from the Sounds They Make in Locks https://kottke.org/20/08/researchers-can-duplicate-keys-from-the-so

                                                                  「鍵穴に鍵を挿した時の音」から合鍵を作られる危険があると研究者が警告
                                                                • MediaPipe と TensorFlow.js を使ってブラウザで顔と手をトラッキングする

                                                                  .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                                    MediaPipe と TensorFlow.js を使ってブラウザで顔と手をトラッキングする
                                                                  • 音楽の立体音響=高音質化と呼んで良いの?

                                                                    音楽の立体音響=高音質化と呼んで良いの?2021.07.26 21:0031,409 ヤマダユウス型 「食べ慣れた味」と「珍しい味」が、似て非なるように。 2021年6月、Appleが空間オーディオ機能をリリースし、ソニーは今年はじめ頃に360 Reality Audioのライセンス提供を開始しました。近頃のオーディオ界隈では、空間や立体、3Dといったワードがトレンドになっています。 本当にやたらと聞くようになったこれらの言葉。字面の通り音楽が立体的に聞こえるという技術ですが、言葉だけではピンと来ないですよね。でも、聞いてみると「今までの聞こえ方と明らかに違う!」とわかるほどに、違いはあるんです。音が面ではなく、奥行きや上下、前後感を持って感じられるといいますか。 …でもこの立体音響ってヤツ、果たして音質に寄与するものなのか? いつも聞いてる音楽が立体音響になることで、高音質になったと表現

                                                                      音楽の立体音響=高音質化と呼んで良いの?
                                                                    • 遂に発売、世界初“ゲイン調整不要”なUSBオーディオ「UAC-232」を試す【藤本健のDigital Audio Laboratory】

                                                                        遂に発売、世界初“ゲイン調整不要”なUSBオーディオ「UAC-232」を試す【藤本健のDigital Audio Laboratory】
                                                                      • 各種WebAPIの簡単な使い方と、組み合わせで実現する新たな体験・可能性を考える

                                                                        2020年2月1日、「PWA Night CONFERENCE 2020」が開催されました。Web体験を進化させる、新しいWeb開発コンセプト「PWA」をテーマに、Web開発に携わるエンジニアたちが集まった本イベント。プレゼンテーション「Webでできる体験を考える会」に登壇したLINE株式会社の折原レオナルド賢氏は、既存のWebAPIを用いてできることや実現できるユーザー体験について、自身の経験や今回の発表に際して行った検証結果を用いて紹介しました。講演資料はこちら Webでできる体験を考える 折原レオナルド賢氏:それでは「Webでできる体験を考える会」ということで始めたいと思います。去年の今頃、こんな記事を書かせていただきました。 もしかしたらこれによって今回呼んでもらったのかなと思いますので、この話の内容も含めていろいろ「Web APIってどういうもの?」という発表をしていきたいと

                                                                          各種WebAPIの簡単な使い方と、組み合わせで実現する新たな体験・可能性を考える
                                                                        • 【レビュー】 普通の机×Polk Audio「ES10」でデスクトップオーディオ始めたら凄かった

                                                                            【レビュー】 普通の机×Polk Audio「ES10」でデスクトップオーディオ始めたら凄かった
                                                                          • PyTorch vs TensorFlow in 2023

                                                                            Should you use PyTorch vs TensorFlow in 2023? This guide walks through the major pros and cons of PyTorch vs TensorFlow, and how you can pick the right framework. PyTorch and TensorFlow are far and away the two most popular Deep Learning frameworks today. The debate over which framework is superior is a longstanding point of contentious debate, with each camp having its share of fervent supporters

                                                                              PyTorch vs TensorFlow in 2023
                                                                            • 録音した音声を一発でプロっぽく仕上げてくれる「Enhance Speech from Adobe」を使ってみたレビュー

                                                                              Adobeが、AIを使った音声編集ウェブサービス「Adobe Podcast」を公開し、Podcast編集用ツール「Enhance Speech from Adobe」のデモを公開しています。Enhance Speech from Adobeを使えば、録音した音声が簡単にプロっぽく仕上がるとのことで、実際に使ってみました。 Enhance Speech from Adobe | Free AI filter for cleaning up spoken audio https://podcast.adobe.com/enhance このAdobe Podcastは2021年12月にProject Shestaという名前で開発が進められており、「語るべきストーリーを持つ人々のためのオーディオツール」と表現されています。 そして、AdobeがAdobe Podcastに含まれるツールとして「E

                                                                                録音した音声を一発でプロっぽく仕上げてくれる「Enhance Speech from Adobe」を使ってみたレビュー
                                                                              • Chrome に、邪魔にならない通知許可 UI を導入します

                                                                                .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                                                                                  Chrome に、邪魔にならない通知許可 UI を導入します
                                                                                • オンラインカンファレンス向け事前収録システムを作った #iosdc

                                                                                  9/19〜9/21にiOSDC Japan 2020を主催しました。今年の開催は初のオンライン開催で、レギュラートーク(20分・40分)はすべて事前収録とし、当日は編集済の動画を配信する方法を採りました。 このエントリではiOSDC Japan 2020のために構築した事前収録システムについてその構成やハマりどころを解説します。 TL;DR 2017年から開発・メンテナンスしているカンファレンス運営支援システムの fortee に収録 & 編集機能を実装しました。1 いくつかのサービスのAPIやWebhookを使って以下の様なことをしています。 収録予約 スタッフは fortee に「レコーディングスロット」を作る 2 3スピーカーは fortee で都合の良い時間のレコーディングスロットを予約する (①) 収録開始 レコーディングスロットの開始時刻になったら、fortee はZoomにミ

                                                                                    オンラインカンファレンス向け事前収録システムを作った #iosdc