並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 162件

新着順 人気順

audioの検索結果1 - 40 件 / 162件

  • ありきたりなシェアウェア代替オープンソースソフトウェアのリスト

    MS OfficeがどうのこうのAdobeがどうのこうのいやわかる、MS OfficeとかAdobeは業界標準だしファイル互換でインポートとかも楽だ。 ただまぁその万人へ必須か?と言われたら圧倒的にそれが必須じゃない仕事をしている人のほうが多い。 何なら仕事じゃなくて趣味レベルであるならばなおさらMS OfficeとかAdobeとか業界標準ソフトウェアじゃなくても良くなっちゃう。 ということで、ありきたりなシェアウェア代替オープンソースソフトウェアのリストを作ってみた。 Libreofficeド定番中のド定番、オープンソースのオフィススイートだ。 MS Officeじゃなくて良い人はLibreofficeかGoogleのクラウドのヤツを使ってる。 やはり主に使われるのはワープロソフトのWriterと表計算ソフトのCalcとプレゼンテーションソフトのImpressだが、MS Accessの代

      ありきたりなシェアウェア代替オープンソースソフトウェアのリスト
    • まだ手元のパソコンでイベント配信してるんですか?クラウド上でTeamsを利用してOBSで配信した方が楽ですよ。

      配信 まだ手元のパソコンでイベント配信してるんですか?クラウド上でTeamsを利用してOBSで配信した方が楽ですよ。 はじめに まだ手元のパソコンでイベント配信してるんですか?クラウド上でTeamsを利用してOBSで配信した方が楽ですよ。 配信のために高いパソコンや配信機材を買ったり、一人で頑張る必要が無くなります。 また。自宅のネットワーク環境を気にする必要がありません。 これまで手元のパソコンでイベント配信を運用してきて下記のような問題が発生しています。 配信するスタッフの確保問題(ほぼ趣味) 同等の環境を冗長することが難しい そのため当日の交代が出来ない イベント運用側としては頭の痛い問題です。 要は手離れができないです。 これらを解決する方法としてクラウド上のIaaSを利用しスタッフ共同運用を行えば解決できると考えています。 配信している方の一部には、すでにクラウド上から配信を行っ

        まだ手元のパソコンでイベント配信してるんですか?クラウド上でTeamsを利用してOBSで配信した方が楽ですよ。
      • Raspberry Pi 4 で構築する録画マシン | 空気録学電子版【公式】

        🍓 Raspberry Pi 4 が買えるようになりました2019年11月、待望の Raspberry Pi 4 技適取得版が発売されました。H.264 ハードウェアエンコーダを搭載した、リッチなシングルボードコンピュータです。2020年5月28日には 8GB メモリ搭載の上位モデルも登場しています。 はたしてこれは何をするためのデバイスなのでしょうか? そうです、録画ですね。もうテレビの録画をするために高価なパソコンを購入する必要はありません。5000円台から入手できるマシンを利用して、安価に録画サーバーを構築することができるようになったのです。 この記事では Raspbery Pi 4 を利用した Mirakurun + EPGStation での録画サーバー構築方法と、ハードウェアエンコーダを利用した録画ファイルのエンコードについて解説を行います。 筆者の⾃宅で運⽤している録画サー

          Raspberry Pi 4 で構築する録画マシン | 空気録学電子版【公式】
        • ChatGPTのおさらいと、プログラミングに活用するための第一歩 | gihyo.jp

          大量の文章から学習することで、多言語を取り扱う能力だけでなく、高度な推論能力まで手に入れました。 GPT-3.5、とりわけその初期モデルのCodexはGitHubに存在する5400万の公開リポジトリから採取された159GBのPythonコードでGPT-3をfine-tuning(微調整)することで生まれました。ChatGPTがとりわけPythonが得意なのはここから来ています。 ChatGPTの学習データを考えることはその能力を発揮させるときに極めて有効です。質問時も以下のように、『⁠涼宮ハルヒの憂鬱』というライトノベル作品について日本語で聞いたときはSOS団の略称を間違えるなどしますが、英語ではほぼ期待通りの回答を見せます。 図1 『ハルヒの憂鬱』について日本語で聞いた場合の回答 図2 『ハルヒの憂鬱』について英語で聞いた場合の回答 知ったかぶりをするChatGPT ところで、ChatG

            ChatGPTのおさらいと、プログラミングに活用するための第一歩 | gihyo.jp
          • AIにコードまるごと解説してもらうと、界王拳100倍すぎる件|深津 貴之 (fladdict)

            最近、見つけた技。知らない言語でコードかくときChatGPTが神すぎる。 そのテクはなんと「プログラミングまるごとを、ChatGPTに突っ込む」というもの。 え、そんなの動くの!? と思うんですが、動くんですそんなの。直球すぎて盲点だった。 試してみよう たとえば、下記はGoogleサービス使って、リアルタイムにマイク音声を文字起こしするサンプル。 こいつをチャットAIで音声会話をやろうと、軽く読んでみたのですが…うん、よくわからん。 Pythonだし、Streamingだし、音声の操作だし、普段つかわない技術が満載すぎてわからん。 雑にコードを突っ込むと人生が解決こういう時は 以下のコードを、わかりやすく説明して。 <以下、上記コードをそのままコピペ>とすると……  こうなる。 このコードは、Google Cloud Speech-to-Text APIを使用して、マイクからの音声をリア

              AIにコードまるごと解説してもらうと、界王拳100倍すぎる件|深津 貴之 (fladdict)
            • 最近よく見る 1000 円くらいの HDMI キャプチャーカード (MS2109) についてのメモ - polamjaggy

              2023/8/21 追記 もっと良いやつ出てるのでそっちを買いましょう polamjag.hatenablog.jp 以下は 2020/9 時点の内容です 今北産業 HDMI キャプチャーボード的なやつって最低でも 1 万円くらいはするよね、みたいな常識を破壊された。個人的には完全にお値段以上 ある程度制限や難はあるものの、それを受け入れられるなら驚くほど普通に使えてしまっている 音声入力の挙動に難があるのが一番大きそう このあたりの話題。 pc.watch.impress.co.jp note.com 似たようなのを 2 台 AliExpress で買って持っている。似たようなのというだけであって、サウンドハウスのそれや Amazon で売られてる似たような商品に以下の話題が当てはまるとは限らないし、この note のエントリで言及されているデバイスについても然り、という感じです。値段が

                最近よく見る 1000 円くらいの HDMI キャプチャーカード (MS2109) についてのメモ - polamjaggy
              • ゲームエンジンはアートである - 8 年以上自作ゲームエンジンをメンテし続けている話|Hajime Hoshi

                自分は Ebiten という 2D ゲームエンジン (ゲームライブラリ) を趣味で開発しています。使用しているプログラミング言語は Go です。 2013 年 6 月に最初のコミットを行ったので、現在 8 周年の 9 年目です。 Ebiten は「くまのレストラン」などのモバイル及び Nintendo Switch 向けゲームで使われており、一定の実績があります。 ゲームエンジンの開発は一朝一夕では終わりません。Unity や RPG ツクールといった既製品がある中、ゲームエンジンをわざわざ自作することは酔狂かもしれません。ではなぜそのようなことをしたのでしょうか。端的に言うと「ミニマムな API で実用的な 2D ゲームが作れるかどうか」ということを証明したかったのです。自分の美的感覚の追求です。この目的に気づいたのは割と最近のことです。やっていくうちに「自分がやりたかったのはこういうこ

                  ゲームエンジンはアートである - 8 年以上自作ゲームエンジンをメンテし続けている話|Hajime Hoshi
                • VSCodeの拡張機能、なに使ってますか? はてなエンジニア世論調査 #2 - Hatena Developer Blog

                  こんにちは、Webアプリケーションエンジニアのid:hogashiです。 半年ほど前に公開した「開発環境のフォントなに使ってますか?」に続く、はてなエンジニア世論調査の第2回「VSCodeの拡張機能、なに使ってますか?」です。 ソースコードエディタであるVisual Studio Code(以下、VSCode)は多くのエンジニアに利用されています。VSCodeにはソースコードのシンタックスハイライトやデバッグなど、さまざまな拡張機能をインストールして使うことができますが、公開されている拡張機能は膨大にあります。 その中から、はてなのエンジニアはどんな拡張機能をインストールして、日頃の開発に使っているのでしょうか? 前回と同様にアンケート調査してみました。 アンケート方法 アンケート結果から見える人気の機能拡張 6割の拡張機能は1人だけが使用 人によってかなり異なるインストール数 興味深いコ

                    VSCodeの拡張機能、なに使ってますか? はてなエンジニア世論調査 #2 - Hatena Developer Blog
                  • Hello GPT-4o

                    GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, image, and video and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversat

                      Hello GPT-4o
                    • 2020年のフロントエンドマスターになりたければこの9プロジェクトを作れ - Qiita

                      以下はSimon Holdorf( dev.to/ Twitter / GitHub )による記事、9 Projects you can do to become a Frontend Master in 2020の日本語訳です。 9 Projects you can do to become a Frontend Master in 2020 Introduction あなたがプログラミングの初心者であるか、既に経験豊富な開発者であるかにかかわらず、この業界では、急速な変化に追いつくために新しい概念と言語・フレームワークを学び続けることが必要です。 たとえばFacebookが4年前にオープンソース化したReactは、既に世界中のJavaScript開発者にとって第一の選択肢になっています。 もちろんVueとAngularにも多くのフォロアーがついています。 さらにはSvelte、Next

                        2020年のフロントエンドマスターになりたければこの9プロジェクトを作れ - Qiita
                      • コードの健全性: 礼儀正しいレビュー == 役立つレビュー

                        .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

                          コードの健全性: 礼儀正しいレビュー == 役立つレビュー
                        • Cache Storage がめちゃくちゃ肥大化する問題について調べる | ぴんくいろにっき

                          Cache Storageがめちゃくちゃ肥大化する問題 TBSのニュースサイト、TBS NEWS DIGがめちゃくちゃブラウザのストレージを消費しているという話がはてブや増田で話題になっています。 TBSのニュースサイトヤバない? – はてな匿名ダイアリー 同・はてなブックマーク 確かに、手元でも同様の状況を観測できる。 当該サイトのストレージ使用状況 はたして、これは真実なのだろうか。本当に1.4GBも食うことがあるのだろうか…… そんなわけない、ということで調査 まずは再現性を確認するためにChromeのゲストモードで当該のサイトのDevtoolを開いてましょう。すると、StorageのUsageは386MBになっていました。(適当なページを開き、リロードした時点で340MB程度であった) 当該サイトのストレージ割合 上記のスクリーンショットをよく見ていただけるとわかると思いますが、こ

                            Cache Storage がめちゃくちゃ肥大化する問題について調べる | ぴんくいろにっき
                          • 突撃! 在宅の開発環境 2021年夏 - Mobile Factory Tech Blog

                            はじめに こんにちは。ブロックチェーンチームのエンジニア、 @nanamachi です。 tech.mobilefactory.jp 前回の記事ではたくさんの方に閲覧&コメントいただきありがとうございました。この記事から1年。モバイルファクトリーは日本のどこからでも働けるようになり、書籍購入、資格取得、セミナー参加、懇親会の支援制度などフルリモートに適応できるよう多くの変化をしてきました ( https://recruit.mobilefactory.jp/work-style/ )。その中で社員の環境もさまざま変わったことでしょう。 この変化を記事にすれば、閲覧数を稼げる 弊社の魅力を発信できるに違いない!という目論見で、初めてバズった記事にすがるエンジニア組織開発責任者の@kfly8から次のようなチャットが送られてきました。 kfly8: インターネット識者*1の @nanamachi

                              突撃! 在宅の開発環境 2021年夏 - Mobile Factory Tech Blog
                            • 「好きな曲と似た雰囲気の曲」をAIが1億2000万曲の中から見つけ出してくれる「Maroofy」

                              ある楽曲が気に入って「同じような雰囲気の曲をもっと聴きたい!」と思っても、音楽ストリーミングサイトや動画サイトからタイトルやアルバムアートを手がかりにして似た雰囲気の曲を探し出すのは至難の業です。そこでプログラマーのSubhash Ramesh氏が、iTunes Storeにある1億2000万曲から「特定の曲と似た雰囲気の曲」を探し出してくれるAIサービス「Maroofy」を公開しました。 Maroofy https://maroofy.com/ ✨ Introducing Maroofy Search for any song & it'll use the song's audio to find similar-sounding music. ???? Powered by an AI model trained on 120M+ songs, for ???? recommenda

                                「好きな曲と似た雰囲気の曲」をAIが1億2000万曲の中から見つけ出してくれる「Maroofy」
                              • 30分で完全理解するTransformerの世界

                                はじめに 初めまして。ZENKIGENデータサイエンスチームのはまなすです。正式な所属はDeNAデータ本部AI技術開発部なのですが[1]、業務委託という形で今年度から深層学習系の開発等に携わっています。 深層学習界隈では、2017年に衝撃的なタイトル(Attention Is All You Need)の論文が発表されてから早5年半、元出自の機械翻訳タスクを大きく越えて、Transformer関連の技術が様々な領域で用いられる汎用アーキテクチャとして目覚ましく発展し続けています。 今回はそんなTransformerが現時点までにどのように活用されてきたか、また、どのように工夫されてきたかをざっくりと俯瞰し、流れをおさらいする目的の記事になります。本記事の大枠は、2021年時点でのサーベイ論文である A Survey of Transformers に倣いつつ、適宜、2023年2月上旬現在ま

                                  30分で完全理解するTransformerの世界
                                • ワイヤレスイヤホンの価格帯別選び方 - ARTIFACT@はてブロ

                                  今使っているワイヤレスイヤホンのEdifier NeoBuds Proが2021年に出た製品でちょっと古めになったので新しいのが欲しいと思い、情報収集をしていた。入門記事で、あまり触れられていないことがあったのでまとめておきたい。 現在、Amazon新生活セールFINALでセール価格になっている製品が多いので、気になる製品は価格をチェックして欲しい。 LDAC接続は再生時間が短くなる ワイヤレスイヤホンの再生時間は初心者にはわかりにくい。10時間以上の再生をうたうものはバッテリーケースを使っての充電を含めての場合を言っているものがほとんどだ。*1更にイヤホン本体のみの再生時間はノイズキャンセルON/OFFと使うCODECによって変わってくる。 「LDAC接続は高音質」みたいなことはよく書かれるのだが、この再生時間がかなり短くなることについては触れられていないことが多くて罠だ。ハイレゾのCO

                                    ワイヤレスイヤホンの価格帯別選び方 - ARTIFACT@はてブロ
                                  • 声以外が消える!? 無料のノイズ除去「NVIDIA Broadcast」がスゴい【藤本健のDigital Audio Laboratory】

                                      声以外が消える!? 無料のノイズ除去「NVIDIA Broadcast」がスゴい【藤本健のDigital Audio Laboratory】
                                    • CORSの仕様はなぜ複雑なのか

                                      Webアプリケーションを実装していると高確率で CORS の問題にぶつかります。CORSがどのようなものかはリンクしたMDNなど既存の解説を読むのが手っ取り早いと思いますが、「なぜそのように設計されたのか」という観点での説明はあまり見ないため、昔の資料の記述や現在の仕様からの推測をもとに整理してみました。 CORSとは 現代のWebはドメイン名をもとにした オリジン (Origin) という概念 (RFC 6454) をもとに権限管理とアクセス制御を行っています。その基本となるのが以下のルールです。 Same-origin policy (同一生成元ポリシー): 同じオリジンに由来するリソースだけを制御できる。 上記Wikipedia記事によるとSOPの概念は1995年のNetscape 2.02に導入されたのが最初のようです。当時のドキュメンテーションを読む限り、これはウインドウ越しに別

                                        CORSの仕様はなぜ複雑なのか
                                      • AIが架空の女性やセクシーな写真、ストーリーや音声まで作成する「ハイパーポルノ」

                                        非常に高度なレベルで文章を生成できる対話型AIのChatGPTや、画像生成モデルのDALL・Eなどを始めとした画像生成AIの発達により、誰でもクオリティの高い文章やイラスト、画像を作成できるようになりました。これらの生成AIを用いることで、存在しない女性のセクシーな自撮りやセリフの吹き込みがある官能的なストーリーなどを全てAIで作成した「ハイパーポルノ」に注目が集まっています。 Mindy https://thisgirlnextdoordoesnotexist.net/mindy/ 生成AIはジャンルや種類を問わず文章や画像を作成できますが、ChatGPTに用いられている言語モデル「GPT-4」には不適切な質問をブロックするコンテンツフィルターが設定されていたり、画像生成AIの「Stable Diffusion」には成人向け表現を含む画像を黒塗りするセーフティーフィルターがあったりと、コ

                                          AIが架空の女性やセクシーな写真、ストーリーや音声まで作成する「ハイパーポルノ」
                                        • 文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK

                                          会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai」なら、超簡単かつ短時間で高精度な文字起こしを実現できるとのことなので、実際に使ってみました。 writeout.ai – Transcribe and translate any audio file https://writeout.ai/ 上記のリンクからwriteout.aiにアクセスすると、以下のような画面が表示されます。文字起こしを行うには「Transcribes for free」をクリック。 すると、GitHubアカウントでのサインインを求められます

                                            文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK
                                          • 声優・小岩井ことりさんと実験! オンライン会議アプリの音質比較してみた 前編【藤本健のDigital Audio Laboratory】

                                              声優・小岩井ことりさんと実験! オンライン会議アプリの音質比較してみた 前編【藤本健のDigital Audio Laboratory】
                                            • 最近話題になった 音楽生成AI まとめ|npaka

                                              最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や 「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。 現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod

                                                最近話題になった 音楽生成AI まとめ|npaka
                                              • 「スティーブ・ジョブズ1.0」の真実(中編)|NHK取材ノート

                                                やりたいことがあっても、 壁にぶつかり、突き返されてしまう。 そんな悩みを抱えたことは、誰しも、一度や二度ではないと思う。 記者歴30年超の私もしかり。2015年から4年かけて調べていた、スティーブ・ジョブズと「新版画しんはんが」との結びつきについて、アメリカ取材を目指して番組提案をするも、採用されなかった。 しかも、次なる機会をうかがっているうちに、世界はコロナ禍に突入。齢よわい五十六。定年まであと3年半、もう残された時間は多くない。でも、あきらめてたまるもんですか。 前編はこちら アップル初期のメンバーも知らない2020年3月11日、WHO・世界保健機関は世界のコロナ感染症の流行を「パンデミック」と認定。ニュースもコロナ関連一色になりつつあった。アメリカ取材に行ける状況ではなかったが、何もしないわけにはいかなかった。 関係者の連絡先を見つけては、「ジョブズ」と「新版画」との結びつきを問

                                                  「スティーブ・ジョブズ1.0」の真実(中編)|NHK取材ノート
                                                • 無料でPC上でシンセサイザーを構築できるオープンソースのソフトウェアモジュラー「BESPOKE」が登場

                                                  Windows・macOS・Linux上で現実のシンセサイザーのようにモジュールやエフェクターをつないで音を作り出すことができるオープンソースのソフトウェアモジュラー「Bespoke」の正式版となるバージョン1.0.0が、2021年9月14日にリリースされました。 Bespoke Synth https://www.bespokesynth.com/ bespoke 1.0.0: now available! https://t.co/i7P7KaEmAbhttps://t.co/QrCr363jrn— Ryan Challinor (@awwbees) September 14, 2021 Bespokeは190以上のモジュールが使用可能で、MIDIコントローラーもサポートします。Bespoke上でソフトウェアモジュールをつなぎ合わせることで、自分だけのオリジナルシンセサイザーを構築する

                                                    無料でPC上でシンセサイザーを構築できるオープンソースのソフトウェアモジュラー「BESPOKE」が登場
                                                  • AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す【藤本健のDigital Audio Laboratory】

                                                      AIでボーカル・ドラムを取り出す、無料音声分離「Demucs」を試す【藤本健のDigital Audio Laboratory】
                                                    • 俺に骨伝導イヤホンの質問するならこれ読んで - 本しゃぶり

                                                      骨伝導イヤホンを常時着用は便利である。 しかし、勧めるには語るべきことが多い。 だからここに俺の知識をまとめることにした。 これを読めばいい 骨伝導イヤホンの基本 常時着用で運用 骨伝導が向かない状況 外がうるさい 音漏れ禁止 音質にこだわる 痛みがする 選び方とおすすめ Shokz OpenRun Pro Shokz OpenMove Shokz OpenComm 2 何でShokz製品しか紹介しないの?手先なの? 骨伝導以外の選択肢 ブコメで人気なFreeClip 終わりに これを読めばいい 骨伝導イヤホンを使い始めて4年が経とうとしている。使い始めた当時はまだ珍しかったが、今ではかなり普及してきたと思う。実際、弊社でも着けている人をよく見るようになった。とはいえ、普通のワイヤレスイヤホンと比べると、使ったことのある人は少ない。 それゆえか、骨伝導イヤホンがどんなものかと質問されること

                                                        俺に骨伝導イヤホンの質問するならこれ読んで - 本しゃぶり
                                                      • 渋谷区長にモスキート音がつらい旨お手紙を書いたら返事が来た - gecko655のブログ

                                                        モスキート音と私について モスキート音と渋谷について 「区長への手紙」を送る 「区長への手紙」への返事が返ってきた まとめと今後 付録 コメント返し(追記:2022-12-29 22:00) 東京駅地下(KITTE, 丸ビルなど)、東京スカイツリー、池袋ラウンドワン(UNIQLO)、池袋びっくりドンキー、秋葉原UDX、新宿TOHOシネマズ、新宿NEWoMan、名古屋世界の山ちゃん本店、四条烏丸駅、博多駅 etc.... ○○○○に行くたび頭痛 or 耳鳴りが発生していたが原因がわかってよかった ネズミ忌避ならもう少し周波数が高い完全な超音波域でいいはず 高周波によるネズミや虫除けは効果がないって90年代から論文が出ている。アメリカ環境保護庁(EPA)も認めていない。本邦の消費者庁も効果がないと御触れを出している。人間避け。 鳴ってる施設は使わないようにしよう(提案) 測定画面は信用なんない

                                                          渋谷区長にモスキート音がつらい旨お手紙を書いたら返事が来た - gecko655のブログ
                                                        • Google、作曲AI「MusicLM」発表。テキストから高度な音楽を生成 - iPhone Mania

                                                          人工知能(AI)を使って、文章から画像や3Dモデルを生成する技術が注目を集めていますが、Googleがテキストなどの情報から音楽を生成できるAIモデル「MusicLM」を発表しました。GoogleのWebサイトで多数のサンプルが公開されています。 28万時間の音楽を学習 テキストから音楽を生成する技術そのものは以前から存在していますが、Googleの「MusicLM」は、28万時間の音楽を学習させて開発されており、音を複雑に組み合わせた高度な楽曲を生成できるのが特徴です。 ただし、Googleはさまざまリスクを考慮し、MusicLMを一般向けに公開する計画はないそうです。 曲の雰囲気を指示すると作曲、鼻歌もアレンジ MusicLMの生成する楽曲のうち特に印象的なものを、人工知能情報のWebサイトbleedingedge.aiがTwitterに紹介しています。 例えば、「早めのペース、アップ

                                                            Google、作曲AI「MusicLM」発表。テキストから高度な音楽を生成 - iPhone Mania
                                                          • This is The Entire Computer Science Curriculum in 1000 YouTube Videos

                                                            This is The Entire Computer Science Curriculum in 1000 YouTube Videos In this article, we are going to create an entire Computer Science curriculum using only YouTube videos. The Computer Science curriculum is going to cover every skill essential for a Computer Science Engineer that has expertise in Artificial Intelligence and its subfields, like: Machine Learning, Deep Learning, Computer Vision,

                                                              This is The Entire Computer Science Curriculum in 1000 YouTube Videos
                                                            • 時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。|にょす

                                                              みなさん、こんにちは!9月は久しぶりに個人開発をしてました。 今回はGeminiを使って、ちょっと変わった文字起こしアプリを開発したので、その裏側をお話ししていきたいと思います。その名も「無限もじおこし」です! 「無限もじおこし」はその名の通り、時間無制限、無料で使える文字起こしアプリです。普通に考えたら「え?大丈夫なの?」って感じですよね笑 でも、ちゃんと収益的に成り立つ算段を立てています。この記事ではそこらへんの考えや、アプリ開発における技術的な学びについてまとめていきたいと思います! 「無限もじおこし」の紹介主な特徴音声の文字起こしが無制限に可能 (10時間でも100時間でも!)使いやすさにこだわった機能 (コピー、シェア、自動タイトル生成など)「よく使う単語帳」に登録すると、文字起こしの変換精度アップバックアップ機能があるので、機種変更などが発生しても簡単に引き継げます そして、無

                                                                時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。|にょす
                                                              • 「割れ音源」は完全に悪なのか?

                                                                「割れ音源」は完全に悪なのか? 「割る側」かつ「割られる側」のピアノ男が論点を整理する 2023年11月1日 19:00 2772 210 × 2772 この記事に関するナタリー公式アカウントの投稿が、SNS上でシェア / いいねされた数の合計です。 606 2110 56 シェア クラブカルチャーに関してSNSなどでたびたび議論が巻き起こるテーマの1つに、割れ音源をDJやリミックスなどで使うことの是非というものがある。「割れ」とは、違法な方法でダウンロードしたものを示すときに使う言葉で、割れ音源とは海賊版の音源のことだ。 2010年1月、ネット上の違法録音・録画物を違法と知りながらダウンロードする行為が著作権法の改正によって違法となり、その後も本行為に関する法整備が続いている。割れ音源と知っていながらそれを入手することは違法ではあるものの、告訴がなければ起訴されない親告罪であり、文化の発

                                                                  「割れ音源」は完全に悪なのか?
                                                                • UnixPornをお洒落に楽しむ

                                                                  UnixPornとは? 「UnixPorn」というワードを見かけた事はありますか? もし、初耳だという方は「UnixPorn」をgoogleで画像検索してみましょう。 大雑っぱに言えば、「UnixPorn」とは、 PC-UNIXのカスタマイズされたデスクトップスクリーンショットのことや、 そのスクリーンショットが沢山投稿されているredditの板のことを指しています。 r/unixporn Submit screenshots of all your *NIX desktops, themes, and nifty configurations, or submit anything else that will make ricers happy. https://www.reddit.com/ そして、「UnixPorn」は、このちょっといかがわしげなPornという文字と、 ダークでハ

                                                                    UnixPornをお洒落に楽しむ
                                                                  • アニメ スナックバス江

                                                                    合成音声 VOICEVOX:四国めたん VOICEVOX:ずんだもん VOICEVOX:後鬼 https://voicevox.hiroshiba.jp/ 動画編集:ゆっくりムービーメーカー4 https://manjubox.net/ymm4/ 音楽:魔王魂 https://maou.audio/ 効果音:効果音ラボ https://soundeffect-lab.info/

                                                                      アニメ スナックバス江
                                                                    • Bluetooth®オーディオについて|Nintendo Switch サポート情報|任天堂サポート

                                                                      以下に対応しているBluetoothオーディオが使用できます。 プロファイル:A2DP コーデック:SBC ※機種ごとの動作確認は行っておりません。 ※上記以外のプロファイル、コーデックには対応していません。 ※Bluetoothオーディオのマイク入力には対応していません。 ※Bluetoothオーディオの操作ボタンはNintendo Switchでは正常に動作しない場合があります。

                                                                        Bluetooth®オーディオについて|Nintendo Switch サポート情報|任天堂サポート
                                                                      • 突撃!在宅の開発環境 2020年春 - Mobile Factory Tech Blog

                                                                        こんにちは。エンジニア組織開発責任者の id:kfly8 です。 はじめに 最近、COVID-19の影響で、在宅で勤務している方が増えているかと思います。モバイルファクトリーでは2月中旬から原則在宅勤務になり、家の開発環境をこの機に整えている声などを聞きます。 そこで、今回は弊社のメンバーに在宅の開発環境のこだわりなどを聞いてみました*1 尚、この記事はGunosyさんのこの記事にインスパイアされた記事です。 tech.gunosy.io 1人目 1人目は、デザイナーの@momoyagiです。 普段はMBP本体+ディスプレイ2枚で開発していますが、自宅環境はMBP+ディスプレイ+気分転換用にipadになっています。デザイナー職のため、会社支給のwacom ペンタブレットを持ち帰ってます。デバイスが少し多いので配線管理がつらい。 在宅開発環境の良い点 周りがうるさいと集中できないので、一人の

                                                                          突撃!在宅の開発環境 2020年春 - Mobile Factory Tech Blog
                                                                        • Browser Dev Tools: The Ultimate Guide 🔥

                                                                          Contents (Click to expand) ↕️ Design Mode Pretty Print Command Pallet and Super Search Snippets Live Expressions Tracking Changes Console Shorthand Find Unused Code Rendering Panel Network Paint Times Network Timings Inspect Network Requests Performance Identifying Memory Leaks Raw Memory Inspection Test bfcache Full Refresh Lighthouse Page Size Breakdown Record User Flows Advanced User Flow Opera

                                                                            Browser Dev Tools: The Ultimate Guide 🔥
                                                                          • Web会議に外付けマイクってやっぱり必要? 試行錯誤してきた3名による「おすすめマイク座談会」 #ソレドコ - ソレドコ

                                                                            こんにちは。ライターの井口エリです。 リモートワークが進み、オンラインミーティングが当たり前の世の中になっていますよね。筆者はライターという仕事柄、オンラインで取材し、初対面の相手と話すことも多いです。 私自身は今まで「聞こえにくい」と言われたことはないのですが、逆に自分が相手に対して「ちょっと聞き取りづらいかも」と気になったことがあります(相手の声が遠い、ノイズで聞き取れないなど)。もしかして、言われていないだけで自分も「聞こえづらい」と思われているのかも……? そういえば、声が聞き取りやすいと感じた方はみんなきちんとしたマイクを使っていました。外付けマイクがあればこの問題を解決してくれるのでしょうか……! しかしいざマイクを買おう! と調べてみても、素人にはなかなか難しい。初めて聞く用語ばかりでメゲてしまいそう……マイク選びって何を基準にどう選んだらいいの?? こんなときは、先人たちの

                                                                              Web会議に外付けマイクってやっぱり必要? 試行錯誤してきた3名による「おすすめマイク座談会」 #ソレドコ - ソレドコ
                                                                            • 「Amazonでさえサーバレスやマイクロサービスを理解できない」とDHH氏が主張する一方で、「進化可能なアーキテクチャこそ重要」とAmazonのVogels博士

                                                                              Ruby on Railsの作者として知られるDavid Heinemeier Hansson(DHH)氏が自身のブログに5月4日付けで投稿した記事「Even Amazon can't make sense of serverless or microservices」(Amazonでさえサーバレスやマイクロサービスを理解できない)が話題になっています。 これはAmazon Prime Videoの技術部門が3月に自社ブログに投稿した記事「Scaling up the Prime Video audio/video monitoring service and reducing costs by 90%」(Prime Videoの音声映像監視サービスにおけるスケールアップと90%のコスト削減の実現)で紹介された、AWS Lambdaのサーバレスで作られたPrime Videoの監視サービス

                                                                                「Amazonでさえサーバレスやマイクロサービスを理解できない」とDHH氏が主張する一方で、「進化可能なアーキテクチャこそ重要」とAmazonのVogels博士
                                                                              • HDMI入力をRaspberry Piで駆使する

                                                                                昨今の衰えることのない技術トレンドに追従すべく、映像配信とかやりたいなーと思っていた2019年。 めっきり時間がなく何もできず、気付けば2020年になっていました。 今年も時間がないだろうなぁと思っていたところ、連日の在宅勤務のおかげで通勤時間がゼロになり、余暇が生まれたので色々やってみることにしました。 お題はHDMI入力で遊ぶ、です。 目次 Open 目次 ビデオ転送プロトコル UVC (USB Video Class) MIPI CSI-2 (MIPI Camera Serial Interface 2) HDMI入力 キャプチャーボード HDMI to MIPI CSI-2 H2C-RPI-B01 HDMI映像入力をみてみる raspivid Gstreamer HDMI映像配信してみる RTMP WebRTC まとめ 参考リンク ビデオ転送プロトコル 早速ですがHDMIから一旦離

                                                                                  HDMI入力をRaspberry Piで駆使する
                                                                                • Spotifyが無料で音声ファイルからMIDIへ変換できるAI搭載ツール「Basic Pitch」を公開

                                                                                  Spotifyが無料で使えるオープンソースのAI搭載ツール「Basic Pitch」を公開しています。 Basic Pitchは、SpotifyのAudio Intelligence LabとSpotify傘下のSoundtrapが共同で開発したオーディオをMIDIに変換してくれるツール。ユーザーが楽器や声といったオーディオファイルをBasic Pitchのサイト上にアップロードすると、そのオーディオファイルをAIに搭載された機械学習モデルが分析。MIDIファイルとして書き出してくれます。 例えば、ユーザーがギターのメロディーフレーズの音源をBasic Pitchにアップロードすると、Basic Pitchは、その音源を分析し、アップロードされたギターのメロディーフレーズをMIDIに変換。ユーザーはそのMIDIファイルを自由にDAWに取り込み、シンセなど別の音源に割り当てて再生することがで

                                                                                    Spotifyが無料で音声ファイルからMIDIへ変換できるAI搭載ツール「Basic Pitch」を公開