並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 632件

新着順 人気順

FFMPEGの検索結果201 - 240 件 / 632件

  • 今週のはてなブックマーク数ランキング(2023年9月第1週) - はてなブックマーク開発ブログ

    はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク数ランキング」。8月28日(月)〜9月3日(日)〔2023年9月第1週〕のトップ30です*1。 順位 タイトル 1位 新人にパワハラしていた先輩を通報した結果 2位 中年会社員が部署異動してつらかった話 - やしお 3位 白Tシャツの黄ばみ どう落とす? 目からウロコの方法に「す、すごい」「やってみる!」 – grape [グレイプ] 4位 「NAT」「NAT越え」「NATタイプ」ってなーに? 5位 ロシアの謎の音楽「メイドコア」 | 仁義なき音楽巡り 6位 何も考えない楽しい映画を教えて【追記】 7位 追燈 / 追燈 - 岡田索雲 | webアクション 8位 「助けてくれ」とはっきり言う人しか、助けないほうがいい。 | Books&Apps 9位 2分以内に寝つける!米軍が採用した究極の睡眠法「漸進的筋弛緩法」

      今週のはてなブックマーク数ランキング(2023年9月第1週) - はてなブックマーク開発ブログ
    • FFmpeg をカスタムレイヤーとして Lambda 上で動かしてみた | DevelopersIO

      こんにちは、大前です。 AWS Media Blog に最近投稿された以下ブログにある、FFmpeg を Lambda レイヤーとして使用する方法が気になったので、実際にやってみました。 Processing user-generated content using AWS Lambda and FFmpeg Lambda レイヤーってなんぞ?って方は下記ブログを参照ください。 Lambda Layerの基本的な仕組みを確認する #reinvent 動画を扱うワークフローで必要となる機能は、マネージドサービスとして AWS Elemental MediaLive や AWS Elemental MediaConvert 等が提供されています。 一方で、上記では実現できない要件がある場合などは FFmpeg の使用が必要となってくるケースも考えられます。 FFmpeg を Lambda で動

        FFmpeg をカスタムレイヤーとして Lambda 上で動かしてみた | DevelopersIO
      • Chrome拡張機能をmanifest v3で開発した簡易記録とハマりポイントの解消方法 - 雑多に技術メモと他色々

        Chromeの拡張機能(プラグイン)を自作で作ってみたので、色々書く。 やってみたこと やった結果 動かせたの? 開発した時の環境 ハマりポイントと解消方法の一覧 そもそも拡張機能を作るために必要な構成や作るべきファイルがわからない 開発成果物のそれぞれの役割がよくわからない 自作したChrome拡張機能の取り込み方法がわからない ツールを修正した時の取り込み方法がよくわからない service_workerが動作しない原因がわからず、デバッグもできない content_scriptsに指定したcssの参照先画像(URL)にアクセスできない 拡張機能アイコンクリック時の動作が定義しても動かない service_workerで外部jsが使えない 自作した拡張機能用HTMLでonclick属性が動作しない Local Storageから読み込んだ情報が想定外にObjectになった Javasc

          Chrome拡張機能をmanifest v3で開発した簡易記録とハマりポイントの解消方法 - 雑多に技術メモと他色々
        • .mov を gif に変換【Mac】 - Qiita

          # ffmpeg -i Input.mov -r FrameRate OutputFilename.gif ffmpeg -i 画面収録_299U-08-09_1.93.N.mov -r 24 gamen_test1.gif

            .mov を gif に変換【Mac】 - Qiita
          • やっぱりWasm は C++!!!~Wasm/EmscriptenでOpenCVを使う~

            はじめに質問 Wasm は何で書く?Go? Rust? AssembyScript? やっぱりWasm は C++!!!~Wasm/EmscriptenでOpenCVを使う~ ※現状での個人の見解です。 ということで、Emscripten で OpenCV を扱うことについて記事です。 この記事の元ネタはWebAssembly Night #10の発表内容です。 そしてOpenCV Advent Calendar 2020 の 9 日目でもあります。 画像処理 on your Browserの時代 Wasm といえば最近はすっかり Go や Rust で書くことが盛り上がっていますが、まだまだ C++/Emscripten も活躍しどころがあります。ブラウザでのクライアント画像処理が代表的なものでしょう。 WebRTCインフラの充実 時雨堂 WebRTC SFU Sora/NTT Com.

              やっぱりWasm は C++!!!~Wasm/EmscriptenでOpenCVを使う~
            • 画像生成AI「Stable Diffusion」をローカル環境で実行する - パソコン関連もろもろ

              公開日:2022年8月23日 最終更新日:2023年1月16日 はじめに 環境構築 実行方法 学習済みパラメーター「sd-v1-4.ckpt」のダウンロード リポジトリのクローン 「sd-v1-4.ckpt」の移動 いよいよ実行 結果 つづき 動作確認できたその他の環境 CUDA 11.3.1 1 2 CUDA 11.6.2 1 2 VRAM不足に直面したら 更新履歴(2022年10月11日) バージョン2.1 はじめに最近「DALL-E2」や「Midjourney」など文章から画像を生成するAIが流行っています。 その一つが今回紹介する「Stable Diffusion」です。 「Stable Diffusion」の特徴はオープンソースで公開されていることであり、ローカル環境で実行可能です。 もちろんWeb上で簡単に試すことも可能で、こちらにデモンストレーションが公開されています。 hu

                画像生成AI「Stable Diffusion」をローカル環境で実行する - パソコン関連もろもろ
              • OBSで超高画質録画するための、シンプルなポイント。じつは数字をいじるだけ

                OBS Studio(以下OBS)でゲームを録画したさい、「なんだか映像が荒い、モザイクのようだ」と感じたことはないでしょうか。 しかし、対処法は簡単です。高画質録画できるように設定を少し変更してやればよいのです。 ポイントだけ見ていきましょう。細かい話や難しい話はありません。 録画用の記事です。ライブ配信の場合は、「OBS Studioで高画質な配信をする方法」をご覧ください。 最初にこの設定にしよう まず、前提となる設定を行います。「設定」ボタンをクリックしてください。 そして、以下のように設定します。 「出力」タブを開く 「出力モード」を「詳細」にする。 その下にある「録画」タブを開く。 「種別」を「標準」にする。 「出力モード」は「基本」でもよいのですが、今回は「詳細」で統一しました。「基本」は「詳細」よりも設定が省かれており、設定の表示名も異なります。 また、「種別」は「カスタム

                  OBSで超高画質録画するための、シンプルなポイント。じつは数字をいじるだけ
                • GitHub - yuanqing/vdx: :film_strip: An intuitive CLI for processing video, powered by FFmpeg

                  You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                    GitHub - yuanqing/vdx: :film_strip: An intuitive CLI for processing video, powered by FFmpeg
                  • OBSを使ってProResキャプチャする(追記あり)

                    タイトル通り。 OBSを使ってProResフォーマットでリアルタイムキャプチャするというもの。Windows専用。 ちなみに、ProResはAppleが作ったフォーマットだけれど、ここに書いてある方法はAppleの承認がないのでご留意ください。 理由はProResが使えるから。 ProResはファイルサイズが大きいんですが、動画の品質は良く、デコードが軽くて編集しやすい。 編集側の精神的ストレスが軽くて楽なんですよね。 これを扱い始めてH.264での編集なんて考えられなくなった。 その後、いろんな理由があってWindowsを使うようになったのだけれど、WindowsでProResの情報があまりない・・・。 PremiereやEDIUSもProResの書き出し(エクスポート)には対応したけれど、キャプチャには対応していない様子・・・。 OBSでも標準でカスタム出力(FFmpeg)があるけど、

                      OBSを使ってProResキャプチャする(追記あり)
                    • youtube-dlの代わりにyt-dlpをインストールする|Toru's Terminal

                      最近youtube-dlのダウンロードスピードが遅い。youtube-dl側が意図的にスピードを遅くしているらしい(理由は不明)。youtube-dlの代わりになるyt-dlpをダウンロードする。 ここではpythonとffmpegのインストール方法は省略して説明します。もしこれらのソフトウェアがインストールできていない方はこちらのサイトこれらダウンロードしてから進んでください。 pythonのインストール方法はこちらffmpegのインストール方法はこちら

                        youtube-dlの代わりにyt-dlpをインストールする|Toru's Terminal
                      • ffmpegでNVENCを使ってエンコードしてみる

                        NVIDIAのGPUのビデオエンコーダNVENCを使ってエンコードをしてみます。CPUを使ったエンコーダに比べ大変高速です。 Windowsを前提に記事を書きますが、ffmpegのオプションの説明になるのでMacやLinuxでも使えます。 NVENCは直に動かすことができません。ビデオ編集ソフトやビデオエンコードソフトにNVENCが組み込まれているものを使います。 ここではffmpegを使って動かします。 ffmpegはコマンドプロンプトで動かします。Window画面はありませんので取っつき難いと思っている方がほとんどでしょう。エンコードには設定するパラメータがたくさんありWindows画面にすべて表示していられません。また、エンコードでは一度設定を決めてしまうと設定を毎回変える必要は無いのでWindow画面とか必要なくなってしまうのです。コマンドプロンプトで動かすのが一番スッキリした方法

                          ffmpegでNVENCを使ってエンコードしてみる
                        • M1 MacBookでの開発環境構築 - Qiita

                          Apple Siliconのネイティブ環境を構築メモ。 QEMUの記述が増えてきたので別ページに移動(2019/01/09) PyTorchが1.9.0でそのままインストールできるようになった(2021/06/17更新) SciPyが1.7.3でまたちゃんとインストールできるようになってた(2021/12/06更新) tensorflow-macos 2.7.0 のインストールについて追記(2021/12/07更新) tensorflow-macos 2.8.0 に合わせて記述を変更(2022/02/15更新) Homebrew周り gcc や OpenBLAS,go や Rust などほとんどがARM対応になっていて,/opt/homebrew をベースディレクトリにしている場合は bottle(バイナリ)がインストールされるようになっている(2021/01/02追記) Homebrew

                            M1 MacBookでの開発環境構築 - Qiita
                          • 推しVtuberのアーカイブを全部保存したい人へ - youtube-dlの使い方【2021年12月12日更新】|亀

                            忙しい人向け【2021年12月12日更新版】yt-dlp.exe,ffmpeg.exe,AtomicParsley.exe を同じフォルダに入れる 以下のコマンドを記述したバッチファイルを作る @echo off set /p url=MovieURL: yt-dlp "%url%" --write-thumbnail --embed-thumbnail --add-metadata --write-sub --socket-timeout 30 --download-archive "finished.txt" --ignore-errors -f "bestvideo[ext=mp4]+bestaudio[ext=m4a]/best[ext=mp4]/best" --output "%%(upload_date)s-%%(title)s.%%(ext)s" --retries 3 pa

                              推しVtuberのアーカイブを全部保存したい人へ - youtube-dlの使い方【2021年12月12日更新】|亀
                            • NVENCを使ったHWEncode環境 (Ubuntu版) - Qiita

                              これは さくらインターネットAdvent Calendar 2018 15日目の記事です。(公開遅くなりました) こんにちは、さくらインターネットのやまけんです さくらのアドベントカレンダーなのにあまりにも関係性が低いような内容ですが、さくらの高火力GPUサーバ環境でも試せる内容なので、今回は記事にさせていただきました。 GPUサーバというと、機械学習などのイメージが大きいですが、本来のグラフィック演算ユニットとしての使い方としてハードウェアエンコードのプラットフォームとして、使ってみようというのが今回のテーマです。 ちょうどH.265も再生環境が整ってきたかと思いますので、MPEG2やH.264からのエンコードを高速に並列処理できる環境として、GPUサーバを利用します。 このテーマに向いている人 ・多量のMPEG2やH.264動画を所有していて、H.265に変換したい人 (画質にそこまで

                                NVENCを使ったHWEncode環境 (Ubuntu版) - Qiita
                              • Spotify の Klio でメディア用データ パイプラインを簡単に作成 | Google Cloud 公式ブログ

                                ※この投稿は米国時間 2020 年 12 月 3 日に、Google Cloud blog に投稿されたものの抄訳です。 音楽ストリーミング サービスの Spotify は連日、オーディオ ファイルをさまざまな方法で処理しています。たとえば、曲のリズムやテンポの判別、ビートへのタイムスタンプ追加、音量の測定といった基本的な処理から、言語の検出や、ボーカルと楽器演奏の分離といった高度な処理まで、その方法は 100 種類以上に及ぶこともあります。こうした処理によって得られた情報は、新機能の開発のほか、再生リストやおすすめの拡充、純粋なリサーチなど、さまざまな目的に利用されます。 こうした処理を 1 つのオーディオ ファイルに対して行うだけでも一仕事ですが、Spotify の音楽ライブラリは 6000 万曲以上におよび、1 日 4 万曲のペースで増え続けています。それに加えて、ポッドキャストのカ

                                  Spotify の Klio でメディア用データ パイプラインを簡単に作成 | Google Cloud 公式ブログ
                                • Homebrew で使われていない formula を削除する :: by and for engineers

                                  May 9, 2020 Homebrew でインストールした formula で使っていない不要なものを調査した。 ほかの formula に依存していない formula を一覧化するbrew uses にかけると、何にも依存していないパッケージ (formula) を特定することができる。 brew list | xargs -I{} sh -c 'brew uses --installed {} | wc -l | xargs printf "%20s is used by %2d formulae.\n" {}' xargs の並列実行バージョン(おすすめ)実行に時間がかかるので、 xargs -P3 など適宜並列プロセス数を指定すると良い。特にこだわりがなければ expr $(sysctl -n hw.ncpu) - 1 で、CPUコア数から割り当てられるだけ指定する。 brew

                                    Homebrew で使われていない formula を削除する :: by and for engineers
                                  • WHIP/WebRTC配信や最新のmacOSでも利用可能な仮想カメラ、オーディオキャプチャ機能をサポートした「OBS Studio v30.0」がリリース。

                                    WHIP/WebRTC配信や最新のmacOSでも利用可能な仮想カメラ、アプリ別のオーディオキャプチャ機能をサポートした「OBS Studio v30.0」がリリースされています。詳細は以下から。 Open Broadcaster Software Projectは現地時間2023年11月11日、今年08月よりBeta版を公開し開発を続けてきたライブ配信アプリOSB Studioの最新メジャーアップデートとなる「OBS Studio v30.0」を正式にリリースしたと発表しています。 Note: As previously announced, this release removes support for Ubuntu 20.04, Qt 5, and FFmpeg versions prior to 4.4. リリースノートより OBS Studio v30.0では既に発表されていたと

                                      WHIP/WebRTC配信や最新のmacOSでも利用可能な仮想カメラ、オーディオキャプチャ機能をサポートした「OBS Studio v30.0」がリリース。
                                    • [レビュー]TDP 65W版「Ryzen 7000」の実力を検証。用途によって評価が分かれるCPUだ

                                      TDP 65W版のRyzen 7000シリーズの実力を検証。用途によって評価が分かれるCPUだ AMD Ryzen 9 7900 Ryzen 7 7700,Ryzen 5 7600 Text by 米田 聡 TDP(Thermal Design Power,熱設計消費電力)を65Wに抑えることで,発熱や消費電力を下げて扱いやすくしたデスクトップPC向けCPU「Ryzen 9 7900」「Ryzen 7 7700」「Ryzen 5 7600」が,1月13日11:00に発売となる。税込のメーカー想定売価は以下のとおり。 Ryzen 9 7900:6万9800円 Ryzen 7 7700:5万3800円 Ryzen 7 7600:3万7500円 本稿では,既存製品や競合製品との比較を中心に,TDP 65W版のRyzen 7000シリーズのゲーム性能をチェックしたい。 Ryzen 9 7900 メ

                                        [レビュー]TDP 65W版「Ryzen 7000」の実力を検証。用途によって評価が分かれるCPUだ
                                      • 【初心者】FFmpegのダウンロードとインストール手順~Windows/Mac/Linux

                                        FFmpegとは 概要 FFmpegは、音声ファイルや動画ファイルに関して変換/記録/再生など機能を提供します。例えば、「エンコード」や「トランスコード」、「トリミング」、「ストリーム」などの機能を備えています。 動作環境 FFmpegは「Windows」、「Mac OS X」、「Linux」、「BSD」「Solaris」などのOSに対応しています。今回は、「Windows」、「Mac OS X」、「Linux」でFFmpegをダウンロード&インストールする手順を説明します。 因みに、FFmpegは、コマンドラインツールとして利用します。 FFmpegツール 実は、FFmpegが動画の変換ツール群です。FFmepgをインストールすると、ffmpegやffplay、ffprobeもインストールされます。 「ffmpeg」は、音声・動画形式を変換するコマンドラインツールです。 「ffplay」

                                          【初心者】FFmpegのダウンロードとインストール手順~Windows/Mac/Linux
                                        • Ubuntu Core 24の一般提供開始、Ubuntu 23.10のEOL | gihyo.jp

                                          Ubuntu Weekly Topics Ubuntu Core 24の一般提供開始⁠⁠、Ubuntu 23.10のEOL Ubuntu Core 24の一般提供開始 「通常の」Ubuntu 24.04 LTSに続いて、Ubuntu Core 24がリリースされました(リリースについてのblog記事の日本語版)[1]。Ubuntu Coreは、Ubuntu(と、その中でも特にSnap)を中心にした、IoTやロボティクス、エッジデバイスや組み込みなどの環境に向けたOTA機能を備えた「開発からデプロイまでを同じ環境で行える」OSです。 「開発からデプロイまで同じ環境」というのは、開発環境としてUbuntu Desktopを、そしてターゲットデバイスにUbuntu Coreを利用することで、ワークステーションと組み込みデバイスで同じアプリケーションを走らせることができるという意味で、Ubuntu

                                            Ubuntu Core 24の一般提供開始、Ubuntu 23.10のEOL | gihyo.jp
                                          • batonnの文字起こし速度を高速化した - LIVESENSE ENGINEER BLOG

                                            これは Livesense Advent Calendar 2022 DAY 16 の記事です。 はじめに 私達のチームはbatonnというサービスを開発しています。 このサービスではWeb上で面接を録画したあと話者ごとに文字起こしをして面接を可視化できるように整形しています。 今回は文字起こしの高速化について行ったことを書きます。 はじめに 文字起こしの大雑把な手順 実装にあたっての話 実際のサービスで動かすときに考えないといけないこと batonnでの話 高速化を考える trackが持っている情報について Twilioのaudio trackを扱うときの注意点 最終的にどうなったか 文字起こしの大雑把な手順 文字起こしを実現するために提供されているサービスはいくつか存在しています。 有名どころではGPC、Azure、AWSが提供するAPIなどがありますがbatonnではこれらのAPIを

                                              batonnの文字起こし速度を高速化した - LIVESENSE ENGINEER BLOG
                                            • WebCodecs の VideoDecoder を使用して H.264 の動画を再生してみた - aptpod Tech Blog

                                              はじめに こんにちは。Visual M2M Data Visualizer Team の白金です。 弊社の製品の intdashでは、H.264形式の動画データを収集/計測できます。計測した動画データは、Fragmented MP4 のフォーマットを使用したライブ動画をストリーミング再生したり、計測した動画を後から確認するためにHLSのフォーマットで再生する機能があります。 今回は、ライブ動画の再生機能を改善するための施策として 先日 Google Chrome の Version 94 でリリースされた WebCodecs の機能に含まれる VideoDecoder を使用して、H.264 のライブ動画をストリーミングで再生を試してみたのでご紹介します。 はじめに WebCodecs とは VideoDecoder を使用することで解決したい課題 課題 1: 欠損時の各動画フレームのタイ

                                                WebCodecs の VideoDecoder を使用して H.264 の動画を再生してみた - aptpod Tech Blog
                                              • python_modules.pdf

                                                Python3 OpenCV / Pillow / pygame / Eel / PyDub / NumPy / matplotlib / SciPy / SymPy / hashlib, passlib / Cython / Numba / ctypes / PyInstaller / JupyterLab / json / urllib / zenhan / jaconv Copyright © 2017-2022, Katsunori Nakamura 2022 3 25 Python ‘ .py’ Python Python Windows PSF Python py .py Enter macOS Linux PSF Python python3 .py Enter Anaconda Prompt Python python .py Enter Python Python Pyt

                                                • GitHub - jianfch/stable-ts: Transcription, forced alignment, and audio indexing with OpenAI's Whisper

                                                  Transcribe audio using Whisper. This is a modified version of :func:`whisper.transcribe.transcribe` with slightly different decoding logic while allowing additional preprocessing and postprocessing. The preprocessing performed on the audio includes: voice isolation / noise removal and low/high-pass filter. The postprocessing performed on the transcription result includes: adjusting timestamps with

                                                    GitHub - jianfch/stable-ts: Transcription, forced alignment, and audio indexing with OpenAI's Whisper
                                                  • ピアノの耳コピはもうAIに任せられる。チート級解析フリーソフトByteDance「Piano Transcription」使い方解説 | ロゴスとレンマのI/O

                                                    はじめに対象読者・想定読者 楽譜が欲しいピアノ曲があるが、楽譜が売ってない(CDなどの音源はある) 楽曲解析したいピアノ曲があるが、1から耳コピはしんどい ソルフェージュ練習でピアノ曲を耳コピしたので答え合わせがしたい この記事でわかること Piano Transcriptionとはどんなソフトなのか、何ができるのか Piano Transcriptionの使い方 基本と応用 使い方を把握するには英語とプログラミングの知識が必要になるソフトです。 しかし安心してください。 この記事では日本語とキャプチャを用いてわかりやすく使い方を解説します。 2023年3月21日現在、Piano Transcription内の音声処理モジュールがアップデートされた影響でプログラムが初期状態では正しく機能しないことが判明しております。 臨時の対応ですが、現在はコードを一文補ってやることで正常に動作します。

                                                      ピアノの耳コピはもうAIに任せられる。チート級解析フリーソフトByteDance「Piano Transcription」使い方解説 | ロゴスとレンマのI/O
                                                    • Raspberry Pi 4 で MPEG-2 TS の動画を H.264 へハードウェアエンコードする際の負荷をみる - kumak1’s blog

                                                      前回の記事で録画サーバを構築、MPEG-2 TS で保存できるようになった。 kumak1.hatenablog.com ということで今回は、Raspberry Pi 4 のエンコードの実力をみていく。 エンコード動作時 ffmpeg -i src.m2ts -vcodec h264_omx desc.mp4 上記コマンドで雑に mp4 へ変換してみる。オプションで -vcodec h264_omx を指定しハードウェアエンコーディングすることで、CPU利用率 140% (4core なので max 400%)で速度は 1.47x を叩き出しているし、熱もファンを動かしているので 53°C と余裕だ。-b:v 8000k オプションでビットレートを指定することで、画質を変更できる。 これは私がメインで利用している MacBook Pro (15-inch, 2016) の CPU エンコー

                                                        Raspberry Pi 4 で MPEG-2 TS の動画を H.264 へハードウェアエンコードする際の負荷をみる - kumak1’s blog
                                                      • OBS Studio に関するメモ - すたいるのOBS情報メモブログ

                                                        OBS Studioに関するメモを書いてる記事 ※「OBS Studioに関する個人的メモ」を移転しました。(現在は閲覧不可) 記事投稿日 2021年10月6日、最終投稿更新日 2024年08月21日 02時10分頃 文字数が凄く多いのでブラウザの検索機能をお使いください。 記事が見にくくて申し訳ありません。 (将来的に内容を細かく分けて記事にしたいと思っています。) ブラウザ検索ショートカット Windows : Ctrl + F macOS : Command + F この記事は下記環境を使用して作成しています。 ※Linux、特定のデバイスが無いと表示されないソースのことはメモしていません。 ★Windowsの場合 OBS Studio 30.2.3 (それ以下のバージョン、開発版も含まれます) OS : Windows 11 Pro 64bit (23H2) CPU : Core

                                                          OBS Studio に関するメモ - すたいるのOBS情報メモブログ
                                                        • AIボーカル除去・抽出ソフト 「Ultimate Vocal Remover」の使い方と最良設定について - YTPMV.info

                                                          2023/01/13 追記 最新版ではこの記事で紹介しているものに加えいくつかの昨日が追加されています。使用の上でこの記事の内容で問題ありませんが、後日アプデ要素について追記します 要旨 機械学習を用いたボーカル除去ソフト「Ultimate Vocal Remover」導入方法・使用方法を解説した上で、いくつかの学習モデルを用い複数条件でボーカル抽出を行い、ボーカル抽出に適したモデル・設定を追求した。その結果、VR Architectureメソッドの3_HP-vocalUVR.pthと、MDX-netメソッドのUVR-MDX-NET Mainモデルでのボーカル抽出が精度が高いという結論になった。両者でのモデルで抽出した後にManual Ensembleで合成するとより良い抽出となるかもしれない。 設定については、結論の項目のスクショを参考のこと。 また、楽曲でのボーカル抽出とは別に、BGM

                                                            AIボーカル除去・抽出ソフト 「Ultimate Vocal Remover」の使い方と最良設定について - YTPMV.info
                                                          • FFmpeg:雑多な形式の音楽ファイルをmp3かm4aに一括変換するコマンド

                                                            前置き さまざまな音楽配信サービスのファイルやネットで配布された音楽ファイルなどを保存していくと PC 内にいろんな形式のファイルが乱雑に転がってしまっている状態になると思います。PC でこれらのファイルの再生するときは VLC などの高機能な万能プレイヤーを使えばファイル形式について気にする必要はありません。 しかしスマートフォンや音楽プレイヤーに移すと再生できないファイルも出てきてしまいます。こうしたときにファイルを一括して特定の圧縮形式にエンコードしてしまいたいのではないでしようか。 本記事はFFmpeg を用いて一発で大量の音声ファイルを変換するコマンドをご紹介いたします。 大本命は超高圧縮率でライセンスの心配がいらないオープンソースな音声圧縮形式「Opus」なのですが、いかんせん普及が全然進んでいません。対応してるプレイヤーがほとんどないのです。YouTube の音声データによく

                                                              FFmpeg:雑多な形式の音楽ファイルをmp3かm4aに一括変換するコマンド
                                                            • Raspberry Pi 4で地デジ4チャンネル同時録画するには

                                                              録画・視聴したい番組が重なった場合。予約を削除したり何だり調整が面倒ですし、まあどうせなら両方視聴・録画できたほうが便利ということで。通常のチューナと比較して価格は高いですが、見たいと思った番組はほぼ全て視聴・録画できるメリットは大きいかと思います。 機材の接続 これらの機材を接続すると、このような感じになります。 コンセントは2つ使用しますが、チューナのコンセントをUSBに変換できれば、使用するコンセントは1つで済む感じもします。このあたりは、あとで実験しようと思います。 B-CASカードは、白い面、電極がある面を上にして刺します。 USB端子は、HDD、B-CASカード、チューナで3つ消費します。 マウスとキーボードを接続しようとすると、端子が足りませんが・・・USB端子1つで、マウスとキーボードを同時に接続したい場合、こちらの記事を御覧ください。 Raspberry Pi 4にUSB

                                                                Raspberry Pi 4で地デジ4チャンネル同時録画するには
                                                              • Unityからパブリッシャーアカウントを削除された開発者が「UnityによるLGPLの摘発はユーザーからの報告頼みでランダム」と批判

                                                                by Jillian Northrup Unity Technologiesが開発するゲームエンジン「Unity」では、「アセット」と呼ばれる、ゲーム制作に使用できる数多くのツールが提供されています。2019年からUnityにおいて「VLC for Unity」というアセットの配布を行っていた開発者のマーティン・フィンケル氏が、Unityのパブリッシャーアカウントを削除された経緯と、Unityに対する批判を自身のブログで公開しています。 Unity’s Open-Source Double Standard: the ban of VLC - mfkl https://mfkl.github.io/2024/01/10/unity-double-oss-standards.html フィンケル氏は、2019年12月からUnity上でVLCメディアプレーヤーを動作させるアセット「VLC fo

                                                                  Unityからパブリッシャーアカウントを削除された開発者が「UnityによるLGPLの摘発はユーザーからの報告頼みでランダム」と批判
                                                                • Introducing the new Wasmer JS SDK · Blog · Wasmer

                                                                  Back to articlesIntroducing the new Wasmer JS SDKToday we are incredibly excited to present `@wasmer/sdk`, a new library that allows running WASI(X) applications easily on the browser Dive into a world where running any WASI and WASIX package in your browser is a breeze. Whether it's Python, Bash, FFmpeg, or any package published in the registry, Wasmer Javascript SDK makes it all seamlessly possi

                                                                    Introducing the new Wasmer JS SDK · Blog · Wasmer
                                                                  • 趣味のプログラムはブロックを組み立てるかのような楽しみ - koudenpaのブログ

                                                                    この記事ははてなエンジニア Advent Calendar 2020の9日目です。 昨日は id:kouki_dan さんの iOSのネイティブアプリでWebRTCを使ったビデオチャットを実装する - Lento con forza でした。 『〜〜ははてな〜〜』って文章読みづらいですね。 さて、はてなエンジニア Advent CalendarはWeb系のITエンジニアが書いていることもあって、IT技術に関した記事が多い。 自分も『最近作ったボットでこんな要素技術を使った』のようなことをかっこいい構成図とともに示そう! と考えていたのだけれど、そのボットには飽きてしまったのでそんな飽きっぽい自分の趣味でのプログラムの楽しみ方について書きたいと思う。 去年も似たような方向で技術じゃ無い記事を書いてる(大規模IT技術系イベントの歩き方 - koudenpaのブログ)。何かしらのIT技術を掘り下

                                                                      趣味のプログラムはブロックを組み立てるかのような楽しみ - koudenpaのブログ
                                                                    • ffmpeg-pythonで動画編集する - Qiita

                                                                      ffmpeg-pythonはffmpegをpythonから使えるようにするパッケージです github https://github.com/kkroening/ffmpeg-python API-reference https://kkroening.github.io/ffmpeg-python/ 使用例 https://github.com/kkroening/ffmpeg-python/tree/master/examples 1. インストール ffmpeg-pythonはsubprocessでCLIからffmpegを実行するwrapperのみのパッケージなので、別途本体をダウンロードしてきてPATHを通しておく必要があります。 1-1. ffmpegをインストールする 公式サイトからインストーラーをダウンロードしてきて入れます https://ffmpeg.org/downlo

                                                                        ffmpeg-pythonで動画編集する - Qiita
                                                                      • mold と呼ばれる高速なリンカを利用して Chromium を Build してみる - Nao Minami's Blog

                                                                        はじめに 現在、広く使われているリンカの中でもっとも高速なものとして有名なのは LLVM project の LLD でしょう。LLD のパフォーマンスについては、公式 document に以下のような benchmark が掲載されていて、GNU ld, GNU gold などと比較して圧倒的に早いという結果が示されています。 Program Output size GNU ld GNU gold w/o threads GNU gold w/threads lld w/o threads lld w/threads ffmpeg dbg 92 MiB 1.72s 1.16s 1.01s 0.60s 0.35s mysqld dbg 154 MiB 8.50s 2.96s 2.68s 1.06s 0.68s clang dbg 1.67 GiB 104.03s 34.18s 23.49s

                                                                          mold と呼ばれる高速なリンカを利用して Chromium を Build してみる - Nao Minami's Blog
                                                                        • GitHub - cshum/imagor: Fast, secure image processing server and Go library, using libvips

                                                                          imagor is a fast, secure image processing server and Go library. imagor uses one of the most efficient image processing library libvips. It is typically 4-8x faster than using the quickest ImageMagick and GraphicsMagick settings. imagor implements libvips streaming that facilitates parallel processing pipelines, achieving high network throughput. imagor features a ton of image processing use cases

                                                                            GitHub - cshum/imagor: Fast, secure image processing server and Go library, using libvips
                                                                          • FPGAベースのAIアクセラレータを開発するための新たな開発環境を発表

                                                                            Xilinxは、統合ソフトウェアプラットフォーム「Vitis」を発表した。標準ライブラリを豊富に備え、既存のツールやフレームワークを使用できるため、ソフトウェア開発者はアルゴリズム開発に専念でき、ハードウェア開発者は生産性を向上できる。 Xilinx(ザイリンクス)は2019年10月1日、統合ソフトウェアプラットフォーム「Vitis(バイティス)」を発表した。同年11月にリリースの予定で、Xilinxボード向けに無償で提供する。 Vitisは、Xilinx FPGA、SoC、Versal ACAPで組み込みソフトウェアやアクセラレーションアプリケーションを開発するための総合環境。標準ライブラリを豊富に備え、ソフトウェア開発者は普段利用しているツールから最適化されたオープンソースライブラリにアクセスできる。ハードウェア開発者は、パッケージ化されたハードウェアモジュールを用いることで、生産性を

                                                                              FPGAベースのAIアクセラレータを開発するための新たな開発環境を発表
                                                                            • ChinachuをやめてCentOSにEPGStationを導入した話 – 水珈琲の日誌

                                                                              ※この記事は前のブログで2018年10月18日に投稿されたものです。最新の情報ではない可能性があります こんにちは。水珈琲です。 突然ですが、この度Chinachuをやめました! 結構前から再生画面を開くとエラーが出るようになってしまい、実害がなかったので放置していたんですが気持ち悪いので思い切ってEPGStationに乗り換えました。 概要 EPGStationはChinachuのプロジェクトの一部であるmirakurunを用いたDVRソフトウェアです。(プロジェクトページ) node.js製でクロスプラットフォームなのでWindowsでも動作します。 大きな特徴として、以下の3つが挙げられます。 モバイルフレンドリー自動エンコード機能新しいプロジェクト 個人的には、細かいところに手が届くChinachuという印象です。 モバイルフレンドリー なんと、EPGStationではアプリを入れ

                                                                                ChinachuをやめてCentOSにEPGStationを導入した話 – 水珈琲の日誌
                                                                              • 音声認識モデル”Whisper”をストリーミング処理対応させる方法 | DevelopersIO

                                                                                こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 OpenAIがリリースしたWhisperについて、前回はtranscribeの内容を紐解きました。 Whisperが提供しているtranscribeのAPIは、バッチ処理のみに対応した構成となっており、リアルタイムに認識を試すのが難しくなっています。 そこで今回は、前回紐解いた結果を使ってストリーミング処理に対応させてみようと思います。 設計の概要 以下に設計の概要を図で示します。 前回ご紹介した通り、transcribeの中身は30秒単位で処理をしています(この単位を本記事ではフレームと呼びます)。 そして次の処理フレームは、前のフレームのタイムスタンプトークンの末尾から30秒となります。 そのためフレームをずらす長さ(これを本記事ではシフト長と呼びます)は動的になります。 そのため、設計方針は以下のようにしました。

                                                                                  音声認識モデル”Whisper”をストリーミング処理対応させる方法 | DevelopersIO
                                                                                • FFmpegで動画変換!各OSごとのインストール方法と使い方まとめ|新卒エンジニアの開発日記

                                                                                  ここからはFFmpegの使い方をまとめていきます。 基本構文 FFmpegのコマンドは大方このような構成になっています。 ffmpeg (入力オプション) -i (入力ファイル名) (出力オプション) (出力ファイル名) では具体的な例を挙げながら説明していきます。 動画の形式を変換する 動画にはいろいろな形式があります。 例えば、mp4,mov,aviなど、新しいものだとGoogleが開発したwebmだったり、様々なものがあります。 しかし環境によっては再生されないものもあったりするので、そういう場合に必要になるかと思います。 ffmpeg -i input.mov output.mp4 上記のように入力ファイル名と出力ファイル名から拡張子を判断して、そのフォーマットに変換してくれるようになっています。 対応しているフォーマットを確認するには以下のコマンドで確認できます。(めちゃめちゃ多

                                                                                    FFmpegで動画変換!各OSごとのインストール方法と使い方まとめ|新卒エンジニアの開発日記