並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 642件

新着順 人気順

FFMPEGの検索結果281 - 320 件 / 642件

  • 破損した動画ファイルを高速に検出する

    以前の記事で書いたように、自宅のサーバー上で録画環境を構築している。このサーバーでは、番組の録画が完了すると、録画した TS ファイルを h.264 の MP4 ファイルにエンコードして別のディレクトリに保存するようなスクリプトを動かしている。元の TS ファイルもそのまま保持していたのだが、最近ストレージ容量が厳しくなってきたので、エンコード済みの TS ファイルを削除しようと思い立った。 問題は、エンコードが正しく終了せず破損した MP4 ファイルがいくつか存在することだ。これらのファイルについては元の TS ファイルを残しておきたい。そこで、大量のファイルの中から破損したファイルを高速に検出する方法を調べた。 調べた結果、以下のようにするのが良さそうだ。(ffprobe コマンドは ffmpeg をインストールするとインストールされる) $ ffprobe -v error -f l

    • 【Nostalgic Sound Converter】

      特徴 各種変換モードは、現物の実測データを基に、精巧に作り込まれています。変換というと音質劣化を伴うイメージがありますが、内部演算を64bit浮動小数点で行い、音質が劣化しない同期式サンプリングレート変換を採用しており、元の音質を損ないません。’60年代~’80年代耳にした思い出の音を、本物を超える高音質でお楽しみいただけます。 実行環境 Windows10 今のところ上記のみです。開発はPythonですから、他の環境でも実行ファイルを作れるかもしれません。処理が重いので並列処理をしています。CPUコアの多いPCがお勧めです。 変換できるファイル 変換できるファイルの形式は次の通りです。 WAV 、MP3、FLAC 変換後のファイルは同じ形式になります。変換後のビットレートは、音質劣化を伴わない適正な形に整えています。 使い方 本ソフトは任意の場所に解凍してお使いいただけます。詳細は後述の

        【Nostalgic Sound Converter】
      • radikoを録音するpythonスクリプトを先人たちのコードを読みながら作ってわかったこと - Qiita

        サマリ Radikoの録音をしたくて調べたら色んな人がコードを書いていました。 単にgit cloneして動かしてもよかったのですが、どんな処理をしているのか気になり、先人たちのコードを読みながら自分でもコードを書いてみました。 やってみると学べたことがわりとあったのでまとめてみました。 Radikoで使われているhls(HTTP Live Streaming)というプロトコル Radikoで番組を聞くときに行われている処理 仕様が公開されていない処理をどうやって調べるのか どう調べたかまとめて得たこと 試した環境 OS: Mac OS 10.14.6 docker desktop community: 2.1.0.5 docker image: python:3.7.5-buster Google Chrome: バージョン: 78.0.3904.108 Official Build 6

          radikoを録音するpythonスクリプトを先人たちのコードを読みながら作ってわかったこと - Qiita
        • $10 HDMI to USB 3.2 video acquisition board is based on MS2130 chip - CNX Software

          CNX Software – Embedded Systems News Reviews, tutorials and the latest news about embedded systems, IoT, open-source hardware, SBC's, microcontrollers, processors, and more We’ve just written about an open-source hardware Allwinner V851S camera board from YuzukiHD, but he/she has made another interesting board with the YuzukiLOHCC PRO HDMI to USB 3.2 video acquisition board based on MacroSilicon M

            $10 HDMI to USB 3.2 video acquisition board is based on MS2130 chip - CNX Software
          • One Shot Talking Face を使って音声で顔画像を動かす

            1.はじめに 今回ご紹介するのは、音声と1枚の顔画像を使って、顔画像がまるで話しているような動画を作成するOne Shot Talking Faceという技術です。 *この論文は、2022.12に提出されました。 2.One Shot Talking Face とは? 下記が、One Shot Talking Faceの概略図です。まず、上段のAudio-visual Correlation Leraning(音声と画像の相関性学習)を行います。 特定話者の音声と顔のキーポイントの動きとの相関性をAudio-visual Correlation Transformer に学習させます。 学習後は、One-shot Generation(音声と一枚の顔画像から動画作成)を行います。音声と1枚の顔画像をAudio-visual Correlation Transformerに入力すると顔のキー

              One Shot Talking Face を使って音声で顔画像を動かす
            • 2020年版自宅録画サーバーの準備 - Simple Life in the digital age

              <2022年5月25日>Ubuntu 22.04で動作確認した、新しいバージョンを公開しました。「15分でできる自宅録画サーバー」の改訂版です。時間が経つと、MirakurunもEPGStationもバージョンアップします。そのために、スクリプトが動作しなくなることもあります。今回の2021年初秋版では、2021年9月1日の時点で、問題なく使用できることを確認しました。(2021年10月3日時点で、問題なくインストールできることを確認しました。)2021年初秋版 『15分でできる自宅録画サーバー』の改訂ポイント(1)Bashでスクリプトを実行します。(2)PX-... (2020年03月08日追記)「2020年版 デジタル放送録画の圧縮を最適化するFFmpegの使い方」について紹介。 FFmpegのパラメータを決める際に参考にしてください。 そろそろ2020年が近くなり、自宅録画サーバーも

                2020年版自宅録画サーバーの準備 - Simple Life in the digital age
              • Host your own Mastodon instance on a Raspberry Pi - Raspberry Pi

                The ongoing emergency at Twitter has made a lot of us take a serious look at social media. After a lot of debate here at Pi Towers, we’ve now spun up our own Mastodon instance. The best thing about it? It’s running on a Raspberry Pi 4 hosted at Mythic Beasts. Last time we talked about Mastodon, we told you why we were doing it. Today’s post talks about how you can join us. Our own Mastodon instanc

                  Host your own Mastodon instance on a Raspberry Pi - Raspberry Pi
                • 次世代ビデオコーデックAV1を使ったライブ配信 | さくらのナレッジ

                  こんにちは、テリーです。コロナ騒動による自宅待機・フルリモートワークになって以来、ビデオ会議や動画再生をほぼ毎日必ず使うようになっています。当たり前のように使えるようになったビデオ会議ですが、ケータイの回線を使用したテザリングのように、インターネット回線が低速で不安定な状況の場合は、音声がブチブチと切れたり、ビデオがコマ落ちしたりという状況が今でも発生しています。そんな低速・不安定な回線でもそれなりの画質・音質で安定したビデオ会議をするためには、使用帯域幅を減らすことが必要です。さらなる高圧縮のビデオコーデックが期待されています。 ビデオコーデックは単に最新であればよいというものではなく、配信側・中継側・視聴側の3つのコンピュータで解釈可能でなければならないという点で、開発からリリースまでの期間が他のソフトウェアと大きく異なります。たとえばOSやプログラミング言語は開発元が自分たちの都合の

                    次世代ビデオコーデックAV1を使ったライブ配信 | さくらのナレッジ
                  • フーリエ級数展開のデモンストレーションをPythonで書いた話 - 備忘録

                    はじめに 東京大学の小山先生が、フーリエ級数展開のデモンストレーションをMATLABでお書きになった。 講義でフーリエ変換というかフーリエ級数展開の説明用に作った動画をせっかくなのでここに置いておく。。 pic.twitter.com/2wm4ecjdty— Shoichi Koyama (@sh01) 2020年5月1日 この素晴らしいアニメーションをPythonで再現するスクリプトを書いても良いのではないかと思い、今回の表題に至るわけである。 ちなみに再現したアニメーションは以下の通りである。グラフの軸ラベルがずっと固定であったり、描画範囲が微妙に異なるので完全再現ではないが、それなりに再現できていると思われる。 ノコギリ波のアニメの向きを修正して再アップ pic.twitter.com/RuOil5QG0N— mat (@ballforest) 2020年5月2日 スクリプトの解説(

                      フーリエ級数展開のデモンストレーションをPythonで書いた話 - 備忘録
                    • Radikoolで「超A&G+」の再生・録音ができない対処メモ (2023/04/07 更新) : ういすぷの記録帳

                      Radikoolで「超A&G+」の再生・録音ができなくなりましたので、対処するメモを残したいと思います。 再生、録音ができない場合のご参考になれば幸いです。 録音、再生のURLを自動取得するようにしてみました。 (Radikool)向けは下側です。 こちらのページでご紹介しています:超A&G+の「m3u8」のURLを取得できるページを作ってみた。 2023/04/07 アドレスが変わっていたので次の値に変更してください。 録音と再生のURLです。 https://agcdn02.cdnext.stream.ne.jp/hls1/basic/data/prog_index.m3u8 または、 https://agcdn.cdnext.stream.ne.jp/hls1/basic/data/prog_index.m3u8 利用可能です。 https://www.uniqueradio.jp/

                        Radikoolで「超A&G+」の再生・録音ができない対処メモ (2023/04/07 更新) : ういすぷの記録帳
                      • 第12世代Core「Core i5-12600K」の実力を検証。ミドルクラスCPUの常識を超える性能を見せる

                        第12世代CoreのミドルクラスCPUは,6コア級CPUの常識を超える Intel Core i5-12600K Text by 米田 聡 Core i5-12600K 12月に入り,ゲーム用PCの新調やアップグレードを検討している読者は多いだろう。ゲーム用のPCでは,ゲームのフレームレートや画質を大きく左右するGPUにコストをかけたいもの。一方,CPUはGPUの性能を引き出せれば十分という判断になる。その点でおすすめできるのが,ミドル〜ミドルハイクラスのCPUだ。ハイエンドGPUの性能にも十分に対応でき,価格もほどほどだからである。 というわけで本稿では,11月初旬に発売された第12世代Coreプロセッサ(開発コードネーム Alder Lake S)のうち,ミドルハイに位置づけられる「Core i5-12600K」(以下,i5-12600K)を中心に,いま市場で入手できるミドルクラスCP

                          第12世代Core「Core i5-12600K」の実力を検証。ミドルクラスCPUの常識を超える性能を見せる
                        • There oughta be a Game Boy capture cartridge.

                          20 December 2022 I present to you: The GB Interceptor. It is an adapter that goes between an unmodified Game Boy and the cartridge and offers a video stream of the game via USB. Click the image to see the video on youtube.com. The video above should give you a good overview of what it does, how it works and what its limitations are. This article here goes more into the technical details of how it

                            There oughta be a Game Boy capture cartridge.
                          • VHS でターミナルを録画する

                            その他のインストール方法については公式ドキュメントをご参照ください。 ttyd FFmpeg VHS のインストール Homebrew や Go など様々なインストール方法が用意されています。 # Homebrew を使う場合 $ brew install charmbracelet/tap/vhs # Go を使う場合 $ go install github.com/charmbracelet/vhs@latest その他のインストール方法については公式の README をご参照ください。 VHS の使い方 vhs new <任意の名前> のように実行することで、 <任意の名前>.tape という名前でファイルが作成されます。 例えば次のように実行した場合、 example.tape というファイルが作成されます。 # VHS documentation # # Output: # Ou

                              VHS でターミナルを録画する
                            • Twitchの動画配信プロトコルWarpのデモを動かしてみる - ASnoKaze blog

                              TwitchはWebTransport over HTTP/3 で単方向のライブストリーミングを可能にするWarpというプロトコル開発してます。 古い記事ですが、以前紹介した通りで、現在IETFで議論が進められています。 asnokaze.hatenablog.com その Warpのデモコードが公開されたので動かすところまでやる。 github.com とはいえ書いてある通りやるだけ。僕は、サーバとブラウザを別環境で動かす都合でちょっと弄っている。先に結果だけ書くと 結果 ブラウザで動画が流れる事を確認しました また、serverを改造してkeylogfileを出力させ、パケットを復号させると SETTINGSフレームで次の値を投げている SETTINGS_WEBTRANS_DRAFT00 = 0x2b603742, SETTINGS_H3_DATAGRAM_DRAFT04 = 0xff

                                Twitchの動画配信プロトコルWarpのデモを動かしてみる - ASnoKaze blog
                              • 週刊Railsウォッチ(20201201前編)switch_pointがActive Record 6.0でサポート終了、Rails DBトランザクションの落とし穴ほか|TechRacho by BPS株式会社

                                2020.12.01 週刊Railsウォッチ(20201201前編)switch_pointがActive Record 6.0でサポート終了、Rails DBトランザクションの落とし穴ほか こんにちは、hachi8833です。本日よりTechRachoアドベントカレンダー2020が始まりました。どうぞよろしくお願いします。 各記事冒頭には⚓でパーマリンクを置いてあります: 社内やTwitterでの議論などにどうぞ 「つっつきボイス」はRailsウォッチ公開前ドラフトを(鍋のように)社内有志でつっついたときの会話の再構成です👄 お気づきの点がありましたら@hachi8833までメンションをいただければ確認・対応いたします🙇 ⚓ Rails: 先週の改修(Rails公式ニュースより) 今週は公式更新情報から見繕いました。 元記事: Bugfixes, improvements and m

                                  週刊Railsウォッチ(20201201前編)switch_pointがActive Record 6.0でサポート終了、Rails DBトランザクションの落とし穴ほか|TechRacho by BPS株式会社
                                • ARM or x86? ISA Doesn’t Matter

                                  For the past decade, ARM CPU makers have made repeated attempts to break into the high performance CPU market so it’s no surprise that we’ve seen plenty of articles, videos and discussions about ARM’s effort, and many of these pieces focus on differences between the two instruction set architectures (ISAs). Here in this article we’ll bring together research, comments from people who are very famil

                                    ARM or x86? ISA Doesn’t Matter
                                  • ffmpeg で low latency DASH server 作ってみた - Qiita

                                    これは何? 最近、cmaf(Common Media Application Format) を使った低遅延ライブについて、ちょこちょこ調べているんですが、手軽にオープンソースベースで試せる環境が見つけられなかったので、作ってみた ・・・ という POST です。 構成概要は、以下のような感じ まずは動かしてみる インストール ffmpeg のインストール 解説は、後に回すことにして、まずは動かし方。まず、ffmpeg をインストールします。(たぶん) v4.3.1 以降が必要です。 Ubuntu20.04

                                      ffmpeg で low latency DASH server 作ってみた - Qiita
                                    • 第47回 『らじる★らじる』の聴き逃がしサービス(3) | gihyo.jp

                                      前回、聴き逃しサービスの番組へのリンクからJSONデータを取り出し、そこに記されたタイトルや配信元URLを使ってffmpegで番組をダウンロードするためのスクリプトを書いてみました。 このスクリプトでいくつかの番組をダウンロードしてみたところ、スクリプト自体はそれなりに動いて必要な情報を取れてはいるものの、番組のダウンロードはしばしば失敗してしまいます。 $ python ./json_01.py 'p=0308_01_3844917' ffmpeg version 4.3.3 Copyright (c) 2000-2021 the FFmpeg developers ... Input #0, hls, from 'https://vod-stream.nhk.jp/radioondemand/r/308/s/ stream_308_5725b4a0be55d9c3c4d52e4c954

                                        第47回 『らじる★らじる』の聴き逃がしサービス(3) | gihyo.jp
                                      • 声をPythonに聴かせて(マイクから入力した声をWhisperに、何度でも認識させよう) - nikkie-ftnextの日記

                                        はじめに ういっすういっすういっすー!✌️ ぱー🖐 nikkieです。 シオン・プロジェクト、Whisper章の続編です。 観測範囲ではいろんな方がWhisperを触られてますね〜。 Whisperを使えば短いコードで音声ファイルを書き起こせます! 今回は「音声ファイルではなく、マイクから入力した音声は書き起こせるの?」という疑問にアプローチします。 目次 はじめに 目次 前回のシオン・プロジェクト!:環境構築 動作環境 結論:Whisperはマイクからも音声認識できます! 「何度でも認識させよう」のモチベーション マイクから入力した音声の認識、既存のアプローチ マイクから入力した音声の認識、提案したいアプローチ 音声データの渡し方を調査:transcribeメソッドは何をしているのか whisper.load_model whisper.model.Whisper.transcribe

                                          声をPythonに聴かせて(マイクから入力した声をWhisperに、何度でも認識させよう) - nikkie-ftnextの日記
                                        • FFmpeg チートシート

                                          You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                            FFmpeg チートシート
                                          • 暗号化されたHLS形式(m3u8)の動画をダウンロードする - 動かざることバグの如し

                                            環境 ffmpeg 4.3 やりたいこと タイトルで完結しているが、WEB配信している動画にはストリーミング再生できるようにHLS形式で配信されている。 が、これはChromeのネットワークタブ等で監視してもm3u8ファイルしか出てこない。それは動画本体ではなく、ただのURLが羅列されているいわばプレイリスト。 それを自動認識してダウンロードまでやってくれるChrome拡張機能もある。 chrome.google.com 今回はこれでもDLできない、暗号化されたHLS形式の動画をダウンロードしたい。 暗号化されているかの確認方法 対象のm3u8ファイルを直接テキストエディタで開いてみると、以下のように EXT-X-KEY:METHOD の記載があれば暗号化されていると言える。つまりkeyがなければ動画を再生することはできない。 #EXTM3U #EXT-X-VERSION:3 #EXT-X

                                              暗号化されたHLS形式(m3u8)の動画をダウンロードする - 動かざることバグの如し
                                            • Ubuntu 23.10のDesktopイメージの再リリース、Jetson Orin向け Ubuntu/ROSイメージ | gihyo.jp

                                              Ubuntu Weekly Topics Ubuntu 23.10のDesktopイメージの再リリース⁠⁠、Jetson Orin向け Ubuntu/ROSイメージ Ubuntu 23.10のDesktopイメージの再リリース 2023年10月12日(現地時間⁠)⁠、Ubuntu 23.10 “⁠⁠Mantic Minotaur⁠⁠”⁠、『⁠⁠卜占(ぼくせん)のミノタウロス』がリリースされました……が、先週の追記でお知らせしていた通り、翻訳にヘイトスピーチが含まれていた問題により、あらためてISOイメージがリリースされています。再リリースの対象となった(=問題のある翻訳が含まれていた)イメージは、Ubuntu Desktop 23.10, Ubuntu Desktop 23.10 arm64 image for Lenovo X13s, Ubuntu Budgie 23.10の3種です[1

                                                Ubuntu 23.10のDesktopイメージの再リリース、Jetson Orin向け Ubuntu/ROSイメージ | gihyo.jp
                                              • 語学講座CS2

                                                ストリーミングで公開されているNHKラジオ語学講座(らじる★らじる(聴き逃し)配信)の録音を自動化するためのアプリです。語学講座の録音にはffmpegを利用します。 開発が中断している https://osdn.net/projects/capturestream/ の派生版です。 正式に開発を引き継いでいるものではありません。録音した語学講座のファイルは著作権法で許されている範囲内でご利用ください。 View the Project on GitHub View On GitHub 語学講座CS2 ブログ (お知らせ、他) [X:旧twitter] NHKゴガク  Learn Japanese [類似アプリ] 語学講座CS2 は、NHKラジオ語学講座の らじる★らじる(聴き逃し)のストリーミング配信の録音を自動化するためのアプリです。 このサイトから入手できる実行ファイルは、デジタル署名

                                                • Radikoを聴くためのスクリプトです。元々は認証してプレイリストのURLを取得するものを、ちょっとだけ修正と整理をしてコマンドラインから簡単に聴けるようにしてみました。ffmpegの付属ツールffplayが必要です。HLS形式での配信になり、rtmpdump, swftoolsが不要になりました。

                                                  radiko.py �37�U �|�6�U #!/usr/bin/env python3 # -*- coding: utf-8 -*- import urllib.request, urllib.error, urllib.parse import os, sys, datetime, argparse, re import subprocess import base64 import shlex import logging from sys import argv auth_token = "" auth_key = "bcd151073c03b352e1ef2fd66c32209da9ca0afa" ## 迴セ迥カ縺ッ蝗コ螳・key_lenght = 0 key_offset = 0 def auth1(): url = "https://radiko.jp/v2/api/a

                                                    Radikoを聴くためのスクリプトです。元々は認証してプレイリストのURLを取得するものを、ちょっとだけ修正と整理をしてコマンドラインから簡単に聴けるようにしてみました。ffmpegの付属ツールffplayが必要です。HLS形式での配信になり、rtmpdump, swftoolsが不要になりました。
                                                  • 【Ubuntu】PPAを追加・削除する方法について

                                                    Ubuntuにパッケージをインストールする際はaptコマンド(またはapt-get)を使うことが多いと思いますが、デフォルトの状態ではUbuntuの公式リポジトリのみがシステム(/etc/apt/source.list)に登録されています。 よって、3rdパーティ製のパッケージなど公式リポジトリに登録されていないパッケージをインストールするには、そのパッケージが格納されている外部のリポジトリを登録する必要があります。 本記事では、PPA等の外部リポジトリをAPTリポジトリに追加/削除する方法についてまとめました。 確認した環境 OS: Ubuntu16.04LTS APTリポジトリはどのように登録される? Ubuntuでは、APTリポジトリの情報は下記の様に登録されます。 /etc/apt/sources.listファイルに記述 または /etc/apt/sources.list.dディレ

                                                      【Ubuntu】PPAを追加・削除する方法について
                                                    • ffmpeg | ニコラボ

                                                      フィルタ内容をテキストで読み込む filter_script、filter_complex_script オプションは何も指定しないと既定値が入力される。指定にはオプション名を指定するのとしないのがあり、指定しないほうは ffmpeg -h filter=フィルタ名で表示される順番に指定しなければならないが同じ意味のオプションはまとめて一つの順番とする。このヘルプコマンドの順番と公式サイトの順番が一致しないことがたまにあるが、ffmpeg -h filter=フィルタ名の順番が正しい。既定値以外を指定するときは別途オプション名を指定して値を指定する。[int]の指定順は基本ヘルプの順番だが、ffmpeg 4.3では対応する数値もヘルプコマンドで表示される。 crop(切り出しフィルタ)を例にする。最初の引数の前に=(イコール)でつなげて第1引数を指定、第2引数以降は:(コロン)でつなぐ。引

                                                        ffmpeg | ニコラボ
                                                      • Think twice about Wayland. It breaks everything!

                                                        Wayland.md Think twice before abandoning Xorg. Wayland breaks everything! Hence, if you are interested in existing applications to "just work" without the need for adjustments, then you may be better off avoiding Wayland. Wayland solves no issues I have but breaks almost everything I need. Even the most basic, most simple things (like xkill) - in this case with no obvious replacement. And usually

                                                          Think twice about Wayland. It breaks everything!
                                                        • Web Sessions at Google I/O 2023の気になった発表のまとめ - console.lealog();

                                                          まとめプレイリストが公開されてたので、その中から気になったやつを流し見した。 https://www.youtube.com/playlist?list=PLOU2XLYxmsIJGxIV8Lt8gF_79Z334LQ6h What's new in Web https://www.youtube.com/watch?v=x9rh0Du4Czg ブラウザで使える最新機能のご紹介 `dialog`要素はいいぞ `showModal()`のほう フォーカスやタブ管理までブラウザがやってくれるし、スタッキングコンテキストも安心 CSS transform `transform: scale(1)`を`scale: 1`って書けるように 複数の組み合わせでもコードがごちゃつかない 新しいCSSの単位 `lv(h|w|min|max)`、`sv(h|w|min|max)`、`dv(h|w|min|m

                                                            Web Sessions at Google I/O 2023の気になった発表のまとめ - console.lealog();
                                                          • ChatGPT のCode interpreterまとめ(更新中)

                                                            2023年7月7日にアナンウンスがあり、Interpreter 機能がChatGPT Plusユーザに順次開放される コードの実行と、アップロードしたファイルへのアクセスが可能。 Pythonの環境 この環境は、OpenAIが提供する対話型のPythonコード実行環境です。具体的な特性は以下の通りです: Python 3.7+を使用しています。 機械学習やデータ分析に使われる主要なライブラリ(pandas、numpy、scikit-learnなど)がプリインストールされています。 インターネットアクセスが無効化されています。したがって、新たなパッケージのインストールや外部APIへのリクエストなどが行えません。 状態はセッション間で保持されません。つまり、セッションが終了すると、それまでの変数の値や計算結果は全てクリアされます。 ユーザーがアップロードしたファイルやユーザーへのファイルのダウ

                                                              ChatGPT のCode interpreterまとめ(更新中)
                                                            • ffmpegでサクッとデスクトップキャプチャ(音声も!) - Qiita

                                                              概要 ffmpegを使ってサクッとデスクトップ画面+音声をキャプチャしてファイルに保存します。実行環境はWindows 10を想定しています。 デスクトップをキャプチャする ffmpegではgdigrab(Linuxではx11grab)を使うことでデスクトップ画面をキャプチャできます。 ffmpeg -video_size 1920x1080 -framerate 30 -f gdigrab -i desktop -vcodec libx264 -pix_fmt yuv420p desktop.mp4 オプションの解説 video_size 無指定だと画面全体をキャプチャします。このオプションを指定すると画面の左上を基準に指定した範囲をキャプチャします。 framerate キャプチャ動画のフレームレートを指定します。 f, i -fオプションにgdigrabまたはx11grabを指定し、

                                                                ffmpegでサクッとデスクトップキャプチャ(音声も!) - Qiita
                                                              • 【MediaPipe】Windowsで環境構築し、Multi Hand Trackingを動かしてみた | DevelopersIO

                                                                【MediaPipe】Windowsで環境構築し、Multi Hand Trackingを動かしてみた ※ 5/29追記:本記事の内容はMediaPipeのバージョンはv0.7.4のときに実行したものです。5/22にバージョンがv0.7.5に変更になったため、以下の方法では動かない可能性がありますので、ご注意ください。 カフェチームの山本です。 前回は、MediaPipeのHand Trackingの性能を確認するため、公開されているAPKを手元のスマートフォンで動かしました。 【MediaPipe】手の形状検出をやってみた 今回は、MediaPipeで公開されている手順に従って、デスクトップ(Windows Subsystem for Lilnux、以下 WSL)で構築し、Hello Worldを動かすまでの内容をメインに記載しています。これによって、APKが公開されていない、Media

                                                                  【MediaPipe】Windowsで環境構築し、Multi Hand Trackingを動かしてみた | DevelopersIO
                                                                • 360°全天球動画からフォトグラメトリで現場を3Dモデル化する話—RICOH THETAやInsta360+ffmpeg+Reality Capture— - 創作意欲とか物欲とか、そういう類のもの

                                                                  こんにちは、最近フォトグラメトリという技術に興味があるので、その話題をひとつ。 フォトグラメトリとは? 撮影には手間がかかる 360°カメラで楽に撮影したい 今回はRealityCaptureを使いたい FFmpegで360°画像・動画を変換できるようになってた THETAで撮った動画をReality Captureで使うには? 1視点から14方向ぶん切り出してみる 楽するためにPythonでコマンドを組み立てる Pythonスクリプト 実践 うまくいった! Insta360 ONE X2で品質爆上げ 今後の課題 1. 切り出し枚数と精度のバランス 2. CLIで工程を自動化 3. RealityCaptureを使いこなす フォトグラメトリとは? フォトグラメトリは写真測量の一種で、いろんなアングルから撮った写真から視差を画像解析することで、3Dモデルに変換するというスゴい技術です。 Li

                                                                    360°全天球動画からフォトグラメトリで現場を3Dモデル化する話—RICOH THETAやInsta360+ffmpeg+Reality Capture— - 創作意欲とか物欲とか、そういう類のもの
                                                                  • Google Colab で はじめる OpenAI Whisper|npaka

                                                                    「Google Colab」でOpenAIの「Whisper」を試してみました。 1. Whisper「Whisper」は、OpenAIが開発した、会話音声をテキストに変換するニューラルネットです。英語の音声認識において人レベルに近い堅牢性と精度を持ちます。大規模で多様な教師付きデータセットにより、アクセント、背景雑音、専門用語に対して堅牢性を向上させています。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) Colabで新規ノートブックを作成。 (2) パッケージのインストール。 # パッケージのインストール !pip install git+https://github.com/openai/whisper.git !sudo apt update !sudo apt install ffmpeg(3) 日本語の会話音声のwavファイルの準備。 今回は、つく

                                                                      Google Colab で はじめる OpenAI Whisper|npaka
                                                                    • 今の40代オタクがボクの師匠、プログラムもCGもDTMも師匠のおかげ その2

                                                                      https://anond.hatelabo.jp/20230319133934 の続き 2000年代後半そもそも前述のオーディションの告知すらDTM magazine以外で見たことがなく(実際はもう少し色んなところで告知していたのだろうけれど観測範囲ではDTM magazineだけだった)、ネット上で注目されるのはロイツマ・ガールからのニコニコ動画に投稿される初音ミクのIevan Polkkaを待つ必要がある。 実は初音ミクのIevan Polkka以前に初音ミク自体は注目されていたのだが、それは深夜アニメブームの文脈で藤田咲ファングッズという需要であり決して初音ミクの可愛さやら革新性がDTMの文脈で評価されたっものではなかった。 実際に当時のKAITOやMEIKOの立ち絵が更新されたのは初音ミクブーム以降であって初音ミク登場時点でもまだ扱いは非常に小さい。 この時期に触れて置かなければ

                                                                        今の40代オタクがボクの師匠、プログラムもCGもDTMも師匠のおかげ その2
                                                                      • GitHub - NatronGitHub/Natron: Open-source video compositing software. Node-graph based. Similar in functionalities to Adobe After Effects and Nuke by The Foundry.

                                                                        Natron is looking for developers and maintainers! You can help develop and maintain Natron if you have the following skills: Git and GitHub C++ (Natron source is still C++98, but switching to C++11 or C++14 should be straightforward if needed) Design patterns Qt (Natron builds with Qt4 or Qt5, but does not yet support Qt6) Basic knowledge of OpenGL Basic knowledge of Python For more information, s

                                                                          GitHub - NatronGitHub/Natron: Open-source video compositing software. Node-graph based. Similar in functionalities to Adobe After Effects and Nuke by The Foundry.
                                                                        • FFmpegでTSファイルをエンコード

                                                                          FFmpegの入手 ダウンロードページからffmpeg-git-full.zipをダウンロードします。 解凍して「bin」フォルダにあるffmpeg.exeを使います。 バッチファイル 拡張子を.batにして保存します。 @echo off cd /d %~dp0 :loop if "%~1" == "" goto end ffmpeg.exe -i "%~1" -vf bwdif=1 -c:v libx264 -preset medium -crf 23 -c:a copy -bsf:a aac_adtstoasc "%~dpn1.mp4" shift goto loop :end 使い方 ffmpeg.exeをバッチファイルと同じフォルダに入れます。 TSファイルをバッチファイルにドラッグ&ドロップすると、エンコードが始まります。 複数の場合は順番にエンコードされます。 出力先はTSフ

                                                                            FFmpegでTSファイルをエンコード
                                                                          • Intel HD Audioで音を奏でよう

                                                                            PCで音を奏でるには,ビープ音を鳴らす仕組みの他にIntel High Definition Audio (以下,HD Audio)という仕様があります。スピーカー以外にもマイクといった音声入力側の制御もカバーしています。サウンドデバイスを気にしたことがないのでよく知らないのですが,現代の主流だそうです。 音のデジタル表現 コンピュータは,文字を文字コードという番号を振ることで表現し,画像は原色(RGB/CMYK)の強さ(濃さ?)の組み合わせで表現します。音はどう表現するかというと音は波の一種なので,その波形の各時間間隔での振幅値(例: 整数)で表現します。モノラルなら振幅値が詰まった1次元配列,ステレオならLとRそれぞれの1次元配列の組になります。 時間間隔を決める値がサンプリングレート(単位はHz)であり,また振幅値の表現範囲(8/16/24-bit)を量子化ビット数と呼びます。 WA

                                                                              Intel HD Audioで音を奏でよう
                                                                            • PowerPointで収録する方法 ~ オンデマンド用の動画ファイル作成 - SORACOM公式ブログ

                                                                              こんにちは、もっぱらオンラインコンテンツ制作職人となっている、ソラコムのテクノロジー・エバンジェリスト “Max” 松下です。 プレゼンテーションソフトウェア「Microsoft PowerPoint」(以下、PowerPoint)を利用した、オンデマンド向けの動画ファイル作成方法について資料を公開しましたので、ご紹介します。 PowerPoint があれば、動画ファイルの作成が可能! PowerPoint はプレゼンテーションにおいてスライドの作成と表示をすることに良く利用されますが、実はナレーション(音声)を記録してスライドショーを動画として作成できます。 作成した動画は YouTube 等の動画サイトにアップできますので、映像制作のためのソフトウェアが無くとも、 PowerPoint があればプレゼンテーションの様子を動画で放送できるようになります。 公開資料と概要 資料は Spea

                                                                                PowerPointで収録する方法 ~ オンデマンド用の動画ファイル作成 - SORACOM公式ブログ
                                                                              • waifu2xで動画をアップコンバートする

                                                                                動画をアプコンしよう 昔の動画は解像度が低く最近のディスプレイで見ると悲しくなります。 そこでwaifu2xを用いてアップコンバートしてみたいと思います。 (参考)4Kディスプレイで640×480動画を再生した場合のイメージ waifu2xとは 畳み込みニューラルネットワークを使用し画像を超解像度化するソフトウェアです。 簡単に言うとAIを用いて画像を”綺麗に”拡大します。 GitHub – waifu2x 動画を画像と音声に分解する waifu2xは動画を直接拡大することができないため画像に分解後処理を行います。 ffmpegを使用し音声と画像ファイルに分けます。 画像へ変換 ffmpeg.exe -hide_banner -i %1 -q:v 1 -y "%~dp0\_temp-project\image-frames\image-%%09d.png" 音声の抽出 ffmpeg.exe

                                                                                  waifu2xで動画をアップコンバートする
                                                                                • raspberry pi zero wでOctoPrintを動かしてみた - Qiita

                                                                                  はじめに GWに格安3Dプリンタ、Ender-3 Proを購入しました。事前の想像以上に綺麗に出力できるので満足しています。ただ、プリンタが結構大きく、稼働時の音がそこそこあり、印刷が数時間に及ぶため普段使わない部屋に設置したところ、 印刷の途中経過がわからない 数時間後に失敗(だいたい一層目が、、、) 仕方ないので印刷開始後、しばらく目視確認。。。 →悲しい データの運搬がマイクロSDカード 往復するのが結構面倒 近いうちに紛失する 操作パネルが、それほど使いやすくない と、どうにかならないかと思案していたら、OctoPrintという3Dプリンタの管理アプリを発見。RaspberryPi用のイメージ(OctoPi)が公開されていて、手持ちのラズパイもあったので、早速試してみました。 「Please note that the Raspberry Pi Zero W is not reco

                                                                                    raspberry pi zero wでOctoPrintを動かしてみた - Qiita