![【Netflixでも使ってる!】 映像品質評価ライブラリVMAFを使ったエンコードパラメータの決定方法の紹介 | さくらのナレッジ](https://cdn-ak-scissors.b.st-hatena.com/image/square/23ea8595c5e599666e2ef0df62ed06a13495fd42/height=288;version=1;width=512/https%3A%2F%2Fknowledge.sakura.ad.jp%2Fwp-content%2Fuploads%2F2021%2F11%2Fencode.png)
動画品質評価 動画品質評価主に以下のカテゴリーに分けられます: 主観評価、つまり人による評価で、正確性が高いが、コストが高く、規模化が難しい。 客観評価、アルゴリズムに依存しています.例えばPSNR(ピーク信号対雑音比)、SSIM(構造類似性)などで、正確性が低く、コストが低く、規模化が容易。 知覚品質評価、NetflixのVMAFが代表例で、VMAFは機械学習アルゴリズムに基づき、人の識別結果に基づいてモデルを訓練し、実際の人の評価を模倣することを目的としています。結果は人の評価に近い正確さを達成することができ、これが「知覚」という言葉の意味です。利点は正確さが高く、規模化も容易です。今日話すVMAF、AVQTもこのカテゴリーに属します。 もう一つの分類は有源評価と無源評価で、有源評価とは、参照ソースが必要であることを意味し、例えば、未圧縮のRaw動画が参照ソースとしてあり、その後、処理
こんにちは。プラットフォーム開発部兼財務データ企画部のshigeniiと申します。 普段はデータ基盤の運用保守、および、全社的なデータ活用やデータ駆動推進を担当しています。 今回は、財務に関する情報の収集からその可視化までの過程をシステム化することで、事業計画や予算策定のプロセス改善に結び付けた我々の取り組みについて、システム化に焦点を当てながら書き綴りたいと思います。 この記事がバックオフィス業務において、同じような課題を抱えている方に少しでもご参考になれば幸いです。 経緯 財務レポート可視化プロジェクト システム化にあたっての具体的な取り組み Before After システム化にあたっての課題 今回の対応 全体的なシステム構成 財務レポートを作るまでのながれ 説明1.各業務システムのデータを取得 説明2.マスタ情報の取得・作成 説明3.データの加工・突合機能 説明4.データに対するセ
◇ アノキミモノガタリその伍・∞ はじめに 最適な自己流のID設計 需要に応じて最適なパーツを組み合わせる Ulid-Flake:64-bitのBitInt型のULID設計 Ulid-Flakeの実装イメージ Ulid-Flake のimplementationについて 感想 最後に IDシリーズ記事の一覧 ◇ アノキミモノガタリその伍・∞ 君の名は、01FZG96YPZK4SANAG1ZM5T2K9Z、忘れないその目。 キミに、A.D.10889年の8月2日、UTC黎明5時31分50秒、655ミリ秒、 やっと、ULID宇宙の最後の1ミリ秒で、キミと再会できた。 7ZZZZZZZZZK4SANAG1ZM5T2K9Zよ、キミ。 忘れられない、なんと可愛らしく、愛しいその目。 たとえ、八千八百年、一万年、一千万年、を経っても、 たとえ、十億回、十兆回、十京回、輪廻しても、 たとえ、十恒河沙回、
はじめに この記事はBeeX Advent Calendar 2020の12/5の記事です。 やったこと WindowsでS3をネットワークドライブとしてマウントすることが可能な以下の2つのツールについて比較してみました。 ・CloudBerry Drive → https://www.msp360.com/drive.aspx ・JPCYBER S3 Drive → https://www.jpcyber.com/download なぜやったか どちらとも一応使ったことはあるけどちゃんと比較したことはなく、何が違うのか確認したかったので。 検証環境 ・AWS EC2(Windows Server 2019) ホームページ上から読み取れるデータで比較 MSP360のページの情報がJPCYBERに比べるとかなり少なかったので、比較要素は少なかったですが、まずはそれぞれの紹介ページの情報で比較
こんにちは。2019年に初々しい記事を書いていた山本です。今でも元気にモノタロウで働いております。 この記事では、社内カンファレンスで私が業務部門向けに行ったプレゼンテーションを基に、マイクロサービス化に踏み切ったエピソードを紹介します。モノタロウがGoとprotobufで進める爆速マイクロサービス開発とそれを支えるプロセス と被る部分もありますが、同じ内容でも今回は易しめに解説していますので、空き時間にでもさらっとお読みください。 -- --まさか共通化されてないなんて 2022年の暮れに、こんな改修依頼を受けました。私はプロジェクトの開発リード担当でした。 出荷目安アイコンとは、当社商品が何日で出荷されるかを表すアイコン群のことです。 正確な値を表示するように工夫していますが、モノタロウでは自社在庫を含む様々なパターンの出荷があり、当時拡大が進んでいた「サプライヤ在庫連携」では特に出荷
はじめに 画質の評価方法には、主観評価(DSCQS法、DSIS法、ACR法、ACR-HR法)と客観評価(SNR, PSNR、SSIM)の2種類がある。ここでは、後者の客観評価についてまとめた。 客観評価:圧縮符号化により生じた雑音をSNR, PSNR, SSIM等の手法で定量的に表す方法 主観評価:画像を見た人が自分の感覚に基づいて評価値を決める方法 以下に示す式で、単位が[dB]の理由は、画像信号のダイナミックレンジ(信号の最小値と最大値の比率)が広いため。 SNRとは SNR(Signal to Noise Ratio):信号と雑音の比(SNR大 ⇒ 雑音の影響小)。 圧縮符号化に伴って発生する雑音の評価値SNR(Signal to Noise Ratio)の定義は SNR = 10\log_{10}\frac{s^2}{e^2} \quad [dB] \tag{1}\\ \Bigr(
サイトマップ お問い合わせ English ホーム 取り扱う技術分野 研究内容 動画ライブラリ 技術解説 音声品質評価法 映像品質評価法 3D品質評価法 Mintent 標準化活動 メンバ一覧 外部表彰実績 アクセス サイトマップ HOME > 技術解説 > 映像品質評価法 映像品質評価法 まえがき 1. 映像品質の主観評価法 1.1. 映像品質に影響を与える要因 1.2. 映像品質劣化の知覚 1.3. 主観評価法の国際標準化 1.4. 主観評価の実験条件 (1) 評価環境 (2) 評価映像 (3) 評価者 1.5. 代表的な主観評価法 (1) ACR法 (Absolute Category Rating) (2) ACR-HR法 (Absolute category rating with hidden reference) (3) DCR法 (Degradation Category
MENU トップページ 知識ベース新記事 S1群 情報環境とメディア S2群 ナノ・量子・バイオ S3群 脳・知能・人間 S4群 宇宙・環境・社会 1群 信号・システム 2群 画像・音・言語 3群 コンピュータネットワーク 4群 モバイル・無線 5群 通信・放送 6群 コンピュータ–基礎理論とハードウェア 7群 コンピュータ – ソフトウェア 8群 情報入出力・記憶装置と電源 9群 電子材料・デバイス 10群 集積回路 11群 社会情報システム 12群 電子情報通信基礎 13群 標準・知財・法規 14群 歴史・年表・資料 知識ベースについて ご意見・ご感想 電子情報通信学会について 学会ホームページ プライバシーポリシー トップ2群 画像・音・言語2群5編 画像符号化 2群5編 画像符号化 編主任 八島由幸(千葉工大) 全体概要 八島由幸(千葉工大) 1章 画像・映像信号の性質 吉田俊之(
module: add --experimental-strip-types by marco-ippolito · Pull Request #53725 · nodejs/node It is possible to execute TypeScript files by setting the experimental flag --experimental-strip-typ... 💁♀️ まだマージされてない点に注意してください --experimental-strip-typesというフラグを実行時に付けることにより、Node.jsでTypeScriptのコードを実行できるようになるPRが出てきました。 背景 TC39でも型注釈の話題(議事録を読むとブラウザとの兼ね合いもあり道のりは長そう)が存在するほどJSのコードにおいて、型は当たり前となっています。 Node.jsと同
Intro Ladybird は、他のブラウザエンジンをフォークせず、企業との取引に頼らず、寄付だけで作ることを宣言した新しいブラウザエンジンだ。 Ladybird https://ladybird.org/ これがいかに価値のある取り組みなのか、 Web を漫然と眺めてきた筆者による N=1 の妄言を書いてみる。 ブラウザエンジンとは ブラウザは、「ブラウザ UI」と「ブラウザエンジン」と、大きく二つの構成要素に分けて考えることができる。 ブラウザエンジンとは、いわゆる Web 標準の技術を片っ端から実装した、ブラウザの土台となるものだ。 ビルドすれば、入力した URL からネットワーク経由でリソースを取得し、パースしてレンダリングして表示できる。そのための IETF RFC や WHATWG HTML や ECMAScript が実装されている、標準技術の結集だ。 その上に、例えばタブ
生成AIに疑似コードで指示すると自然言語よりも効率的にプログラムが生成できるというアイデアから生まれた、生成AI用の疑似言語「SudoLang」 ChatGPTやCopilotなどの生成AIを用いてコードを生成しようとすると、多くの場合プロンプトを自然言語で書くことになるでしょう。 しかし自然言語で的確にプログラムの内容を表現するのは、ときに面倒だったり、あいまいさを排除することが難しかったりします。 一方で、プログラマが自分でコードを書こうとするとき、あるいは他のプログラマとコードの内容を議論するときに、自然言語をプログラミング言語のような構文で書く、いわゆる「擬似コード」を使うことがよくあります。 例えばこんな風に自然言語をコードっぽくホワイトボードに書いたことのあるプログラマの方は多いのではないでしょうか? 入力値を処理するための関数(A、B){ Aは数字かどうか確認する Bは日付か
はじめに 2023年4月に基盤エンジニアとして Ubie に入社しました nerocrux です。主に Ubie の ID 基盤の開発と保守運用を担当しています。 この記事は、2023 Ubie Engineers アドベントカレンダー 5 日目の記事となります。 Ubie では、モジュラモノリスを採用しつつ、マイクロサービスアーキテクチャも採用しており、領域によってサービスを分けて、それぞれの担当チームが開発と保守運用をしています。 クライアントから一つのリクエストを受け取ったあとに、Ubie のバックエンドではリクエストを受け取ったサービスだけがそのリクエストを処理することもあれば、別のサービスにディスパッチし、複数のサービスがひとつのリクエストを処理して結果を返すこともあります。 マイクロサービス間の通信が Ubie の内部で発生したとしても、必ずしも無制限で自由に行われていいわけで
本稿はNext.js v15.0.0-rc.0時点の情報を元に執筆しており、PPRはさらにexperimentalな機能です。v15.0.0のリリース時や、PPRがstableな機能として提供される際には機能の一部が変更されてる可能性がありますので、ご注意下さい。 Partial Pre-Rendering(以降PPR)はNext.js v14.0で発表された、SSRやSSGにならぶ新たなレンダリングモデルです。 PPRは前述の通り開発中の機能で、v15のRC版にてexperimentalフラグを有効にすることで利用することができます。ppr: trueとすれば全部のページが対象となり、ppr: "incremental"とすればexport const experimental_ppr = trueを設定したRouteのみがPPRの対象となります。 // next.config.mjs
Google、Google Sheetsの計算エンジンをWebAssemblyに最適化し、2倍の性能を実現したと発表 GoogleはWebブラウザ上でスプレッドシート機能を提供する「Google Sheets」の計算エンジンの性能をWebAssembyで実装し、従来のJavaScriptによる実装と比較して性能を2倍に向上させたことを明らかにしました。 これにより単純なSUM計算から複雑なクエリまで、シート上でのあらゆる計算を始め、ピボットテーブルの作成、条件付きフォーマットなどさまざまな処理が高速になるとのことです。 この性能向上は、JavaScriptで構築されていた計算エンジンをWebAssemblyに最適化したことで実現していると説明されており、そのためにWebAssemby GC(ガベージコレクション)機能を用いたとのことです。 そのため現時点ではChromeとMicrosoft
こんにちは。 マネーフォワード クラウドBox (以下MFCBox)というサービスを開発しています、RailsエンジニアのReoです。 MFCBoxはその名の通りストレージのマイクロサービスなのですが、ファイルの配信方法においてセキュリティと処理の負担軽減を考慮した結果、NGINXの機能である X-Accel-Redirect と AWSの署名バージョン 4 を利用することにしました。 X-Accel-Redirect こちらが、公式ドキュメントの概要説明です。 X-accel allows for internal redirection to a location determined by a header returned from a backend. This allows you to handle authentication, logging or whatever el
Googleが2024年4月3日、新たなJPEGのコーディングライブラリである「Jpegli」を発表しました。Jpegliは高い下位互換性を維持しながら機能が強化されており、高品質の圧縮設定で圧縮率を35%も向上したとのことです。 Introducing Jpegli: A New JPEG Coding Library | Google Open Source Blog https://opensource.googleblog.com/2024/04/introducing-jpegli-new-jpeg-coding-library.html libjxl/lib/jpegli at main · libjxl/libjxl · GitHub https://github.com/libjxl/libjxl/tree/main/lib/jpegli インターネットは人々の生活や仕事に
チームでReactを使って開発していると、コードレビューをする際に、「この書き方はしない方がいいが、それを説明するには800文字くらい必要。図も描きたい。でもそれらを準備する時間はない。」ということが度々ありました。 また、フレームワークやライブラリの技術選定をする際、マネージャに「どうして技術選定が必要なのか」を説明する必要がありました。ROUTE06のマネージャはエンジニアリングへの造詣が深い方が多いので、対立構造になることはありませんが、説明するためには1000文字くらい必要で、やはり図も描きたい。時間はない。と同じ気持ちになることがありました。 参考情報として紹介できる情報がないか探してみると、「とりあえずこうすればOK」というベストプラクティスについては検索エンジンやSNSですぐに見つかります。ただ、どうしてその方法がベストプラクティスなのか、仕組みや原理を説明している情報は少な
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く