サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
体力トレーニング
up-cat.net
多くの人々が誤解しているであろう、CBRの実態を書いてみる。 記事を書くきっかけがx264のr1244でのCBRの説明削除にあるため、x264を説明する意図が多分に含まれているが、一般的なCBRの理解にも十分資するはず。また、CBRという言葉・概念が一般に浸透したのはMP3が大きく関わっていると思われるため、多く引き合いに出している。 最近のx264におけるCBRという用語についての注意 x264はr1480でnal-hrdパッチを取り込み、Filler NALユニットが使用可能になった。このため、x264には現在、CBRという用語は2つのポイントで存在する。 --bitrate == --vbv-maxrateとするCBRモード。 --nal-hrd cbrで指定し、出力にFiller NALユニットを加える指定。 この両者とも、広い意味でのCBRに寄与するのだが、その働きは異なる。本記
かなり以前からp4x4は使うなと言われているし、x264のデフォルト設定でもp4x4は不使用になっている。さらには、一部のx264のフロントエンド(GUI)ではLevelが3以上の場合にp4x4を指定すると規格適合性に問題が出るという趣旨の警告が表示される。少し古い話ではあるが、p4x4の可否は若干ネット上での議論を醸した。 結論から言って、p4x4はSD未満(Level3.0未満)なら使用してもよいし、それなりに効果が期待できる。そして多少の疑問はあるものの、規格適合性の観点からLevel3.0以上では使用しないほうが無難だ。 この記事では、問題となる規格適合性に関して追ってみる。 なぜ規格に適合しないか 基本的にLevelの定義は高いものほど制限が緩いはずなのに、Levelを上げると問題が出るとはどうしたことか、と疑問に思っていたのだが、doom9にakupenguin氏による答えがあ
このページの全ては誤っているかもしれません。x264関連の記事に関してを読んでください。 この記事はshon3i氏のdoom9での発言に依存しており、彼のpostが不正確であった場合、この記事は全く正しくない可能性があります。BDの仕様書が手に入らないので仕方がありません。 x264は2010/04/25に、フリーソフトウェアとして初のBlu-ray disc向けのエンコーダになったと公式にアナウンスした。これまでも各種パッチを使用すればBDプレーヤで再生可能なコンテンツを作成することはできたが、r1480で--nal-hrdオプション等を公式に取り込み、規格適合性を検証するソフトウェアの検査にパスしたことが大きかったのだろう。 この記事では、x264でBlu-ray規格に適合するH.264ストリームを作成するための情報をメモレベルで記載する。この記事の執筆にあたり、きっかけと情報を提供し
先日、wxRuby + Exerb 2009を書いたばかりなのだが、ExerbはRuby1.8.7にしか対応していない。どうせならRuby1.9.1を使用したいというのは誰もが思うところ。この記事ではRuby1.9.1 + wxRuby2.0.1 + ocraでWindows上で動く実行ファイル(.exe)を作成する。 とは言っても、この記事の方法ではExerb + Rubygemsのような面倒な問題はない。wxRubyの総合パッケージは、wxRubyが導入済みのRuby実行環境だ。これを利用すればwxRubyのインストールにRubygemsが介入せず、従って素直に.exe化までたどり着ける。Rubyを扱った経験のある方には、何の目新しい情報もない。 構築する環境 この記事では、Ruby実行環境がない状態から、wxRuby2.0.1の総合パッケージ(Ruby1.9.1を含んでいる)とocr
x264、というよりもH.264関連の文書を読む際に頻出の用語であるNALを概説してみる。 本当はx264の--nal-hrdオプションの説明を書きたかったのだが、そもそもNALとは何か、という説明が必要になってしまうため、まずはNALだけの説明をすることにした。 非常に端折っているため、厳密には正しくない記述があるが、ご了承願いたい。 大まかに理解する Network Abstraction Layer(ネットワーク抽象化層)の略で、H.264の生のストリームを適当に区切る処理階層を指す。この処理階層では、イメージ的には「パケット」に近い、NALユニット(NAL unit)を生成する。NALはH.264のデータを多様なメディア(記憶媒体や伝送媒体)に乗せるために、アクセスしやすく整形することを目的としている。 x264で出力ファイルの拡張子に.264を指定した場合、このNALユニットの連
コマンドプロンプトで、コマンドに空白を含む文字列を渡したい場合、二重引用符「"」で囲む必要があることは多くの方が知っていると思う。 しかし、その他のエスケープシーケンスはどうなっているのだろうか。Windows XP SP3のマシンでヘルプ内を探してみたが、それらしい記述が見つからない。どうしてそんな基本的な仕様を明確に書いていないのだろうか…。 等と思っていたところ、殆ど偶然に、MSDNにその記述を発見したのでメモしておく。 引数は、空白 (スペースまたはタブ) で区切ります。 キャレット (^) は、エスケープ文字やデリミタとしては認識されません。カレットは、オペレーティング システムのコマンド ライン パーサーによって完全に処理されてからプログラムの argv 配列に渡されます。 二重引用符で囲まれた文字列 ("string") は、空白を含む場合でも、単一の引数と見なされます。二重
タイトルはオプションの説明であるかの様になっているが、例によって好き勝手に書く。今回はマルチスライスとは何かという感じの漠然とした説明を試みる。 x264のr1242でマルチスライスのサポートが復活した。伝聞で申し訳ないが、Blu-ray関係ではマルチスライスが必須という話があるらしく、その対応らしい。 また、r1364ではsliced-threads(スライス毎にスレッドを割り当てるマルチスレッド方式)が復活した。圧縮率は悪化するものの、ゼロ遅延エンコードが可能で、規格が意図する並列処理方式だ。この記事は本来、sliced-threadsが主眼ではなく、slices等の方が主眼だが、便宜上この記事のタイトルに含めた。 特徴 メリットは、Blu-rayやその他のスライスを必要とする規格・機器での再生を目的とした場合、再生互換性を高められるかも知れないことだ。また、再生機器によっては再生負荷
Vista以降、Windowsはアプリケーションが設定等を保存する場所として、%USERPROFILE%\AppData以下にRoaming, Local, LocalLowという3つのフォルダを用意している。%APPDATA%はRoamingに割り当てられているのだが、では他の2つとの使い分けはどうなるのか。 これを満足なレベルで解説してるところがあまり見つからず、自分で簡単に調べてみたのでメモ。 Roamingの正体 恐らく第一の答えはkb955555(機械翻訳版)になるだろう。(後で気づいたがTechNetの方に同等内容の公式な日本語訳があった) 機械翻訳版はどうも気持ち悪いので頑張って原文を訳してみる。 Windows Vista uses the Local and LocalLow folders for application data that does not roam
MinGW上で頻繁にgccを利用しているくせにすぐに忘れるのでメモ。-D,-I,-i,-L,-l等の一般的で分かり切ってるものは書かない。随時追加。 なお、正確にはGCCのオンラインマニュアルが存在するのでそちらを参照すべき。オプションの一覧(リンク先は4.5.xのもの)もある。だが、あまりに膨大すぎるのでこの記事では「よく使用するが意味を忘れがちなオプション」に関してのメモとする。 -f(no-)strict-aliasing 厳密な別名規約(aliasing rule)に則っているとみなすか、則っていないとみなすか。intの変数に対してshort*でアクセスするような行儀の悪いコードが無いと宣言できるなら-fstrict-aliasingにする。 #include <stdio.h> int main(int argc, char* argv[]){ int x = 0; short*
各機能に関して簡単に説明しておこう。 B-frame noであるBaselineでは-bまたは--bframesを0で指定する必要がある。これに伴い、Bフレーム関連の機能、つまり--b-adapt, --b-bias, --b-pyramid, --weightb, --pbratioや--partitionsのb8x8等の機能は意味を持たなくなる。 interlace --interlace, --tff, --bff等で指定するインターレースモードの事で、noであるBaselineでは使用できない。x264で使用可能なMBAFFに限った話ではなく、他のエンコーダで使用可能なPAFFも許可されないので注意。 CABAC noであるBaselineでは--no-cabacを指定する必要がある。これによって--trellisもOFFになる。なお、x264ではロスレスの場合には--no-cab
この記事はL-SMASHの暫定・準公式ページです。 L-SMASHとは L-SMASHはmp4ファイルを扱うクロスプラットフォームのライブラリです。将来的にはmp4に関わる様々な用途を想定していますが、現在のところ、実際に動作する機能は以下のように限られています。 α版レベルのx264のmp4 muxerとして動作します。 単独で、いくつかの形式の音声をmuxすることができます。 最低限のm4a/3gp/3g2のmuxerとしても動作します。 具体的には、以下の標準の一部を実装しています。 ISO/IEC 14496-1, MPEG-4 Part1: Systems ISO/IEC 14496-12, MPEG-4 Part12: ISO base media file format ISO/IEC 14496-14, MPEG-4 Part14: MP4 file format ISO/
猫科研究所ではMPEG-4 Part10 AVC / H.264(所謂H.264/AVC)関連の記事が増えてきているが、この記事ではHEVC (High Efficiency Video Coding)、またはH.265/HVCと呼ばれる次世代の映像圧縮技術を紹介する。現在のところまだ正式に規格としてリリースされておらず、検討中のものであるため、時間と共に大きく変わる可能性がある点はご了承いただきたい。このため、テクニカルな記事というより興味本位の読み物と思ってほしい。 2010年現在、このHEVCはH.265と呼ぶべきなのかどうかも微妙だ。そもそもH.265という名前はITU-Tで勧告後に正式決定するはずのものであって、勧告前にどう呼ぶべきかは難しい。そのためH.NGVC (Next-generation Video Coding)という呼称も使われていたのだが…。一方でH.264/AV
猫科研究所では2008年・2009年に今更MinGW/MSYSシリーズを書いた。2008年版では猫科研究所パックをリリースしているが、猫研パックは導入方法の記事を書かない場合でも更新するため、今更MinGWシリーズの記事とは別に、随時ここに置くこととした。 諸事情により、a008から完全なネットワークインストーラにした。保存性等の理由からこれがよろしくない場合は、postinstallまでを実行したあとアーカイブすれば、これまでの猫研パックとなんら変わらない。 次回、a010からpthread-w32は抜くかもしれない。ffmpeg/libavもx264もwin32-threadsをサポートする今、無理にpthread-win32を使うには理由が乏しい。 ブツ msys_felidlabo_a009.7z 386.50kiB (5186)(2011/05/20)(experimental,
Windows XPまではエクスプローラのフォルダオプションで画像ファイルのプレビュー用キャッシュ(Thumbs.db)を作成しない設定が可能であった。 VistaではThumbs.dbに当たるものが画像のあるフォルダではなく C:\Users\<username>\AppData\Local\Microsoft\Windows\Explorer に保管され、通常はユーザから見えなくなったためか、このオプションが無くなった。 しかし、それでもキャッシュを作成したくない場合は以下の設定で可能。 Windows Registry Editor Version 5.00 [HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Policies\Explorer] "NoThumbnailCache"=dword:00000001
ただし、これは音声込みのビットレートなので注意。例えば実際に125分の動画を記録する場合には、動画4.8Mbps+音声192Kbps=約5Mbpsとする必要がある。 また、その他にも以下のような要因から、合計で2〜5%程度の余裕は取った方がよい。 muxのオーバーヘッド(音声と合わせVOBファイルにする時の追加サイズ)が必要 メニューや管理情報の記録容量がビデオとは別に必要 ビットレートは完全に指定通りにはならず膨らむことがある DVDメディアの最後の方(外周部分)はエラーが発生しやすくギリギリは避けたい 個人的には、125分の動画を記録するとすれば、動画4.5Mbps+音声192Kbps=約4.7Mbpsくらいにする。Auto-fitも100%ぴったりにはしないのだから、無理に容量を使い切ろうとしない方がよい。 なお、あまりにFAQなために、Auto-fitは今後デフォルトではなくなる公
DVDFlick via 猫科研究所 DVD Flickの日本語化+改造版。既に日本語化を行っている方がいるが、単なる日本語化のみでなく機能的な修正や追加も含めている。DVD Flick自体の紹介はDVDFlickに期待を参照。また、DVD Flickを使用する上でのQ&Aに関してはDVD Flick FAQへ。 特徴 本家の問題修正 エンコードが遅い(特にオーディオ)問題の修正。 日本語パス・ファイル名が使えない問題の修正。(2枚目〜) 映像と音声の同期がズレる(いわゆる音ズレ)オリジナルの問題に試験的に対処。(12枚目〜) 機能追加 mkvのチャプタのインポートが可能。(3枚目〜) ボリュームラベルに日本語(Unicode)を使用可能。(ただし非推奨)(3枚目〜) メニューテンプレートのフォントの文字セットを設定可能。(7枚目〜) 別途用意すればAC-3(A/52)のエンコードにaft
フリーのCD・DVD書き込みソフト(焼きソフト)が増えている。選択肢が多くなるのは良いことだが、相変わらず有料ソフトでさえも、ファイル名への制限はキツイ。31文字または64文字までしか使えない等の制限が代表的だ。これはISO9660やJolietという古い規格の名残なのだが…。 本来DVDにはこれらに替わるUDFというフォーマットが規定されている。これによりファイル名には大凡127文字まで使用できる(パスは別途規定なので本当にファイル名のみ)はずなのだが、対応状況はかなり甘い。 一見UDF対応と書いてあっても、パケットライトでの書き込み時のみ対応、というケースは少なくない。Vistaには標準で書き込み機能が付いたが、VistaのCD・DVD作成機能を無効化にも書いたように非常に使い勝手が悪い。 日本語特有の問題 さらに状況を悪くするのは日本語でのファイル名に特有の問題で、いわゆるダメ文字に
猫科研究所では2008年の春に今更MinGW2008を書いたが、2009年6月現在では大分内容が古くなっている。特にメインターゲットであるffmpegやx264がgcc4系列でのビルドを想定するようになり、MinGWのCurrentである3.4.5も古くなってきた。 MinGW/MSYSを使用するだけなら、MinGW猫科研究所パックは最新に更新しているのでこれを使用すればよいが、その構築方法はa000に対応するものを執筆して以来、明文化してこなかった。この記事の執筆時点で最新であるa003はa000に比べかなり別物と化しているので、ここで2009年バージョンとして再度執筆したいと思う。以前は"今更MinGW"の記事が先にあり、猫研パックを作成したが、今回は逆に猫研パックが元ネタである。 なお、2008年版に比べると今回はライブラリが増えていることもあり、分量が大きくなりすぎるため、内容は2
猫科研究所(felid labo) 猫科研究所(felid labo)は猫科人間が調べたことを書いていく研究報告所です。猫科なので基本的に気まぐれです。なお、旧名称u.p.catは廃止になりました。 主なコンテンツ x264 git snapshot proxy(x264gsp) x264のtarball取得を楽にするCGIです。r1000以降のchangelogの日本語化も行ってます。 L-SMASH mp4を扱うライブラリです。まずはx264のmp4 muxer、そして汎用的なツールとなるべく開発中です。 今更MinGW/MSYSシリーズ 今更ながらMinGWの環境構築情報です。ひとまずffmpegのビルド環境を作ります。構築済み環境であるMinGW猫科研究所パックの配布も行ってます。 MinGW+ffmpegインデックス 上記MinGW環境でffmpegをビルドします。H.264/A
Vistaではフォルダに含まれるファイルから、そのフォルダの表示に使うテンプレートを自動的に判断する。これの機能を無効にするメモ。 Vistaのこの機能は、使用者の意図にそぐわない場合が非常に多い。画像がいくつか含まれていれば画像フォルダと判断してしまうし、過去に.wmaファイルがあったフォルダはいつまでも音楽フォルダになっていたり。 問題をさらに悪化させるのは、この自動判別で設定されたテンプレートを変更するには、一々ダイアログを開いて設定し直さなければならない点だ。これがツールバーなどでワンタッチでできたなら、まだ救いがあった。画像のサムネイルは通常のアイコン表示でも縮小表示になるのだし、正直この自動判別機能は不要だ。 設定方法 ネタ元の@ITの記事では、以下のようになっている。 HKEY_CURRENT_USER\Software\Classes\Local Settings\Soft
InternetExplorer7、Firefox、Opera等の現世代(もう次世代ではないよね?)ブラウザは半透明のPNG(PNG内のαチャンネルで透過の割合をピクセルごとに設定できるPNG)に対応している。これを背景やボタン画像に使用すると表現の幅がかなり広がる。 しかし、2008年夏現在、シェアがトップであると思われるInternetExplorer6ではこれに対応していない。WebデザイナーのためのIE6で何とかする方法のメモ。 キモ 結局のところ、CSSのIE独自拡張であるfilterで、 filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src='trans.png',sizingMethod='scale'); などとしてやれば一応αチャンネル対応になる。 しかし、話はそう単純でなく、 イベント(マウスオーバー
最近巷ではFLVを再生するためのソフトに関しての情報が出回っている。が、これらの殆どはローカルでFLVファイルを再生するためのものだ。YouTubeやzoomeのようなサイトを作成するための、Webに貼り付けられるプレーヤコンポーネント(SWF)に関してはかなり情報が少ない。Google等で検索してみようにも、検索語が「FLV プレーヤ」ではローカル用のものばかりが表示される。 もちろん正統にはAdobe Flashを購入するのが筋なのだが、何度も繰り返し使用するほどでもないのに豪華で高価なソフトウェアは二の足を踏む向きも多いだろう。やっとのことでフリーのWeb用プレーヤを見つけても、個人・非商用のみフリーだったりしないだろうか。 結論から言おう。Web用・フリー・商用可能なFLVプレーヤコンポーネントは存在する。しかも複数あるのだが、サイトやソフト自体が比較的わかりやすいものを2つ紹介す
(2010/06/27)Flash Player 10.1に関して追記しました。 Firefox Portableと各種プラグイン 猫PはFirefox Portable Edition(日本語版)を使用している。で、Flash Playerの最新版やWindows Media Player Firefox Pluginを手動で無理矢理インストールする場合のメモ。拡張機能ではないので、xpiで簡単には入れられない。 これらプラグインは、普通の手順を追うとそれらの専用インストーラを使うことになる。ところがこれらのインストーラはレジストリからFirefoxの位置を検出するため、Portable Editionはいないものとされてしまう。つまり、普通にインストールができない。 この対処法は主に2つで、 Portableなのにレジストリにインストール位置を記述する 手動でインストールする のどちら
以下注意事項 「外部レンダラ」とはGhostScript等の外部レンダラを必要とするか否か。 「日本語」の項目は以下の点をごちゃまぜで総合評価している。GOODならほとんど問題なし。 メニューなどの日本語化度。 日本語ファイル名対応。 印刷内容の日本語対応。 「付加機能」とはセキュリティ設定や文書情報設定、しおり設定などの機能。 「?」の付いている項目は筆者が試した結果や公式情報ではなく信頼性が微妙。 「商用」(営利目的使用)に関しては大雑把に記載。使用前に実際の条件を確認すること。 お薦め 付加機能が不要ならdoPDF。とにかく使用法が簡単で、広告も無く登録も必要ない。1年ほど前の時点で、他のPDF作成ソフトよりも内容に日本語を含む文書の対応がしっかりしていた。具体的には、WordやExcel等で図形オブジェクトや埋め込みVisioオブジェクトなどを使用した場合に、それらの中まで日本語を
この記事ではwxWidgetsを紹介するわけだが、さて書こうとして、その書き出しに困ってしまった。あまりに色々な切り口の紹介が可能で、魅力的すぎるからだ。ここは素直に、特徴を箇条書きにしてしまおう。 洗練されたAPIを持つGUIライブラリである。 実装言語はC++だが、Python, Perl, C#(.NET)等へのバインディングがある。 Win32, MacOS X, GTK+, X11, Motif, WinCEなどのマルチプラットフォーム対応。 基本はネイティブコンポーネントへのラッパであり、OS固有のLook&Feelを保つ。 文字列クラス等の基本的なものを含め、GUI以外の豊富なクラス群を持つ。 無料かつオープンソースであり、LGPLを非常に緩和したライセンスで商用利用も容易→参考。 15年以上もの歴史(since 1992)があり、非常に安定している。 wxWidgets F
特に大きな問題ではないのだけれど、Firefox3のPortable Edition(日本語版)はいくつか注意点があるのでその解説。 Firefox Portableのインストール Firefox3のPortable Editionは初回インストール時に日本語を含むパスにインストールすると、ウィンドウがいくつも開いてしまうバグがあるらしい。これはFirefox Portableが使用しているインストーラに起因するものでFirefox Portable自体の問題ではないのだけれど。 一度半角英数字のみのパスにインストールしてから起動・終了し、それから場所を移動すれば問題ないとのこと。 ポータブルなんだからインストーラじゃなくzipで提供すればいいのでは、と思う。 Firefox Portableのセッションストア Firefox3.0.0.0のPortable Editionの日本語版で初回
bbs2chreader(b2r)でイメピタ(imepita.jp)対応 b2rとchaikaでイメピタの画像をポップアップする改造です。以前の方法も一応有効です。 お知らせ ImaveViewURLReplace対応改造パッチをメインにします。なお、今後b2r0.5系には対応しないと思います。引き続きやる気が萎えており、いつ更新しなくなってもおかしくないです。 最新リリース 現在のリリース物はほぼ全てパッチであり、これらは明示されているバージョン以外のchaika / bbs2chreaderにも適用できる可能性があります。パッチにはWindows環境向けの簡易インストーラが付いています。 ImaveViewURLReplace対応改造パッチ chaika 1.2.0で動作確認 / bbs2chreader0.4.19.008-pre6-exは不明 bbs2chaika_ivur-007
今更MinGW/MSYS 2008年春版 インデックス MinGW/MSYSの環境構築シリーズを書いているのだが、長編になってきたのでここにインデックス(目次)を書いておく。(追記:構築が面倒な方向けに構築済みのパックもAnnexに用意している。) 思いつくままに書いているので、記事の順番はそのうち望ましい順番に変更するかもしれない。 なお、以下はWindowsXPでの環境構築方法である。MSの新OSでは色々問題が発生するらしいが、その対応方法はまたの機会にさせてもらう。 今更MinGW(1) 何はともあれMinGW/MSYS/msysDTKの初期インストール。 今更MinGW(2) mingwPORTの利用方法とzlib/libjpegのビルドについて。 今更MinGW(3) アセンブラのnasm/yasmのインストール。 今更MinGW(4) MSYS標準のbashが古すぎるのでアップ
次のページ
このページを最初にブックマークしてみませんか?
『猫科研究所 - FrontPage』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く