タグ

FPGAに関するt_43zのブックマーク (17)

  • AV1リアルタイムハードウェアエンコーダを開発しました - dwango on GitHub

    選定作業にはAOMが公開しているソフトウェアエンコーダaomを使用し、改造によってツールを削減したときの映像品質を比較しました。 映像品質は一般的にビットレートと客観/主観画質のバランスで表されます。 客観画質とは計算によって数値化した画質のことで、代表的な手法としてはPSNRやSSIMがあります。 主観画質とは人の目で映像を評価した画質のことです。 今回は、客観画質としてPSNRを用いた指標(RD性能)を用い、映像品質を比較しました。 PSNRには"30dBを下回ると低品質である"といった基準はありますが、人の目で見たときの評価と必ずしも一致するわけではありません。 そこで、主観画質の評価も並行して実施し、多角的に映像品質低下を防止しました。 選定結果 まず、Superblockサイズを64X64と128X128とで比較しました。 その結果、テストケースのうち約75%でRD性能に変化がな

    AV1リアルタイムハードウェアエンコーダを開発しました - dwango on GitHub
  • Blueoil | Bring Deep Learning to small devices

    Efficiera IP他社AIアクセラレータとの比較において、性能(Power, Performance, Area)に圧倒的な差があり、実用的なAIモデルをエッジデバイス上で稼働させることが可能になっています。 優れた電力効率・面積効率を実現し、AI搭載製品の省電力化・低コスト化に貢献AIを稼働させるためには、その膨大な計算量ゆえに、コンピュータ性能や消費電力などのハードウェア由来の影響が大きく、半導体性能が劇的に進化しない限り、エッジデバイス上で実用的にAIを稼働させることは困難です。 そういった中、当社では107.8TOPS/W*の演算能力を達成した、CNN(Convolutional Neural Network)の推論演算処理に特化した超低消費電力AIアクセラレータIPの開発を行い、AIの実用化に貢献しています。また、このIPを使ったTSMC 28nmと12nmでのSoC開発に

    Blueoil | Bring Deep Learning to small devices
  • 東大のCPU実験で自作コア上の自作OS上で自作シェルを動かした話 - 旅する情報系大学院生

    東大の情報科学科では3年の秋学期にCPU実験という、自分たちでCPU、コンパイラ、シミュレーターを作ってレイトレーシングを動かすことが単位要件の名物実験があります。僕らの班では12月初旬に単位要件を満たすCPUは出来ていたので、2/20にあった成果報告会までの間にIwashi班という自作CPU上でlinuxを動かすことを目標とした余興班を作ってこのエントリのタイトルにあるような結果に終わったのでその報告をしたいと思います。 コンテキストスイッチしている画像: 目次 目次 対象とする読者 自己紹介 できたこととできなかったこと 技術的な詳細 ISA よかったところ 悪かったところ 結論 ステート管理 Floating point UART 自作OS/Shellの仕様 動機 やること 実装方針 増えるレジスタ 増える命令 MMUの挙動 タイマ割り込みの挙動 iretの挙動 Kernelの実装

    東大のCPU実験で自作コア上の自作OS上で自作シェルを動かした話 - 旅する情報系大学院生
    t_43z
    t_43z 2018/02/28
    良い授業だし、良い余興だなー。
  • RTL設計スタイルガイドのアンチパターンをやってみた - exits

    はじめに この記事は 第2のドワンゴ Advent Calendar 2017 の6日目の記事です。 昨日は@urakawaさんでした。 10月から仕事Verilog HDLを書いています。 ↓配属について一瞬だけ触れた記事 学生時代に1週間だけ書いたことはあったんですが、ほとんど入門者状態なので今回はVerilog HDLの勉強的な記事にしようと思います。 RTl設計スタイルガイド RTL設計スタイルガイド Verilog HDL編 今は絶版になっているようです。 BookWayからPDF版かオンデマンド印刷版を購入できました。 の中では下の図のようなマーク付きでRTL設計、VerilogHDL記述上の必須、推奨項目が記述されています。 (図はBookWayの立ち読みページからキャプりました) この記事では、スタイルガイドで必須と言われている項目を守らないとどうなるのかを実際にやって

  • 第3回 ドワンゴがFPGAを使った開発に乗り出したワケ | gihyo.jp

    自由に設計できる集積回路であり、また仕様変更なども容易なLSIの一つとして注目を集め始めているのがFPGA(Field-Programmable Gate Array)です。このFPGAをニコニコ動画などのサービスに応用するプロジェクトに携わる、ドワンゴの宮崎賢一氏と小嶋尚氏にお話を伺いました。 写真1 小嶋尚氏(手前)と宮崎賢一氏(奥) FPGAのメリットは圧倒的な効率の良さ ――ドワンゴでFPGAを使った開発を進めていると伺いました。どのようなプロジェクトなのでしょうか。 小嶋:書き換え可能な集積回路であるFPGAを利用した開発を進めていて、その用途の一つとして考えているのが動画のエンコードです。現状は汎用のCPUを使っていますが、汎用CPUでは計算量的に効率が良くないことをFPGAで実現していきたいと思っています。またFPGAはさまざまな用途に使えるので、たとえば現在ホットな機械学習

    第3回 ドワンゴがFPGAを使った開発に乗り出したワケ | gihyo.jp
  • 機械学習/Deep Learningの仕事が増える2017年、ソフトウェアエンジニアがFPGAを学ぶべき理由

    ソフトウェアエンジニアFPGA(field-programmable gate array)を使うハードルがさらに下がってきている。クラウドサービスでFPGAを活用できたり、Pythonで記述したニューラルネットワークをFPGAに高位合成できる研究成果が出てきたりしているのだ。 ソフトウェア開発者の立場でFPGAに取り組むイベント「FPGAエクストリーム・コンピューティング」を主宰する佐藤一憲氏、FPGAの高位合成によるディープラーニングについて研究している東京工業大学の中原啓貴氏(中原研究室)、そしてFPGAベンダーであるザイリンクスの神保直弘氏が、急激に常識が変わりつつあるFPGAの動向を語り合った。 稿では座談会の中から、ソフトウェアエンジニアFPGAや高位合成が求められる現状、そして、今後どのようなツールを使うべきか、ソフトウェアエンジニアFPGAに取り組む際の課題などにつ

    機械学習/Deep Learningの仕事が増える2017年、ソフトウェアエンジニアがFPGAを学ぶべき理由
    t_43z
    t_43z 2017/01/30
    中原先生だー
  • [速報]AWS、FPGAを利用可能な「F1 Instances」を発表。クラウドでプログラマブルなハードウェアアクセラレーションを実現可能に。AWS re:Invent 2016

    Amazon Web Servicesはラスベガスで開幕した同社のイベント「AWS re:Invent 2016」で、プログラマブルなプロセッサであるFPGAを利用可能な「F1 Instance」を発表しました。 F1 Insntanceは、利用者がFPGAに30回までカスタムロジックを書き込むことが可能。ハードウェアレベルで高速にロジックを実行することができ、さまざまなアプリケーションの高速化が可能になります(修正:30回まで、というのは誤りでした)。 提供されるFPGAの仕様は次の通り。 Xilinx UltraScale+ VU9P fabricated using a 16 nm process. 64 GiB of ECC-protected memory on a 288-bit wide bus (four DDR4 channels). Dedicated PCIe x16

    [速報]AWS、FPGAを利用可能な「F1 Instances」を発表。クラウドでプログラマブルなハードウェアアクセラレーションを実現可能に。AWS re:Invent 2016
    t_43z
    t_43z 2016/12/01
  • 深層学習フレームワークChainerの紹介とFPGAへの期待

    http://connpass.com/event/17063/ でのスライドです。Feed-forward netの簡単な解説(特に実装面)とChainerの紹介。Read less

    深層学習フレームワークChainerの紹介とFPGAへの期待
  • 増え続ける情報に対応するためのFPGA基礎知識

    OpenFlow Switchは従来の Layer 2/3 Switchと異なり、より柔軟なパケットマッチング・変換・転送処理を実現するため、従来のネットワーク・プロセッサとは異なる設計が必要となります。 発表では、既存のネットワーク・プロセッサではなく、FPGAを用いた独自設計によるOpenFlow Switchの開発経験を元に、ハードウェア処理にかかわるOpenFlowの機能概要と、FPGAを用いた実現方法や課題について解説します。

    増え続ける情報に対応するためのFPGA基礎知識
    t_43z
    t_43z 2015/06/24
  • 回路マンガ | 特殊電子回路

    製品情報 MITOUJTAG JTAG書き込みツール インストール ファームウェアの更新 通常モードの使用 Vivadoモードでの使用 便利な機能 まとめ IC真贋判定サービス Spartan-7評価ボード 各種図面 ダウンロード はじめの使い方 開封 基板上のコンポーネント デバイスドライバのインストール サンプルデザインについて FPGAの書き込み サンプルソフトの起動 MicroBlazeで組み込みシステムを作ろう 開発日記(最新) 開発日記(構想~基板設計) Artix-7評価ボード 仕様と特徴 基板図面 ピン配置図 ダウンロード USBテストプログラム 注文情報 新基板への更新 価格改定のご案内 Artix-7技術情報 ArtixのQ&A USBを使う USB APIの使い方 USB 3.0プログラムの作成方法 書き込みツール DDR3の使い方 CoreGenでMIG AXIバス

    t_43z
    t_43z 2015/06/08
    嫌いじゃない
  • サービスの差異化はハードウエアで、ドワンゴの挑戦

    「【ニコニコ事業】ハードウェア開発エンジニア (正社員) 日最大級の動画サイトニコニコ動画を中心とした『niconico』を支える配信システムのハードウェアによる高速化を行っていただきます。」 ドワンゴは2014年11月、こんな職務内容で、ハードウエアエンジニアを募集した(エンジニア募集サイト)。実際、2015年4月時点で既に10数人のハードウエア技術者を採用。今後も採用数を増やすという。 連載第4回は、ニコニコ動画やニコニコ生放送を運営するドワンゴのプラットフォーム事業部の宮崎賢一氏らに、IT企業がハードウエア開発を手がけることの意義を聞いた(写真)。 写真●ドワンゴ プラットフォーム事業部長の宮崎賢一氏(左)、同部 プラットフォーム事業部 コンテンツ配信基盤開発部 担当部長の谷内崇浩氏(中央)、同部 コンテンツ配信基盤開発部 コアデバイス開発セクション セクションマネ

    サービスの差異化はハードウエアで、ドワンゴの挑戦
  • ネット業界などでのFPGA化について - SANMAN

    勉強を兼ね、Microsoftによる検索エンジンのFPGA化についていろいろ書こうと思う。 今回はバックグラウンドやらの話。 次回はMicrosoftの実装したシステムについてFPGAよりにいろいろ書きなぐる。 無駄に図も作っている。 ひとつ言えるのはソフトウェアエンジニアFPGA方面きたきゃOpenCLガッツリやって趣味レベルFPGA設計やれ。 優秀な兵隊になれるぞ。 ネット企業などにおけるFPGAの用途 現状は2つ ・スループット重視型(大量データの処理) →機械学習 →テキスト検索 →画像検索 ・レイテンシ重視型 →HFT(High Frequency Trade) →RTB(Real Time Bidding) →CEP(Complex Event Processing) に利用されている。 クラウドサービスや巨大なネットサービスを実現するデータセンタでの ・画像認識 ・暗号化

    ネット業界などでのFPGA化について - SANMAN
    t_43z
    t_43z 2015/03/16
  • FPGAエクストリーム・コンピューティング第6回が終わりました #fpgax - Qiita

    FPGAエクストリーム・コンピューティング第6回、今回はドワンゴさんの会場をお借りして開催しました。80席のところ登録数は230名、ニコ生来場者はのべ1773名という盛況ぶりでした。これはやはりMS&ドワンゴさん効果でしょうか。 資料・まとめなど 今回の発表資料やまとめ、ブログ記事等はこちらに集めておきました。 FPGAエクストリーム・コンピューティング第6回 イベント資料一覧 Togetterまとめ 今回のおしながき えびさわさん:FPGAで作るOpenFlow Switch えびさわさんはFPGA仕事で扱い始めてまだ半年ほどだそうですが、今回の発表内容だけを見てるとばりばりハードエンジニアにしか見えませんw すごいーー。OpenFlow仕様は変更が多すぎてASICではとても間に合わずFPGAが適してるという点はなるほどです。また、TCAM(メモリアドレスの代わりにバイナリのパターンマ

    FPGAエクストリーム・コンピューティング第6回が終わりました #fpgax - Qiita
    t_43z
    t_43z 2015/02/03
  • インテルが求める「FPGAアプリケーションエンジニア」とはこんな人 - Qiita

    なんとインテルが、FPGAアプリケーション エンジニアなる職種で求人を始めてた。 From Jobs at Intel この募集要項がいろいろ味わい深いので、まとめてみた。 目的:次世代のクラウドをFPGAでつくる The DCG/CPG (Data Center Group/Cloud Platform Group) team develops technologies that accelerate cloud computing. We are looking for FPGA Application Engineers to help us deliver the next generation cloud computing platforms. 目的はずばり、「次世代クラウドプラットフォームの構築」。単なる組み込みデバイスの開発じゃなくて、データセンター/クラウドプラットフォー

    インテルが求める「FPGAアプリケーションエンジニア」とはこんな人 - Qiita
    t_43z
    t_43z 2014/12/18
  • Microsoft BingのFPGAアクセラレーションについて学ぶ 1 - SANMAN

    MicrosoftのBingをFPGAで高速化した件についての話。 FPGAで処理をしたことよりも、FPGA間ネットワークをイーサネットとは別に用意するシステムアーキテクチャとその運用に注目すべき。 ホモジニアスでありながら高いアクセラレーション効果を得られるように、とても良い設計&使い方をしている。 なお、FPGAを使ったハードウェアアクセラレーション自体はいわゆるスパコンの分野(HPC)等で結構チャレンジ(海外ばかりだが)されてきていて、さして新しいアプローチではない。 最初のアプローチ、集中化 Microsoftはまずサーバーのアクセラレータとして最高のものを作ろうとした。 XilinxのFPGA Spartan6を1個とVertex6を6個使い、PCIeにてホストCPUと接続されたアクセラレータ「BFB Board」。なおSpartan6はPCIe接続(PLXのPCIeチップ)とV

    Microsoft BingのFPGAアクセラレーションについて学ぶ 1 - SANMAN
  • マイクロソフトはどうやってBingをFPGAで実装したか - Qiita

    ドワンゴがニコ動の画像配信向けにFPGAエンジニアを募集したり、マイクロソフトはBingをFPGA実装したり、Baiduもディープラーニングの高速化にFPGAを導入したりと、なんだか世の中急にハードウェアくさくなってきた。IoTとは違う意味で。 金融分野ではすでにCPUでは遅すぎてFPGAによるナノ秒単位の株取引が行われているって記事を書いたのは2年前だけど、ここ数年はIntelのCPUのクロックもあまり上がらなくなってきたし、Fusion-ioやNetezzaといった大手御用達のハイエンド鬼速ストレージも、フタを開ければ中身はすでにFPGAに移行済み。IBMが最近出したData Engine for NoSQLという製品ではPOWER8プロセッサにFPGAを直付けしてRedisを高速化したり。いよいよデータセンターにも、先の見えないCPUに代わってFPGAGPUを導入する波が押し寄せつ

    マイクロソフトはどうやってBingをFPGAで実装したか - Qiita
    t_43z
    t_43z 2014/12/08
    "このあたりの話題に興味がある人は、FPGAエクストリーム・コンピューティングの第6回を1月〜2月に開催予定なので、遊びに来てみるといいです。mesoさんのご協力により、会場はドワンゴさんの予定!"
  • IPSJ 2014

  • 1