y_uukiのブックマーク - はてなブックマーク

Preferred Networks における研究活動 - Preferred Networks Research & Development

こんにちは、新しく執行役員兼 Chief Research Strategist に就任した秋葉です。就任の挨拶を兼ねて、PFN における研究活動に関する考えを共有したいと思います。 PFN における研究とは何か？何が研究であり何が研究でないかという境界を引くのは非常に難しく、またそれを積極的に行う意味もありません。研究とは「研ぎ澄まし究めること」を語義とし、一般に、物事について深く調査・考察を行い事実を解明したり発明を行ったりすることを指します。 PFN では挑戦的であり不確実性の高いプロジェクトが大部分を占めており、ほぼ全てのプロジェクトが少なからず研究的側面を伴います。深層学習関連のコア技術の研究開発は勿論、その応用に関してもデータやタスクに応じた適切な手法の選択や非自明な工夫がなければ上手くいかないことが殆どです。また、ロボティクス、コンピュータビジョン、自然言語処理等のような多

y_uuki 2018/06/08

research

リンク

ChainerMNのクラウド環境向け新機能とAWSにおける性能評価 - Preferred Networks Research & Development

※この記事はChainer Blogの抄訳です Chainer にマルチノードでの分散学習機能を追加するパッケージであるChainerMN に、ネットワークスループットが低いシステム向けの以下の2つの機能をv1.2.0とv1.3.0で追加しました。 Double bufferingによる通信時間の隠ぺい機能半精度浮動小数点数(FP16)によるAll-Reduce機能 ChainerMNは高速なネットワークを持つスーパーコンピュータやMicrosoft Azureのようなシステムを想定して開発してきたため、高速なネットワークのない環境では高い並列性能を達成するのが難しいという問題がありました。しかし、これらの機能を使うことで、GTC2018で発表したようにAmazon Web Services (AWS)のような一般的なシステムでもChainerMNによって高い並列性能を達成することができ

y_uuki 2018/05/26

リンク

「コンピューターサイエンスのすべての分野に精通していること」という応募資格に込めた想い | Preferred Research

※PFNの募集要項は、本ブログの内容をふまえ、適切に意図が伝わるよう一部更新しました PFN代表の西川です。今回は、SNS上でもたびたび話題（炎上？）になっているPFNの応募資格について、改めてご紹介したいと思います。 PFNの採用募集ページに書かれたリサーチャーの条件には、「コンピュータサイエンスのすべての分野に精通していること」という一文があります。この条件は、PFIの時から、リサーチャーの応募資格として常に掲げてきました。その背景にある想いは、コンピュータサイエンスの研究をする上では、一つの分野だけでなく、幅広い分野について深い知見を有することが極めて重要である、ということです。たとえば、データベースの研究をする上では、トランザクション処理の理論や関係代数について詳しく知っているだけではなく、データベースを動かすコンピュータアーキテクチャ、ストレージ、また、今では分散データベース

y_uuki 2018/02/27

research

リンク

ニューラルネットの逆襲から５年後 | Preferred Research

私が2012年にニューラルネットの逆襲（当時のコメント）というのをブログに書いてからちょうど5年が経ちました。当時はまだDeep Learningという言葉が広まっておらず、AIという言葉を使うのが憚られるような時代でした。私達が、Preferred Networks（PFN）を立ち上げIoT、AIにフォーカスするのはそれから1年半後のことです。この5年を振り返る良いタイミングだと思うので考えてみたいと思います。 1. Deep Learning Tsunami 多くの分野がこの5年間でDeep Learningの大きな影響を受け、分野特化の手法がDeep Learningベースの手法に置き換わることになりました。NLP（自然言語処理）の重鎮であるChris Manning教授もNLPで起きた現象を「Deep Learning Tsunami」[link] とよびその衝撃の大きさを表して

y_uuki 2017/11/28

deeplearning

リンク

Go言語でのCI環境構築 - Preferred Networks Research & Development

PFNの柏原です。Go言語製のソフトウェアのCI(Continuous Integration, 継続的インテグレーション)環境の構築方法（導入方法）について解説します。想定としてはgithub上にホストしているOSSプロジェクトのソースツリーをCIの対象とします。OSSのpublicリポジトリなため、無料で使えるサービスを利用対象とします。紹介する各CIサービスすべてでGo言語を扱えますが、まず最初にサービスを利用する上で各サービスについて結論から述べます。その後、各CI環境（OS、Goバージョン）、設定ファイルの例を説明します。今回はTravis CI、CircleCI、Codeship、AppVeyor の4つのサービスを紹介します。結論から結論から書きますと、Linux, OS X, Windowsの各種OSプラットフォームで同時にCIを動かしたいなら、Travis CI(

y_uuki 2015/12/01

golang
ci

リンク

100倍で考える - Preferred Networks Research & Development

私が最近強く印象に残った言葉が10倍で物事を考えるです[wired]。これが私の記憶の中で拡大解釈され、今は100倍で物事を考えるようになっています。「100倍」というのは一見すると不可能なことの例えのように思えますが、決してそんなことはありません。どの程度現実的か例をあげて考えてみましょう。 DWH（DBと考えても良いです）という分野を考えてみます*1。 *1 この分野は専門家ではないのであくまで外から見ている素人の意見です。 2014年10月現在 Google BigQueryは1GBの保存に月あたり約3円、クエリ時1TBスキャンあたり500円という価格設定です。基本的なDBの操作は全部できて、その上でユーザーが自由に関数を定義できて、画面とつながって結果が数十秒で返ってきてです。これはこの分野を知る人にとっては衝撃的な価格です。 1昔前、DWHの世界では製品が数千万から数億円

y_uuki 2014/10/21

リンク

技術と時機 - Preferred Networks Research & Development

2000年前後、クラウドという言葉が立ち上がった時、クラウドビジネスを立ち上げた企業の多くは失敗しました。（例：opsware 彼らはその後システム運用ツール提供で生き残ることができました）。クラウドという言葉はそれ以降あまり聞くことはなくなりました。2006年GoogleのErick Schmidtがクラウドという言葉を再登場させ、AmazonがAWSを提供開始します。それ移行クラウドは爆発的に普及し、ITの戦場は全てクラウドに移行しつつあります。（IBMですら、半導体部門を売却しクラウドに移行できるかに社運をかけています link）自社運用やDC運用をしている企業もまだ多く存在しますが、パブリック・クラウドを利用している企業の競争力は増すため、今後10年ぐらいを考えるとパプリッククラウドの影響力はさらに増していくと考えられます。 IoTという言葉も1999年から存在します。私自

y_uuki 2014/10/21

リンク

顔認証技術: DeepFace と Pyramid CNN - Preferred Networks Research & Development

得居です。3月下旬とは思えない寒さに凍えています。 Facebook が CVPR2014 に投稿しアクセプトされていた顔認証に関する論文 [1] が MIT Techno logy Review にて紹介されたことで注目を集めています。DeepFace と名付けられた手法で、同社が集めた4030人の顔写真440万枚を用いた大規模学習によってほぼ人間並の人物識別性能を達成しているということで、なかなかキャッチーな話題です。一方、Face++ という顔認証・分類のプラットフォームを展開する Megvii社がつい先日公開したプレプリント [2] でも DeepFace と同程度の性能を達成しています。今日はこの2つの論文を解説します。 DeepFace の論文では、検出された顔矩形に対して以下の3つの処理を施しています。矩形の2次元アラインメント 3次元モデルを用いた out-of-plan

y_uuki 2014/09/24

へ〜

論文

リンク

SIGMOD 2014 に参加しました - Preferred Networks Research & Development

初めまして，新入社員の楠本です．今年の4月からPFIで働いています．先週 SIGMOD 2014 (Special Interest Group on Management of Data) という学会に参加してきたのでその参加記を記したいと思います． SIGMOD はデータベース分野でトップに位置づけられる会議の1つです．SIGMOD では併設で PODS という理論系データベースの会議も同時開催されています．今年はアメリカ合衆国ユタ州のスノーバードというスキーリゾート地で開催されました．この時期は夏だったのでスキーはなかったのですが自然が雄大な場所でした．(↓写真) 今回は修士時代にやっていた研究の論文が受理されたので，発表(と他の発表の聴講)をするために参加しました．会議について SIGMOD/PODS は全部で6日間開催されており，以下のようなスケジュールで行われていました．

y_uuki 2014/09/24

論文

リンク

ACL2014読み会を開きました - Preferred Networks Research & Development

ワールドカップで寝不足の海野です。ドイツ強かったですね。先週末の7/12（土）に、PFIオフィスにてACL2014読み会を開きました。ACLとは最もメジャーな自然言語処理の国際学会で、先月2014年の会議が行われたので、その論文を読んで発表しあいました。狭い部屋でしたが、およそ30人の方に参加いただき、発表11件でした。質問も沢山飛んで盛況だったように思います。参加者も、大学や研究機関の先生から、企業の研究員、エンジニア、学生まで幅広くバランスよく参加していただけたようです。そのままオフィスで懇親会を行いましたが、実務で自然言語処理を活用されている方が多く、技術交流が進んだのであれば幸いです。以下、発表された論文へのリンクと、当日の発表資料（アップされた分だけ）です。 @unnonouno How to make words with vectors: Phrase generati

y_uuki 2014/09/24

論文

リンク

システム系論文輪読会を開きました - Preferred Networks Research & Development

柏原です。PFIでは夏季インターンシップがついに始まりました。インターンとは関係ないのですが、昨日の2014年8月6日（水）、PFIオフィスにてシステム系論文輪読会を開きました。趣旨としては参加者が好みのカンファレンスなどからシステム系の論文を読んできて発表するものです。システム系といっても分野は絞りきれず幅広いのですが、普段PFI社内では話題にあがらないであろうテーマを期待して、参加者を募って開催しました。普段の日常生活では扱わない分野のシステムについて見識を広めることができたら幸いです。今回は5名の方に参加、発表していただきました。私からは非中央集権型のストリーム処理系について話をしました。参加者の方からは発表順に、Infinibandを用いた高速なKVSの実装、PaaS向けx86コードのsandbox手法、Facebookにおける画像キャッシュのアーキテクチャ、SDNにおけ

y_uuki 2014/09/24

論文

リンク

異常検知の世界へようこそ - Preferred Networks Research & Development

比戸です。先週Jubatusの最新0.4.0がリリースされましたが、外れ値検知機能の追加が目玉の一つとなっています（jubaanomaly）。昨年PFIへ入社して初めて手がけた仕事が公開されたということで感慨ひとしおですが、便乗してあまり語られることのない異常検知の世界について書きたいと思います。以下の資料は昨年のFIT2012で使ったものです。異常検知とは簡単にいえば、「他に比べて変なデータを見つけ出す」タスクです。お正月にテレビで繰り返し流れた、おすぎとピーコのCM(*1)がわかりやすいイメージですね。機械学習の枠組みで言えば”教師無し学習”に属します。分類や回帰、クラスタリングなど応用も多く人気も研究熱も高いタスクに比べると、マイナーです。SVMとか、Random Forestとか、Boostingとか、最近だとDeep Neural Networkとか、有名な必殺技アルゴリズム

y_uuki 2013/12/11

machinelearning

リンク

技術を実用化する - Preferred Networks Research & Development

論文の最後に「この技術はこれから様々な場面で役に立つだろう」と書いてあるのを読んだり、実際に書いた人がいると思います。研究者の視点からは「十年に一度のすごい発見が起きた」場面に出くわし、世の中にどのような影響を与えるのだろうと思うこともあります。しかし殆どの技術は世の中で活かされることはありません。なぜなら技術を実用化するには非常に多くの困難が必要とされるからです。そもそも、殆どの技術は誕生したとしても人の頭に留まっています。ものすごくいい手法を思いついた、としてもそれを言語などで外在化させない限り、その技術がその人以上に世の中に広まることはありません。有名な例でBurrows-Wheeler変換という今のゲノムシーケンシングを支える技術はWheeler氏が「あまりにも当然である」ことから論文化していませんでした。Burrowsの勧めでこの技術はDECの社内報として発表され、現在のように

y_uuki 2013/12/10

Preferred Infrastructure

リンク

モダン並列・並行プログラミング～ Concurrent Revisions による実装と現実～ - Preferred Networks Research & Development

本日社内向けのTechTalkにて、並列・並行プログラミングに関する話を行いました。昨今、プログラムの並列化はなくてはならないものとなっています。しかし、そのプログラミング環境は依然としてロックを用いたものが主流です。今回の発表の主張を端的に申し上げますと、 “Locks must go！” ということになります。並列プログラミングに銀の弾丸はありません。しかし、ロックは別の何らかの安全性を確保したプログラミングモデルで置き換えられなければいけません。そうでなければ、再現しにくいバグに苦しめられ、終電を逃す日々と決別することはできないでしょう。また、ロックによるプログラミングの抱える本質的問題にも言及しています。この界隈の最新の動向として、去年OOPSLA’10にて発表されたConcurrent Revisionsについての解説も行なっております。また、弊社研究開発において、先日Con

y_uuki 2013/01/20

並列処理

リンク

高速な安定ソートアルゴリズム "TimSort" の解説 - Preferred Networks Research & Development

先日、TimSortというソートアルゴリズムが話題になりました。TimSortは、高速な安定ソートで、Python(>=2.3)やJava SE 7、およびAndroidでの標準ソートアルゴリズムとして採用されているそうです。 C++のstd::sort()よりも高速であるというベンチマーク結果1が話題になり(後にベンチマークの誤りと判明)、私もそれで存在を知りました。実際のところ、ランダムなデータに対してはクイックソート(IntroSort)ほど速くないようですが、ソートというシンプルなタスクのアルゴリズムが今もなお改良され続けていて、なおかつ人々の関心を引くというのは興味深いものです。しかしながら、オリジナルのTimSortのコードは若干複雑で、実際のところどういうアルゴリズムなのかわかりづらいところがあると思います。そこで今回はTimSortのアルゴリズムをできるだけわかりやすく解

y_uuki 2012/05/30

リンク

専門知識の仕入れ方 - Preferred Networks Research & Development

今日は，普段どのようにして専門知識を仕入れているかについて書いてみようと思います．特に自分が得意でない分野を知りたいと思った時に，どうするかに注目したいと思います．自分の専門の場合は，いくらでも時間を注ぐことが出来るので，世界中のリソースを全て探し当てて勉強すれば良いのですが，ちょっと興味が有るぐらいではそこまでやる時間は取れません．なので出来るだけ効率的に分かった気になるのが目標です．まず，論文を直接読むのはあまり効率的では無いと思います．論文は広い分野の中の或る問題に対して一つの解決方法を書いているだけで，分野全体を俯瞰することは目指していません．論文だけ読んで分野全体を理解するには，最低50本ぐらい読む必要が有ると思います．

y_uuki 2011/09/20

リンク

はてなブックマーク

タグ

ブックマーク / tech.preferred.jp (16)

お知らせ

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

今週のはてなブックマーク数ランキング（2024年6月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス