lEDfm4UEのブックマーク - はてなブックマーク

ハイパーパラメータ自動最適化ツール「Optuna」公開 - Preferred Networks Research & Development

ハイパーパラメータ自動最適化フレームワーク「Optuna」のベータ版を OSS として公開しました。この記事では、Optuna の開発に至った動機や特徴を紹介します。公式ページ公式ドキュメントチュートリアル GitHub ハイパーパラメータとは？ハイパーパラメータとは、機械学習アルゴリズムの挙動を制御するパラメータのことです。特に深層学習では勾配法によって最適化できない・しないパラメータに相当します。例えば、学習率やバッチサイズ、学習イテレーション数といったようなものがハイパーパラメータとなります。また、ニューラルネットワークの層数やチャンネル数といったようなものもハイパーパラメータです。更に、そのような数値だけでなく、学習に Momentum SGD を用いるかそれとも Adam を用いるか、といったような選択もハイパーパラメータと言えます。ハイパーパラメータの調整は機械学習ア

lEDfm4UE 2018/12/04

あとで読む

リンク

ChainerMNのクラウド環境向け新機能とAWSにおける性能評価 - Preferred Networks Research & Development

※この記事はChainer Blogの抄訳です Chainer にマルチノードでの分散学習機能を追加するパッケージであるChainerMN に、ネットワークスループットが低いシステム向けの以下の2つの機能をv1.2.0とv1.3.0で追加しました。 Double bufferingによる通信時間の隠ぺい機能半精度浮動小数点数(FP16)によるAll-Reduce機能 ChainerMNは高速なネットワークを持つスーパーコンピュータやMicrosoft Azureのようなシステムを想定して開発してきたため、高速なネットワークのない環境では高い並列性能を達成するのが難しいという問題がありました。しかし、これらの機能を使うことで、GTC2018で発表したようにAmazon Web Services (AWS)のような一般的なシステムでもChainerMNによって高い並列性能を達成することができ

lEDfm4UE 2018/05/27

あとで読む

リンク

ニューラルネットの逆襲から５年後 | Preferred Research

私が2012年にニューラルネットの逆襲（当時のコメント）というのをブログに書いてからちょうど5年が経ちました。当時はまだDeep Learningという言葉が広まっておらず、AIという言葉を使うのが憚られるような時代でした。私達が、Preferred Networks（PFN）を立ち上げIoT、AIにフォーカスするのはそれから1年半後のことです。この5年を振り返る良いタイミングだと思うので考えてみたいと思います。 1. Deep Learning Tsunami 多くの分野がこの5年間でDeep Learningの大きな影響を受け、分野特化の手法がDeep Learningベースの手法に置き換わることになりました。NLP（自然言語処理）の重鎮であるChris Manning教授もNLPで起きた現象を「Deep Learning Tsunami」[link] とよびその衝撃の大きさを表して

lEDfm4UE 2017/11/29

あとで読む

リンク

分散深層学習パッケージ ChainerMN 公開 - Preferred Networks Research & Development

Chainer にマルチノードでの分散学習機能を追加するパッケージ ChainerMN のベータ版を公開しました。 GitHub ドキュメント ChainerMN とは ChainerMN は Chainer の追加パッケージで、Chainer を用いた学習を分散処理により高速化できます。柔軟で直感的に利用できる Chainer の利便性をそのままに、学習時間を大幅に短縮できます。1 ノード内の複数の GPU を活用することも、複数のノードを活用することもできます。既存の学習コードから数行の変更で ChainerMN を利用可能です。ChainerMN は既に社内の複数のプロジェクトで実証が行われています。 Chainer を用いた通常の学習における 1 イテレーションは下図のように Forward, Backward, Optimize の 3 つのステップからなります。 Chainer

lEDfm4UE 2017/05/10

あとで読む

リンク

人工知能技術の健全な発展のために - Preferred Networks Research & Development

4月10日の日経ITproの記事「 AIベンチャーの雄が総務省の開発指針に反対する理由」で、総務省主導で推進されているAIネットワーク社会推進会議とその開発原則分科会からPFNが離脱したことを、取り上げていただきました。私とのとりとめのないインタビューを適切にまとめてくださった日経ITpro浅川記者に深く感謝いたします。また、その記事に対して、はてなブックマーク、NewsPicks、FacebookなどのSNSを通して多くのコメントを下さった方にも感謝の意を表します。ありがとうございます。離脱の理由は記事にある通りですが、総務省の方々も私達の立場を真摯に受け止めてくださっていて、実りのある議論を続けてくださっています。その上で、今後の議論を深めるために、いくつかの点について補足したいと思います。汎用人工知能と特化型人工知能現在、人工知能という言葉は大雑把には、汎用人工知能（「強い」人

lEDfm4UE 2017/04/12

あとで読む

リンク

ChainerMN による分散深層学習の性能について - Preferred Networks Research & Development

米サンフランシスコで開催された「Deep Learning Summit 2017」にて、PFN は Chainer のマルチノードでの分散学習対応への取り組みについて発表しました。本記事では、その発表について詳しく説明していきます。分散深層学習の重要性と現状 GPU の性能は継続的に向上していますが、より大きなデータを活用してより精度の高いモデルを実現するために、深層学習で使われるモデルのパラメータ数や計算量も増大しています。そのため、現在でも、Chainer を含む一般的なフレームワークを用いた標準的な学習では 1 週間以上かかってしまうようなユースケースが少なくありません。より大規模なデータを扱ったり、試行錯誤のイテレーションを効率化するために、複数の GPU を連携させ学習を高速化させることは重要な課題です。そこで、我々は Chainer にマルチノードでの分散学習の機能を追加す

lEDfm4UE 2017/02/10

あとで読む

リンク

EMNLP2015読み会を開催しました - Preferred Networks Research & Development

海野です。10/24に、リクルートテクノロジーズさんの会議室で、EM NLP2015読み会を開催しました。 10件の発表と、およそ40人の参加者が集まりました。昨年も開催しましたが、規模が2倍程度になり、この分野への注目度が伺えます。特にEmbeding系の論文が多かったらしく、EM NLPのEはEmbeddingのEではないか、という皮肉があったそうです。 10本の発表中、2本がattentionベースの手法で、Embedding、RNNに続いて次のトレンドになりつつあるのかなという感触を得ました。当日のTwitterの様子は、togetterにまとめました。最後に、会場提供や運営を手伝っていただいた、リクルートテクノロジーズ様と、@yag_aysさんに感謝いたします。以下に発表スライドの一覧を載せます。 @Quasi_quant2010 Learning Better Embed

lEDfm4UE 2015/11/03

リンク

画風を変換するアルゴリズム - Preferred Networks Research & Development

Deep Neural Networkを使って画像を好きな画風に変換できるプログラムをChainerで実装し、公開しました。 https://github.com/mattya/chainer-gogh こんにちは、PFNリサーチャーの松元です。ブログの1行目はbotに持って行かれやすいので、3行目で挨拶してみました。今回実装したのは”A Neural Algorithm of Artistic Style”(元論文)というアルゴリズムです。生成される画像の美しさと、画像認識のタスクで予め訓練したニューラルネットをそのまま流用できるというお手軽さから、世界中で話題になっています。このアルゴリズムの仕組みなどを説明したいと思います。概要 2枚の画像を入力します。片方を「コンテンツ画像」、もう片方を「スタイル画像」としましょう。このプログラムは、コンテンツ画像に書かれた物体の配置をそのま

lEDfm4UE 2015/09/21

リンク

分散深層強化学習でロボット制御 - Preferred Networks Research & Development

新入社員の松元です。はじめまして。 “分散深層強化学習”の技術デモを作成し、公開いたしました。ロボットカーが0から動作を学習していきます！まずはこの動画を御覧ください。以下で、動画の見どころと、使っている技術を紹介します。動画の見どころ Car 0(○の付いている車)が右折カーブの手前で減速する様子(右画面の白いバーのところが、ブレーキのところで赤くなっている。ニューラルネットはブレーキが最も多く報酬が得られると推測していることがわかる)。速い速度ほど報酬は大きいが、カーブを曲がりきれず壁にぶつかってしまうので学習が進むとカーブ手前でのみ減速するようになる。目の前に車がいるときは一時停止して、いなくなってから加速する。エチオピアには本当にこのような交差点があるらしい。ぎりぎりですれ違う2台。学習途中ではすれ違いきれずにぶつかって倒れてしまうこともある(早送りシーン中に人が写って

lEDfm4UE 2015/06/12

リンク

Deep Learning のフレームワーク Chainer を公開しました - Preferred Networks Research & Development

こんにちは、得居です。最近は毎晩イカになって戦場を駆けまわっています。本日、Deep Learning の新しいフレームワークである Chainer を公開しました。 Chainer 公式サイト GitHub – pfnet/chainer Chainer Documentation Chainer は、ニューラルネットを誤差逆伝播法で学習するためのフレームワークです。以下のような特徴を持っています。 Python のライブラリとして提供（要 Python 2.7+）あらゆるニューラルネットの構造に柔軟に対応動的な計算グラフ構築による直感的なコード GPU をサポートし、複数 GPU をつかった学習も直感的に記述可能ニューラルネットをどのように書けるか次のコードは多層パーセプトロンの勾配を計算する例です。 from chainer import FunctionSet, Vari

lEDfm4UE 2015/06/09

リンク

Deep Learningと自然言語処理 - Preferred Networks Research & Development

クリスマスイブの夜は男三人しかいないオフィスで関数型言語の素晴らしさについて語っていた西鳥羽です。こんにちは。昨日のPFIセミナーで「Deep Learningと自然言語処理」というタイトルで発表させていただきました。以下がその時の資料です。この辺りに興味を持たれた方は今度の1月20日に「NIPS 2014 読み会」http://connpass.com/event/10568/ もどうぞ。残り枠数少ないので申し込みはお早めに。本当はBoltzmann Machine, Deep Belief Network, Auto Encoder, Stacked Auto EncoderなどのDeep Learningの歴史的なところも説明したかったのですが端折ってしまいました。Deep Learningそのものの説明も含めて以下の資料が参考になります。 http://ci.nii.ac.j

lEDfm4UE 2014/12/28

リンク

EMNLP2014読み会を開催しました - Preferred Networks Research & Development

海野です。先週末の11/22（土）に、PFIオフィスにてEM NLP2014読み会を開催しました。7月に行ったACL2014読み会の続編です。EM NLPとは、自然言語処理の国際会議で最もメジャーとされるものの１つで、10月に今年の会議が開催されたので、気になる論文をみんなで紹介しました。前回に引き続き、30人弱の方にお集まり、8件の発表が行われました。エンジニアや学生の方を中心に、いろんな方に集まっていただけたようで良かったです。当日のTwitterの様子は、togetterにまとめました。今回初めての試みとして、Ustreamの配信と録画を行いました。カメラで撮った映像なので、画質は荒いです。発表者のスライドを横に置きながら見ていただくことをおすすめします。 EM NLP読み会 #1 Broadcast live streaming video on Ustream EM NLP読み会

lEDfm4UE 2014/11/27

リンク

技術と時機 - Preferred Networks Research & Development

2000年前後、クラウドという言葉が立ち上がった時、クラウドビジネスを立ち上げた企業の多くは失敗しました。（例：opsware 彼らはその後システム運用ツール提供で生き残ることができました）。クラウドという言葉はそれ以降あまり聞くことはなくなりました。2006年GoogleのErick Schmidtがクラウドという言葉を再登場させ、AmazonがAWSを提供開始します。それ移行クラウドは爆発的に普及し、ITの戦場は全てクラウドに移行しつつあります。（IBMですら、半導体部門を売却しクラウドに移行できるかに社運をかけています link）自社運用やDC運用をしている企業もまだ多く存在しますが、パブリック・クラウドを利用している企業の競争力は増すため、今後10年ぐらいを考えるとパプリッククラウドの影響力はさらに増していくと考えられます。 IoTという言葉も1999年から存在します。私自

lEDfm4UE 2014/10/21

リンク

100倍で考える - Preferred Networks Research & Development

私が最近強く印象に残った言葉が10倍で物事を考えるです[wired]。これが私の記憶の中で拡大解釈され、今は100倍で物事を考えるようになっています。「100倍」というのは一見すると不可能なことの例えのように思えますが、決してそんなことはありません。どの程度現実的か例をあげて考えてみましょう。 DWH（DBと考えても良いです）という分野を考えてみます*1。 *1 この分野は専門家ではないのであくまで外から見ている素人の意見です。 2014年10月現在 Google BigQueryは1GBの保存に月あたり約3円、クエリ時1TBスキャンあたり500円という価格設定です。基本的なDBの操作は全部できて、その上でユーザーが自由に関数を定義できて、画面とつながって結果が数十秒で返ってきてです。これはこの分野を知る人にとっては衝撃的な価格です。 1昔前、DWHの世界では製品が数千万から数億円

lEDfm4UE 2014/10/06

*あとで

リンク

Group Lassoでグループごと重みが0に潰れる理由 - Preferred Networks Research & Development

海野です。先日会社の論文読み会で、ICML2014のMaking the Most of Bag of Words: Sentence Regularization with Alternating Direction Method of Multipliersという論文を紹介しました。さて、この時話題になったのが正則化項をグループ化すると何でグループごと重みが0に潰れるのかという話でした。式を見ても直感的にはわからなかったのですが、得居さんがとてもわかり易い説明をしてくれました。この話、日本語で検索してもあまり出てこないのでちょっと紹介します。まず、Lassoというのは、正則化項にL1normを使ったいわゆるL1正則化のことで、大部分の重みが0に潰れて疎な解が得られます。 \(\Omega_{\mathrm{lasso}}(\mathbf{w}) = \|\mathbf{w}\|_1

lEDfm4UE 2014/08/10

リンク

第2回全脳アーキテクチャ勉強会でDeep Learningについて講演しました - Preferred Networks Research & Development

得居です。1月30日にリクルートGINZA8ビルで開催された第2回全脳アーキテクチャ勉強会にて、Deep Learningについて講演しました。全脳アーキテクチャ勉強会は「人間のように柔軟汎用な人工知能の実現に興味のある研究者、脳に興味のあるエンジニア，関連分野(神経科学、認知科学等)の研究者間での交流をはかりつつ、こうした取組へ関わるきっかけ」作りが目的の勉強会です。今回は主催者の一人である産総研の一杉裕志先生、筑波大学の酒井宏先生、そして私が講演を行いました。最終的な来場者数は把握しておりませんが、200名超の大規模な勉強会となりました。私の発表は Deep Learning の最近の進展について、できるだけ幅広い学習手法やモデルを紹介する内容です。各手法の実際の成果がどうかというよりは、今後の研究の種になりそうな面白そうな話題を詰め込みました。発表後にも多数の質問を頂き、その後の

lEDfm4UE 2014/02/24

リンク

データ解析作業の救世主！超絶☆実験ビルドシステムmafをOSS公開しました - Preferred Networks Research & Development

Photo by midiman under Creative Commons License (original) メリークリスマフ！得居です。今日はクリスマスですね。皆様昨日はいかがお過ごしでしたでしょうか？クリスマスということで、今日は私たちから皆様に、特にデータ解析や論文執筆、手法の比較検証のために計算機上で様々な実験をしている方々に、プレゼントがあります！ Github – pfi/maf 今日、実験結果を「ビルドする」ためのツールmafを公開しました！ mafは、PFIでもよく使われているPythonベースのビルドツールwafを実験に使うための拡張です。大まかな使い方を学ぶために、ドキュメントとサンプルも公開しています。 maf — maf 0.1 documentation サンプル実験手順をビルドだと思って宣言的に書くこと自体はwaf等既存のビルドツールで可能です。m

lEDfm4UE 2013/12/29

リンク

バイオロジー分野での取り組みの紹介 - Preferred Networks Research & Development

大野です。寒くなりましたね。現在バイオプロジェクトのリーダーを務めています。最近外部のライフサイエンス機関と協業に関するプレスリリースがいくつかあり、反響を多く頂きました。折角の機会ですのでPFIでのバイオ・ヘルスケア・医療分野でのこれまでの取り組みや今後の方向性について紹介をさせていただきたいと思います。次世代シーケンサーなどを始めとして、バイオ・医療・ヘルスケア分野では蓄積されるデータ量は爆発的に増加しています。しかし、それらの解析技術は研究レベルでは数多く存在するものの、マッチングがうまくいかず、実際の現場で活かせていないケースが少なくないようです。バイオプロジェクトではこれらの分野で現れるデータに対して情報検索技術、機械学習技術を活用する事を目標として取り組んでいます。これはPFIが開発に携わっている機械学習基盤Jubatusの将来の応用先を説明した図です。今後の適用領域とし

lEDfm4UE 2013/11/17

リンク

分散並列環境における機械学習 - Preferred Networks Research & Development

もうすぐ春ですね。花粉さえ飛ばなければ最高なのに。岡野原です。先日、Hadoop Conference Japan 2011で、”MapReduceによる大規模データを利用した機械学習”というタイトルで発表しました。発表内容は三部構成になっています。最初に、機械学習の基本と、それがMapReduceとどのような関係にあるかを紹介しました。その中でHadoop上で動く機械学習ライブラリMahoutの簡単な紹介をしました。次に、機械学習の最前線ではどのような問題が解かれているかを紹介し、グラフィカルモデルの例、一般の最適化（教師付き学習におけるパラメータ学習）の分散並列化についての話題をしました。最後に、MapReduceの補完として使えるようなシステムの例としてdremelを紹介しました。このシステムはMapReduceがバッチ型処理で、全データが処理対象の場合が得意なのに対し、一

lEDfm4UE 2013/07/14

*あとで

リンク

異常検知の世界へようこそ - Preferred Networks Research & Development

比戸です。先週Jubatusの最新0.4.0がリリースされましたが、外れ値検知機能の追加が目玉の一つとなっています（jubaanomaly）。昨年PFIへ入社して初めて手がけた仕事が公開されたということで感慨ひとしおですが、便乗してあまり語られることのない異常検知の世界について書きたいと思います。以下の資料は昨年のFIT2012で使ったものです。異常検知とは簡単にいえば、「他に比べて変なデータを見つけ出す」タスクです。お正月にテレビで繰り返し流れた、おすぎとピーコのCM(*1)がわかりやすいイメージですね。機械学習の枠組みで言えば”教師無し学習”に属します。分類や回帰、クラスタリングなど応用も多く人気も研究熱も高いタスクに比べると、マイナーです。SVMとか、Random Forestとか、Boostingとか、最近だとDeep Neural Networkとか、有名な必殺技アルゴリズム

lEDfm4UE 2013/01/19

*あとで

リンク

はてなブックマーク

タグ

ブックマーク / tech.preferred.jp (50)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス