ブックマーク / tech.preferred.jp (63)

  • 表形式データに対する深層学習ライブラリの開発と実験 - Preferred Networks Research & Development

    記事は、2021年度PFN夏季インターンシップで勤務した平川雅人さんと畠山智之さんによる寄稿です。 はじめに 2021年度PFN夏季インターン生の平川雅人と畠山智之です。 今回のインターンでは、表形式データに対して様々な深層学習モデルを試すことができるライブラリを共同で開発しました。開発したライブラリは https://github.com/pfnet-research/deep-table で公開しています。 背景 近年、深層学習は画像や自然言語、音声の分野で目覚ましい成功を収めてきました。しかし表形式データに対しては、深層学習はそのような成功を遂げることは少なく、いまだにXGBoostやLightGBMのような決定木ベースのモデルが主流となっています。 深層学習の有望な手法として、決定木のアンサンブルを模倣して勾配ベースの学習を可能にしたNODE [1] や、スパースなattenti

    表形式データに対する深層学習ライブラリの開発と実験 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2021/10/02
  • 不可視マーカー(Invisible marker)を用いたセグメンテーションマスクの自動アノテーション手法 - Preferred Networks Research & Development

    リサーチャーの高橋城志(Kuniyuki Takahashi)とエンジニアの米倉健太(Kenta Yonekura)です. 二人の共著でIROS2020で発表しましたので,論文を紹介します.論文,データセット,動画は下記から閲覧できます. 論文タイトル:Invisible Marker: Automatic Annotation of Segmentation Masks for Object Manipulation 論文のリンク:https://arxiv.org/abs/1909.12493 データセット:https://github.com/pfnet-research/Invisible_marker_IROS2020 論文の動画:https://www.youtube.com/watch?v=fnpyDYUvDA4&feature=youtu.be 物体認識の課題 ロボットで物

    不可視マーカー(Invisible marker)を用いたセグメンテーションマスクの自動アノテーション手法 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2021/01/16
  • 少数の病変部位アノテーションを活用したMultiple Instance Learningの拡張 - Preferred Networks Research & Development

    記事は,2020年インターンシッププログラムで勤務された髙木優介さんによる寄稿です. はじめに PFN2020夏季インターンに参加させていただいた,名古屋工業大学大学院修士1年の髙木優介です.研究室では,医用画像に対する機械学習,メタ学習の研究を行なっています.今回のインターンではMultiple Instance Learning (MIL) と呼ばれる手法において,病変部位のアノテーションを含まない画像に加え,一部のみ病変部位のアノテーションが付与された画像も使用できる設定で学習を行う研究に取り組みました. 背景 近年,医用画像(X線画像,CT画像,病理画像など)に対して機械学習を用いて,診断補助や臓器のセグメンテーションなどを行う研究が数多く存在します.しかし,医用画像を機械学習で用いる上で2つの大きな問題点が存在します. 1つ目は,医用画像が大抵の場合,機械学習で扱うには大きすぎ

    少数の病変部位アノテーションを活用したMultiple Instance Learningの拡張 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2020/11/11
  • TOP500とGreen500:コンピュータの性能指標をどう読むか - Preferred Networks Research & Development

    1. はじめに 2020年6月22日深夜(日時間)にリモート開催されたISC2020のTOP500セッションで、PFNが作った深層学習用スーパーコンピュータ、MN-3が21.11 GFlops/WのHPLベンチマークの実行性能をあげ、Green500ランキングで500システム中No.1になりました(写真1)。開発チームの一員として、ここに至るまでの苦労の連続を思うと、とても嬉しいです。 なお、同日発表されたTOP500, HPCG, Graph500, HPL-AIベンチマークでは、理研に設置された「富岳」システムが各々500システム中1位、68システム中1位、10システム中1位、2システム中1位と、1位を多数達成したことも、ポスト京プロジェクト(富岳と命名される前の名前)の前座プロジェクトや、システム評価にかかわったものとして嬉しく思います。 このBlogでは最近増えてきてちょっと混乱

    TOP500とGreen500:コンピュータの性能指標をどう読むか - Preferred Networks Research & Development
    yag_ays
    yag_ays 2020/07/19
  • Optuna の拡張機能 LightGBM Tuner によるハイパーパラメータ自動最適化 - Preferred Networks Research & Development

    Optuna 開発メンバの小嵜 (@smly) です。この記事では Optuna拡張機能として開発している LightGBM Tuner について紹介します。 LightGBM Tuner は LightGBM に特化したハイパーパラメータ自動最適化のためのモジュールです。Pyhton コードの import 文を 1 行変更するだけで簡単に利用できます。LightGBM Tuner はエキスパートの経験則を自動化しコードに落とし込むことで、従来より短い時間で最適なハイパーパラメータを探索できます。また記事の後半では従来手法と比較したベンチマーク結果についても紹介します。ベンチマークをとることで、従来の方法と比較して効率的に探索できることを確認しました。 ナイーブな LightGBM のハイパーパラメータチューニング LightGBM は勾配ブースティング法の高速な実装を提供する人気の

    Optuna の拡張機能 LightGBM Tuner によるハイパーパラメータ自動最適化 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2020/01/20
  • Announcing Optuna 1.0 - Preferred Networks Research & Development

    yag_ays
    yag_ays 2020/01/15
  • Graph Neural Network を用いたグラフの木幅予測 - Preferred Networks Research & Development

    記事は、2019年夏のインターンシップに参加された中野裕太さんによる寄稿です。 皆様はじめまして。2019 年 PFN 夏季インターンシップに参加していた北海道大学の中野裕太です。ブログでは、私が夏季インターンで取り組んだテーマである、「Graph Neural Network を用いたグラフの木幅予測」について説明します。 要旨 与えられた無向グラフがどれくらい木に近いかを表す値である木幅は、グラフ上の組み合わせ最適化問題に対するアルゴリズムの効率性や解そのものと深く関係しています。しかし、木幅を計算することは NP 困難なため、木幅を計算するには頂点数に対し指数時間かかってしまいます。そこで、今回 Graph Neural Network を用いた 2 つの方法でこの問題にアプローチしました。1 つ目は、よく知られた既存のアルゴリズムと組み合わせ探索木の枝刈りを行い高速化を図り計算

    Graph Neural Network を用いたグラフの木幅予測 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2019/10/10
  • Disentangled な表現の教師なし学習手法の検証 - Preferred Networks Research & Development

    記事は、2019年インターンシップに参加された蕭喬仁さんによる寄稿です。 はじめまして。PFN の2019夏季インターンシップに参加した東京大学の蕭喬仁です。 大学では自然言語処理について研究しており、SNS からのマイニングに興味があります。 今回のインターンでは「Disentangled な表現の教師なし学習手法の検証 (Unsupervised Disentangled Representation Learning)」というテーマで研究を行いましたので、その紹介をいたします。 実験に使用したコードはこちら https://github.com/pfnet-research/chainer-disentanglement-lib で公開しています。 Disentangledな表現 映画 Star Wars がお好きな方は ”imperial entanglements” という表現

    Disentangled な表現の教師なし学習手法の検証 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2019/10/08
  • スポーツ映像に対するシーンのアノテーション効率化 - Preferred Networks Research & Development

    記事は、2019年インターンシップとして勤務した佐々木 克仁さんによる寄稿です。 はじめまして。PFNの2019年夏季インターンシップに参加させていただいた東京大学修士1年の佐々木克仁です。大学ではHCIの研究をしています。WEB開発が好きです。 テーマとその背景 今回のインターンシップで私が取り組んだ研究テーマは「スポーツ映像に対するシーンのアノテーション効率化」です。 PFNでは、スポーツ映像の中でチームが取っている戦術を推定し、スポーツの戦術解析に応用するシステムを開発しています。このような推定を実現する機械学習モデルを学習するためには、チームが取っている戦術とその時間範囲(以降シーンと呼びます)がスポーツ映像にアノテーションされた大量のデータセットが要求されます。しかし、スポーツ映像におけるシーンの戦術レベルでの詳細な区別を一般の人々が行うのは困難で、そのスポーツに精通した専門家

    スポーツ映像に対するシーンのアノテーション効率化 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2019/10/04
  • 化学反応におけるDeep learningの適用 - Preferred Networks Research & Development

    近年様々な分野に対してDeep learningの応用が研究されてきています。 化学の分野でも物性値の予測モデルや、化合物の生成モデルの研究などが盛んになってきています。最近では、有機化合物の合成を行う際に必要な化学反応の予測をDeep learningで行うという試みが行われてきているのでその先行研究サーベイをしました。 サーベイ資料はこちらのSlideshareにアップロードしています。 問題設定:反応予測および逆合成経路探索 化学反応で、反応物 (reactant) AとBを触媒 (reagent) Cの下で反応させたときに 生成物 (product) D ができたようなプロセスは Reaction SMILES を用いると “A.B.C>>D” というように表すことができます。 ここで、 AとBとC から何ができるか? (答えはD)を予測する問題を順方向の反応予測問題と呼び、Dを作

    化学反応におけるDeep learningの適用 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2019/09/07
  • ACL 2019 参加レポート - Preferred Networks Research & Development

    PFNでは自然言語処理(NLP)による研究開発にも取り組んでいます。 自然言語は人にとって最も身近なインターフェースのうちの一つです。 弊社ではこれまでにもロボットへの言語指示(ICRA 2018, CEATEC 2018)などの研究開発の成果を発表してきました。 先日7/28-8/2にイタリアのフィレンツェにて、自然言語処理のトップ国際会議ACL 2019が開催され、弊社からも佐藤元紀と小林颯介が参加しました。今回はその様子を論文紹介とともにお伝えしたいと思います。記事は2名で協力し執筆しています。 (写真:会場となったバッソ要塞) また、佐藤元紀が東北大学の鈴木潤氏・清野舜氏と執筆した論文 “Effective Adversarial Regularization for Neural Machine Translation” を口頭発表しました。この論文についても紹介します。 ※佐

    ACL 2019 参加レポート - Preferred Networks Research & Development
    yag_ays
    yag_ays 2019/08/30
  • 2019年 PFN夏季インターンシップのコーディング課題公開 - Preferred Networks Research & Development

    Preferred Networks 2019 夏季インターンシップの選考で用いたコーディング課題を github 上で公開しました。 https://github.com/pfnet/intern-coding-tasks PFN 楠です。PFN では毎年8月9月の夏季休暇に約2ヶ月間の長期インターンシップを行っています。コーディング課題はその選考で応募者のプログラミング能力や問題解決能力を見るために出題させて頂いているものです。今年は「機械学習・数理」「バックエンド」「フロントエンド」「チップ」「性能最適化」「コンピュータービジョン(Chainer)」の6種類のコーディング課題を用意し、応募者の希望テーマに応じてこのうちのいずれかを解いていただく形にしていました。 今年のインターンシップでは去年をさらに上回る数の応募を頂きました。PFN では来年以降もインターンシップを開催する予定で

    2019年 PFN夏季インターンシップのコーディング課題公開 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2019/06/25
  • Rust向け字句解析器生成器「rflex」を公開しました - Preferred Networks Research & Development

    Rust向け字句解析器生成器である「rflex」をOSSで公開しました。ここでは簡単に、「rflex」や開発に至った経緯について紹介します。 https://github.com/pfnet/rflex PFNエンジニアの柏原です。あまりリサーチブログには出てきませんが、前回は「[BoF] How to choose programming language for product/in-house software development」というブログを書きました。 「rflex」はプログラミング言語処理系のフロントエンドにおける文字列解析を行うコンポーネントである字句解析器(Lexical analyzer)と構文解析器のうち、前者の字句解析器のコードを生成するツールです。字句解析器生成器の「flex」とよく似たツールとなっています。構文解析器の生成では 「GNU Bison」が有名で

    Rust向け字句解析器生成器「rflex」を公開しました - Preferred Networks Research & Development
    yag_ays
    yag_ays 2019/04/09
  • ハイパーパラメータ自動最適化ツール「Optuna」公開 - Preferred Networks Research & Development

    ハイパーパラメータ自動最適化フレームワーク「Optuna」のベータ版を OSS として公開しました。この記事では、Optuna の開発に至った動機や特徴を紹介します。 公式ページ 公式ドキュメント チュートリアル GitHub ハイパーパラメータとは? ハイパーパラメータとは、機械学習アルゴリズムの挙動を制御するパラメータのことです。特に深層学習では勾配法によって最適化できない・しないパラメータに相当します。例えば、学習率やバッチサイズ、学習イテレーション数といったようなものがハイパーパラメータとなります。また、ニューラルネットワークの層数やチャンネル数といったようなものもハイパーパラメータです。更に、そのような数値だけでなく、学習に Momentum SGD を用いるかそれとも Adam を用いるか、といったような選択もハイパーパラメータと言えます。 ハイパーパラメータの調整は機械学習

    ハイパーパラメータ自動最適化ツール「Optuna」公開 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2018/12/03
  • 2018年 PFN夏季インターンシップのコーディング課題公開 - Preferred Networks Research & Development

    PFN 2018夏季インターンシップの選考で用いたコーディング課題を github 上で公開しました。 https://github.com/pfnet/intern-coding-tasks PFN の楠です。PFN では毎年8,9月前後に2ヶ月間の長期インターンシップを行っています。コーディング課題はその選考で応募者のプログラミング能力や問題解決能力を見るために出題させて頂いているものです。PFN のインターンシップでは機械学習をはじめとする幅広い分野で応募を行っているため、今年は「機械学習・数理」「バックエンド」「フロントエンド」「プロセッサ/コンパイラ」「Chainer」の5種類のコーディング課題を用意し、応募者の希望するテーマに応じてこのうちのいずれかを解いていただく形にしていました。 今年は去年を大きく上回る数の応募を国内外双方からいただくことができました。それに伴い、インタ

    2018年 PFN夏季インターンシップのコーディング課題公開 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2018/07/18
  • Emergence of Locomotion Behaviors in Rich Environment の追試 - Preferred Networks Research & Development

    1.内容紹介 はじめまして。PFNでSummer Internship 2017に続き、アルバイトをしている東京大学の西浦です。現在は駒場2キャンパスの先端研で神経科学・循環器系の数理モデルの研究をしています。 さて、2017年の春頃、DeepMindから”Emergence of Locomotion Behaviours in Rich Environments”[1]という論文が公開され、その動画が話題になりました。しかし、この論文では公開されている情報が限られており(深層学習分野でよくあることなのですが)、実験環境の設定、ネットワークの構成や学習に必要なパラメータで不明なものが多く、論文の結果を再現するためには不明な部分を推定するために多くの組み合わせを試す必要がありました。そのため、このような実験の再現は深層学習の実践的な知識と学習のための大規模なリソースが必要とされ、個人で行う

    Emergence of Locomotion Behaviors in Rich Environment の追試 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2018/06/29
  • Preferred Networks における研究活動 - Preferred Networks Research & Development

    こんにちは、新しく執行役員兼 Chief Research Strategist に就任した秋葉です。就任の挨拶を兼ねて、PFN における研究活動に関する考えを共有したいと思います。 PFN における研究とは何か? 何が研究であり何が研究でないかという境界を引くのは非常に難しく、またそれを積極的に行う意味もありません。研究とは「研ぎ澄まし究めること」を語義とし、一般に、物事について深く調査・考察を行い事実を解明したり発明を行ったりすることを指します。 PFN では挑戦的であり不確実性の高いプロジェクトが大部分を占めており、ほぼ全てのプロジェクトが少なからず研究的側面を伴います。深層学習関連のコア技術の研究開発は勿論、その応用に関してもデータやタスクに応じた適切な手法の選択や非自明な工夫がなければ上手くいかないことが殆どです。また、ロボティクス、コンピュータビジョン、自然言語処理等のような多

    Preferred Networks における研究活動 - Preferred Networks Research & Development
    yag_ays
    yag_ays 2018/06/08
  • NIPS'17 Adversarial Learning Competition に参戦しました - Preferred Networks Research & Development

    機械学習の国際学会 NIPS’17 に併設され Kaggle で開催されたコンテスト「NIPS’17 Adversarial Learning Competition」に PFN のメンバーで参加し、4 位入賞を果たすことができました。その結果、NIPS’17 に招待され発表を行い、手法についての論文も執筆し公開しました。ソースコードも公開しています。記事では、具体的にどういった内容のコンテストだったかや、我々がどのようなアプローチで取り組み 4 位入賞を達成したのかについて紹介します。 Adversarial Example とは? Adversarial example [1, 2, 3] は深層学習を実用化していく上での最も大きな課題の 1 つとして考えられている非常にホットな研究分野です。画像認識を例に取ると、元画像に対し人が気づかない程度の僅かな変更を加えるだけで、CNN によ

    NIPS'17 Adversarial Learning Competition に参戦しました - Preferred Networks Research & Development
    yag_ays
    yag_ays 2018/04/18
  • 「コンピューターサイエンスのすべての分野に精通していること」という応募資格に込めた想い | Preferred Research

    ※PFNの募集要項は、ブログの内容をふまえ、適切に意図が伝わるよう一部更新しました PFN代表の西川です。 今回は、SNS上でもたびたび話題(炎上?)になっているPFNの応募資格について、改めてご紹介したいと思います。 PFNの採用募集ページに書かれたリサーチャーの条件には、「コンピュータサイエンスのすべての分野に精通していること」という一文があります。この条件は、PFIの時から、リサーチャーの応募資格として常に掲げてきました。 その背景にある想いは、コンピュータサイエンスの研究をする上では、一つの分野だけでなく、幅広い分野について深い知見を有することが極めて重要である、ということです。たとえば、データベースの研究をする上では、トランザクション処理の理論や関係代数について詳しく知っているだけではなく、データベースを動かすコンピュータアーキテクチャ、ストレージ、また、今では分散データベース

    「コンピューターサイエンスのすべての分野に精通していること」という応募資格に込めた想い | Preferred Research
    yag_ays
    yag_ays 2018/02/27
  • Chainerの可視化・実験管理を支援するChainerUIを公開 | Preferred Research

    Chainer上の実験中の学習ログの可視化や実験管理機能を追加するパッケージ、ChainerUIを公開しました。 GitHub ChainerUIは、多くのChainerユーザが持つ「学習中の実験ジョブの進捗を手軽に知りたい」、「複数の実験ジョブの手軽に管理したい」ニーズに応えるために開発しました。 具体的には、下記の機能を備えています。 学習ログの可視化 実験履歴閲覧 実行中の実験に対する操作 (スナップショット・学習ハイパーパラメーター修正) パッケージは、Chainerの学習用Trainerを監視するChainer extensionとして機能するものです。このChainer extensionを有効化した実験を、Webブラウザからリアルタイムで監視、制御することができます。複雑な依存関係がないため、Trainerを用いる既存の実験スクリプトに簡単に導入できます。 学習ログの可視化

    Chainerの可視化・実験管理を支援するChainerUIを公開 | Preferred Research
    yag_ays
    yag_ays 2017/12/20