ブックマーク / tech-blog.abeja.asia (40)

  • 2022年AI倫理ニュースベスト10 - ABEJA Tech Blog

    記事はABEJAアドベントカレンダー2022の16日目の記事です! 日の担当は、法務・AI倫理関係を担当している古川です。12年ほど弁護士をしていまして、途中で機械学習をやってみたくなり数学から統計から機械学習の勉強をして(PRMLとかカステラとか読みました!)、Pythonも勉強をして、ある会社で画像解析AIの実装をしていたのですが、現在は法律・倫理関係業務だけ扱っています。 AI倫理・ガバナンス関係の記事を毎年書いているので、今年もその路線で行きます。テーマは「行く年くる年」。このテーマなら毎年書けますしね。まあ、「くる年」の議論はしませんので、厳密には「行く年」だけで2022年の振り返りでしかないのですが・・・ では、ランキング形式で2022年のAI倫理関係のニュースを振り返ります。ランキング形式が人気らしいのでランキング形式なだけで、別に1位だとか2位という順位に大した意味は

    2022年AI倫理ニュースベスト10 - ABEJA Tech Blog
  • Kaggle Days World Championshipで優勝した話 - ABEJA Tech Blog

    ABEJAでデータサイエンティストをしている服部です。 2022年10月28, 29日にバルセロナにてKaggle Days World Championship Finalというデータサイエンスに関するイベント兼コンペティションが開催され、そこに参加しました。そして幸いなことに私の所属するチームが優勝することができました!! 記事では今回のイベントそのものと、優勝に至るまでのコンペ上での過程や工夫点などについてご紹介しようと思います。 Kaggle Days World Championship Finalとは 1日目(ワークショップやプレゼンテーション等) Opening remarks by LogicAI and Kaggle HP introduction - Key note Kaggle Team - Ask Me Anything Winners team present

    Kaggle Days World Championshipで優勝した話 - ABEJA Tech Blog
  • GPT-neoxの学習用にマルチノード並列学習環境を整えた with DeepSpeed - ABEJA Tech Blog

    1. はじめに 2. 並列学習環境を調べる 並列学習方法を調べる ネットワーク、コンピューティング周りを調べる 3. インフラ環境を構築する コンパクトプレースメントポリシーの作成 Compute Engine を起動する (Fast Socket と gVNIC を利用する) 4. まずはシングルノードで動かす 5. 次はマルチ環境で動かす w/ Docker リポジトリをクローン ssh/config を作成 authorized_keys を作成 hostfile を作成 Dockerbuild 6. つまずいたポイント 学習途中に出力したファイルを再利用するのでNFSが必要に NFSのリージョンを間違えて速度が出なかった 大量のGPUの調達はリソースを確保できないかもしれないので要サポート確認 コンパクトプレースメントポリシーは邪魔になりそうだった 7. 結果 8. まとめ

    GPT-neoxの学習用にマルチノード並列学習環境を整えた with DeepSpeed - ABEJA Tech Blog
  • ABEJAで作った大規模GPTモデルとその道のり - ABEJA Tech Blog

    1. はじめに 2. そもそもGPTとは?? 3. ABEJAで作ったGPTモデルについて 3.1 モデルサイズ 3.2 データセット Wikipedia CC100 OSCAR mC4 3.3 参考にしたコード 3.4 モデルの学習 せっかくここまで育てたモデルが・・・ 4. 技術的な工夫点 4.1 データセットの前処理 4.2 GPT-neoxの活用 4.3 並列VMでの学習 4.4 モデルアーキテクチャの工夫 5 学習したGPTのアウトプット例 5.1 失敗モデルたちの作品集 5.2 完成モデルの出力例 5.3 少しFine-tuningした結果 6. 最後に 6.1 採用メッセージ 6.2 ABEJAで学習したGPTモデルの今後について 1. はじめに こんにちは、ABEJAの服部です。昨日、ABEJAが主催しているABEJA SIX2022でも発表がありましたが、NVIDIA社の

    ABEJAで作った大規模GPTモデルとその道のり - ABEJA Tech Blog
  • オフィスDXを支える技術(バックエンド編) - ABEJA Tech Blog

    ABEJA Advent Calendar 2021 23日目の記事です。21日目のオフィスDXを支える技術フロントエンド編)のバックエンド編の記事となります。 はじめに こんにちは、エンジニアの @toshitanian です。 ABEJAは2021年11月にヒューリック株式会社と資業務提携を行い、その一環として「Bizflex By HULIC」という賃貸オフィスを支えるBizflexシステムの開発・運営しています。 Bizflexシステムでは、クラウドサービスと連携した共用会議室予約システム、取次対応を効率化するゲスト受付システム、社員の所在地・状況可視化システムなどの機能を提供しています。Bizflex システムは、オフィスDXを推進するためのプロダクトなので、インターネットサービスだけでは無く、オフィスに設置されているWiFiや、ビルのセキュリティシステム等とも連携を行ってい

    オフィスDXを支える技術(バックエンド編) - ABEJA Tech Blog
  • オフィスDXを支える技術(フロントエンド編) - ABEJA Tech Blog

    こちらは ABEJA アドベントカレンダー2021の 21 日目の記事です。 はじめに こんにちは。CS 統括部システム開発グループ 1 の石川 (@ishikawa) です。緊急事態宣言の解除を受け、ABEJA でも各自任意での出社が可能となりました 2。今回は ABEJA のサテライトオフィスである「Bizflex 麻布十番」を紹介するとともに、オフィスでの新しい働き方をサポートするために私たちが開発しているアプリケーション及びシステムのアーキテクチャについて書きたいと思います3。 この記事ではフロントエンド中心の話になります。バックエンド側についてはオフィスDXを支える技術(バックエンド編)をご覧ください。 Bizflex の紹介 オフィスの様子 まずはこちらの写真をご覧ください。「Bizflex 麻布十番」の 1F、共有部の様子です。 Bizflex はフロア占有型のセットアップオ

    オフィスDXを支える技術(フロントエンド編) - ABEJA Tech Blog
  • ABEJA システム開発グループと取り組みのご紹介 - ABEJA Tech Blog

    はじめに ABEJA におけるシステム開発グループの仕事 どんな仕事? どんな人たち? 業務の進め方 アセスメントフェーズ インテグレーションフェーズ システム開発グループの特徴 フルスタック 日々の取り組みや制度 朝会 エンジニアレビュー プリセールス 社内ツール開発 モデル開発テンプレート おわりに 参考: 取り扱っている技術スタック はじめに こんにちは、CS(カスタマーサクセス) 統括部の近藤&小笠原です。日は、CS 統括部のシステム開発グループの仕事について紹介しようと思います。CS 統括部では、お客様の描く将来像をどのようにすれば実現できるかを検討するところから始め、最終的に DS チームの開発したモデルを組み込んでシステムインテグレーション、さらには運用までを行っています。 システム開発グループはその中の主にシステムインテグレーションを担当しますが、お客様の求める状態に繋げ

    ABEJA システム開発グループと取り組みのご紹介 - ABEJA Tech Blog
    toshitanian
    toshitanian 2021/12/20
    お待ちしてます
  • ABEJAの技術スタックを公開します (2019年11月版) - ABEJA Tech Blog

    2021/10/22追記:最新版は下記記事になります!こちらもご一読くださいませ。 tech-blog.abeja.asia どうも、Tech Blog編集長(自称)の緒方(@conta_)です。 よくエンジニアの方にご質問いただく ABEJAってよく聞くけど、実際どんなことやってるのかよくわからない という点をクリアにするために、事業内容と技術視点でのABEJAの取り組みを紹介したいと思います。 ABEJAに興味のある方や、未来の一緒に働くメンバーに読んでいただけると嬉しいです! 割とAIコンサルの会社と思われているらしいので、ちゃんとプロダクト作ってますよ!ということを伝えていきたい ABEJAの事業紹介 ABEJAは2012年から約7年間、機械学習・ネットワークやIoTデバイスを活用したプロダクトの研究・開発・運用を行っています。 様々な産業・業種へ機械学習の適用・運用を培ってきたナ

    ABEJAの技術スタックを公開します (2019年11月版) - ABEJA Tech Blog
  • サンタクロースとサンタコスを見分けるDeep Learningモデルをサービス化してみた - ABEJA Arts Blog

    この記事はABEJA Platform Advent Calendar 2018の24日目です。 はじめに どうも、緒方です。 世はAI戦国時代、皆さんの会社ではAI活用進んでいますか?😃 自分たちのプロダクトでDeep Learningを活用する際、データ収集からアノテーション、学習モデル作成やプロダクトへの組み込み(API化等)を一通りこなす必要があります。 今回はクリスマス・イブなので、 サンタクロースを題材にDeep Learningをフルスクラッチでサービスインしたら・・・?という内容でお送りしたいと思います。 やりたいこと クリスマスといえば、サンタクロース。きっと子供の頃は待ちわびたことだと思います。 しかし世の中には様々なサンタが存在します。 はたしてDeep Learningは世の中に複数存在するサンタの属性を見分けられるのか、、、? 今回のDeep Learningの

    サンタクロースとサンタコスを見分けるDeep Learningモデルをサービス化してみた - ABEJA Arts Blog
  • KDD 2018 に参加してきました - ABEJA Tech Blog

    ABEJAでResearcherをしている白川です。 8/19-23にロンドンで開催されたKDD 2018に参加してきたので、目についた内容をかいつまんで報告させていただこうと思います。 とくに目についたこと 中国系の台頭が目覚ましい。参加者、企業ともに中国系が支配的で、かなりアグレッシブに機械学習データ分析をビジネスに取り込んでいる印象。 Graph + Deep Learningが着実に使われ始めている。Deep系の発表でGraph CNNの話をちょくちょく聞いた。 Finance / Economics の分野に対する注目。 シェアバイクサービスやAirBnBの部屋貸しサービスような新しいビジネスにおけるデータ分析。 新しく使われ始めたテクニックはあまりなさそう。 特徴量エンジニアリングをして正攻法で攻めるのはやはり大事。 NVIDIA, Intel, Twitter, Apple

    KDD 2018 に参加してきました - ABEJA Tech Blog
    toshitanian
    toshitanian 2018/09/04
    KDD参戦レポート!
  • SpotinstとECSを組み合わせたら気付けばContainer as a Service with Spot Instanceができてました - ABEJA Tech Blog

    こんにちは。ABEJAのインフラを担当している村主です。 昨今インフラ界隈で流行っておりますKubernetesに全振りしたい気持ちで仕事に励んでおりますが、サクッと使うにはKubernetesは重くて、ECSが軽いのでECSも使っています。 まずはじめにSpotinstについてや、ECSの組み合わせのメリットについてはこちらに書いてありますので一読ください。 tech-blog.abeja.asia 事の発端 今回、社内でコンテナを使ったWebインフラを作りたいという要望があり、ほな作るわ。ということでECSをベースにEC2はSpotinstで管理させることにしました。 出来上がった後、使い方の説明してる時に「これ利用者から見たらContainer as a Serviceやん。しかもスポットインスタンス使ってるし激安やん」ということに気付いたよ。ってのが今回の話です。 内容としては E

    SpotinstとECSを組み合わせたら気付けばContainer as a Service with Spot Instanceができてました - ABEJA Tech Blog
    toshitanian
    toshitanian 2018/08/31
    Fargate? #aws #spotinst
  • Jetson 上で Docker イメージをビルドするのが辛かったので EC2 上にビルド環境を作った - ABEJA Tech Blog

    ABEJA の Platform エンジニアの小笠原です。 ABEJA Platform は Cloud 環境のみならず Edge 環境でも推論機能を提供していますが、正式にサポートしている Edge device として NVIDIA Jetson があります。 ABEJA Platform は、ユーザーコードの実行を Docker コンテナ上で行うことで、Cloud でも Edge device 上でも同じソースコードを利用できる仕組みになっています。 Jetson の CPU アーキテクチャは arm64 なので、各 Deep Learning フレームワークを含む Docker イメージも、arm64 アーキテクチャ用のものを作成する必要がありました。 最初の頃は Jetson TX2 上でビルドを行っていたのですが、tensorflow や pytorch といったフレームワーク

    Jetson 上で Docker イメージをビルドするのが辛かったので EC2 上にビルド環境を作った - ABEJA Tech Blog
    toshitanian
    toshitanian 2018/08/28
    Jetson上でのコンパイル辛いもんな
  • サンフランシスコにあるテック系企業のオフィスにお邪魔してきました - ABEJA Tech Blog

    先月末に開催された Google Cloud NEXT 2018 に行ってきました。 せっかくなのでサンフランシスコにある、いくつかのテック系企業のオフィスにお邪魔してきました。 今回訪れた企業 Apple Google Spotinst Netlify Github Apple まず、サン・ノゼまで足を伸ばして、Apple社に立ち寄りました。 残念ながら新社屋「Apple Park」には入れませんでしたが、 すぐ近くにあるガラス張りのお洒落な建物、「Apple Park Visitor Center」には入れます。 Apple Park Visitor Center ここでしか買えないApple製品が沢山置いてあり、かなり物欲をかきたてられます。 特に面白かったのは、真っ白なジオラマにiPadをかざすと、ARで新社屋の見学を体験できるデモがありました。 Parkのジオラマ AR 最近、

    サンフランシスコにあるテック系企業のオフィスにお邪魔してきました - ABEJA Tech Blog
    toshitanian
    toshitanian 2018/08/21
    サンフランシスコ行きたい
  • Uberのような配車サービスは海外の観光客とって必須なサービス。というのを体感した - ABEJA Tech Blog

    ABEJAのSRE/インフラエンジニアの村主です。 今回、サンフランシスコでGoogle Cloud Next '18 が行われていたので行ってきました。その際にUberの乗りまくって体感したことを共有します。 Google Cloud Next '18 やサンフランシスコのネタはもっとあるので、順次掲載しますね。 機会損失? 日人の僕達がアメリカに行き感じたことは、海外の観光客の方が日に来て感じることと同様と思ったのでブログに書くことにしました。 Uberのような配車サービスが浸透することで、より海外からの観光客の利便性が向上し、行きたいとことに無駄なく観光できて時間をお金で買うことで、一般的な交通機関より高単価の支払いが発生するんじゃないか。逆に言うと、現状は機会損失があるのでは?と感じました。 Uber、Uberと書いてますが書いていることが満たせるならUberでなくても良いです

    Uberのような配車サービスは海外の観光客とって必須なサービス。というのを体感した - ABEJA Tech Blog
    toshitanian
    toshitanian 2018/08/07
    インドやフィリピンのタクシーって正規でもメーター入れないでぼったくってくるし、どこか変なところに連れて行かれる不安感あるから、Uberの安心感がある。
  • より良い機械学習のためのアノテーションの機械学習 - ABEJA Tech Blog

    ABEJAでリサーチャーをしている白川です。 皆さん、アノテーションしていますか? 私はしています。アノテーション、自分でやるのは大変ですよね。 AIというとモデルの学習に注目されがちですが、もしかしたら、アノテーションはAI開発においてモデル開発以上に重要で注意の必要なプロセスかもしれません。今回はなぜアノテーションがそれほど重要なのか、良いアノテーションとはどのようなアノテーションなのかについて、機械学習的にアプローチしてみたいと思います。 アノテーションを機械学習で解析するの、楽しいですよ。 なお、記事に関連して、2018年7月1日に開催されるccse2018というカンファレンスでもお話させていただく予定です。記事内では触れられなかった内容についてもお話させていただくかもしれないので、ご興味ある方はチェックしてみてください。 この記事を読むとわかること アノテーションはAIの開発・

    より良い機械学習のためのアノテーションの機械学習 - ABEJA Tech Blog
  • ABEJAリブランディングのデザインプロセス - ABEJA Arts Blog

    おひさしぶりです。骨とワニが好きなデザイナー兼アートディレクターの吹上(@takana8)です🐊 去る2月22日、ABEJAは大規模AIカンファレンス「SIX 2018」を開催し、その基調講演でコーポレート・リブランディングを発表しました。 記事では、この発表に至るまでのブランディングプロジェクトの「舞台裏」を、アートディレクターの視点からご紹介します。 1. ブランディングプロジェクト、はじまる ブランディングプロジェクトのはじまりは、2016年の秋に遡ります。 当時はまだ正式なプロジェクトではなく、チームもない(社内に専任デザイナーは1人だけ)、まさに暗中模索な日々😎 絶えず発生する様々なデザイン業務と並行しながら、まずは「現状整理」を粛々と行っていました。経営陣へヒアリングしたり、社内外に散らばった制作物をかき集めたり、「ABEJAをとりまく環境」や「ABEJAらしさとは何か」

    ABEJAリブランディングのデザインプロセス - ABEJA Arts Blog
    toshitanian
    toshitanian 2018/05/09
    すごく考え抜かれててすごいなと思いました。
  • CVPR2018 1000本ノック!(なお37本) - ABEJA Arts Blog

    はじめまして。ABEJAでリサーチャーをやっている藤です。 今年もCVPRの季節がやってきました。CVPRとはコンピュータビジョンに関するトップカンファレンスです。毎年規模が大きくなってきており、今年は3300の論文投稿があり、979件がacceptされました。また、21のチュートリアル、48のワークショップ、115以上の企業展示と様々なイベントが行われています。今年度のCVPR2018の開催は6月なのですが、プログラム自体は4月に公開済みですので、今回のブログの記事では、オーラル発表予定の論文のうちarxivで公開されている内容について一気に紹介します。 論文の動向 Deep learningについて Deep Learningに関連する論文は毎年増え続けており、今年度についてはacceptされた論文979件のうちarxivで459件が公開されており、なんと424件(頑張って数えました

    CVPR2018 1000本ノック!(なお37本) - ABEJA Arts Blog
  • serverlessで作る外形監視 - ABEJA Tech Blog

    エンジニアの鎗水です。 ABEJA Platformの機能は様々なAPIによって支えられています。 今回はそれらのAPIに対し行っている外形監視について紹介します。 今回紹介する外形監視は、ユーザーの利用シナリオに沿って行われます。 ABEJA Platform上の特定のresourceの作成、更新、削除といった一連の作業をユーザーが正しく行えるかという視点でテストを行います。 1. 構成 AWS Step Functions AWS Step Functionsは、複数のLambdaを組み合わせてワークフローを組むことができるサービスです。 ワークフローはAmazon States LanguageというDSLを使って記述し、実行するLambdaの定義やLambdaのリトライ、Lambda間の遷移条件や待ち時間などを設定することができます。 Serverless Serverless F

    serverlessで作る外形監視 - ABEJA Tech Blog
  • Kubernetes x AWS x GPUにハマった話 - ABEJA Tech Blog

    tl;dr 長文なので3行で kubernetesAWSGPUは超える壁が多かった。やるならkubeadmがオススメ。 kubeadmでcloud-provider=awsの手順を後半に記載 はじめに ABEJAのサービス系インフラを管理しているインフラエンジニアの村主です。 コンテナ周りは割とECSを中心に組むことが多かったのですが、あれだけkubernetesが持ち上げられると使ってみないとな。と言うことで、新しく追加する機能はkubernetesで開発することにしました。そこにkubernetesがあったから kubernetesAWSGPU を組み合わせた時にすごくハマりどころが多かったので、ここに奮闘記を記載します。 まず、kubernetesを構築するためのプロビジョニングツールを何にしようか。と言うことで、特徴を知らないと工夫も出来ないので色々触ってみました。 1.

    Kubernetes x AWS x GPUにハマった話 - ABEJA Tech Blog
  • pandas DataFrameをもっと自由にJOINしよう! - ABEJA Tech Blog

    データエンジニアの千葉です。 今回は、データ分析の必須ライブラリ「pandas」について、 データフレーム結合機能 mergeと 自作の拡張ライブラリの話を書いています。 苦しみポイント 先日、2つのpandas.DataFrameを、こんな感じで結合する必要がありました。 SELECT * FROM df_a JOIN df_b ON df_a.xxx_id = df_b.xxx_id AND df_a.yyy_id = df_b.yyy_id AND df_b.ccc BETWEEN df_a.aaa AND df_b.bbb ; BETWEENを使ったJOINです。 実はこの処理、pandas上では簡単にできません。 なぜかというと、pandasは結合機能は、 1. 標準の結合条件がすごくしょぼい! 2. カスタムするとすごく面倒くさい! からです。 標準では、df_a.xxx_id

    pandas DataFrameをもっと自由にJOINしよう! - ABEJA Tech Blog