『入門 機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化』 Hannes Hapke, Catherine Nelson 著、中山 光樹 訳 2021年9月24日発売予定 384ページ(予定) ISBN978-4-87311-951-9 定価4,180円(税込) 機械学習を用いた本番システムの構築には、データの前処理やモデルの学習、デプロイなどのステップが必要です。しかし、これらのステップは手動で実行されることが多く、エラーの原因となっています。そこで本書では、TensorFlowのエコシステムを使用した機械学習パイプラインの構築方法について学びます。パイプラインを用いて各ステップを自動化することで、レガシーなシステムの保守から解放され、新しいモデルの開発に集中できるようになります。 本書の表紙の動物は、マッドパピー(Necturus maculosus)です。北米東
コンテンツブロックが有効であることを検知しました。 このサイトを利用するには、コンテンツブロック機能(広告ブロック機能を持つ拡張機能等)を無効にしてページを再読み込みしてください。 ✕
ビッグデータの活用に多くの企業が注目している現在では、機械学習エンジニアの需要が高まっていると言えます。 そして需要の高さは副業案件にも同様のことが言え、案件数はまだまだ限定的ではあるものの好条件の副業案件が沢山存在しています。 そこで今回は、機械学習エンジニアの副業案件の種類や収入(時給)の高さ、求められるスキルセットや案件獲得方法などを解説します。 特に、以下の方にこの記事をご一読していただきたいです。 ・機械学習のスキルがあればどんな副業案件に参加できるかを知りたい方 ・副業に興味をもっている機械学習エンジニアの方 ・機械学習エンジニアの副業に必要なスキルセットを知りたい方 ・機械学習エンジニアが副業案件を獲得する方法を知りたい方 ここでは、機械学習エンジニアの副業案件にはそのようなものがあるのかを、4つに分類してお伝えします。 データ分析案件 メディアやSNSなどのデータ分析に関す
『実践 時系列解析 ―統計と機械学習による予測』 Aileen Nielsen 著、山崎 邦子、山崎 康宏 訳 2021年9月18日発売予定 484ページ(予定) ISBN978-4-87311-960-1 定価3,960円(税込) 時系列データが使われる範囲は広く、医療データ、金融分析、経済予測、天気予報など、さまざまな分野で使用されています。本書は時系列データを通してデータ解析手法を学んでゆくアプローチで、データのクリーニング、プロットの方法、入出力など基本的なトピックについてひととおりカバーしてから、さまざまな分野の事例を数多く取り上げ、統計的手法と機械学習手法の両方を時系列データに適用し、また人気のオープンソースツールも積極的に取り入れた手法を紹介します。プログラムにはRとPythonの両方を利用。データセットやコードはGitHubからダウンロード可能です。 表紙の動物は、ブルーフ
ELYZA(イライザ)はAI分野に強みを持つ東京大学・松尾研究室出身のメンバーで創立したスタートアップです。私たちは未踏の問題の解決を目指し、近年発展目覚ましい自然言語処理 (Natural Language Processing: 以降NLPと略記)(※1)・マルチモーダルAI(※2)の技術に焦点を当て、研究開発・社会実装に取り組んでいます。 突然ですがELYZAのTwitterアカウント(@ELYZA_inc)はご存知でしょうか? ELYZAのアカウントでは会社紹介や採用情報の他に、NLP分野の最新論文や機械学習関連ライブラリを日本語で100字程度に要約して、つぶやいています。ご存知なかった方は是非この機会にフォローいただけるととても励みになります! さて、ELYZAのアカウントをフォローしている皆さまの中で、最近のツイートの文面に違和感を感じた方はいらっしゃいますでしょうか? 実は7
背景 はじめまして、JX通信社でインターンをしている原田です。 近年深層学習ではモデルが肥大化する傾向にあります。2020年にopen aiが示したScaling Laws([2001.08361] Scaling Laws for Neural Language Models) の衝撃は記憶に新しく、MLP-Mixerが示したように、モデルを大きくすればAttention構造やCNNでさえも不必要という説もあります。([2105.01601] MLP-Mixer: An all-MLP Architecture for Vision) しかし大きな深層学習モデルを利用しようとすると、しばしば以下のような問題に悩まされます。 推論速度が問題でプロダクトに実装不可能 GPU/TPUはコスト上厳しい プロダクトの性質上バッチ処理が不可能(効率的にGPU/TPUが利用できない) 例えばJX通信社
長いビジネス文章やメール、ウェブページ、小説などを読む際には「3行くらいで説明して欲しいな」という気分になることがよくあるはず。東京大学・松尾研究室発のAI企業・ELYZAが開発した「ELYZA DIGEST(イライザダイジェスト)」は、文章やウェブサイトのURLを入力するだけでAIが内容を3行に要約してくれるとのこと。一体どれだけの精度で要約してくれるのか気になったので、実際に使って精度を確かめてみました。 ELYZA DIGEST https://www.digest.elyza.ai/ ELYZA DIGESTのトップページはこんな感じ。「どんな文章でも、AIが3行に要約!」と機能がアピールされています。 トップページを下方向にスクロールすると、URLや文章の入力欄が現れます。 まずは、App Storeについて記したGIGAZINEの記事を要約してみます。入力欄に記事のURL「ht
東京大学・松尾豊研究室発のAIベンチャーELYZA(イライザ/東京都文京区)は8月26日、文章の要約文を生成するAI「ELYZA DIGEST」を試せるデモサイトを公開した。人間より短時間で要約でき、要約の正確性は「人間に匹敵する」という。今後も精度を高め、議事録作りやコールセンターでの対話メモ作成などでの活用を目指す。 同社は自然言語処理技術(NLP)の研究を進めており、日本語テキストデータの学習量・モデルの大きさともに日本最大級というAIエンジン「ELYZA Brain」を開発している。 ELYZA DIGESTは、大規模言語モデルを基に、要約というタスクに特化したAIとして開発。読み込んだテキストを基に、AIが一から要約文を生成する「生成型」モデルで、文の一部を抜き出す「抽出型」モデルなどと異なり、文の構造が崩れていたり、話者が多数いる会話文だったりしても、精度の高い要約文を生成でき
Gartnerによると、このハイプ・サイクルには今後5~10年にわたって高度な競争優位性をもたらす可能性が高い先進的な技術やトレンドがまとめられており、「信頼の構築」「成長の加速」「変化の形成」の3つのトレンドに集約できるという。 3つのトレンドで分類する最新技術 GartnerのPhilip Dawson氏(アナリスト、バイス プレジデント)は先進テクノロジーのハイプ・サイクルについて、「企業が追跡すべき重要な先進トレンドの他、特に注視すべき技術を『信頼』『成長』『変化』という3つのテーマを設定して包括的に把握できるようにした」と説明する。 信頼の構築 ここでいう信頼とは「セキュリティ」と「リライアビリティ」によって個人情報や重要な業務データを保護することだ。こうした「信頼の構築」が重要なケースとして、Gartnerはクラウドのデータを例に挙げる。 「現在クラウドサービスの多くが米国とア
AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す本連載『「AI」エンジニアになるための「基礎数学」再入門』。前回は「行列計算」について学びました。今回のテーマは、「行列の計算分解」です。 前回、データを分析する際には、基本的に1次元のベクトルデータではなく多次元のデータを用いることが多いので、行列計算が重要になると解説しました。行列の計算は、AIが行う計算でもよく使用されており、さまざまな分析に関わる教科書などは行列表記での説明がほとんどです。今回紹介する「行列分解」は、そんな行列計算の中で重要なテクニックの一つです。 行列分解をする理由や行列分解後に得られる結果の意味などについて、数式の内容よりも意味の解釈に注力して解説するので、そこに注目して学習してください。 行列分解をする理由 初めに「行列分解とは何か」を説明します。行列分解とは、ある行列を
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く