misshikiのブックマーク / 2021年8月27日

軍事AIの弱点をなくすべく、米国防総省は自らを“ハッキング”する

misshiki 2021/08/27

リンク

9月新刊情報『入門機械学習パイプライン』

『入門機械学習パイプライン ―TensorFlowで学ぶワークフローの自動化』 Hannes Hapke, Catherine Nelson　著、中山光樹　訳 2021年9月24日発売予定 384ページ（予定） ISBN978-4-87311-951-9 定価4,180円（税込）機械学習を用いた本番システムの構築には、データの前処理やモデルの学習、デプロイなどのステップが必要です。しかし、これらのステップは手動で実行されることが多く、エラーの原因となっています。そこで本書では、TensorFlowのエコシステムを使用した機械学習パイプラインの構築方法について学びます。パイプラインを用いて各ステップを自動化することで、レガシーなシステムの保守から解放され、新しいモデルの開発に集中できるようになります。本書の表紙の動物は、マッドパピー（Necturus maculosus）です。北米東

misshiki 2021/08/27

“2021年9月24日発売予定”新刊

リンク

AIが｢フェイクニュース｣を大量に作成､配信！？

コンテンツブロックが有効であることを検知しました。このサイトを利用するには、コンテンツブロック機能（広告ブロック機能を持つ拡張機能等）を無効にしてページを再読み込みしてください。 ✕

misshiki 2021/08/27

“AIに忍び寄る潜在リスクとそれに対処するための5つの行動原則「TRUST」について解説”

人工知能

リンク

機械学習エンジニアの副業案件はあるの？機械学習の副業案件に必要なスキル・収入(時給)を解説！

ビッグデータの活用に多くの企業が注目している現在では、機械学習エンジニアの需要が高まっていると言えます。そして需要の高さは副業案件にも同様のことが言え、案件数はまだまだ限定的ではあるものの好条件の副業案件が沢山存在しています。そこで今回は、機械学習エンジニアの副業案件の種類や収入(時給)の高さ、求められるスキルセットや案件獲得方法などを解説します。特に、以下の方にこの記事をご一読していただきたいです。・機械学習のスキルがあればどんな副業案件に参加できるかを知りたい方・副業に興味をもっている機械学習エンジニアの方・機械学習エンジニアの副業に必要なスキルセットを知りたい方・機械学習エンジニアが副業案件を獲得する方法を知りたい方ここでは、機械学習エンジニアの副業案件にはそのようなものがあるのかを、4つに分類してお伝えします。データ分析案件メディアやSNSなどのデータ分析に関す

misshiki 2021/08/27

機械学習

リンク

rinna、日本語に特化した「GPT-2」「BERT」事前学習モデルを無償公開 75ギガバイトのデータを最大45日間で学習 | Ledge.ai

Top > 学術＆研究 > rinna、日本語に特化した「GPT-2」「BERT」事前学習モデルを無償公開 75ギガバイトのデータを最大45日間で学習

misshiki 2021/08/27

“日本語に特化した「GPT-2」と「BERT」の事前学習モデル...、開発した事前学習モデルとその学習を再現するためのソースコードを、GitHubおよびNLPモデルライブラリHuggingFaceにMITライセンスのオープンソースとして公開”

BERT
GPT-2

リンク

ELYZA DIGEST

misshiki 2021/08/27

“どんな文章でも、AIが3行に要約！”デモ

人工知能

リンク

冴えるヒロイン（ミライ小町）の制作事例を通じた、自然言語処理AIによるキャラクター性の抽出と反映【CEDEC2021】 | Gamer

本セッションに登壇したのは、バンダイナムコ研究所の技術開発本部先端技術部AI課に所属する頼展韜氏と石原健司氏。AIがいかにテキストでキャラクターの魅力を立たせるか、AIがどのようにセリフ制作現場をサポートするか、といった観点からセッションを進行していった。

misshiki 2021/08/27

“CEDEC2021」のセッション「冴えるヒロインの作りかた～自然言語処理AIによるキャラクター性の抽出と反映への事例紹介～」の内容をレポート”

人工知能

リンク

9月新刊情報『実践時系列解析』

『実践時系列解析 ―統計と機械学習による予測』 Aileen Nielsen　著、山崎邦子、山崎康宏　訳 2021年9月18日発売予定 484ページ（予定） ISBN978-4-87311-960-1 定価3,960円（税込）時系列データが使われる範囲は広く、医療データ、金融分析、経済予測、天気予報など、さまざまな分野で使用されています。本書は時系列データを通してデータ解析手法を学んでゆくアプローチで、データのクリーニング、プロットの方法、入出力など基本的なトピックについてひととおりカバーしてから、さまざまな分野の事例を数多く取り上げ、統計的手法と機械学習手法の両方を時系列データに適用し、また人気のオープンソースツールも積極的に取り入れた手法を紹介します。プログラムにはRとPythonの両方を利用。データセットやコードはGitHubからダウンロード可能です。表紙の動物は、ブルーフ

misshiki 2021/08/27

“2021年9月18日発売予定”新刊

リンク

AIが書いたツイートを見分けられるか？ELYZA Digestの開発背景｜ELYZA, Inc.

ELYZA（イライザ）はAI分野に強みを持つ東京大学・松尾研究室出身のメンバーで創立したスタートアップです。私たちは未踏の問題の解決を目指し、近年発展目覚ましい自然言語処理 (Natural Language Processing: 以降NLPと略記)（※1）・マルチモーダルAI（※2）の技術に焦点を当て、研究開発・社会実装に取り組んでいます。突然ですがELYZAのTwitterアカウント(@ELYZA_inc)はご存知でしょうか？ ELYZAのアカウントでは会社紹介や採用情報の他に、NLP分野の最新論文や機械学習関連ライブラリを日本語で100字程度に要約して、つぶやいています。ご存知なかった方は是非この機会にフォローいただけるととても励みになります！さて、ELYZAのアカウントをフォローしている皆さまの中で、最近のツイートの文面に違和感を感じた方はいらっしゃいますでしょうか？実は7

misshiki 2021/08/27

人工知能

リンク

BERTの推論速度を最大10倍にしてデプロイした話とそのTips - JX通信社エンジニアブログ

背景はじめまして、JX通信社でインターンをしている原田です。近年深層学習ではモデルが肥大化する傾向にあります。2020年にopen aiが示したScaling Laws（[2001.08361] Scaling Laws for Neural Language Models）の衝撃は記憶に新しく、MLP-Mixerが示したように、モデルを大きくすればAttention構造やCNNでさえも不必要という説もあります。（[2105.01601] MLP-Mixer: An all-MLP Architecture for Vision）しかし大きな深層学習モデルを利用しようとすると、しばしば以下のような問題に悩まされます。推論速度が問題でプロダクトに実装不可能 GPU/TPUはコスト上厳しいプロダクトの性質上バッチ処理が不可能（効率的にGPU/TPUが利用できない）例えばJX通信社

misshiki 2021/08/27

“大きなNLPモデルの代表格であるBERTを利用して各高速化手法を検証”

リンク

AIがどんな文章でも3行に要約してくれる「ELYZA DIGEST」を使ってみた

長いビジネス文章やメール、ウェブページ、小説などを読む際には「3行くらいで説明して欲しいな」という気分になることがよくあるはず。東京大学・松尾研究室発のAI企業・ELYZAが開発した「ELYZA DIGEST(イライザダイジェスト)」は、文章やウェブサイトのURLを入力するだけでAIが内容を3行に要約してくれるとのこと。一体どれだけの精度で要約してくれるのか気になったので、実際に使って精度を確かめてみました。 ELYZA DIGEST https://www.digest.elyza.ai/ ELYZA DIGESTのトップページはこんな感じ。「どんな文章でも、AIが3行に要約！」と機能がアピールされています。トップページを下方向にスクロールすると、URLや文章の入力欄が現れます。まずは、App Storeについて記したGIGAZINEの記事を要約してみます。入力欄に記事のURL「ht

misshiki 2021/08/27

人工知能

リンク

「どんな文章も3行に要約するAI」デモサイト、東大松尾研発ベンチャーが公開　「正確性は人間に匹敵」

東京大学・松尾豊研究室発のAIベンチャーELYZA（イライザ／東京都文京区）は8月26日、文章の要約文を生成するAI「ELYZA DIGEST」を試せるデモサイトを公開した。人間より短時間で要約でき、要約の正確性は「人間に匹敵する」という。今後も精度を高め、議事録作りやコールセンターでの対話メモ作成などでの活用を目指す。同社は自然言語処理技術（NLP）の研究を進めており、日本語テキストデータの学習量・モデルの大きさともに日本最大級というAIエンジン「ELYZA Brain」を開発している。 ELYZA DIGESTは、大規模言語モデルを基に、要約というタスクに特化したAIとして開発。読み込んだテキストを基に、AIが一から要約文を生成する「生成型」モデルで、文の一部を抜き出す「抽出型」モデルなどと異なり、文の構造が崩れていたり、話者が多数いる会話文だったりしても、精度の高い要約文を生成でき

misshiki 2021/08/27

事例“文章の要約文を生成するAI「ELYZA DIGEST」を試せるデモサイトを公開”

人工知能

リンク

4行でモデル構築と予測ができるAutoML OSSの老舗「auto-sklearn」

4行でモデル構築と予測ができるAutoML OSSの老舗「auto-sklearn」：AutoML OSS入門（2）（1/3 ページ） AutoML OSSを紹介する本連載第2回は、AutoML OSSの老舗ともいえる「auto-sklearn」を解説します。auto-sklearnは、scikit-learnを拡張した形で、効率的なベイズ最適化手法を用いたAutoML機能を提供するツールです。

misshiki 2021/08/27

“auto-sklearnは、scikit-learnを拡張した形で、効率的なベイズ最適化手法を用いたAutoML機能を提供”

リンク

Gartnerが「先進テクノロジーのハイプ・サイクル」を発表

Gartnerによると、このハイプ・サイクルには今後5～10年にわたって高度な競争優位性をもたらす可能性が高い先進的な技術やトレンドがまとめられており、「信頼の構築」「成長の加速」「変化の形成」の3つのトレンドに集約できるという。 3つのトレンドで分類する最新技術 GartnerのPhilip Dawson氏（アナリスト、バイスプレジデント）は先進テクノロジーのハイプ・サイクルについて、「企業が追跡すべき重要な先進トレンドの他、特に注視すべき技術を『信頼』『成長』『変化』という3つのテーマを設定して包括的に把握できるようにした」と説明する。信頼の構築ここでいう信頼とは「セキュリティ」と「リライアビリティ」によって個人情報や重要な業務データを保護することだ。こうした「信頼の構築」が重要なケースとして、Gartnerはクラウドのデータを例に挙げる。「現在クラウドサービスの多くが米国とア

misshiki 2021/08/27

AI（人工知能）主導のイノベーション、量子機械学習、ジェネレーティブAI、AI拡張型設計、AI拡張型ソフトウェアエンジニアリング、物理学に基づくAI

人工知能

リンク

機械学習やレコメンドでよく見る「特徴量」の本質とは――「行列分解」の基本を図版とPythonコードで理解する

AIに欠かせない数学を、プログラミング言語Pythonを使って高校生の学習範囲から学び直す本連載『「AI」エンジニアになるための「基礎数学」再入門』。前回は「行列計算」について学びました。今回のテーマは、「行列の計算分解」です。前回、データを分析する際には、基本的に1次元のベクトルデータではなく多次元のデータを用いることが多いので、行列計算が重要になると解説しました。行列の計算は、AIが行う計算でもよく使用されており、さまざまな分析に関わる教科書などは行列表記での説明がほとんどです。今回紹介する「行列分解」は、そんな行列計算の中で重要なテクニックの一つです。行列分解をする理由や行列分解後に得られる結果の意味などについて、数式の内容よりも意味の解釈に注力して解説するので、そこに注目して学習してください。行列分解をする理由初めに「行列分解とは何か」を説明します。行列分解とは、ある行列を

misshiki 2021/08/27

“「行列の計算分解」”

数学

リンク

ColabCodeを使って、Google Colabの上でVS Codeを使ってみよう

ColabCodeを使って、Google Colabの上でVS Codeを使ってみよう：Visual Studio Codeで快適Pythonライフ（1/2 ページ） Google Colab上でVS Codeを動かす幾つかの方法のうち、ColabCodeというモジュールを使ってお手軽にこれを実現する手順を紹介します。

misshiki 2021/08/27

“ColabCode”面白い。けど実用はしづらいかなって思った。

Jupyter

リンク

はてなブックマーク

タグ

2021年8月27日のブックマーク (16件)

軍事AIの弱点をなくすべく、米国防総省は自らを“ハッキング”する

9月新刊情報『入門機械学習パイプライン』

AIが｢フェイクニュース｣を大量に作成､配信！？

機械学習エンジニアの副業案件はあるの？機械学習の副業案件に必要なスキル・収入(時給)を解説！

rinna、日本語に特化した「GPT-2」「BERT」事前学習モデルを無償公開 75ギガバイトのデータを最大45日間で学習 | Ledge.ai

ELYZA DIGEST

冴えるヒロイン（ミライ小町）の制作事例を通じた、自然言語処理AIによるキャラクター性の抽出と反映【CEDEC2021】 | Gamer

9月新刊情報『実践時系列解析』

AIが書いたツイートを見分けられるか？ELYZA Digestの開発背景｜ELYZA, Inc.

BERTの推論速度を最大10倍にしてデプロイした話とそのTips - JX通信社エンジニアブログ

AIがどんな文章でも3行に要約してくれる「ELYZA DIGEST」を使ってみた

「どんな文章も3行に要約するAI」デモサイト、東大松尾研発ベンチャーが公開　「正確性は人間に匹敵」

4行でモデル構築と予測ができるAutoML OSSの老舗「auto-sklearn」

Gartnerが「先進テクノロジーのハイプ・サイクル」を発表

機械学習やレコメンドでよく見る「特徴量」の本質とは――「行列分解」の基本を図版とPythonコードで理解する

ColabCodeを使って、Google Colabの上でVS Codeを使ってみよう

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス