misshikiのブックマーク / 2021年12月6日

グーグルを追われたAI倫理研究者が、新たな研究所を開設した理由

misshiki 2021/12/06

人工知能

リンク

TechCrunch

Tesla investors, still digesting a 43% drop in share price since the beginning of the year, are gearing up for what will likely be unimpressive financial results for the first quarter and a shift in

misshiki 2021/12/06

人工知能

リンク

「AI導入は当たり前。最高のマシンが必要になる」DataRobotのデータサイエンティストら語る未来 | Ledge.ai

misshiki 2021/12/06

DataRobot Japanのイベント「AI Experience Virtual Conference 2021」レポート。

DataRobot

リンク

肥料どうまく？収穫時期は？ＡＩが小麦生産お助けします…ＮＥＣが実証実験

【読売新聞】　ＮＥＣは、国内外の大規模農園の作業を支援する人工知能（ＡＩ）の開発に乗り出した。今年６月からは小麦で実証実験を始めており、衛星写真や土壌センサー、農機で集めたデータを分析。肥料のまき方や収穫時期を細かく調整し、収穫量の

misshiki 2021/12/06

事例“衛星写真や土壌センサー、農機で集めたデータを分析。肥料のまき方や収穫時期を細かく調整し、収穫量の向上を図る”

人工知能

リンク

「説明可能なAI」に企業が注目　欧州規制案などに対応 - 日本経済新聞

人工知能（AI）の活用に規制をかける動きが世界で強まっている。AIは意図せぬ結論を出したり、その理由が説明できなかったりすることが少なくないためで、欧州連合（EU）が2021年4月に公表した規制案では厳格な利用条件を設け、違反企業には罰金を科す。企業は規制強化に対応し、判断理由を提示できる「説明可能なAI（XAI）」の開発を急いでいる。企業はAIの活用で約束される自動化や効率化の恩恵を得ようとし

misshiki 2021/12/06

“企業は規制強化に対応し、判断理由を提示できる「説明可能なAI（XAI）」の開発を急いでいる。”へぇ。

リンク

AIによるレコメンドサービスはどこまで使えるか？｜@DIME アットダイム

買い物の途中、AIが自分に合った商品をレコメンドしてくれるサービスがぞくぞくと増えている。意外と自分の好みや適した商品というのは自分自身ではわからないものだ。また、最近では商品の種類が多いため、どれを選べばいいか迷うこともある。そんなときにも便利なのが、レコメンドだ。日頃の実店舗でのショッピングをさらに楽しめる3つのサービスを紹介する。 AIが商品をレコメンド！ショッピングがさらに楽しめる3つのサービス 1.今の気分に合った日本酒をAIがレコメンド！日本酒ソムリエ AI「KAORIUM for Sake」 2021年12月8日（水）まで、紀ノ国屋渋谷スクランブルスクエア店に、今日の気分にぴったりの日本酒をレコメンドしてくれるAIシステム「KAORIUM for Sake」が設置されている。これは、SCENTMATIC（セントマティック）と紀ノ國屋がタッグを組んで行っている実証実験で、今

misshiki 2021/12/06

事例“AIが商品をレコメンド！ショッピングがさらに楽しめる3つのサービス”日本酒ソムリエ AI、似合うメガネをAIがランキング、自分にぴったりのコーヒーをロッカー受取。

人工知能

リンク

The Coming AI Singularity in 2050: How to Survive and Thrive in the Trans-Human Era

misshiki 2021/12/06

“2050年に登場するAIの特異点：人間を超えた時代に生き残り、繁栄する方法”AGIで知識を持つ次は意識を持つ？この手の記事は久しぶりな気がする。現実感は全然ないが。

人工知能

リンク

序盤に試すテーブルデータの特徴量エンジニアリング

この記事はKaggle Advent Calendar 2021の4日目の記事です．はじめにこの記事ではテーブルデータコンペティションにおいて，主に数値データ，カテゴリデータをもとに特徴量を作成する方法をまとめました．発展的な内容というより，初めてコンペに参加する方でも使える汎用的な特徴量エンジニアリングを紹介します．特徴量エンジニアリング！...そのまえにモデルについて特徴量エンジニアリングはモデルによって処理が変わることがあります．例えば勾配ブースティング決定木(GBDT)といった決定木はスケーリングする必要がなく，またLightGBMなどは欠損値をそのまま扱うことができます．一方でニューラルネットワーク(NN)や線形回帰モデルはスケーリングおよび欠損値補完をする必要があります．このこと以外にも，決定木は各特徴量間で差や比率を表現することが苦手であるために明示的に作る必要

misshiki 2021/12/06

数値データ、カテゴリデータ、テキストデータ、それらの組み合わせ、スケーリングで大きく7つの枠組みでどのような手法を取るかが紹介されています。

リンク

数量・時間表現抽出ツールをPythonでゼロから実装してみた【NormalizeNumexp】 - Qiita

はじめに何をしたのか NormalizeNumexpと呼ばれる数量表現や時間表現の抽出・正規化を行うOSSの実装をすべてPythonで実装しました。 Python3.7～3.10で動きます。 GitHub：https://github.com/tkscode/pyNormalizeNumExp PyPI：https://pypi.org/project/pynormalizenumexp/ 何が嬉しいのか Pythonで使う際にpipコマンドで一発でインストールできるようになりました。本家はC++で実装されており、Pythonで利用する場合は依存ライブラリであるuxとpficommonをインストールする本家のNormalizeNumexpをインストールする SWIGによるPythonバインディングをインストールするといった手順を踏みますがコードが古いため1.～2.でエラーが頻発

misshiki 2021/12/06

“NormalizeNumexpと呼ばれる数量表現や時間表現の抽出・正規化を行うOSSの実装をすべてPythonで実装”PyPIでインストール可能。

Python

リンク

深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era

■イベント  ：【SenseTime Japan × Sansan】画像処理勉強会 https://sansan.connpass.com/event/230636/ ■登壇概要タイトル：深層学習時代の文字認識とその周辺発表者：  技術本部 DSOC R&D研究員　宮本優一 ▼Twitter https://twitter.com/SansanRandD

misshiki 2021/12/06

27ページのスライド資料。

OCR

リンク

Writing and publishing a Python module in Rust

Procmaps? procmaps is an extremely small Python library, backed by a similarly small Rust library2. All it does is parse “maps” files, best known for their presence under procfs on Linux3, into a list of Map objects. Each Map, in turn, contains the basic attributes of the mapped memory region. By their Python attributes: import os import procmaps # also: from_path, from_str # N.B.: named map_ inst

misshiki 2021/12/06

“RustでのPythonモジュールの作成と公開”

Rust
Python

リンク

FairLens - How to tackle machine learning fairness - Synthesized

misshiki 2021/12/06

FairLensはデータバイアスの発見と測定するライブラリ。公式サイト。

リンク

データの「偏見」を可視化するPythonライブラリの真の価値とは何か

データのバイアス（偏り、偏見）に対する保険が必要だ。特にAIにデータを提供する機械学習には欠かせない。機械学習の誤差は、データ内のある要素が他の要素よりも高く重み付けされ、非常に強く現れる場合に発生する。英国のスタートアップ企業SynthesizedのDataOpsプラットフォームは、データにあるバイアスを見つける手段を提供する。このバイアスが軽減されれば、例えば保険の見積もり、賠償請求、保険の掛け金が公平になる可能性がある。オープンソースのPythonライブラリ iStock.com/designer491 Synthesizedはデータのバイアスを識別および計測するオープンソースのPythonライブラリ「FairLens」を発表した。 Synthesizedのデニス・ボロビコフ氏（共同創設者でCTO：最高技術責任者）は、データサイエンスモデルの多くのデータには年齢や人種、性別などの

misshiki 2021/12/06

“機械学習に使うデータに年齢や人種、性別に関わるバイアスが含まれていると、AIは誤った推論を出力する。FairLensはこれらのバイアスを可視化し、公平性に寄与する。”

機械学習

リンク

Pyroで実践するベイズ機械学習

本書について #Pyroで実践するベイズ機械学習は、Uber AI Labsが中心となって開発を進めている確率的プログラミング言語Pyroを用いてベイズ機械学習を行う方法を解説した入門書です。ベイズ機械学習の基礎からPyroでそれをどのように実装するのかまでを解説していきます。本ドキュメントは2021/08/08 現在、制作中です。本ドキュメントはオープンなプロジェクトであり、そのため協力者を広く求めています。本書のソースコードは GitHub上で公開されています。本書への追記や修正などありましたら、上記GitHubにてIssueの発行、またはPull requestをお願いいたします。本ドキュメントは Creative Commons Attribution-ShareAlike 4.0 International License のもとで公開されています。

misshiki 2021/12/06

“Pyroで実践するベイズ機械学習は、Uber AI Labsが中心となって開発を進めている確率的プログラミング言語Pyroを用いてベイズ機械学習を行う方法を解説した入門書”

確率的プログラミング

リンク

機械学習を学び、実験できる無料サービス「Amazon SageMaker Studio Lab」プレビュー版が発表

機械学習を学び、実験できる無料サービス「Amazon SageMaker Studio Lab」プレビュー版が発表：「JupyterLab」ベースのノートブック開発環境でAWSリソースを利用 AWSはJupyterノートブックを使用して機械学習を学び、実験できる無料サービス「Amazon SageMaker Studio Lab」のプレビュー版を発表した。クレジットカード番号は不要であり、AWSアカウントすら必要ない。

misshiki 2021/12/06

“Studio Labを使うと、次のような無料の教育コンテンツにアクセスできる。・AWS Machine Learning University（MLU）・Dive into Deep Learning（D2L）・Hugging Face”

Jupyter
AWS

リンク

Amazon Sagemaker Studio Lab で無料で機械学習を学んでみよう！ #reinvent | DevelopersIO

こんにちは！森田です。先日のSivasubramanian KeynoteでAmazon SageMaker Studio Labが発表されました。この記事では、Sagemaker Studio Labに登録して、機械学習を無料で学ぶ方法をご紹介します。 Amazon SageMaker Studio Labとは Amazon SageMaker Studio Labとは、AWSが提供する無料の機械学習実行環境となっております。（AWSが提供していますが、AWSアカウントは必要ではありません。）もちろん無料ですので多少の実行制限はありますが、機械学習を学び、実験する程度では問題ない環境が整っております。初めて機械学習を学ぶ際には、実行環境構築の敷居が高くなってしまいがちですが、このSageMaker Studio Labであればそんな問題も解決され、誰でも簡単に機械学習を始めれそ

misshiki 2021/12/06

Jupyter

リンク

Vertex AI使ってみた - Qiita

実際に使ってみる Vertex AIのチュートリアルで使用されているデータを利用して表形式のデータの機械学習を行います。使用するのは、銀行のマーケティングデータです。銀行の顧客が年齢、収入、職業などから定期預金を購入するかどうか予測するのが機械学習モデルの目的です。今回の場合にはプログラミングを行うことなく全てのワークフローを実施することができます。 *)「4.機械学習モデルの学習」を実行すると1時間以上計算にかかります。数千円ほど課金されますのでご注意ください😭 0.準備まずGCPのナビゲーションメニューから「Vertex AI」の「ダッシュボード」を選択します。 Vertex AIのダッシュボード画面に遷移します。 1.データの収集ダッシュボードの「トレーニングデータを準備する」の「データセットを作成」をクリックします。データセット画面に遷移します。「データセット名」に任

misshiki 2021/12/06

リンク

ＡＩは選挙をどう捉えた？分析で見えた“衆院選の実像”

misshiki 2021/12/06

“今回の選挙分析に活用した富士通のＡＩ技術「ＷｉｄｅＬｅａｒｎｉｎｇ」は、結果を導くプロセスが論理的で、客観的な説明が可能なＡＩ技術です。”

人工知能

リンク

Deep Metric Learningによる、ホテルや飲食店などの拠点検索改善

1.2 なぜDeep Metric Learningにしたか改善前のモデルでも特徴量を頑張って作れば解決できないことはないとは思います。「地名、ジャンル等に引っ張られて、拠点名指定を無視してしまう」パターンでは、クエリを解釈するロジックを入れ、地名だということを理解して地名部分のみを拠点の住所とマッチングさせて、それ以外を拠点名にマッチングさせて、という具合で特徴量を作れば正解できる可能性があると思います。しかし、これは一例で全体的に精度を上げるにはさまざまなケースを人が考慮して特徴量を作っていく必要があるので大変です。そこで、学習データ（クエリと正解拠点のペア）が大量にあることを生かして、DNN（Deep Neural Network）がよしなに学習してくれるのに期待しました。また、プロダクト化することを考えると遅くとも数百ミリ秒以内で応答する必要があるので、クエリと拠点側をそれぞれ

misshiki 2021/12/06

“ユーザーの検索クエリの意図に合った拠点（ホテルや飲食店など）を検索するモデルをDeep Metric Learningで学習したベクトルを使った検索モデルにすることで精度を改善した事例を紹介”

機械学習

リンク

RISC-Vに新仕様が15個追加される、AI・機械学習・IoTアプリ関連の機能を強化

オープンソースライセンスで提供される命令セットアーキテクチャの「RISC-V」の標準化団体であるRISC-V Internationalが、新たにRISC-Vのベクトル仕様とハイパーバイザー仕様、スカラー暗号化機能について40個の拡張仕様を含む15個の新仕様を承認したと発表しました。今回承認された新仕様は、人工知能(AI)・機械学習・モノのインターネット(IoT)・自動運転車・データセンター向けのアプリケーション開発者に新たな可能性をもたらすと述べられています。 RISC-V International Ratifies 15 New Specifications, Opening Up New Possibilities for RISC-V Designs - RISC-V International https://riscv.org/announcements/2021/12/ri

misshiki 2021/12/06

人工知能

リンク

エンジニアとしての機械学習との付き合いかた

機械学習システムの開発・運用を担うエンジニアの視点からの話です ※社内LT用につくったもの

misshiki 2021/12/06

22ページのスライド資料。

機械学習

リンク

Deepでポン用実験管理ツール（サービス）の比較2021 - Qiita

皆様メリークリスマス！ふぁむたろうです。記事遅れてしまいすみませんでした自分はここ1年くらいのコンペでは脳死で wandb（Weights & Bias）を使って実験管理をしていたのですが、1年の節目ということで他のツール（サービス）も見てみようと思い記事にしました。（余談ですが wandb の読み方は「Weights & Bias」でも「ワンディービー」でも「ダブリューアンドビー」でも良いっぽいです）特に業務上で使う場合 pricing 等も気をつけなきゃいけないため、この記事ではそこらへんにも触れていければと思います。とはいえ昨今の実験管理ツールはたくさんあるので、今回は以下の5つに絞って比較してみます。（pytorch lightning に標準装備されているもの） TensorBoard MLflow Neptune.ai Weights & Biases Comet

misshiki 2021/12/06

“TensorBoard MLflow Neptune.ai Weights & Biases Comet”を比較

MLOps

リンク

【Hydra+wandb+etc..】研究室で利用している機械学習実験環境について(追記予定です．) - Qiita

はじめに TDU_データ科学・機械学習研究室Advent Calendar 5日目記事書ききれてないです．すみません，もう少し解説加えたものを近日中にアップします!! 普段僕はComputer Visionの研究をしています．研究ではCNNを用いて伝統文様の解析をしています．昨今の深層学習ではGPUを利用することがほぼマストで．かくいう僕も研究では研究室のGPUマシンを利用しています．リモート(大学のGPU)マシンでの画像関係の実験は難しいです．具体的に言うと，画像は大量にあるので生データを逐一見るのは難しい．そこで，僕は普段GPUマシン上に利用している実験環境について語ります．パラメータ管理: hydra ログ(Accuracy, loss, GPUモニタリング)管理: wandb 画像の管理 sshfs streamlit(オリジナルアプリ) データ管理 csv管理 dvc(D

misshiki 2021/12/06

Hydraやwandbでの実験管理について。

MLOps

リンク

ミニマルな機械学習の実験管理を目指して

(追記 (2021/12/30): ここで述べた方法を実践するための Python パッケージ luigiflow を公開しました。) (この記事は私が書いた英語版の記事 Toward the minimalism of machine learning experiment workflows を私自身が翻訳したものです。元記事の作成にあたり友人の Sajjadur Rahman と Sara Evensen にフィードバックをいただいたことを感謝します。) 本記事は、ストックマーク Advent Calendar 2021 の 15 日目の記事です。機械学習分野の研究者やエンジニアの多くにとって実験は業務の大きなコストを占めます。そのため実験環境の構築が業務のパフォーマンスに直結することは言うまでもありません。それと関連して近年 MLOps への注目が非常に高まっていますが、

misshiki 2021/12/06

“私の業務フローにおいてどんな機能が必要でどんな機能が必要でないかを考え、” Luigi と MLflow による実験管理方法を紹介。

MLOps

リンク

機械学習で何ができる？やさしくわかりやすく解説する『Python3年生機械学習のしくみ』発売

『Python3年生機械学習のしくみ体験してわかる！会話でまなべる！』は、プログラミング初心者のための入門書シリーズ「Python1年生」の最新刊です。本書はライブラリが豊富なPythonで機械学習を体験できる内容で、「機械学習って？　何ができる？」というレベルの方が仕組みや要点を学ぶことができます。機械学習や人工知能の触りは『Python 1年生体験してわかる！会話でまなべる！プログラミングのしくみ』でも解説しています。また、機械学習に関連するデータ収集は『Python2年生スクレイピングのしくみ』、データ分析は『Python2年生データ分析のしくみ』で解説しており、合わせて読むことで理解が深まりますが、本書自体は前提知識がなくても楽しめるようになっています。とにかくやさしくわかりやすく解説した入門書として、学び始めのエンジニアだけでなく、学生や非IT職でプログラミングに

misshiki 2021/12/06

新刊“『Python3年生機械学習のしくみ』が12月6日（月）に発売”

機械学習

リンク

2021: A Year Full of Amazing AI papers — A Review - KDnuggets

misshiki 2021/12/06

“2021年：すばらしいAI論文でいっぱいの1年—レビュー”35本を概説。

機械学習

リンク

はてなブックマーク

タグ

2021年12月6日のブックマーク (26件)

グーグルを追われたAI倫理研究者が、新たな研究所を開設した理由

TechCrunch

「AI導入は当たり前。最高のマシンが必要になる」DataRobotのデータサイエンティストら語る未来 | Ledge.ai

肥料どうまく？収穫時期は？ＡＩが小麦生産お助けします…ＮＥＣが実証実験

「説明可能なAI」に企業が注目　欧州規制案などに対応 - 日本経済新聞

AIによるレコメンドサービスはどこまで使えるか？｜@DIME アットダイム

The Coming AI Singularity in 2050: How to Survive and Thrive in the Trans-Human Era

序盤に試すテーブルデータの特徴量エンジニアリング

数量・時間表現抽出ツールをPythonでゼロから実装してみた【NormalizeNumexp】 - Qiita

深層学習時代の文字認識とその周辺 / OCR and related technologies in the Deep Learning era

Writing and publishing a Python module in Rust

FairLens - How to tackle machine learning fairness - Synthesized

データの「偏見」を可視化するPythonライブラリの真の価値とは何か

Pyroで実践するベイズ機械学習

機械学習を学び、実験できる無料サービス「Amazon SageMaker Studio Lab」プレビュー版が発表

Amazon Sagemaker Studio Lab で無料で機械学習を学んでみよう！ #reinvent | DevelopersIO

Vertex AI使ってみた - Qiita

ＡＩは選挙をどう捉えた？分析で見えた“衆院選の実像”

Deep Metric Learningによる、ホテルや飲食店などの拠点検索改善

RISC-Vに新仕様が15個追加される、AI・機械学習・IoTアプリ関連の機能を強化

エンジニアとしての機械学習との付き合いかた

Deepでポン用実験管理ツール（サービス）の比較2021 - Qiita

【Hydra+wandb+etc..】研究室で利用している機械学習実験環境について(追記予定です．) - Qiita

ミニマルな機械学習の実験管理を目指して

機械学習で何ができる？やさしくわかりやすく解説する『Python3年生機械学習のしくみ』発売

2021: A Year Full of Amazing AI papers — A Review - KDnuggets

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス