samurairodeoのブックマーク / 2021年8月10日

7 Cool Python Packages Kagglers Are Using Without Telling You

samurairodeo 2021/08/10

リンク

第1回　自分にしか書けないものにこだわった ―異色の機械学習書誕生の裏側 | gihyo.jp

2021年8月に発売される『機械学習を解釈する技術』の著者である森下光之助氏と、『施策デザインのための機械学習入門』を共著した齋藤優太氏、安井翔太氏の3人による対談を3回にわたってお届けします。第1回は、書籍執筆のモチベーションのお話から。それは個人的な興味から始まった安井：では僕から振ったほうがいいでしょうか。じゃあとりあえず執筆のモチベーションと裏話みたいなところから伺っていきたいのですが。安井翔太（やすいしょうた）2013年にNorwegian School of Economicsにて経済学修士号を取得しサイバーエージェント入社。入社後は広告代理店にて広告効果検証等を行い、その後2015年にアドテクスタジオへ異動。以降はDMP・DSP・SSPと各種のアドテクプロダクトにおいて、機械学習に関する業務やデータを元にした意思決定のコンサルティングを担当。現在はAILabの経済学チー

samurairodeo 2021/08/10

あとで読む

リンク

PDFの正確かつ高度な要素抽出が可能となるアドビの新API「PDF Extract API」

アドビは8月3日、公式ブログにて「PDFの可能性を広げるAdobe Document Serviceの新しいAPI」と題した記事を公開した。新たなAPIである「PDF Extract API」を使うことでPDFからの高度なデータ抽出が可能となる。 Adobe PDF Extract APIは、アドビが昨年発表した「Adobe Sensei」をベースとしたPDF解析API。PDFにどのようなデータが含まれているかを判別することはテキストや段組み、表組みや画像といった要素を解釈してドキュメントの構造を理解することが必要となるが、これをAIと機械学習プラットフォームであるAdobe Senseiを用いるもの。 PDFに含まれる要素を自動的に抽出できることにより、機械学習モデルへの利用、分析やインデックス作成、抽出データの保存、RPA（ロボティック・プロセス・オートメーション）やNLP（自然言語処

samurairodeo 2021/08/10

あとで読む

リンク

Engadget | Technology News & Reviews

Apple is launching new iPads May 7: Here's what to expect from the 'Let Loose' event

samurairodeo 2021/08/10

リンク

We’ve Got a New Way for Telehealth Patients to Easily Connect to Care

samurairodeo 2021/08/10

リンク

HTTP/3 From A To Z: Core Concepts — Smashing Magazine

After almost five years in development, the new HTTP/3 protocol is nearing its final form. Earlier iterations were already available as an experimental feature, but you can expect the availability and use of HTTP/3 proper to ramp up over in 2021. So what exactly is HTTP/3? Why was it needed so soon after HTTP/2? How can or should you use it? And especially, how does it improve web performance? Let

samurairodeo 2021/08/10

あとで読む

リンク

学びのススメ vol.2：IPA 独立行政法人情報処理推進機構

学び続けている実践者の方からお話を伺いました。ご自身の組織や個人としての学びのご参考になれば幸いです。 2004年東京大学理科一類で入学するも、心理学に関心を持ち文学部に転籍。2008年東京大学文学部卒業。その後2社のベンチャー企業を経て2011年に起業、2年弱で代表を交代し2012年にスローガン株式会社にジョイン。キャリアカウンセラーとして2年間で数百人の就活生とキャリアについて対話するなかで、思考を言語化する面白さや課題解決への効果を実感。2015年8月にフリーランスとして独立し、ディスカッションパートナーという職業を名乗り支援した企業は約100社。2017年には行き過ぎた「個の時代」の反動として「コミュニティの時代」を直感し、2月にフリーランスコミュニティのFreelanceNowを、11月には議論でつながるコミュニティの議論メシを立ち上げる。議論メシのメンバー数は200人。様々な

samurairodeo 2021/08/10

あとで読む

リンク

「ほぼすべてが手作業」からAI-OCRとRPAで脱却、福岡銀行が挑む

「国際業務は顧客にとって重要なインフラの役割を担うにもかかわらず、手作業が多い。人の頑張りに頼らず、効率的で持続可能な体制を早期に実現していく」。ふくおかフィナンシャルグループ（FG）市場統括部部長の工藤章氏は、福岡銀行が2021年8月に利用を始める予定の新クラウドサービスの狙いをこう語る。福岡銀行が導入するのは、NTTデータ四国が開発する「WIFES（ワイフェス）」。AI-OCRやRPA（ロボティック・プロセス・オートメーション）を活用し、国際送金業務の効率化を狙う。当初から開発協力していた同行が第1号ユーザーになる。国際送金業務は、顧客から受け取った送金依頼書の内容を確認し、SWIFT（国際銀行間通信協会）のネットワーク向けに送金メッセージを作成。メッセージをSWIFT用端末に入力して送信する、という流れで進める。WIFESはこの一連の作業を効率化するものだ。 WIFESによる国際

samurairodeo 2021/08/10

あとで読む

リンク

Google、初オリジナルモバイルSoC「Google Tensor」発表　「Pixel 6」に搭載

Googleは2016年に機械学習向けプロセッサ「Tensor Processing Unit（TPU）」を発表しており、主にデータセンターのサーバで採用してきた。Google Tensorには、モバイル向けに最適化したTPUが搭載されるようだ。スンダー・ピチャイCEOは自身のTwitterアカウントで「Tensorチップをクリップサイズまで小型化するのに4年かかった！（中略）TensorはPixel史上最大のイノベーションだ」とツイートした。オステルロー氏は米The Vergeに対し、「他のSoCと同様に、多くの技術はライセンスしている（サードパーティー製のCPUやGPUを採用しているという意味）が、設計はオリジナルであり、機械学習とAI強化を目的として特別に設計した」と語った。TPUにより、例えばカメラ関連の新機能が追加され、従来の機能がより高性能になるという。また、Google

samurairodeo 2021/08/10

あとで読む

リンク

https://pubs.acs.org/doi/10.1021/acs.jcim.1c00653

samurairodeo 2021/08/10

リンク

医療および検査リソースの最適化シミュレーション #23 | COVID-19 AI・シミュレーションプロジェクト

インタビュー記事：ゴードン・ベル賞COVID-19研究特別賞受賞！坪倉誠先生が語る飛沫・エアロゾル飛散シミュレーションが切り拓く未来

samurairodeo 2021/08/10

あとで読む

リンク

京都大学、データサイエンス講座のオンライン受講者募集を開始 | Ledge.ai

※この記事はデータサイエンス専門メディア「Da-nce」からの転載です京都大学は8月2日、「京都大学データサイエンス講座」と題したオンライン講座の受講生を募集開始した。「文系のための統計入門講座～統計検定®3級を目指して～」「データ分析に役立つ統計基礎講座～統計分析ソフトウェアR活用を目指して～」の2講座だ。＞＞「京都大学データサイエンス講座文系のための統計入門講座～統計検定®3級を目指して～」受講生募集について | 京都大学＞＞「京都大学データサイエンス講座データ分析に役立つ統計基礎講座～統計分析ソフトウェアR活用を目指して～」受講生募集について | 京都大学はじめて統計を学ぶ人向けの「文系のための統計入門講座」文系のための統計入門講座は、統計学を初めて学ぶ人やデータ分析業務を始めてみたい人が対象。データ分析の手法を身に着け、身近な問題解決に生かす力が習得できるとされる

samurairodeo 2021/08/10

あとで読む

リンク

コードで学ぶAWS入門

各方面でご好評をいただいている本講義資料ですが，この度増補・改訂のうえ書籍として出版することが決定いたしました！書籍限定の書き下ろしの３章 (約100ページ分！)を新たに追加して，2021年9月27日に発売予定です．この資料を気に入っていただいた方は，手に取っていただけるとありがたいです．ここで公開している資料は引き続きオンラインで無料で読めますので，ご安心ください🙇

samurairodeo 2021/08/10

あとで読む

リンク

Google Transparency Report

samurairodeo 2021/08/10

あとで読む

リンク

ElasticのクライアントライブラリがAWS OpenSearchへの接続を排除。AWSは仕方なくクライアントライブラリのフォークを発表

ElasticのクライアントライブラリがAWS OpenSearchへの接続を排除。AWSは仕方なくクライアントライブラリのフォークを発表オープンソースの検索エンジンElasticsearchは、ログ解析による運用監視やセキュリティインシデントの発見、データ分析などに使われている人気のソフトウェアです。その開発元であるElasticは、Elasticsearchのクライアントライブラリに対して変更を加え、AWSが提供しているElasticsearch互換のサービス「Amazon Elasticsearch Service」に対して接続を拒否する機能を追加しました。今後、Elasticsearchのクライアントライブラリを用いたアプリケーションはAWSのElasticsearch Serviceを使えなくなってしまいます。そこでAWSはElasticsearchクライアントライブラリ

samurairodeo 2021/08/10

あとで読む

リンク

Pythonの異常検知パッケージPyODのフォーマットに従って、カーネル密度推定に基づく異常検知を実装した - 備忘録

はじめに異常検知（外れ値検知）のための便利なPythonパッケージとしてPyODが存在する。 pyod.readthedocs.io github.com クラシックな手法から比較的最先端の手法まで実装されており、インタフェースも使いやすいのでオススメできる。 2021年8月9日現在、PyODにカーネル密度推定（Kernel Density Estimation; KDE）ベースの異常検知が実装されていなかったので、それを実装したということである。 PyODのインストール pipでインストール可能である。 pip3 install pyod 異常検知について以下の記事を読むのが良いだろう。 qiita.com カーネル密度推定についてばんくし氏の記事が参考になるだろう。 vaaaaaanquish.hatena blog.com 作成したクラス：KDE すでに実装済のPyODの各種アル

samurairodeo 2021/08/10

あとで読む

リンク

ハイパーパラメータとは？チューニングの手法を徹底解説（XGBoost編）

【macOS】 macOS Mojvabe 10.14.6 Python 3.6.9 NumPy 1.14.6 Pandas 0.22.0 Scikit-Learn 0.20.1 XGBoost 1.0.2 ハイパーパラメータ（英語：Hyperparameter）とは機械学習アルゴリズムの挙動を設定するパラメータをさします。少し乱暴な言い方をすると機械学習のアルゴリズムの「設定」です。この設定（ハイパーパラメータの値）に応じてモデルの精度やパフォーマンスが大きく変わることがあります。例えば男女を分類するモデルを構築していた場合、特に調整を行わずに初期設定のままモデリングを行なった結果、最初は90%の正解率を得ることができたとします。90%の精度では使い物にならないと上司に怒られたので、ハイパーパラメータ（モデルの設定）を調整したところ93%へ改善することがあります。ハイパーパラメータチュ

samurairodeo 2021/08/10

リンク

機械学習のパラメータチューニングを「これでもか！」というくらい丁寧に解説 - Qiita

はじめに私はこれまで機械学習のパラメータチューニングに関し、様々な書籍やサイトで学習を進めてきました。しかしどれもテクニックの解説が主体のものが多く、「なぜチューニングが必要なのか？」という目的に関する記載が非常に少なかったため、体系的な理解に苦労しました。この経験を後世に役立てられるよう、「初心者でも体系的に理解できる丁寧さ！」をモットーに記事にまとめたいと思います。具体的には、 1. パラメータチューニングの目的 2. チューニングの手順とアルゴリズム一覧 3. Pythonでの実装手順 (SVMでの分類を例に) の手順で解説を進めます。独自解釈も含まれるため、間違っている点等ございましたら指摘頂けると有難いです。なお、文中のコードはこちらのGitHubにもアップロードしております。 2021/9/6追記：LightGBMのチューニング実行例追加以下の記事に、Ligh

samurairodeo 2021/08/10

あとで読む

リンク

Explainability for Natural Language Processing

samurairodeo 2021/08/10

リンク

Rustで扱える機械学習関連のクレート2021 - Stimulator

- はじめに - 本記事では、Rustで扱える機械学習関連クレートをまとめる。普段Pythonで機械学習プロジェクトを遂行する人がRustに移行する事を想定して書くメモ書きになるが、もしかすると長らくRustでMLをやっていた人と視点の違いがあるかもしれない。追記：2021/02/24 repositoryにしました。こちらを随時更新します github.com 追記；2021/07/26 GitHub Pagesでウェブサイトにしました vaaaaanquish.github.io - はじめに - - 全体感 - - 機械学習足回り関連のクレート - Jupyter Notebook Numpy/Scipy Pandas 画像処理形態素解析/tokenize - scikit-learn的なやつ - 各ライブラリと特徴比較 - Gradient Boosting - XGBoos

samurairodeo 2021/08/10

あとで読む

リンク

はてなブックマーク

タグ

2021年8月10日のブックマーク (20件)

7 Cool Python Packages Kagglers Are Using Without Telling You

第1回　自分にしか書けないものにこだわった ―異色の機械学習書誕生の裏側 | gihyo.jp

PDFの正確かつ高度な要素抽出が可能となるアドビの新API「PDF Extract API」

Engadget | Technology News & Reviews

We’ve Got a New Way for Telehealth Patients to Easily Connect to Care

HTTP/3 From A To Z: Core Concepts — Smashing Magazine

学びのススメ vol.2：IPA 独立行政法人情報処理推進機構

「ほぼすべてが手作業」からAI-OCRとRPAで脱却、福岡銀行が挑む

Google、初オリジナルモバイルSoC「Google Tensor」発表　「Pixel 6」に搭載

https://pubs.acs.org/doi/10.1021/acs.jcim.1c00653

医療および検査リソースの最適化シミュレーション #23 | COVID-19 AI・シミュレーションプロジェクト

京都大学、データサイエンス講座のオンライン受講者募集を開始 | Ledge.ai

コードで学ぶAWS入門

Google Transparency Report

ElasticのクライアントライブラリがAWS OpenSearchへの接続を排除。AWSは仕方なくクライアントライブラリのフォークを発表

Pythonの異常検知パッケージPyODのフォーマットに従って、カーネル密度推定に基づく異常検知を実装した - 備忘録

ハイパーパラメータとは？チューニングの手法を徹底解説（XGBoost編）

機械学習のパラメータチューニングを「これでもか！」というくらい丁寧に解説 - Qiita

Explainability for Natural Language Processing

Rustで扱える機械学習関連のクレート2021 - Stimulator

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第2週）

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス