sh19910711のブックマーク / 2022年7月22日

sh19910711 id:sh19910711

2022年7月22日のブックマーク (9件)

AI時代に向けたクラウドにおける信頼性エンジニアリングの未来構想 / DICOMO2022 6A-1
DICOMO2022 6A 統一セッション：クラウド招待講演 https://tsys.jp/dicomo/2022/program/program_abst.html#6A-1 情報サービスの利用者に必要な機能を頻繁に加え続けながらも、いかに必要十分な信頼性を継続させるかが従前より課題となっている。この課題に対するひとつの回答とも言える、Googleが提唱した情報サービスの新しい運用形態であるSite Reliability Engineering（SRE）の普及が進んでいます。本発表では、SREの中核概念を整理した上で、AI時代に向けて、AIとの対話を軸にした未来の運用のあり方を構想します。
sh19910711 2022/07/22
"AIOps: 直接的な判断や操作よりは補助的な情報支援のための研究が支配的 / SREの原則にはAIが持つ可謬性を織り込みやすい / 運用データを広く入手できない制約の範囲では異常のデータを自ら作り出し学習する必要"

*algorithm

機械学習

*infra

devops
リンク
Detectron2で小銭を数える - Qiita
はじめにこの記事ではDetectron2というFacebook AIが開発している物体検出ライブラリを利用して，自作のデータセットに対して物体検出をしてみます．実際にやってみるとDetectron2に関する日本語・英語の情報があまり見つからず少し苦労したので，私と同じようにDetectron2で物体検出をしようとしている人の助けになれば幸いです．データセットとして日本硬貨４種類（1円，5円，10円，100円）が含まれた画像を用意し，PretrainedのFaster R-CNNを訓練しています．結果として次のように硬貨を検知できました． ※データセットに50円，500円硬貨が含まれていないのは，たまたま財布に入っていなかったためです． ※今気づきましたがhundredをスペルミスしてますね．恥ずかしいですが直すのが面倒なのでこのままで行きます．僕は深層学習に関して全く詳しくないため，
sh19910711 2022/07/22
2021 / "Detectron2: Facebook AIが開発している物体検出ライブラリ / iPhoneで硬貨の画像を30枚程度撮りました / データセットに50円，500円硬貨が含まれていないのは，たまたま財布に入っていなかったためです"

*algorithm

機械学習

Detectron2
リンク
元フィギュアスケート選手とディープラーニングの華麗な出会い　「選手の役に立ちたい」社会人大学院生の挑戦
2月24日、スポーツアナリストおよびスポーツデータ分析に興味のある人向けのイベント「Sports Analyst Meetup」が報知新聞社で開催されました。野球やサッカーなどメジャーな競技以外に、F1や登山、自転車など「そもそもどういうスポーツで、どうやって分析するの？」と考えさせられるものも多く、いろいろな示唆を得られました。ちなみに筆者も、ゴルフをお題に発表させていただきました。中でも異彩を放っていたのが、フィギュアスケートに関する発表をした慶応義塾大学社会人大学院生の廣澤聖士さんです。日本スポーツ振興センターにも所属しており、トップアスリートたちの映像分析サポートもしています。学部時代は自身もフィギュアスケート選手として氷上を滑っていた廣澤さん。「フィギュアスケートの採点方法が難しすぎる」ことに問題意識があり、中でも勝敗を分ける「ジャンプの回転不足」に注目したといいます。私
sh19910711 2022/07/22
2019 / "研究のモチベーションは「あいまいな採点基準をAIで正したい」というよりは、「AIを使って選手の競技力向上に貢献できないか」 / 「いまのジャンプは回転不足か否か」が分からず、コーチでも正確な判断は困難"

*algorithm

機械学習

sports
リンク
iPhoneで日本語OCR、文字認識が使える - Qiita
文字認識をかんたんにつかえる iPhoneで文字認識できたら、板書の書き起こしや、標識認識アプリなど便利につかえます。２０２２年のアップデートで日本語が利用可能に２０２２年のiOS16から、日本語の文字認識が可能になりました。組み込みのフレームワークのみで可能です。精度もかなり良く、さまざまなアプリで実用に耐えるレベルだと個人的には思います。つかいかた VisionのVNRecognizeTextRequestをつかいます。 recognitionLanguages に "ja" を指定します。 macOS13、Xcode14、iOS16以降が必要です。 let request = VNRecognizeTextRequest() request.recognitionLanguages = ["ja"] // 日本語を指定 let handler = VNImageReques
sh19910711 2022/07/22
"iPhoneで文字認識できたら、板書の書き起こしや、標識認識アプリなど便利 / iOS16から、日本語の文字認識が可能になりました / 精度もかなり良く、さまざまなアプリで実用に耐えるレベルだと個人的には思います"

*algorithm

OCR

*program

ios
リンク
PyG (PyTorch Geometric) のデータセットを自作する - Qiita
グラフ構造を深層学習する PyG (PyTorch Geometric) を Google Colaboratory 上で使ってみました。今回は、PyG (PyTorch Geometric)のデータセットを自作することがテーマです。自作ではなくベンチマーク用に用意してあるデータを用いる場合は過去記事をご覧ください。日本地図のデータ題材として日本地図のデータを用います。日本語を matplotlib で表示するための準備をします。 Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/ Collecting japanize-matplotlib Downloading japanize-matplotlib-1.1.3.tar.gz (4.1
sh19910711 2022/07/22
"日本地図のデータ: 各市町村から、何番目（top - 1 番目）に近い市町村までに辺（edge）を引いた / 座標データとネットワークの接続関係を入力として、その市町村が「何地方なのか」を予測"

*algorithm

機械学習

graph

*program

python
リンク
dbtとLookerにたどり着いたデータ基盤 ~混ざり合う境界線を考える~
「Looker User Meetup Online #8」にて登壇した内容となっております
sh19910711 2022/07/22
"「これは一旦LookMLだけで対応するようにします」ができるのは、開発リソースがそれほどないチームにはかなり助かった / データ基盤にはPIIを取り込まない: 解約後6ヵ月で削除するようにするなどを考えたくない"

*data

datalake

*service

dashboard
リンク
論文・発表資料を作成するときに意識していること - Qiita
はじめに今までに、論文・発表資料を作成し、以下のシンポジウムで発表する機会をいただきました。ソフトウェア品質シンポジウムソフトウェア・シンポジウム SPI Japan 論文・発表資料を作成を作成するときに、多くの皆様にご指導いただきました。本当にありがとうございます。皆様からのご指導を受けた結果、論文・発表資料を作成するときに意識していることをまとめておきます。意識することは変わると思いますので、随時追記・整理していきます。意識していること論文・発表資料共通で意識していること内容自分のプロジェクトで見受けられる問題を扱う。自分のプロジェクトで効果を確認する。解決する課題は小さくする（小さくてもいい）。盛りだくさん内容を詰め込んだら、「Busy」とご指導いただいたことがあった。大きすぎる課題にしたときに、「あきらめなさい」とご指導いただいたことがあった。自分の経験
sh19910711 2022/07/22
"うしろから書く: 「まとめ」を述べるために必要なことのみを論文に記載 / 余白をなくそうとすることが、文章を見直すきっかけとなり、内容が洗練 / 自分で説明するのではなく、先行研究に説明していただけないか"

*writing

研究
リンク
論文要約: GraphCodeBERT - コードの変数の依存関係を入力して事前学習したモデル
概要テキスト、コードに加え、コードの変数の依存関係を表す有向グラフ（＝データフロー）の情報を入力し、グラフの構造を加味した2つのタスクで事前学習を行うことで、4つの下位タスクでCodeBERTを抜いてSOTAを達成した。 Abstract: https://arxiv.org/abs/2009.08366v4 研究の特徴 CodeBERTはコードを一方向のシーケンスとして捉えるためコードの構造を意識しない。例えばv = max_value - min_valueという式において、変数名のみから変数vの役割を推定するのは困難だが、「vが2つの変数max_value, min_valueに依存する」という情報を用いると、変数vの役割を知る手がかりとなる。先行研究には構文木を利用した研究があるが、本研究では構文木を直接利用せず、そこから抽出したデータフロー（＝変数どうしの依存関係を示す有効
sh19910711 2022/07/22
"「変数がどの変数に由来するか」を示した有向グラフ / 先行研究には構文木を利用した研究があるが、本研究では構文木を直接利用せず、そこから抽出したデータフロー（依存関係）を利用"

*algorithm

NLP

graph
リンク
「データレイク」と「データレイク層」
「データレイク」という言葉は使う人によって異なった意味があるように感じており、気になっていた。このポストではアーキテクチャ目線でのデータレイクと内容物目線でのデータレイクの違いについて書いてみる。便宜上前者を「データレイク」、後者を「データレイク層」と呼ぶことにする。アーキテクチャ目線の「データレイク」#「データレイク」については以前こちらのポストで書いたのでここでは詳しく触れない。詳細はリンク先を見ていただきたい。ここでキーとなるのが、加工前データや非構造化データを含むあらゆるデータを保存一元的なデータ管理という部分だ。あらゆるデータを一元的に管理するという思想であり、これができるアーキテクチャがデータレイクということだ。例えば AWS や Azure のドキュメントを見るとデータレイクの中が zone に分けられており、生データを保持する raw zone や加工された
sh19910711 2022/07/22
"アーキテクチャ目線でのデータレイクと内容物目線でのデータレイクの違い / 個人的には「データレイク層」は「raw data 層」というような命名の方が混乱を避けつつ実を表しておりいいのではという感じがする"

*data

datalake
リンク
- 2022年7月23日
- 2022年7月22日
- 2022年7月21日