[B! 前処理] slay-tのブックマーク

slay-t id:slay-t

前処理に関するslay-tのブックマーク (3)

OCR前処理としてのOpenCV超解像 - OPTiM TECH BLOG
R&D チームの徳田（@dakuton）です。最近は画像とテキストの狭間にいます。今回記事のまとめ簡単にまとめると以下のとおりです。いくつかの超解像(高解像度化)モデルがOpenCV extra modules(opencv_contrib)インストール + コード数行記述で導入可能超解像に限らず、文字が一定サイズ以上になるような前処理 -> OCR解析を実施すると、OCR精度改善につながることがある超解像による見た目の滑らかさに比例して、OCR精度改善につながるわけではない低計算コストな画像拡大から超解像に変更する恩恵は発生しにくいテスト条件を変えた場合、違った結果になる可能性あり(用いるOCRエンジン、画像の劣化条件、OpenCV未提供の後発モデル利用など) 実験内容利用するOCRエンジンの実行条件は変えずに、前処理部分のみ変更した場合のOCR精度・速度変化を調べま
slay-t 2021/03/23
blog

tech

前処理

ocr

cv

opencv
リンク
機械学習のための日本語前処理 - Qiita
はじめに機械学習を使ったチャットボットの仕組みを理解するために、テキストを訓練データとする簡単なニューラルネットワークを作成した際の備忘録。目的英文テキストで作成したルールベース型チャットボットを、日本語テキストにも適用して動作させること。日本語テキストを前処理し、それをニューラルネットワークへ通せることを確認する。訓練データとして、Niantic社の"Pokemon GO"に関連したサポートページをWebスクレイピングしたものを使用した。 Nianticサポートページ使用しているCSVファイル(GitHub) マルチクラス分類予め用意された応答文を入力にあわせて返す「ルールベース型」を参考に、"Intents"（意図）を識別して予測するマルチクラス分類の部分までを形にした。「生成型」ではなく、入力情報から関連した「よくある質問（FAQ）」を予測するものであるため、”RNN”で
slay-t 2020/04/30
学習

index

CSV

qiita

データ

前処理

機械学習

mecab

python
リンク
たった2行で画像認識モデルの精度向上！？新しいDataAugmentation自動最適化手法「RandAugment」解説！
3つの要点 ✔️ ランダムにData Augmentationの手法を選択するRandAugmentを提案 ✔️ 従来のAutoAugmentと比べ探索空間を$10^{-30}$にも削減し計算量を激減させたことで実践で使えるようにしただけでなく、CIFAR-10/100やImageNet, COCOなどのデータセットにおいて有用性が確認できた ✔️ ImageNetのSoTAであるNoisyStudentにも使われており、関数は2行で実装できるため読者の方も容易に使うことができる。 RandAugment: Practical automated data augmentation with a reduced search space written by Ekin D. Cubuk, Barret Zoph, Jonathon Shlens, Quoc V. Le (Submitted
slay-t 2020/02/12
画像

AI

画像認識

前処理

機械学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx