作ったもの 紙の書類などスキャンして管理してると ↓こんな感じでファイル名がカオスになりがち… そこで、今回のツールを一発たたくとこうなります。 何となく中身が推測できるようになりました。 このツールは何? 請求書・名刺・Webページなどのpdf・画像ファイルの中身を読み取り、重要(っぽい)ワードで自動リネームするツールです。 内部では以下を行ってます。 ファイルをGoogle Driveにアップロード (G Suiteが理想) OCRされたテキストを抽出 重要部分をNTTコミュニケーションズの固有表現抽出APIで抽出 (企業名とかの専門用語辞書使うと精度上がるっぽいけど無料版だと使えない…) 日付、会社名、人名を結合したファイル名を作りリネーム 動作確認環境 Mac 10.14.3 Python 3.7.2 動かし方手順 1.ファイルをGoogle Drive APIでアップロードできる
![GoogleのAIとNTTのAIを融合したら最強の業務カイゼンツールが爆誕した - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/0d56e107615d98cc69ce1025a4dcc4ac4b529d0f/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9R29vZ2xlJUUzJTgxJUFFQUklRTMlODElQThOVFQlRTMlODElQUVBSSVFMyU4MiU5MiVFOCU5RSU4RCVFNSU5MCU4OCVFMyU4MSU5NyVFMyU4MSU5RiVFMyU4MiU4OSVFNiU5QyU4MCVFNSVCQyVCNyVFMyU4MSVBRSVFNiVBNSVBRCVFNSU4QiU5OSVFMyU4MiVBQiVFMyU4MiVBNCVFMyU4MiVCQyVFMyU4MyVCMyVFMyU4MyU4NCVFMyU4MyVCQyVFMyU4MyVBQiVFMyU4MSU4QyVFNyU4OCU4NiVFOCVBQSU5NSVFMyU4MSU5NyVFMyU4MSU5RiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTU2JnM9Mzk3ZWFiNTU4NGEzODZhZTRhMDVjNzNkZTJiYmQ3YjU%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBIYXJ1c3VnaSZ0eHQtY29sb3I9JTIzMjEyMTIxJnR4dC1mb250PUhpcmFnaW5vJTIwU2FucyUyMFc2JnR4dC1zaXplPTM2JnR4dC1hbGlnbj1sZWZ0JTJDdG9wJnM9ZGMxYTM3NDRkNzJlMTFjZmFjZGQ3N2RhZGU3NDYyYWM%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3D56de84b10e5f2bb3a67b0a409e21a4a8)