Web系の企業でデータサイエンティストをしている者です。 今回はどこでも進捗状況が見れる「notion-tqdm」というPyPIライブラリを作ったので、そのお話をします。 🤔 処理はどこまで完了したのか? DSの人間なら、以下のようなことを思ったことはないでしょうか? あの重たいデータ整形どこまで終わってるかな?? あのモデルの学習はどこまで完了してるかな?? 軽い処理ならtqdmを仕込めばその場で確認できますが、重たい処理ではそうはいきません。 例えばJupyterで処理を実行する場合、コネクションが切れたりすると再度ノートブックを開いてもtqdmの反映はそこで止まってしまいます。 そのため、重たい処理の進捗を確認する場合によく取られるケースは以下です slack, line 等の botで通知 実験管理系のライブラリ(tensorboard, Naptune.ai, MLFlow)等