タグ

2024年2月24日のブックマーク (2件)

  • 確定申告のことが何もわからない人へ|第三のロース

    「確定申告って何?」のざっくりした回答です。いろんな例外を無視しており不正確です。全員には当てはまらない内容なので、絶対に真に受けないでください。【まだ執筆中なので全文無料です】 -------- ------- ------- ------- ------- ------- ▼だいたい大丈夫なので安心してください ⭐︎確定申告とはなにか・確定申告とは、去年の所得税の額を計算して自己申告すること。 ・「去年(1月1日〜12月31日)」のことを「2月16日〜3月15日」に申告するというサイクルが毎年行われている。今は令和6年の2月なので、令和5年分の申告をいまみんなやっている。 ・給料以外の収入があった人は、基的に確定申告をする。 ・どんな計算をするか、ざっくり言うと→ ①100お金もらいました(収入・売上) ②60お金払いました(支出・経費) ③差し引きで40もうかりました(所得) ④4

    確定申告のことが何もわからない人へ|第三のロース
  • pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama

    これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。 参考記事 導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。 解析コード: from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード: for structure in pdf_elements: print(structure) 結果: 残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ

    pdfからtextを抜き出す試行錯誤のメモ|Kan Hatakeyama