電子健康記録には構造化されていないテキストが大量に含まれているため、臨床分析を可能にするために情報抽出技術を適用する必要があります。 キングス・カレッジ・ロンドンのZeljko Kraljevicらは、医療自然言語処理ツールキットであるMedCATを紹介しています。 メディカルドキュメントは略語や同義語など一意でない言葉が使用されている場合があります。学習は一意な言葉で行われており、類似度の高いものを選択します。フリーテキストのみでキャプチャされた大量の医療情報が、最先端のヘルスケアに特化したNLPを使用してアクセスできるようになりました。BERTのような教師付き学習モデルを用いて、拡張していくでしょう。 参照した論文: Zeljko Kraljevic、Thomas Searle、 Daniel Bean ,” Multi-domain Clinical Natural Language
![医療の用語に対応した自然言語処理パッケージ「MedCAT」登場!【GitHub】 | AIDB](https://cdn-ak-scissors.b.st-hatena.com/image/square/e6ce6e1b280cf4c0f1a2d3e91cfd42c31e465900/height=288;version=1;width=512/https%3A%2F%2Faiboom.net%2Fwp-content%2Fuploads%2F2020%2F10%2Fgithub_20201014_on-4.png)