情報処理などコンピュータを利用する講義の増加に伴い、レポートをコンピュータで作成して提出することが多くなっています。そのため、コンピュータに関する知識が少しあれば簡単に他人のレポートを複製できてしまい、講義内容の習得率が低下しやすくなっています。 この問題を解決するために、各々のレポートが他の学生のレポートとどのくらい類似しているかを判定するシステムを構築しました。このシステムを利用することで、また、このシステムの存在を知らせるだけでも、レポートの複製という行為の無意味さを学生に気づかせ、学生のやる気を促すことができます。 当システムは文書検索の概念を用いて、以下のような流れで類似度判定を行います。(単純な類似度判定の例) レポートを一つの文書とみなし、形態素に分解します。 形態素の中から、実際に類似度判定に用いる形態素を抽出します。 形態素ごとにtfおよびidfを取得します。 tf・id