TISは機械学習に向けた教師データ作成ツール「doccano」をオープンソースソフトウェアとして公開した。テキスト分類、系列ラベリング、系列変換という3つの基本的なタスクで使用するデータを作成しやすいという。 TISは2018年11月6日、自然言語処理や機械学習に向けた教師データ作成ツール「doccano(ドッカーノ)」をオープンソースソフトウェア(OSS)として公開すると発表した。GitHubから入手できる。 doccanoは、機械学習などで教師データに使うラベル付きデータを作成するアノテーションツール。「テキスト分類」、文中の人名や地名などを特定する「系列ラベリング」、要約や翻訳といった「系列変換」という3つの基本的なタスクで使用するデータを作成しやすいという。 これらの基本的なタスクは表計算ソフトなどの帳票ツールでも実行可能だが、例えば系列ラベリングでは文字単位、単語単位でデータを作
![機械学習向け教師データ作成ツール、TISがオープンソースで公開:3種類のデータ作成に向く - @IT](https://cdn-ak-scissors.b.st-hatena.com/image/square/9a243736f6312e4da9e0e6f5109b853694d757d1/height=288;version=1;width=512/https%3A%2F%2Fimage.itmedia.co.jp%2Fait%2Farticles%2F1811%2F07%2Fl_yh20181107TIS_pict_590px.png)