2023/03/23 ChatGPT選手権!エンジニアリングに組み込んでみたらこうなりました LT大会 https://findy.connpass.com/event/276736/
上記のような出力結果の用途として僕が想定したのは、ユーザーが過去に入力した人名の表記のデータに対する読み仮名を追加で入力する必要に迫られた場合や、未知の人名リストにまとめて読み仮名を付与したい場合などです。 最近は電話帳を見かけなくなったので、人名リストではなく店名リストの画像になってしまいましたけど、この画像のように沢山の名前が列挙されている時に、それらに漏れなく読み仮名を付けたい場合があるのです。そして人間はとても賢いので、この様なリストに対してかなり高精度で読み仮名を付与できます。 めぐみやっきょく、うえのやっきょく、やまむらやっきょく、とまったく間違う気がしませんね。 同様にユーザーが過去に入力した人名の正解な読み方はユーザーに直接聞いたら分かるでしょう。しかし、その際にユーザーからすると読み仮名を入力する手間がかかります。これは1件くらいなら些細な時間の差ですが、500件、100
はじめに 以前、日本語のBERT事前学習済モデルやXLNet事前学習済モデル等の紹介記事を投稿しましたストックマークの森長です。 モデル公開の記事を多くの皆様に読んでいただき、ありがとうございます。 今回は、ALBERTの日本語事前学習済モデルを公開します。 さて、様々な事前学習済モデルが多数提案されている中、なぜALBERT日本語モデルを公開するかといいますと、ALBERTが、A Lite BERTと記載されるように、ただSOTAを突き詰めたものではなく、精度を維持・向上させつつもBERTを軽量化しているモデルのためです。 事前学習済モデルのサイズを大きくすると性能が向上する傾向にありますが、学習時間が長くなったりメモリにのらなくなったり、作成の上での制約が(費用面の制約も)増えてきます。そのため、比較的短時間でモデルを作成でき、モデルサイズが小さいALBERTは、とても使いやすいです。
最近、情報抽出、特にOpen Information Extraction(OpenIE)という分野について勉強しています。せっかく勉強しているので、学んだ内容について何回かに分けて紹介していこうと思います。第一回目の今回は、OpenIEという分野の概要について紹介し、OpenIEのきっかけとなったシステムであるTextRunnerとその仕組みについて説明します。 Open Information Extractionとは? OpenIEについて述べる前に、まずは伝統的な情報抽出について述べておきましょう。情報抽出は非構造化データであるテキストを構造化された表現に変換するタスクです*1。情報抽出で抽出される情報は関係のタプルの形(arg1, rel, arg2)で表現されます。このタプルは関係を示すフレーズ(rel)とその対象であるエンティティ(args)から成ります。一般的な処理の流れと
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く