最新のニューラル会話モデルでおしゃべりしよう！ - GPT-2でチャットボット作成 - チャットボットひろば

テクノロジーカテゴリーの変更を依頼記事元:

noriyukipy.github.io

4 usersがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

最新のニューラル会話モデルでおしゃべりしよう！ - GPT-2でチャットボット作成 - チャットボットひろば

>>> import transf ormers >>> tokenizer = transf ormers.GPT2Tokenizer.from_pretrained("gpt2") >>> to... >>> import transf ormers >>> tokenizer = transf ormers.GPT2Tokenizer.from_pretrained("gpt2") >>> tokenizer.tokenize("お腹が空いた") ['ãģ', 'Ĭ', 'è', 'ħ', '¹', 'ãģĮ', 'ç', '©', 'º', 'ãģĦ', 'ãģŁ'] 日本語はスペースで単語が分けられていないため、トークナイザは文「お腹が空いた」を一単語として認識し、その後あらかじめ学習しておいたトークン単位に分割しています。バイト単位での分割のため、入力した文字数よりも多くのトークンが出現していることもわかります。このような観点から、GPT-2 を日本語で使おうとしたとき、日本語用のトークナイザに変更するその上で、GPT-2 を事前学習する必要があります。以上を踏まえて、

ブックマークしたユーザー

nyaocat2023/02/05

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx