[B! コーパス] nakaoka3のブックマーク

nakaoka3 id:nakaoka3

コーパスに関するnakaoka3のブックマーク (4)

NII、130億パラメータのLLM構築　コーパスなども全公開　「今後の研究に資するため」
国立情報学研究所（NII）は10月20日、パラメータ数130億の大規模言語モデル（LLM）「LLM-jp-13B」を公開した。初期段階のモデルだが、アカデミアや産業界の研究開発に資するため、コーパスやツールなどを含めてすべてオープンにする。公開したLLMの学習データ量は合計約3000億トークン。うち日本語は約1450億トークン（mC4／Wikipedia）、英語は約1450億トークン（The Pile／Wikipedia）、プログラムコード約100億トークン。計算資源としては、大学や研究機関が共同運営する仮想化環境・データ活用社会創成プラットフォーム「mdx」を12ノード活用。モデル構築にはMicrosoftのDeepSpeedを、モデル構築時の監視やログの保存には、モデル開発プラットフォームのWeights＆Biasesを利用した。 NIIが主宰するLLM勉強会（LLM-jp）で7月
nakaoka3 2023/10/21
LLM

日本語

コーパス
リンク
How to Pronounce English Naturally | YouGlish
• Arabic • Chinese • Dutch • English • French • German • Greek • Hebrew • Italian • Japanese • Korean • Polish • Portuguese • Russian • Spanish • Swedish • Thai • Turkish • Ukrainian • Vietnamese • Sign Languages
nakaoka3 2022/02/04
英語の発音を確認するときに便利

英語

webサービス

コーパス
リンク
AIのべりすと
Write Stories, with the Largest Public Japanese AI ever! AIで小説を書こう！ AI Novelist is the largest public Japanese storywriting AI, trained from scratch by more than 2TB corpus. You may start from one of the example prompts or start with your own text! Tips: You may want to enter at the least 5-6 lines worth of a seed text to make sure the AI understands the context/genre.
nakaoka3 2022/02/04
webサービス

文章

小説

機械学習

コーパス
リンク
SKELL
v1.11.5
nakaoka3 2021/01/15
コーパス

英語
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx