gengohouseのブックマーク / 2022年1月28日

gengohouse id:gengohouse

2022年1月28日のブックマーク (6件)

Huggingface Transformers 入門 (27) - rinnaの日本語GPT-2モデルの推論｜npaka
「rinna」の日本語GPT-2モデルが公開されたので、推論を試してみました。・Huggingface Transf ormers 4.4.2 ・Sentencepiece 0.1.91前回特徴は、次のとおりです。・学習はCC-100のオープンソースデータ。・Tesla V100 GPUで70GBの日本語テキストを約1カ月学習。・モデルの性能は約18 perplexity。2. rinnaの日本語GPT-2モデルの推論(1) Huggingface Transf ormersとSentencePieceをインストール。 # Huggingface Transf ormersのインストール !pip install transf ormers==4.4.2 # Sentencepieceのインストール !pip install sentencepiece==0.1.91(2) 日本語GPT
gengohouse 2022/01/28
リンク
TechCrunch
Piyush Gupta, one of the operating leaders at Peak XV Partners, is leaving the firm at the end of this month to start his own fund, four people familiar with the matter told TechCrunch. Gupta joined P
gengohouse 2022/01/28
リンク
15年間自然言語処理技術の研究開発をしてきた私が、これから"みらい翻訳"で実現したいこと | 働く社員を知る
はじめまして今月2022年1月にみらい翻訳にjoinした西山です。社内では初日からlisaと呼ばれているので、こういう風に苗字を名乗ることが既に懐かしいです。一方で、これまでは大企業に「入社」していたので「joinする」という表現には未だに慣れないです（書いててちょっと恥ずかしい…）。新卒入社したITベンダーの研究所で自然言語処理チームに配属されてから現在までの約15年間、所属や立場、他の仕事との比重を変えながらも、一貫して自然言語処理技術の研究開発（いわゆるR&D）に携わっています。昨年までは化学メーカーのデジタルトランスフォーメーション（DX）推進部門で、社内の文書活用にまつわる業務課題を解決するための自然言語処理技術開発と評価に取り組んでいました。みらい翻訳では、機械翻訳技術の研究開発を行う部門であるエンジニアリング部に所属し、機械翻訳エンジン開発チームのエンジニアリングマネージ
gengohouse 2022/01/28
#自然言語処理の求人求職
リンク
メタ、新たなAIスパコン構築　「間もなく世界最速に」
米メタ（旧フェイスブック）は24日、自社の研究チームが新しい人工知能（AI）スーパーコンピューターを構築したと明らかにした。間もなく世界最速のスパコンになるとしている。このスパコン「AIリサーチ・スーパークラスター」は2年近く取り組んだ成果で、新型コロナウイルスの感染が拡大する中、リモートでの作業が多かった。開発はメタのAIチームとインフラチームが率いた。提携している半導体大手エヌビディア、AIや高性能コンピューティング（HPC）などを手掛けるペンギン・コンピューティング、企業向けストレージサービスを手掛けるピュア・ストレージの研究者を含め数百人がこのプロジェクトに関わったという。メタによると同社の研究チームは現在、このスパコンを用いて自然言語処理（NLP）やコンピュータービジョン（CV、コンピューターによる視覚の実現）のAIモデルに学習させているところ。...
gengohouse 2022/01/28
自然言語処理にスパコンを使う時代が到来。
リンク
Awesome NLP — 21 popular NLP libraries of 2022
In this article I list the most used NLP libraries of today, giving them a brief description. They each have specific strengths and weaknesses in distinct use cases, so they can all be useful as a wealth of knowledge of a good data scientist specialized in NLP. Descriptions of each library are extracted from their GitHub repositories. Top NLP librariesHere is the list of top libraries, sorted by t
gengohouse 2022/01/28
リンク
人間と見分けがつかないほど自然な文章を書けるAI「GPT-3」の改良版AI「InstructGPT」一般公開、詩も執筆可能
文章生成AI「GPT-3」はオンライン掲示板で人間とバレずに1週間会話できるほど違和感の少ない文章を生成できることで知られており、Microsoftのプラットフォームに採用されるなど大きな注目を集めています。一方でGPT-3には反イスラム教的なバイアスが存在することが指摘されるなど、生成される文章に偏りがあることも分かっています。そんなGPT-3の学習モデルを改良して偏りを抑えつつ文章生成精度も向上させた文章生成AI「InstructGPT」の一般提供が2022年1月27日に始まりました。 Aligning Language Models to Follow Instructions https://openai.com/blog/instruction-following/ OpenAI launches new GPT-3 model despite continued toxic t
gengohouse 2022/01/28
リンク
- 2022年1月29日
- 2022年1月28日
- 2022年1月27日