タグ

Qiitaと日本語に関するni66lingのブックマーク (9)

  • 【Auth0】ログイン画面を日本語化する - Qiita

    はじめに Auth0のUniversal LoginにはClassicとNewの二つがありますがどちらもデフォルトだと英語が表示されます。 Classicの場合 Newの場合 今回はこれら二つのログイン画面の表記を日語にしてみました。 Classicの場合 Universal LoginのCustomize Login PageをONにします。 すると、画面下部にhtmlを編集する画面が表示されるので、変数のlanguageに'ja'を設定します。 <!DOCTYPE html> <html> <head> ... </head> <body> ... <script> // Decode utf8 characters properly var config = JSON.parse(decodeURIComponent(escape(window.atob('@@config@@')

    【Auth0】ログイン画面を日本語化する - Qiita
  • BERTを使った汎用的な日本語QAモデルの作成 - Qiita

    はじめに 自然言語処理の様々なタスクでSOTAを更新したBERTですが、2019年12月に日語のpretrainedモデルがpytorch版BERTに追加されました。これにより日語のBERTが以前より簡単に試せるようになりました。しかし、依然としてBERTの日語QAモデルに関する記事が存在しなかったため、この記事では日語pretrainedモデルをfinetuningすることで日語QAモデルを作成する方法について説明します。モデル作成の大まかな流れは以下のようになっているので、この流れを頭に入れて記事を読むと理解しやすいと思います。 モデル作成の流れ 1.モデルの学習データを用意する(これができれば、ほぼ完了です) 2.すでに用意された、run_squad.pyと言うスクリプトを実行する 3.モデル完成 この記事で扱う内容 事前知識 ・BERTとは ・squadの形式 学習データ

    BERTを使った汎用的な日本語QAモデルの作成 - Qiita
  • 【日本語モデル付き】2020年に自然言語処理をする人にお勧めしたい文ベクトルモデル - Qiita

    2023/03/20 追記 Studio Ousia様によるLUKEモデルをベースに学習したSentence-LUKEモデルを公開しました。 Sentence-LUKEモデル: https://huggingface.co/sonoisa/sentence-luke-japanese-base-lite 手元の非公開データセットでは、日語Sentence-BERTモデル(バージョン2)と比べて定量的な精度が同等〜0.5pt程度高く、定性的な精度はモデルの方が高い結果でした。 2021/12/14 追記 MultipleNegativesRankingLossを用いて学習した改良版モデルを公開しました。 改良版(バージョン2)のモデル: https://huggingface.co/sonoisa/sentence-bert-base-ja-mean-tokens-v2 手元の非公開デー

    【日本語モデル付き】2020年に自然言語処理をする人にお勧めしたい文ベクトルモデル - Qiita
  • 【PyTorch】BERTの使い方 - 日本語pre-trained modelsをfine tuningして分類問題を解く - Qiita

    PyTorch】BERTの使い方 - 日語pre-trained modelsをfine tuningして分類問題を解くPython自然言語処理機械学習PyTorchbert はじめに 自然言語処理の様々なタスクでSOTAを更新しているBERTですが、Google家がGithubで公開しているものはTensorflowをベースに実装されています。 PyTorch使いの人はPyTorch版を使いたいところですが、PyTorch版は作っていないのでHuggingFaceが作ったやつを使ってね、ただし我々は開発に関与していないので詳しいことは彼らに訊いてね!とQAに書かれています。 HuggingFace製のBERTですが、2019年12月までは日語のpre-trained modelsがありませんでした。 そのため、英語では気軽に試せたのですが、日語ではpre-trained mod

    【PyTorch】BERTの使い方 - 日本語pre-trained modelsをfine tuningして分類問題を解く - Qiita
  • Python で日本語文章の感情分析を簡単に試す (google colab で試す) - Qiita

    こちらの記事は少し古くなっています。修正した記事を下記の URL へ移転しました。 Python で日語文章の感情分析を簡単に試す (with google colab) 感情分析をお手軽に試したいときに使えるツールをまとめました。 日語文章の感情分析の手法については記事では詳しく触れませんが、以下の記事にわかりやすくまとまっていると思います。 【自然言語処理】感情分析の進め方&ハマりやすいポイント - Qiita ディープラーニングを使って転職会議の企業クチコミデータを感情分析してみる - Qiita 感情分析を簡単に試すときに使えるツール一覧 試してみたツールを箇条書きにして以下に示します。 asari 日語 Sentiment Analyzer を作ってパッケージ化した話 - Ahogrammer sklearnのTfidfVectorizerとLinearSVCを使っている

    Python で日本語文章の感情分析を簡単に試す (google colab で試す) - Qiita
  • いますぐ使える単語埋め込みベクトルのリスト - Qiita

    はじめに 単語埋め込みとは、単語を低次元(と言っても200次元程度はある)の実数ベクトルで表現する技術のことです。近い意味の単語を近いベクトルに対応させることができるとともに、ベクトルの足し引きで意味のある結果(例えば king - man + women = queen)が得られるのが特徴です。 単語埋め込みベクトルは品詞タグ付け、情報検索、質問応答などの様々な自然言語処理アプリケーションに使われる重要な技術です。とはいえ、実際に用意するのはなかなか骨の折れる作業です。大規模なデータをダウンロードし、前処理をかけ、長い時間をかけて学習させ、結果を見てパラメータチューニングを行う・・・。 そのため、単に使いたいだけなら学習済みのベクトルを使うのが楽です。というわけで、そんな単語埋め込みベクトルの中から今すぐ使えるものをピックアップしてみました。 埋め込みベクトルの情報は以下のリポジトリにま

    いますぐ使える単語埋め込みベクトルのリスト - Qiita
  • 押下(おうか)にまつわる話 - Qiita

    はじめに 私が仕様書を書くようになったのは30歳を過ぎてからと遅く、仕様書の書き方が分からなくて悩んだことがありました。通常は先輩たちが作成した仕様書等を見て書き方を覚えていくのでしょうが、仕様書も無く直接プログラムを組むような体制の仕事をしていたため、SI系に転職してから苦労したのであった。 仕様書を書く際に、ボタンを「Enterキーを押す」か「クリックする」かで考えて「押下」にすれば両方満たすだろうと、それ以来ずっと使用しています。 押下については、コンピューター雑誌やマニュアル等を読んで憶えていた用語で特に気にも止めていなかったのですが、別ブログの仲間が過去に「ボタン押下?」について書いていたことを思い出し、調べてみることにしました。 調べていくと自分は誤用して使っている気がしますw 押下について 読み方 押下は「おうか」と読みます。ちなみに苗字の押下さん(読方:おしした)は全国でお

    押下(おうか)にまつわる話 - Qiita
  • 日本語文章のスタイルガイドのまとめ - Qiita

    JTF日語標準スタイルガイド(翻訳用) 実務翻訳において和訳時に使用できる日語表記ガイドラインです。 このルールを適応出来るtextlintプラグインを書いた azu/textlint-plugin-JTF-style JTF日語標準スタイルガイドのルールセットで文章をチェックできるtextlintプラグイン | Web Scratch 外来語(カタカナ)表記ガイドライン第3版 カタカナの長音や複合語の際の表記についてのガイドライン JIS Z 8301:2011 規格票の様式及び作成方法ではちゃんと決められてない部分についても書かれている Download International Style Guides - Microsoft | Language Portal Microsoftの各言語別の翻訳スタイルガイド(日語向けもある) 『社会学評論スタイルガイド』 日の社会学分

    日本語文章のスタイルガイドのまとめ - Qiita
  • modern.IEのWindows 7で日本語の表示と入力をできるようにする - Qiita

    2014-09-08 追記 White Tiger - 英語Windows 7 Ultimateを日語化する方法にスクリーンショット入りの親切な記事があったので、お好みでそちらをご参照ください。 概要 Modern.IEのサイトで配布されているIEテスト用のWindows VMは英語環境になっています。これに日語ランゲージパックをインストールして、日語の表示と入力をできるようにするための手順のメモです。ついでにタイムゾーンも日に変更します。 試したVMはIE8 Win7です。環境はOS X 10.8.5上のVirtualBox 4.3.6です。 タイムゾーンを日に変更。 スタートメニューの[Control Panel]をクリックします。 [Clock, Language, and Region]セクションのリンクをクリックします。 [Date and Time]セクションの[C

    modern.IEのWindows 7で日本語の表示と入力をできるようにする - Qiita
  • 1