タグ

日本語に関するp_tanのブックマーク (8)

  • CS50 for Japanese: コンピュータサイエンスの入門 – 当ウェブサイトは、Creative Commons ライセンスに基づいて管理されています。

    お知らせ: 2022/9/1 CS50 を活用した非営利/協賛企業による「コロナ学生支援」プロジェクトを実施中 ▼ 学生の方へ:CS50 の学習(履修証明書の取得)を一緒に取り組むプロジェクト CS50日語版の翻訳コントリビューターである CODEGYM が主催する、非営利/無償のプロジェクト「CODEGYM Academy (外部リンク)」は、昨年に続き2022年度(春/秋)も、キャリア選択を控えた学生に対し、以下の企業の協賛により無償で17週間のプログラミング教育カリキュラムを提供します。 CODEGYM Academy 協賛企業(2022年) https://codegym.jp/academy/ 今年度のエントリーは締め切りました — ようこそ! このページは、ハーバード大学 CS50 の日語版翻訳プロジェクトのページです。当サイトのドメインに掲載されているコンテンツは、Cre

  • Laboro.AI、日本語版「BERT」モデルを開発--オープンソースで公開

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます オーダーメイドのAI人工知能)を開発・提供するLaboro.AIは4月17日、自然言語処理モデル「BERT(Bidirectional Encoder Representations from Transformers)」を独自に事前学習させた日語版モデル「Laboro.AI BERTモデル」を開発し、オープンソースとして公開したと発表した。 自然言語処理は、機械学習技術領域の一つである。人が日常的に使用する言葉や文字など、テキスト情報をAIに処理させる分野になる。手書き文字の読み取りを行うOCR(光学文字認識)やテキストで会話するチャットボットのほか、スマートスピーカーにも技術が活用されている。 BERTは、2018年10月にG

    Laboro.AI、日本語版「BERT」モデルを開発--オープンソースで公開
  • CQRSの和訳

    DDDとCQRSについて DDD (Domain Driven Design = ドメイン駆動設計)が世間に知られるようになってきましたが、今度はDDDをさらにスケーラビリティにするCQRS (Command Query Responsibility Segregation = コマンドクエリ責務分離)が出てきました。 DDD提唱者の英語の和訳版「エリック・エヴァンスのドメイン駆動設計」がAmazonにありますが、非常に分厚く高価です。概要をまとめた資料が「Domain Driven Design(ドメイン駆動設計) Quickly 日語版 - InfoQ」から入手できます。 CQRSはデータベース設計とイベントソーシングも含めた壮大なWebアプリケーションのアーキテクチャですが、日語の資料がまだ少ないです。CQRSを適用したアプリケーションを構築できるインフラがWindows Az

    p_tan
    p_tan 2018/10/19
    "Greg Young流CQRSの和訳版"
  • 若者ことばの「やばみ」や「うれしみ」の「み」はどこから来ているものですか - ことばの疑問 - ことば研究館

    ご質問の「―み」は、「Twitter(ツイッター)」などのインターネット上の交流サービスにおける若者の投稿でしばしば見られる、次の(1)~(4)のような使い方ですね。 (1)今年の花粉はやばみを感じる。 (2)卒業が確定して、今とてもうれしみが深い……。 (3)夜中だけどラーメンべたみある。 (4)その気持ち分かる分かる! 分かりみしかない。 このような「―み」の使い方になじみのない方もいらっしゃるでしょうし、私の周りの大学生に聞いてみても、「なぜここで「―み」を使うんでしょう? 」と逆に質問されてしまうことがあります。そこで、次のような問いが立てられます。 「やばみ」「うれしみ」などの表現はどのように作られたのか 文法的に見ると、この「―み」は、主に形容詞の後に付いて名詞を作る働きを持つ「接尾辞」(あるいは「接尾語」)と呼ばれるものです。形容詞に「―み」を付けて作られる名詞には、「うま

    若者ことばの「やばみ」や「うれしみ」の「み」はどこから来ているものですか - ことばの疑問 - ことば研究館
  • Electron でユーザーの言語を検出する | ぴんくいろにっき

    あけましておめでとうございます。 いまとむかしで事情の変わっているElectronの多言語化事情です。 過去のElectronの多言語化事情 Electron (もとAtom-Shell ) が世に出たのはもう2年半前のことなんでしょうか。 当時……というか1年ちょいまえのElectronには面倒な問題がありました。 アプリケーションを作るにあたって多言語化は欠かせない問題なのですが、当時のElectronではユーザーの言語を検出するのが困難だったのです。 というのも当時、RendererProcessでnavigator.languageを取得しようとすると何故かOSの言語にかかわらずen-USが返されるという問題がありました。(環境依存かもしれない) navigator.language always return “en-US”? · Issue #2484 · electron/e

    Electron でユーザーの言語を検出する | ぴんくいろにっき
  • KH Coder: 計量テキスト分析・テキストマイニングのためのソフトウェア

    研究ノート「計量テキスト分析ツールKH Coderによる分析結果の再現性」公開 医療用語の辞書をご用意(無料) 産学連携プロダクト「KH Coderオフィシャルパッケージ」発売中 KH Coderとは KH Coderとは、計量テキスト分析またはテキストマイニングのための自由ソフトウェアです。 アンケートの自由記述・インタビュー記録・新聞記事など、さまざまなテキストの分析にお使いいただけます。 プログラミング不要、マウス操作で格的な分析 安心の分析プロセス完全公開、研究利用も多数 New! 機能紹介(スクリーンショット) スクリーンショット集 [旧ページ:言葉・文書・可視化・他] KH Coder 3 正式版の新機能 New! 機能追加プラグイン「文錦®」シリーズ New! ダウンロードと使い方 KH Coder 3 正式版ダウンロード (Version 3.02) 使い方を知るためのチ

  • RedPenで技術文書の誤りを指摘してもらおう - yasuhisa's blog

    自然言語の誤りを指摘してくれるRedPenを手元で使えるようにしてみました、という記事です。気が向いたので、色々書いてみました。 エンジニアであっても意外と文書を書いたり見たりする機会が多い 自然言語も機械が勝手に間違いを指摘して欲しい 自然言語もルールで分かることは機械(RedPen)に指摘してもらう 指摘例 EmacsからRedPenを使う まとめ エンジニアであっても意外と文書を書いたり見たりする機会が多い エンジニアとしてはてなに入社後、コードレビューをする機会はもちろん多いですが、意外と自然言語(私の場合は日語、英語がメイン)のレビューをする機会も多いことに気が付きました。他人の書いた文書に対するレビューに限らず、自分の書いた文書に対するレビューも含みます。 告知文のチェック mackerelでは毎週告知をブログに書くので、エンジニアも内容をレビューする こういうやつ: mkr

    RedPenで技術文書の誤りを指摘してもらおう - yasuhisa's blog
  • 文化庁指針(漢字のとめ・はねなど)への誤解と早とちり① - マチポンブログ

    指針への理解 文化庁の文化審議会漢字小委員会が漢字に関する指針(案)*1を作成しました。 どのような内容か、ちょっと読売新聞を引用して述べますと、 漢字の手書き文字について、「はねる」「とめる」など細かい違いで正誤はなく、多様な漢字の形が認められていることを説明する*2 というもので、具体的には画像のようなものです(画像は2.29読売新聞夕刊より)。 つまり、「とめ」「はね」など些細な違いで漢字の正誤を判断するのは誤りであるから、それを説明する指針を作ったわけです。また、これは、学校教育などでも柔軟に評価するように求めています。 すこし結論めいたことをいうと、漢字を厳しく採点するのは教員間で徐々に出来上がった代物であり、それに全く根拠はありません。実は、細部にこだわらなくてよいということは、文部省時代から60年以上にわたって述べられていたことで、どちらかというと教員の方がそのことを理解せず

    文化庁指針(漢字のとめ・はねなど)への誤解と早とちり① - マチポンブログ
  • 1