タグ

日本語に関するnakaoka3のブックマーク (9)

  • 「ごめんなさい」などと言わずに「おわびします」だけできちんと謝ったことになるのでしょうか - ことばの疑問 - ことば研究館

    人に謝るとき、よく「おわびします」とだけ言ったり書いたりしているのに出会います。「すみません」「ごめんなさい」などの言葉がないと、きちんと謝ったことにならないような気がするのですが、どのように考えたらいいのでしょうか。 ※ この記事の初出は『新「ことば」シリーズ』17号(2004、国立国語研究所)です。当時の雰囲気を感じられる「ことばのタイムカプセル」として、若干の修正を加えた上で公開します。 直接的な表現と間接的な表現 質問にあるように、「おわびします」という言葉だけで謝ることはよく見聞きします。「おわび」の手紙や文書には「…を心からおわびします」「…を深くおわび申し上げます」とだけ書いた例がよく見られます。また、「おわびします」とだけ言って、あとはただひたすら頭を下げたり両手を合わせたりしている人の姿も十分に想像できます。 つまり、「すみません」「ごめんなさい」などと言ったり書いたりし

    「ごめんなさい」などと言わずに「おわびします」だけできちんと謝ったことになるのでしょうか - ことばの疑問 - ことば研究館
  • どうして日本でだけカードのトランプのことを「トランプ」と言うのか、わかる児童書が読みたい。 | レファレンス協同データベース

    ①では、「ポルトガルから日へやってきた」の項目では、「日では16世紀の南蛮貿易のころにトランプの元となるものがポルトガルから輸入されたようです。ポルトガル語ではカードのことを「カルタ」というので、当時の日でも「カルタ」とよばれていました。その後、19世紀の明治時代になると、今度は欧米流のトランプが日でもはやりました。欧米の人がゲームをしているときに「トランプ(切り札)」といっているのを聞いた日人が、カードそのものを「トランプ」とよぶようになったのではないかと考えられています。」と記載されている。 ②では、「室町時代に日伝来!」の項目では、「トランプが日につたわったのは、16世紀ごろのこと。ポルトガルの宣教師によって持ち込まれ、当時は、「南蛮かるた」と呼ばれていました。というのも、トランプは、ポルトガル語で「かるた(carta)」を意味するからです。」とあり、さらに、「ちなみに

    どうして日本でだけカードのトランプのことを「トランプ」と言うのか、わかる児童書が読みたい。 | レファレンス協同データベース
  • 「寒かったです。」の言い切りは公認された?

    「やや稚拙な感じはするが許容範囲」「違和感はない」を合わせ3人に2人が許容している数字となりました。たいへん興味深い結果です。 出題者は「寒かったですね」が最多になると予想していましたが見事に覆されました。伝統的な文法として正しい形のはずの「寒うございました」は5%足らずにとどまりました。 「寒うございました」などの形で思い出されるのは、1964年東京オリンピックのマラソンで銅メダルを取り、68年に自殺した円谷幸吉の遺書です。 父上様 母上様 三日とろろ美味しうございました。 干し柿、もちも美味しうございました。 ……などと続く「美味しう(おいしゅう)ございました」の悲しくも美しいリフレイン。このころは「ございました」が生き生きしていたことがうかがえます。 国語審議会のお墨付きでも「仮面夫婦」 しかし、それから10年もしないころ、朝日新聞記者(当時)の多勝一さんは「日語の作文技術」(1

    「寒かったです。」の言い切りは公認された?
  • 「おざなり」と「なおざり」。意味の違いは-NHK

    「おざなり」と「なおざり」とは、どう違うのでしょうか? 現代語として考えた場合、両方に共通している部分は、「いい加減な対応だ」ということです。そして異なるのは、「おざなり」は「いい加減ではあるにせよ、何らかの対応をする」のに対して、「なおざり」は「多くの場合、何の対応もしない」という点にある、と言うことができます。 まず、それぞれの語源について見てみましょう。 「おざなり」は、「御座(敷)の形<なり>」を縮めたものです。このことばは19世紀初めには使われ始めていますが、宴会の席(御座敷)などで表面的に形ばかりを取り繕った言動のことを指したものと推測されます。 いっぽう「なおざり」はもう少し歴史の古いことばで、10世紀には使用例が見られます。このことばの語源にはいくつか説があるのですが、その1つに「なほ(直・猶)+さり(去)」というものがあります。「なほ」は「そのまま何もせずにいること」、「

  • NII、130億パラメータのLLM構築 コーパスなども全公開 「今後の研究に資するため」

    国立情報学研究所(NII)は10月20日、パラメータ数130億の大規模言語モデル(LLM)「LLM-jp-13B」を公開した。初期段階のモデルだが、アカデミアや産業界の研究開発に資するため、コーパスやツールなどを含めてすべてオープンにする。 公開したLLMの学習データ量は合計約3000億トークン。うち日語は約1450億トークン(mC4/Wikipedia)、英語は約1450億トークン(The Pile/Wikipedia)、プログラムコード約100億トークン。 計算資源としては、大学や研究機関が共同運営する仮想化環境・データ活用社会創成プラットフォーム「mdx」を12ノード活用。モデル構築にはMicrosoftのDeepSpeedを、モデル構築時の監視やログの保存には、モデル開発プラットフォームのWeights&Biasesを利用した。 NIIが主宰するLLM勉強会(LLM-jp)で7月

    NII、130億パラメータのLLM構築 コーパスなども全公開 「今後の研究に資するため」
  • 日本語言語モデル「Japanese StableLM Alpha」をリリースしました — Stability AI Japan

    Stability AI Japan は70億パラメータの日語向け汎用言語モデル「Japanese StableLM Base Alpha 7B」及び、指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を一般公開しました(略して「JSLM」)。これらのモデル はベンチマークスイート「lm-evaluation-harness」による複数の日語タスクを用いた性能評価において、一般公開されている日語向けモデルで最高の性能を発揮しています。 汎用言語モデル「Japanese StableLM Base Alpha 7B」「Japanese StableLM Base Alpha 7B」はウェブを中心とした大規模なデータを用いてテキスト生成を学習したモデルです。学習データは主に日語と英語で、それに加えソースコードが約2%含まれています。学習データに

    日本語言語モデル「Japanese StableLM Alpha」をリリースしました — Stability AI Japan
  • How to implement Japanese full-text search in Elasticsearch

    全文検索は一般的に知られていますが、検索エクスペリエンスで非常に重要な役割を果たしています。ただし、日語など、一部の言語では、全文検索を実装するのが難しい場合があります。このブログでは、日語で全文検索を実装する際の課題を探り、Elasticsearchでこれらの課題を解決する方法をいくつか示します。 全文検索とは? Wikipediaより、下記が定義となります。 全文検索とは、コンピュータにおいて、複数の文書(ファイル)から特定の文字列を検索すること。「ファイル名検索」や「単一ファイル内の文字列検索」と異なり、「複数文書にまたがって、文書に含まれる全文を対象とした検索」という意味で使用される。 全文検索は、現在多くのデジタル体験を強化するものです。全文検索は、データセット内に隠れている可能性のある単語やフレーズを見つけようとしてくれます。例えば、ネットショッピングして「phone」を検

    How to implement Japanese full-text search in Elasticsearch
  • 正確な文章の書き方

    このページでは、正確な文章を書くための秘訣をまとめてみようと思います。それほど文章がうまいとはいえない私が、文章の書き方について述べるのですから、むこうみずな行為であることは百も承知です。しかし、数年に渡って探求した正確な文章の書き方が、少しでもみなさんの役に立てばという思いを自分への励ましに代えて筆をとります。 ここでお話するのは、「文章をいかに正確に書くか」や「自分の考えをどうやったら適切に表現できるか」であって、決して「どうやったら人を感動させる名文句が書けるのか」ではありません。 このページを読んだら「科学技術文献」を書くための技術が少しは身に付くのではないかと期待しています。しかし、 人はいさ 心も知らず ふるさとは 花ぞ昔の 香ににほひける (紀貫之) などのような心に残る文章が頭に浮かぶようになるわけではありません。 絵の書き方に例えて言うなら、ここで述べる内容は、色彩や調和

  • Kotobade Asobou 言葉で遊ぼう

    Japanese Wordle - daily word puzzle game. 日語版 Wordle - 日替わり単語パズルゲーム

  • 1