タグ

関連タグで絞り込む (334)

タグの絞り込みを解除

languageに関するmyrmecoleonのブックマーク (707)

  • 理系必修第二外国語、いらなくない?(追記あり)

    (追記) コメント見ていて「やっぱドイツ語はオワコンだったよな〜〜」「中国語か韓国語できてたら仕事に役だったのにな〜〜」とかいう気持ちになったんだけど、でもやっぱり、「別の言語をやったとて、必修二外程度でAI翻訳を超えるレベルに到達できるのか?」という疑問が残るのよね。 というのもここ最近のAIの進展は凄まじく、「機械翻訳に騙されないレベル」に到達するのに必要な労力が数年前と比べても爆上がりしている。ChatGPTはすでに東大英語で8割取れちゃうのよね。 https://www.nikkei.com/article/DGXZQOUC2103E0R20C24A3000000/ そういう意味では、「この単位を取る頃には、DeepLに騙されないレベルに到達できます!」とか「ChatGPTでできないこんなことができるようになります!」って明確な学習基準があったら学生もやる気出すんじゃないだろうか。

    理系必修第二外国語、いらなくない?(追記あり)
    myrmecoleon
    myrmecoleon 2024/08/16
    “そこまでは無理”だからこそ可能な範囲で取っ掛かりを提供してるのかなと思う。入り口でちゃんと教わってれば自習できるし教師も見つけられる。まあ日本も衰退してるからすぐ第二外国語教える余裕も無くなるよ。
  • 「竜」の字体が「龍」よりも古いというトンデモについて|nkay

    楷書の「龍」という形は殷墟甲骨文に見られる文字を継承したもので、「竜」という形は早くとも漢代以降に作られたものだが、「竜」が「龍」より古くから存在するというトンデモが存在する。 「竜」が「龍」より古いというトンデモには全く根拠がないが、ほとんどの人は漢字の歴史について無知なのと、このトンデモが当なら意外なので(逆に)、一定数の人が信じているようである。 実際には、「竜」が「龍」より古いなどということは無い。これは「最終的には「龍」も「竜」も同じ甲骨文字に由来するのだからどちらかが古いと言うことはできない」というような表現的問題ではなく(それも一理あるかもしれないが、ここではどちらかが古いという表現を受け入れよう)、「竜」が「龍」より古いというトンデモが描いている歴史が決定的に間違っているという意味である。 この記事で「竜」「龍」の歴史を再確認することで、トンデモの歯止めになれば幸いである

    「竜」の字体が「龍」よりも古いというトンデモについて|nkay
  • 日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox) | テクノエッジ TechnoEdge

    仮想的なシステムであり、実際の普及は想定されていない。 言語学習や異文化コミュニケーションのツールとしての可能性がある。 結論ローマ字運動とJaphalbetは、どちらも日語の表記をラテン文字化する試みという点で共通していますが、その目的、アプローチ、そして想定される使用範囲に大きな違いがあります。ローマ字運動が日の近代化と識字率向上を主眼としていたのに対し、Japhalbetは国際的な日語学習とコミュニケーションの促進を目指しています。 また、ローマ字運動が日語の文法構造をほぼそのまま維持したのに対し、Japhalbetはより大胆な文法の簡略化を提案しています。これは、Japhalbetが非日語話者にとっての理解のしやすさを重視しているためです。 結果として、ローマ字運動は日社会に一定の影響を与え、特に技術分野での応用を見出しましたが、Japhalbetは現時点では理論的な提

    日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox) | テクノエッジ TechnoEdge
    myrmecoleon
    myrmecoleon 2024/07/20
    素直に英語か「やさしい日本語」使おうよ。誰にも正確な表記わからないような言語、覚えても使える場所ないよ。
  • 「確率的なオウム」にできること、またそれがなぜできるのかについて

    九州大学大学院 人文情報連係学府(仮称・設置認可 申請中)学際シンポジウムシリーズ「接続する人文学:テクストを計算する」 https://dh.kyushu-u.ac.jp/research/ 2024年7月

    「確率的なオウム」にできること、またそれがなぜできるのかについて
  • 生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ

    かなり前から「ChatGPTに学術論文を(英語で)書かせると"delve"のような普段使わないような単語が多く使われるのでバレやすい」という話がSNS以下各所で頻繁に噂されていたんですが*1、最近になってこの件について面白いpreprintが発表されていたのを知りました。それがこちらです。 もう読んで字の如しで「ChatGPTが登場して以来学術論文に使われる単語のレパートリーが劇的に変わってしまった」というのを、実際に具体的なデータに基づいて示した論文です。割と短めの読みやすい論文であることと、先述したようにSNSでは頻繁に噂されていた推測を明確化したということもあり、折角ですのでこのブログで簡単に紹介してみようと思います。 Preprintあげたのでご報告!📣 ChatGPTが使いがちな英単語ってありますよね。「delve」「realm」「utilize」あたり。 (限界助教先生の記事

    生成AIによる「慣用表現の『乗っ取り』」と、その根底にある別の問題と - 渋谷駅前で働くデータサイエンティストのブログ
  • ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ

    まえがき ミャンマーでは公用語としてビルマ語が使われている。ビルマ語の表記にはビルマ文字を用いるのだが、このビルマ文字のインターネット上での使用は、混迷を極めていた。そしておそらく今もまだ…。なぜか? それは、Unicodeという文字コードの標準がありながら、Zawgyiというものが広く使われていたためである。なぜそのようなものが登場し、普及することとなったのか、この記事で解説する。 目次 まえがき 目次 凡例 この記事で使う名称について ビルマ語表記 コードポイント ラテン文字表記について Zawgyiの概説と歴史 Zawgyiとは Zawgyiのダウンロード Zawgyi誕生・普及の経緯 複雑なビルマ文字 ビルマ文字とUnicode 回避策としてのビルマ文字フォントの登場 Zawgyiの普及 Zawgyiの実装 実装の方針 文字の並べ替えをせず、左から右に書く 文字の形のバリエーション

    ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ
    myrmecoleon
    myrmecoleon 2023/12/20
    勉強になる。日本の漢字や他の文字もUnicode収録ではそれぞれの苦労があったようなので、それぞれの言語にこういうのあるんだろうな。
  • 化学を「ばけがく」と読むみたいな言葉一覧・完全版

    科学と化学が、同じようなシーンで使うのに、どっちも「かがく」という読みであり、伝えにくい……こういうことって、よくありますよね。 でも、大丈夫。化学の方を「ばけがく」とわざと読む読み方があるんです! これは便利! こういう言葉って他にどんなのがあるのか気になったので、調べてみた。 「説明読み」と言われているらしい 化学と科学が紛らわしいので、化学の化をわざと訓読みして、ばけがくと読むみたいな言葉。ウィキペディアを調べると「説明読み」と呼ばれているらしい。(武部良明「二字漢字語の音訓読み分けについて」) 正しい読みかたではないけれど、紛らわしさをさけるため、わざと読みを変える。 すぐ思いつくのは、私立と市立の読み分け。私立を「わたくしりつ」、市立を「いちりつ」と読み替える例だろう。 テレビのニュースなどでは、なんの説明もなく「わたくしりつの学校で〜」というふうに普通に読み上げるので、もはやこ

    化学を「ばけがく」と読むみたいな言葉一覧・完全版
  • 【追記あり】「〜なんよ」がとても不快

    ==== 追記 ==== 書いた直後に全然反応がなかったのに、今見たら色々コメントがついていて驚きました。 ブコメを読んだら、結構な数の人が怒っていて、私の中の善良な市民感覚が、「悪いことをしてしまった」という後悔の念を自然と抱かせましたが、落ち着いて考え直してみると、別にそう悪いわけでもないなという気もしています。とりあえず、これが率直なところです。 色々とコメントをもらったので、いくつか返答します。 ・「不快」で他人の発言を抑圧しようとするのを表現規制って言うんじゃなかったっけ ・自分の意思にそぐわないからと言って他人の言動を制限しようという発想かー。上手くいきそう? ・自分の不快感のために他人の自由を制限できると思ってるんかな ・不快に思うのは勝手だが、人の発話の自由を制限しようとするのは何様のつもりだろうと思うし、方言の利用を咎めることも更に最悪って感じがする(私は方言コスプレをポ

    【追記あり】「〜なんよ」がとても不快
    myrmecoleon
    myrmecoleon 2023/10/17
    千鳥全然見てないんだけど確認したら2008年くらいから使ってるなあ自分。口頭では一切使わないので方言とかではない。何に影響されたのかは意識ないが、何かしらのネットミームかな。
  • 糖尿病の新呼称案は英語の「ダイアベティス」…専門家「普及難しいのでは」

    【読売新聞】 日糖尿病協会などが、糖尿病への偏見をなくすため、糖尿病の英語表記である「ダイアベティス」という呼称を用いる案をまとめ、近く公表する。「尿」の字を含む病名に抵抗感を示す患者の声を踏まえた対応だが、医師ら専門家からは「分

    糖尿病の新呼称案は英語の「ダイアベティス」…専門家「普及難しいのでは」
    myrmecoleon
    myrmecoleon 2023/09/22
    わかりづらい語は略されるのが通例なので、ダイアベとかアベとか略されて「何々さんアベだから」とか不要な誤解を巻き起こしそう。
  • 「マッチングアプリ」と同じイントネーションの言葉ってなくない?

    色々考えたけど、なさそう。 無理やり考えたのが以下の言葉。 ・バッティングだるい ・ピッチング悪い ・ブラッシング歯茎 ・クッキングたぬき 何かある?

    「マッチングアプリ」と同じイントネーションの言葉ってなくない?
    myrmecoleon
    myrmecoleon 2023/06/13
    発禁すら不意
  • 「視覴」の謎

    ChatGPTが「視覴」という新語を発明したらしいことをフガクラさんのツイート(2023-06-08 08:51:02 JST)で知る。 すでに「視覴」は、いくつかの最近書かれたWebページで使われていた。ChatGPTで生成されたページらしい。ざっと検索して見つけたページを列挙しておく。いずれも最近作られたか修正されたページである(1件だけ2020年のページがあるが、最近修正されたものかどうか不明)。 映像・音声編集におけるノーマライズの重要性!(2023-05-11)「視覴的・聴覚的な一貫性」「視覴的な効果を最大化」「視覴的な混乱を避け」(2回)なお、このページは現在消えて視覴とは?AIChatGPT)が出力した新しい言葉なのか?(2023-06-08)にリダイレクトされ、「弊社では、2023年3月より用語集作成に際しAIライティングの試験運用を行っておりますが、この度、「視覚」の誤

    myrmecoleon
    myrmecoleon 2023/06/12
    AI時代の音便、あるいは読み間違いによる新語(独壇場とか)的なものを感じるよね。
  • おいしい→おいしそう〜! 楽しい→楽しそう〜!じゃあ「かわいい」はどうすれば?→様々な案が寄せられる

    柊マグネタイト @hiiragi_magne ・「かわいそう〜!」 ← 別の意味になる ・「かわいいだろうな〜」 ← なんか違う。転校生が女子で、現役アイドルらしいっていう噂がクラスで流れたときにモブが言ってそう ・「おそらくかわいい」 ← 含みがありそう。なんか失礼。何様感 ・「絶対かわいいじゃん!」 ← ニュアンスとしては近い 2023-05-22 22:11:43

    おいしい→おいしそう〜! 楽しい→楽しそう〜!じゃあ「かわいい」はどうすれば?→様々な案が寄せられる
    myrmecoleon
    myrmecoleon 2023/05/24
    おいしいと楽しいは体験への表現で未体験で目前にある場合にも起こるが、かわいいは見た瞬間発生するので、目の前にない前提の表現、たとえば「かわいいらしい」(伝聞)が妥当かな。「赤そう」と言わないようなもの
  • 文字コード | 衆議院議員 河野太郎公式サイト

    2023.05.10 官報に使われる「官報文字」というものがあります。 そこには渡辺さんの「辺」の異体字が140文字も登録されています。 日語の常用漢字には2136文字ありますが、そこには邉や邊などは入っていません。 そこでJISの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。 ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも55,270文字もあります。 全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した「文字情報基盤」を2011年に策定し、それにあわせたフォントを作成し、無償で提供しています。 この「文字情報基盤」(MJ)には、58,862文字が含まれています。 しかし、このMJを全庁的に採用している自治体は、川口

    文字コード | 衆議院議員 河野太郎公式サイト
  • 【追記あり】外国語の単語+る、で動詞として定着している単語

    思いついたところ+ちょっと調べた範囲で。 他にあったら適宜追加します。 単語元の単語備考サボるサボタージュ(sabotage)前方一致ダブるダブル(double)発音一致ハモるハーモニー(harmony)前方一致ググるグーグルgoogle)ググレカスパニクるパニック(panic)後方追加ディスるディスリスペクト(disrespect)前方一致ミスるミス(miss)後方追加トラブるトラブル(trouble)発音一致デコるデコレート(decorate)前方一致メモるメモ(memo)後方追加バズるバズ(buzz)後方追加スペるスペランカー(spelunker)前方一致 発音一致:単語と元の単語の発音が一致している 前方一致:元の単語の後方が省略され「る」が付加されている 後方追加:元の単語にそのまま「る」が付加されている =========以下追記分========= ブコメとコメントから拾い

    【追記あり】外国語の単語+る、で動詞として定着している単語
    myrmecoleon
    myrmecoleon 2023/04/11
    定着してるかわからないけど、る言葉という呼び方があるみたいね。 https://www2.ninjal.ac.jp/conversation/event/pdf/sympo2019_1.pdf
  • iモード、企業戦士、コギャル――三省堂、消えた言葉だけ集めた辞書を発売

    iモード、オート三輪、企業戦士、コギャル――三省堂は、こうした時代の変化によって使われなくなった言葉だけを集めた「三省堂国語辞典から消えたことば辞典」を発売した。価格は2090円。辞書としてだけでなく、昭和レトロや平成レトロを楽しめる商品として注目度アップを狙う。

    iモード、企業戦士、コギャル――三省堂、消えた言葉だけ集めた辞書を発売
  • 古代バビロニアの文章を解読できるAIを開発。ギルガメシュ叙事詩の一部や賛歌を解読 : カラパイア

    ドイツのルートヴィヒ・マクシミリアン大学(LMU)の研究チームは、古代バビロニアの楔形文字の難しい文章を解読できるAIシステムを開発した。 「Fragmentarium」というこのアルゴリズムは、ギルガメッシュ叙事詩を含む、人類がこれまでに書いたもっとも古い物語の断片をつなぎ合わせて解読することができるという。 LMUでは、2018年から、現存しているバビロニアの楔形文字の石板すべてをデジタル化するプロジェクトを行っている。

    古代バビロニアの文章を解読できるAIを開発。ギルガメシュ叙事詩の一部や賛歌を解読 : カラパイア
  • 旦那って言い方がおぞましすぎる

    なんでみんなこれに疑問を抱いていないのかわからない。 旦那って何?配偶者の女性は奴隷かなんかですか? 旦那って主従関係の時に使う言葉だよね? なんで平然と結婚した夫婦に使ってるの? なんで当たり前みたいに男が「上」なの? 店で「旦那様」と言う店員にも腹立つし、自分から配偶者の男のことを「うちの旦那が」と言ってるのも気持ち悪くて仕方ない。 この意見言うと「気にしすぎだ」って言う阿保が沢山出てくるのも腹立つ。こうした無意識のミソジニーが積み重なって男尊女卑が続いてるのが日だろうが。 結局、こういう言葉を気にせず使う/修正しようともしない時点で、日の男や一部女性達は男尊女卑を変える気がないんだなって絶望する。 一生奴隷扱いでいい、そういう烙印なんだと思う。

    旦那って言い方がおぞましすぎる
    myrmecoleon
    myrmecoleon 2023/01/26
    旦那は本来仏教語でお布施とか檀家とかとほぼ同じ、お金を出してくれるパトロンのことなんだよな。主従関係とはちょっと違う。贈与が原義でドナーとかドネートとかが同系統。悪く言うと「財布」。
  • もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Techブログ

    こんにちは。「リーダブルコード」を先月読破して、感銘を受けた弁護士の人です。 なにに感銘を受けたかというと、「エンジニアが高級言語を効率的にコーディングするための工夫」は、契約という言語をコーディングするために援用できることがとても多いということです。 例えば、リーダブルコードは「関数には空虚な名前(tmpとかretvalとか)でなく、エンティティの実体に即した名前をつけよう!」と提案しています。 これめっちゃわかります!!!なぜなら、契約言語では当事者というクラスの表現のために「甲」「乙」という定義を未だに使います。そして、甲と乙を逆に書いてしまったままReviewを通過することが実際によくあります。オライリーさんには激怒されるでしょう。 しかし、よく考えると高級言語と契約言語が似ているのは当然だと思うようになりました。それは、どちらも「一定のインプットを入れると、必ず一定のアウトプット

    もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Techブログ
  • 三大同じ単語なのにカタカナ英語で区別されてるやつ

    セカンドとセコンドあと二つは?

    三大同じ単語なのにカタカナ英語で区別されてるやつ
    myrmecoleon
    myrmecoleon 2022/08/03
    オランダ語のletter(レッテル)を挙げる人ばかりで、ラベル/レーベル/レイブル(紋章学)を挙げてる人がいないのはなんでだろう(いずれも英語のlabel)。/関連して調べて知ったがタグとタッグ(tag)も同じ語らしい
  • 「カラスの漢字“烏”が“鳥”より一画少ないのは体が黒く目がどこにあるかわからないから」は誤り - 古代漢字学習ブログ @kanji_jigen

    「カラスの漢字“烏”が“鳥”より一画少ないのは体が黒く目がどこにあるかわからないから」という説があります。以下のように、現在販売されている漢和辞典にも掲載されています。 象形。からすの形にかたどる。からすはからだが黒く、目がどこにあるかわからないので、「鳥」の字の目にあたる部分の一画を省いた。借りて、感嘆詞、また、疑問詞に用いる。 ――『角川 新字源』改訂新版、角川書店2017年、p824 烏は鳥の目玉を表す部分である「-」を省いた形。 ――『漢字源』改訂第六版、学研2019年、p1152 しかし、この説は誤りです。 この説は金文の研究が盛んになるより以前に提唱されましたが、清代に金石学(金文研究)が発達したおかげで誤りであることがわかりました。すなわち、古文字学(古代の漢字を研究する学問分野)の世界では100年以上前に否定された説です。 漢和辞典に掲載されているいわゆる「漢字の成り立ち」

    「カラスの漢字“烏”が“鳥”より一画少ないのは体が黒く目がどこにあるかわからないから」は誤り - 古代漢字学習ブログ @kanji_jigen