タグ

言語に関するfield_combatのブックマーク (38)

  • 多言語組版について | 多言語フォント | モリサワのフォント

    ○MORISAWA PASSPORT 英中韓組版ルールブック(タイ語含む) 全ページPDF (30MB) 多言語組版に必要なルールと、その言語の組版に活用できるMORISAWA PASSPORT収録書体を紹介したハンドブックです。近年需要が高まるタイ語を新たに収録しました。 ○言語別PDFダウンロード はじめに(3MB) MORISAWA PASSPORTの多言語対応 p2 MORISAWA PASSPORTに収録されている多言語フォントフォントベンダー p4 欧文(10MB) ラテン文字と欧文組版 p6 欧文組版の考え方 p8 欧文組版の手法 p12 欧文約物(Punctuation)p18 併記組版の考え方 p22 データ受け渡しとアプリケーションの設定 p24 欧文書体の選び方 p32 欧文組版の確認リスト p33 フォント紹介 p34 中国語 - 簡体字(7MB) 中国語(簡体字

    多言語組版について | 多言語フォント | モリサワのフォント
    field_combat
    field_combat 2023/10/25
    英中韓組版ルールブック(タイ語含む)。中韓は基本ルールだけでも把握しとこ
  • アイヌ語仮名「ㇷ゚」に対する正規表現の罠

    導入 アイヌ語は日語と異なり、閉音節(子音で終わる音節)も存在するので、表記の際音素文字であるラテン文字なら、そのまま p, t, k, m, n, s, r などの子音文字を後ろの付ければ良いわけなので、アイヌ語ローマ字表記では、何も問題が生じない。しかし、元々開音節言語である日語に特化したカタカナのような仮名文字で表記する際、鼻音 n は「ン」でなんとかなる(実はそれでもまずい事になっているけどここでは割愛する)が、p, t, k, m, n, s, r, h はどうしようもないので、特殊の捨て仮名(小書き仮名文字)を利用することになっている。 具体的には以下のような特殊仮名文字(通称 アイヌ語仮名)である。 ㇷ゚ -p ッ -t ㇰ -k ㇺ -m ㇱ -s ㇻ -(a)r, ㇼ -(i)r, ㇽ -(u)r, ㇾ -(e)r, ㇿ -(o)r お分かり頂けただろうか… 問題 r

    アイヌ語仮名「ㇷ゚」に対する正規表現の罠
  • 『日中韓共通語彙集』pdf

    field_combat
    field_combat 2023/07/24
    おもしろい。思ってる以上に似てるんな
  • ソフトウェアの日本語文字が中華フォントに侵食されていて想像以上の危機らしい「違和感すごい」

    usagimaru ⌘ @usagimaruma 日人が想像するよりかなり広い範囲で日語文字が中華フォント化している現象。CJK処理系における日語の扱いに対する問題としてそろそろ何とかしていかないと、ソフトウェアの中の日語が死んでいく危機感がある。そもそもなんでChineseに分類されるフォントにフォールバックされるのかって。 2022-09-28 16:03:32 usagimaru ⌘ @usagimaruma 前も調べたけど、言語環境の言語優先度設定で“わざわざ”日語を優先言語にしておかないと、日語の文字の多くは簡体中国語の奇妙なフォントで描画される。バグではなく仕様。わざわざ日語を優先している民族なんて日人しかいないから、世界のほとんどはきっと中華フォントで日語を眺めている。 2022-09-28 16:07:52

    ソフトウェアの日本語文字が中華フォントに侵食されていて想像以上の危機らしい「違和感すごい」
    field_combat
    field_combat 2022/09/30
    OSとかブラウザの仕様も絡むとのこと。中華ガジェット買うとこれなので慣れてるといえば慣れてるんだが、違和感はスゴイ。これ続くと正しい漢字がわかんなくなることもあり得るし
  • 機械翻訳に対する現時点(2022年8月)での私の認識

    字幕翻訳スクールがAI字幕翻訳ツールを開発したというニュース 数日前に字幕翻訳スクールがAI字幕翻訳ツールを開発したというニュースが流れ、翻訳者たちの間に衝撃が広がりました。これを受けて翻訳者の堂秋次さんがYouTubeで緊急動画を配信され、それを見たローズ三浦さんの発案で堂さん、ローズさん、私の3人で機械翻訳の現状についてライブ配信することになりました。当日の告知にもかかわらず30名以上に方々にライブでご視聴いただき、その場でコメントもたくさんいただき成功裡にイベントは終了しました。(3人のトークイベントの動画はこちら:https://www.youtube.com/watch?v=L09NEJLBNzU) 普段「機械翻訳についてどう思いますか」と聞かれるわりに回答にこれほど長い時間をいただけることはなかったので、司会の堂さんが用意してくださったテーマでお2人と話すことで私自身とし

  • はじめは信じがたかったが「国語ができない子」の一部に問題用紙の真ん中から放射状に読む子がいる「読み方の問題?」「自分もそうなる」

    竹中秀幸@ピクセルスタディ @PixelStudy2022 はじめは信じがたがったか、国語ができない子の一部に、問題用紙の真ん中から放射状に読む子がいる。たかだか50名ほどの個別教室で年間5認確認できていた。 2022-06-04 07:30:13

    はじめは信じがたかったが「国語ができない子」の一部に問題用紙の真ん中から放射状に読む子がいる「読み方の問題?」「自分もそうなる」
    field_combat
    field_combat 2022/06/06
    知らない+興味がない分野の資料とか見るとき、そんな感じかも。全く頭に入ってこないことが多い
  • 元JavaエンジニアがGoに感じた「表現力の低さ」と「開発生産性」の話 - DMM inside

    |DMM inside

    元JavaエンジニアがGoに感じた「表現力の低さ」と「開発生産性」の話 - DMM inside
  • 【論文を読む】ポケモンの名付けにおける母音と有声阻害音の効果 - 第一コラムラボ

    ゲームボーイ はじめに この連載では,広い学びへ興味をもつきっかけになればといいという目的で,第一学習社の編集者が見かけた興味深い論文や研究を不定期に紹介していきます。 論文というのは,学びの最先端がまとめられたとても面白いものです。しかし,大学の研究以外では,日常的に触れることは多くありません。また,内容も難解なものが多いです。しかしそのハードルを越えれば,自分の目で見る世界の解像度が,少し明瞭になっているはずです。 はじめに Pickup 用語解説 音象徴,有声阻害音 ブーバ・キキ効果 最大エントロピーモデル 読んでみよう。 まとめ 参考リンク Pickup 今回,紹介するのは音声学の分野からこちらの論文です。身近なテーマ,ポケモンに関する論文です。 www.jstage.jst.go.jp 音声学はその名の通り,「音と声にまつわる全て」を研究する学問となります。そのため言語や音楽と関

    【論文を読む】ポケモンの名付けにおける母音と有声阻害音の効果 - 第一コラムラボ
  • 「摩天楼」はいったい誰が訳したのか、言語学の夢想家 - ネットロアをめぐる冒険

    センターの英語かなんかで出てきたんですかね、「摩天楼」を意味する「Skyscraper」についてのツイートが伸びていました。 skyscraper すなわち「空をこするもの」を「摩天楼」と訳した人は当にセンスある。skyを空ではなく天にしたり、scrapeに擦でも掻でも磨でもなく摩を当てる雅びな言葉選びで、「まてんろう」という音の響きもいい。そして読み下せば「天を摩する楼」ってまんま原語の直訳。天才の所業だわ。 — 佐藤ケイ(´ヮ` )11月新刊 (@K9uNS7uFrBC31BA) 2018年1月15日 skyscraperを「摩天楼」という字をあてたことに対するすばらしい感覚について述べていますが、果たして当のところ、この語を誰が訳したのか、調べてみました。ちなみにこのツイートのリプについている情報は興味深いものばかりなので、目を通されることをオススメします。 skyscraper

    「摩天楼」はいったい誰が訳したのか、言語学の夢想家 - ネットロアをめぐる冒険
    field_combat
    field_combat 2021/10/14
    「摩天」がすごく高いって意味なんか
  • Microsoft Word - 大村_文体練習_.docx

    1 卒業研究 ( 文体練習 ) 日近代文学 柴田勝二ゼミ 外国語学部 南・西アジア課程 トルコ語専攻 8507260 大村真央 2 ( 文体練習 )目次 0 素 1 ひらがな 2 カタカナ 3 ローマ字 4 ギャル文字 5 2ちゃんねる 6 Twitter 7 100 字 8 なんか 9 え~ 10 英訳 11 重複 12 アメリカ人きどり 13 短歌 14 某 15 とても 16 星新一調 17 オノマトペ 18 誤変換 19 ~じゃないですか 20 レストランにて 21 はんたい 22 漢文風 23 和製英語 24 数値 25 漫才 26 あいうえお作文 27 田舎の母への手紙 28 なぜかよめてしまう 29 小学生の日記 30 類義語 31 別の視点からⅠ 32 別の視点からⅡ 33 別の視点からⅢ 34 別の視点からⅣ 35 客観 36 古文風 37 お嬢様 38 事情聴取 39

  • すきえんてぃあ@書け on Twitter: "多言語オタクは知ってるかと思うんですけど、実は東京外国語大学がこんな無料学習サイトを作ってくれているので需要ありそうだからツイートしてみます https://t.co/L6b2D0PRjr https://t.co/MKyCyau9wh"

    多言語オタクは知ってるかと思うんですけど、実は東京外国語大学がこんな無料学習サイトを作ってくれているので需要ありそうだからツイートしてみます https://t.co/L6b2D0PRjr https://t.co/MKyCyau9wh

    すきえんてぃあ@書け on Twitter: "多言語オタクは知ってるかと思うんですけど、実は東京外国語大学がこんな無料学習サイトを作ってくれているので需要ありそうだからツイートしてみます https://t.co/L6b2D0PRjr https://t.co/MKyCyau9wh"
    field_combat
    field_combat 2021/08/05
    外国語音声教材まとめ
  • 東外大言語モジュール

    Introduction TUFS言語モジュールは,東京外国語大学大学院の21世紀COEプログラム「言語運用を基盤とする言語情報学拠点」の研究成果を活かして開発した,新しいインターネット上の言語教材です。英語以外の言語教材は,主として大学生が初めて新しい外国語を学ぶための教材を想定しています。英語については,小学校での総合学習や中学校で初めて学ぶ外国語としての英語を念頭において開発しました。 2004年6月に「発音モジュール」が12言語で公開され,それに先立つ2003年12月には「会話モジュール」が17の全ての言語で公開されました。 続く2006年4月には,「文法モジュール」が10言語で公開され,「語彙モジュール」も2言語で公開中です。 これらの教材は,東京外国語大学の教員,大学院生および学外協力者を含む100名以上の協力によって開発されました。 詳しくは開発者一覧をご覧ください。 さらに

    field_combat
    field_combat 2021/08/05
    外国語音声教材
  • 自作言語 eb

    数年ぶりに自作言語を作りたい。 今の所、 スクリプト言語 見やすい JITできる 漸進的型付け Rust製 他のアプリに組み込める JITバックエンドにCraneliftを使いたい GCどうしようかなぁ 関数ごとに並列でコンパイル(遅延させる)すれば、プログラムが大きくなってもモッサリしない? そもそもそんなに大きなプログラム向けじゃないかもね という感じの構想。

    自作言語 eb
  • 2歳の子どもの言い間違いがあまりに規則的→言語学で説明される現象であることが判明『ヘリポクター』『とうもころし』

    傘 @GerkMco @tao_reco 音位転換(メタセシス)ですね。これは子音だけが入れ替わっているわけですが、このような例は幼児期にしか観察されない貴重なデータです。 2021-01-16 13:04:58 傘 @GerkMco @tao_reco ちなみに/p/と/k/は(簡単に言うと)両方とも一回息を止める音(閉鎖音)という点で、/s/と/t/は両方とも舌を歯茎に近づけるかくっ付ける音と言う点で共通しています。つまり、お子さんは無意識に似ている音をひっくり返しているわけです。子どもの言い間違いって面白いですよね。 2021-01-16 13:06:26

    2歳の子どもの言い間違いがあまりに規則的→言語学で説明される現象であることが判明『ヘリポクター』『とうもころし』
    field_combat
    field_combat 2021/01/18
    へー
  • 言語が減ることって問題ですか?への私の答え|下地理則(九州大学人文科学研究院 教授)

    このコラムは,『春秋』(2017年7月号,8/9月合併号)に連載した内容に,リンクをつけたり加筆修正したりして,さらにイントロを書き足したものです。 言語が減ることって問題ですか?私は言語学者である。琉球列島の言葉を専門にしている。 下地理則の研究室 冒頭の問いは,これまで何十回も,話者の人たちから,学生たちから,講演会での聴衆から,そして同業者たちから,投げかけられた問いである。同じような問いをされた言語学者も多いと思うし,自問している人もいるだろう。だから,この問題に対する私なりの回答を書き留めておくのは意味があることだと考えて,コラムにすることにした。 かなり前からのことではあるが,とりわけ21世紀に入って,言語学の世界では言語の消滅危機が大きな問題になっている。以下で述べるように,世界には7000近くの言語があるが,これが今世紀中に,50〜90%消滅する可能性がある。 さて,ここで

    言語が減ることって問題ですか?への私の答え|下地理則(九州大学人文科学研究院 教授)
  • 「てふ」と書いてなぜ「ちょう」と読むのか知りたい。 | レファレンス協同データベース

    調査した結果、もともと「てふ」は「ちょう」とは読まなかったことが判明した。 調査した資料に書かれていたことをまとめると次の通り。 ・昆虫の蝶は、昔は和語の「カハヒラコ」と呼称されていたが、平安時代、外来語の呼称「tiep」に取って代わられた。 この発音「tiep」をそのまま文字に書き写したものが「てふ」だった。 ・この発音「tiep」は、時代を下るにつれて変化していく。 具体的には、平安中期以降から鎌倉時代にかけて「てう」に変化し、 江戸時代までには「ちょお」と発音するようになった。 ・ところが「てふ」という表記だけは変わらずに「てふ」のまま残り続けた。 このずれのために、「てふ」と書いて「ちょう」と読むようになった。 〇調査した資料 ・『国語科図説:図説全集』(石井 庄司/編著 岩崎書店 1960) p.238-239「歴史的かなづかいは、われわれ現代人の発音を写し書くには、まことに不便

    「てふ」と書いてなぜ「ちょう」と読むのか知りたい。 | レファレンス協同データベース
    field_combat
    field_combat 2020/09/17
    「調査した結果、もともと「てふ」は「ちょう」とは読まなかったことが判明した。」
  • プログラミングでつまづいてきたこと - 覚書

    プログラミング初心者に対してどういう情報が役立つのかをぼんやり考えていると、そこそこコードを書けるベテランが、いつ、どういうことにつまづいてきたのかを書くとけっこう有益なのではないかと思ったので書きました。これを読むと直接プログラミング能力が上がるわけではないですが、「ああ、こういうところでつまづいてもいっぱしのプログラマになれている人もいるのだな」と思ってもらうのが目的です。成功談よりも失敗談のほうが役立つとよく言われますが、それと少し似ているのかもしれません。 全段落で「いっぱしのプログラマ」とか言った手前、自分のことを書いておきます。18歳ごろから20年くらい前からプログラミングをしていて、主に有名どころのOSSに向けてコードを書いてきました。昔はLinuxカーネルを10年少々やっていて、ここ最近はCephオーケストレータであるRookの開発とかをしています。プログラマとしてはスーパ

    プログラミングでつまづいてきたこと - 覚書
  • 若い世代のサ行の発音が変化している?中学生YouTuberの動画から観察したことの考察

    すきえんてぃあ@書け @cicada3301_kig カキクケコ [k'ə ks kɸ k'ɛ k'ɔ] サシスセソ [ssə ss sɸ ssɛ ssɔ] タチツテト [tə tss tsɸ tɛ tɔ] ハヒフヘホ [xə xs xɸ xɛ xɔ] 2019-12-01 19:18:15 すきえんてぃあ@書け @cicada3301_kig 中学生が「そこでクスクス笑ったら負け」とか言ってるシーンがあったんだけど 「クスクス」が子音の無声化とかじゃなくてナチュラルに ksskss みたいに発音していて、普段会話に使っている音素を笑い方のオノマトペに当てた感じだった twitter.com/cicada3301_kig… 2019-12-01 19:23:07 すきえんてぃあ@書け @cicada3301_kig 「今日」がほとんど「キャー」に近く聞こえる人がいた 半狭母音が下がってがっ

    若い世代のサ行の発音が変化している?中学生YouTuberの動画から観察したことの考察
    field_combat
    field_combat 2019/12/02
    へー、あとで見てみよ
  • スーパー中学生誕生、プログラミング言語わずか数週間で開発、U-22プログラミング・コンテスト2019 - BCN+R

    「もっと人間にとって扱いやすい、自分の言語をつくってみたかった」。10月20日に東京の秋葉原コンベンションホールで開催された第40回「U-22プログラミング・コンテスト2019」の最終審査会で、見事、経済産業大臣賞(総合)を受賞した開成中学校3年の上原直人さん(15歳)は、独自プログラミング言語「Blawn」を発表した。IT業界の経営者など、並みいる審査員を驚かせたのは、完成度の高さはもちろんのこと、今年8月からわずか数週間で完成させたスピードだった。一次審査の応募期間7月1日~9月2日に着想から開発、完成まで一人で仕上げたという。 C言語を使ったのは今年7月 それまでPythonを使っていたという上原さんは発表の中で、「今年の7月か8月にC++を始めたが、扱いにくかった。もっと可読性の高い構文とメモリの安全性や速度を高めたいと思った」と、開発のきっかけについて語った。 質疑応答で審査員か

    スーパー中学生誕生、プログラミング言語わずか数週間で開発、U-22プログラミング・コンテスト2019 - BCN+R
    field_combat
    field_combat 2019/10/22
    ヤバいな
  • 我偽中国語翻訳機作成了 - Qiita

    のように、日語の文章から偽中国語を自動生成したい。 偽中国語とは 中国語のようでいて日人でも意味を理解できてしまう漢字の羅列のこと。 通常「私はご飯がべたい」を中国語では 我想吃饭 と書きます。一方で偽中国語は 我飯希望 と「私はご飯をべることを希望する」と読めなくもない表記で記します。 これが偽中国語です。以前からTwitterLINEなど各種SNSで使われてきたユーモアあふれる記法です。 そこで、日語の文字列を与えることで偽中国語に変換してくれる翻訳機を作りました。 サンプル 実行環境 macOS High Sierra 10.13.6 Python 3.5.1 方針 実装方法 偽中国語の慣例上 1 、 - 動詞「○○する」は「○○実行」と変換することが多い - 「明日お酒飲みに行かない?」のような提案する文章の場合、文末に「如何?」を付ける - 「私は◯◯したい」のよう

    我偽中国語翻訳機作成了 - Qiita