タグ

2021年11月3日のブックマーク (2件)

  • RCEP、22年1月1日発効 GDP・人口で世界の3割 - 日本経済新聞

    【シドニー=松史】日中韓や東南アジア諸国連合(ASEAN)各国など15カ国が参加する地域的な包括的経済連携(RCEP)協定について、オーストラリアとニュージーランド(NZ)が3日までに国内手続きを終了した。豪政府はこれにより、2022年1月1日にRCEPが発効すると発表した。RCEPは、ASEAN10カ国のうち6カ国、その他5カ国のうち3カ国が事務局のASEANに寄託すると、その60日後に発

    RCEP、22年1月1日発効 GDP・人口で世界の3割 - 日本経済新聞
    legoboku
    legoboku 2021/11/03
    “RCEPは参加国の国内総生産(GDP)と人口の合計が、それぞれ世界の約3割を占める大型の自由貿易協定(FTA)だ。貿易自由化の水準は環太平洋経済連携協定(TPP)より低いが、約9割の品目で関税を段階的に撤廃する。”
  • 海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される

    by Whooym 文字が適切に表示されずに読めなくなってしまう「文字化け」は、海外技術者の間でも「Mojibake」で通用するとのこと。そんな文字化けの種類について、東京で自然言語処理(NLP)の開発をしているポール・オリーリ・マッキャン氏が解説しました。 A Field Guide to Japanese Mojibake https://www.dampfkraft.com/mojibake-field-guide.html マッキャン氏によると、文字化けは作成した時と異なる文字コードで文書を開くことで発生するとのこと。文章が文字化けすると無意味な文字列になってしまうので読めませんが、どのような文字コードが使われたかによって異なるパターンが表れるので、慣れると使われている文字コードの種類を推測することができるそうです。 ◆UTF-8 UTF-8はインターネット上では最も一般的な文字

    海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される
    legoboku
    legoboku 2021/11/03
    この間、MySQLのデフォルト文字コード(latin1)だとhyphen に見えるけど、UTF8だと不正な文字コードにで詳した。DBダンプのCSVをUTF8で読もうとしたらエラーになったので気づいた。文字コード問題は英語圏でも存在する。