タグ

言葉と規格に関するotori334のブックマーク (4)

  • 学名 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "学名" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2012年5月) Orcinus orca, シャチ 生物学における学名(がくめい、scientific name)は、生物学(かつては博物学)の手続きに基づき、世界共通で生物の分類群に付けられる名称である。 種の学名は種名(しゅめい、species name)と呼ばれ、[属名〈ぞくめい、generic name〉+ 種小名〈しゅしょうめい、specific name〉](細菌では[属名 + 種形容語〈しゅけいようご、specific epithet〉])の構成で表す。この表し方を二名

    学名 - Wikipedia
  • Unicodeでは濁点や半濁点を別扱いしてることがあるので結合した - はてなの鴨澤

    PDFをテキストに変換して使うことがときどきあります。 今日処理してたPDF電子書籍の中に、テキストデータは持っているのに、なんかしらんけど検索がうまくかからないことが多い、という変なファイルがありました。ぜんぜん検索できないならまだわかるんだけど、できる検索語とできない検索語があるかんじ。 pdftotextでテキストファイルにしてみたところ、なんとこのテキストファイルが同じように検索できたりできなかったりする。さすがにちょっと不思議。 で、「が」という文字が入ってると検索がかからないのに気がついたので、「が」だけ切り出したテキストファイルを作り、ほかに普通のエディタで「が」だけ入力したテキストファイルを作って、PythonでUnicodeコードポイントを見てみました。ga.txtが検索のかからないもの、ga2.txtがかかるものです。 >>> for line in open('ga

    Unicodeでは濁点や半濁点を別扱いしてることがあるので結合した - はてなの鴨澤
  • 幽霊文字 - Wikipedia

    幽霊文字(ゆうれいもじ、英:ghost letter)は、JIS基漢字に含まれる、典拠不明の文字(漢字)の総称。幽霊漢字(ゆうれいかんじ)、幽霊字(ゆうれいじ)とも呼ぶ。 河内𡚴原地区(滋賀県犬上郡多賀町)の地名看板。幽霊漢字「妛」は「𡚴」の誤字である可能性が指摘されている。 1978年に当時の通商産業省が制定したJIS C 6226(後のJIS X 0208)では、いわゆるJIS第1・第2水準漢字として6349字が規定された。この漢字集合を「JIS基漢字」と呼ぶ。このとき典拠として次の4つの漢字表に含まれる漢字が採用された[1]。 標準コード用漢字表(試案): 情報処理学会漢字コード委員会(1971年) 国土行政区画総覧: 国土地理協会(1972年) 日生命収容人名漢字: 日生命(1973年、現存せず) 行政情報処理用基漢字: 行政管理庁(1975年) しかし、制定当時は各

  • ベリーのパラドックス - Wikipedia

    英語版記事を日語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、{{翻訳告知|en|Berry paradox|…}}をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明があ

    otori334
    otori334 2020/11/18
    “「自然言語による数の定義」から生まれるパラドックスは他にリシャールのパラドックスが存在し” この記事はラッセルが用いた非通常集合の例「英単語19語未満で定義できるもの全体の集合」を汲んでると思う.
  • 1