タグ

ブックマーク / srad.jp (213)

  • デジタル庁が考える文字情報基盤の「整備」 | yasuokaの日記 | スラド

    昨日の日記に対して、デジタル庁は文字情報基盤を拡張する心算なのではないか、との御指摘をいただいた。地方公共団体情報システムデータ要件・連携要件標準仕様書【第1.0版】を、もう少し読んでみよう。 標準準拠システムを導入する前に地方公共団体がそれぞれ独自に作成した文字、いわゆる「外字」については、戸籍システムにおいて当該「外字」を文字情報基盤として整備された文字と同定した文字を利用することにより、他の標準準拠システムは、当該「外字」を利用しない。仮に、「外字」を文字情報基盤の文字と同定する取組みを行った上でも、なお「外字」を利用せざるを得ない場合においては、戸籍システムにおいて文字情報基盤の文字とは別の文字コード(デジタル庁が指定したものに限る。以下同じ)に対応させたものを利用することにより、他の標準準拠システムは、当該「外字」を利用しない*。 文字情報基盤の文字セット及び文字情報基盤の文字と

    karpa
    karpa 2022/09/02
  • 「象は鼻が長い」の主語は「象」なのか「鼻」なのか | yasuokaの日記 | スラド

    昨日の日記の読者から、「私は腹が立つた」は「象は鼻が長い」と同じ構造なのか、という趣旨の質問をもらった。昨日と同様に、nsubj:outerで書いてみよう。 象   NOUN ═╗<══╗ nsubj:outer(主語[外側]) は   ADP  <╝   ║ case(格表示) 鼻   NOUN ═╗<╗ ║ nsubj(主語) が   ADP  <╝ ║ ║ case(格表示) 長い ADJ  ═══╝═╝ root(親) 確かに、「象は鼻が長い」なら「鼻が長い」をPredicate Clauseとみなすのも、アリだと思う。ただ、もし当にPredicate Cluaseであるならば、Universal Dependenciesの新しいルールによって倒置文「鼻が象は長い」は、以下のように表すことになる。

    karpa
    karpa 2022/07/25
  • tatoebaデータセットにおけるアイヌ語ain日本語jaパラレルコーパス | yasuokaの日記 | スラド

    私(安岡孝一)の11月6日の日記の読者から、datasetsが1.16.1にバージョンアップされて、最新のtatoebaが使えるようになった、との連絡をいただいた。これで、アイヌ語と日語のペアもダウンロードできるようになったので、さっそく試してみよう。 $ pip3 install -U datasets --user $ python3 >>> from datasets import load_dataset >>> d=load_dataset("tatoeba",lang1="ain",lang2="ja") >>> print(d) DatasetDict({ train: Dataset({ features: ['id', 'translation'], num_rows: 18 }) }) >>> print(d["train"][:]) {'id': ['0', '1'

    karpa
    karpa 2021/11/28
  • 製紙メーカーら、来年からコピー用紙などの値上げを表明 | スラド

    印刷業界紙のPJ web newsの記事によると、製紙メーカー各社から印刷・情報用紙(いわゆるコピー用紙など)の値上げ予告が相次いでいるそうだ。各社とも改定幅は15%以上の値上げとされている。記事によれば、日製紙は2022年1月1日出荷分から、大王製紙は2022年1月21日出荷分から、三菱製紙は2022年1月1日出荷分から値上がりするとのこと。コロナ禍による国内需要低迷や原材料や燃料の価格高騰、人件費高騰などが理由であるとしている(PJ web news)。

    karpa
    karpa 2021/11/16
  • tatoebaデータセットにおけるアイヌ語ain英語enパラレルコーパス | yasuokaの日記 | スラド

    >>> d=load_dataset("tatoeba",lang1="ain",lang2="en") >>> print(d) DatasetDict({ train: Dataset({ features: ['id', 'translation'], num_rows: 27 }) }) >>> print(d["train"][:]) {'id': ['0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '10', '11', '12', '13', '14', '15', '16', '17', '18', '19', '20', '21', '22', '23', '24', '25', '26'], 'translation': [{'ain': 'クパケ アㇻカ。', 'en': 'I have a headache.'},

    karpa
    karpa 2021/11/06
  • 「私は腹が立つた」の主語は「私」なのか「腹」なのか | yasuokaの日記 | スラド

    「クツニサクトンクトン」の平行コーパスUniversal Dependenciesを作っていたところ、「私は腹が立つた」という文で悩みこんでしまった。元のアイヌ語は「Chirushka」なので、「Chi」⇐nsubj=「rushka」で大丈夫だと思うのだが、問題は「私は腹が立つた」の主語を「私」にしていいかどうかだ。ちょっと、GiNZAにお伺いを立ててみよう。 $ echo 私は腹が立つた | ginza # text = 私は腹が立つた 1    私    私    PRON    代名詞    _    5    dislocated    _    SpaceAfter=No|BunsetuBILabel=B|BunsetuPositionType=SEM_HEAD|NP_B|Reading=ワタクシ 2    は    は    ADP    助詞-係助詞    _    1   

    karpa
    karpa 2021/08/06
  • 「頭が赤い魚を食べる猫」における6通りの解釈 | yasuokaの日記 | スラド

    「頭が赤い魚をべる」を係り受け解析していて、どうも私(安岡孝一)には6通りの解釈が可能な気がしてきた。まあ、日語としてはヤリ過ぎなのだが、少し悪ノリしてUniDic2UD 2.1.5でやってみよう。 >>> import unidic2ud >>> ja=unidic2ud.load() >>> doc=ja("頭が赤い魚をべる") >>> print(doc.to_tree()) 頭 ═╗<╗       nsubj(主語) が <╝ ║       case(格表示) 赤い ═══╝<╗     acl(連体修飾節) 魚 ═╦═══╝<╗   obj(目的語) を <╝     ║   case(格表示) べる ═══════╝<╗ acl(連体修飾節) ═════════╝ root(親)

    karpa
    karpa 2020/06/24
  • UniDic2UDとGiNZAで読む「難儀な難儀は難儀する」 | yasuokaの日記 | スラド

    昨日の日記で示したUniDic品詞とUniversal Dependencies品詞の対応だが、かなり難儀なのが「名詞-普通名詞-サ変形状詞可能」だったりする。何せ「名詞」のくせにNOUNとは限らず、VERBだったりADJ(adjective)だったりするのだ。最新のUniDic2UD 1.9.1+現代話し言葉UniDicで、「難儀な難儀は難儀する」を解析してみよう。 $ echo 難儀な難儀は難儀する | unidic2ud -U spoken # text = 難儀な難儀は難儀する 1       難儀    難儀    ADJ     名詞-普通名詞-サ変形状詞可能    _       3      acl      _       SpaceAfter=No|Translit=ナンギ 2       な      だ      AUX     助動詞  _       1   

    karpa
    karpa 2020/02/09
    hm
  • テレビ東京、InterFMを木下グループに譲渡 | スラド

    テレビ東京は、100%子会社でFM放送局「InterFM」を運営するエフエムインターウェーブの株式90%を木下グループのキノシタ・マネージメントに譲渡する(テレビ東京ホールディングスのプレスリリース: PDF、 木下グループのニュースリリース、 ITProの記事、 朝日新聞デジタルの記事)。 InterFMは洋楽を中心に毎日300曲以上を放送する音楽専門のFM放送局。番組で使用する言語の90%は英語で、北京語、韓国語、タガログ語、スペイン語、ポルトガル語の5か国語で首都圏に住む外国人向けの情報を発信。日語の番組も放送されている。 テレビ東京グループは、今後提供コンテンツを映像に特化していく計画だという。キノシタ・マネージメントは同グループの掲げる「文化の創造」の一環としてInterFMを子会社化し、音楽事業分野の拡大を目指す。これに伴い、InterFMは木下工務店代表取締役の木下直哉氏が

    karpa
    karpa 2012/06/03
  • 「璽」はめったに見ない漢字なのに、どうして常用漢字なのですか? | yasuokaの日記 | スラド

    前田富祺の『常用漢字最新ハンドブック』(明治書院、平成23年1月)を読んでいたところ、質問6の「璽」はめったに見ない漢字なのに、どうして常用漢字なのですか?に対する以下の【答え】が気になった。(p.31) 「璽」は「ジ」と読み、この字には印、印形、玉などの意味があります。たしかに日常生活で目にすることのあまりない字ですが、これは、憲法に使われている漢字です。憲法は全日国民が読めるということが前提なので、憲法に使われる漢字は、すべて常用漢字表に入れて、読めるようにする努力目標としています。同じように普段あまり目にすることがないけれど常用漢字表に入っている「朕」(チン)という字も、憲法に使われている字です。「朕」は天皇が用いた一人称代名詞で「私」という意味です。「璽」も「朕」も、天皇が憲法を公布した文書の中に使われています。「璽」は「御璽」として出てきますが、天皇の印形、印が押されていること

    karpa
    karpa 2011/02/12
  • GHQが導入した当用漢字 | yasuokaの日記 | スラド

    昨日付の日経済新聞(第44902号)をチェックしていたところ、和久井康明の「漢字の使用制限を撤廃せよ」(朝刊p.5)というインタビューが、目に止まった。 国語審議会が当用漢字表を答申したのは昭和21年11月5日。当用漢字表が次官会議に持ち込まれたのが11月11日。閣議に持ち込まれたのが11月12日。内閣告示が11月16日。実は、当用漢字表はGHQを通っていない。 『米国教育使節団報告書』(昭和21年3月30日)を読めばわかる通り、GHQの方針は日語のローマ字化だった。漢字制限どころか仮名も捨てて、ローマ字で日語を表わせ、というのだ。でも、国語審議会は、この報告書に先立つこと4ヶ月、昭和20年11月27日には、標準漢字表の再検討に着手していて、あくまで漢字制限の方向に突き進んでいく。この結果GHQは、昭和21年11月16日の当用漢字表内閣告示に対し、沖縄における当用漢字表の告示を許可し

    karpa
    karpa 2011/02/01
    考へたこともなかったw
  • 『新しい常用漢字と人名用漢字』予約開始 | yasuokaの日記 | スラド

    『新しい常用漢字と人名用漢字』(三省堂、平成23年3月発行予定)のe-hon予約が無事、開始された。ちなみにこの、第2章「人名用漢字の新字旧字」と第3章「人名用漢字以外を子供の名づけに使うには」は、三省堂ワードワイズウェブでの連載を全面的に加筆修正したものだが、第1章「常用漢字と人名用漢字の歴史」は完全に書き下ろしだ。ちなみに、第1章の各節の見出しは、こんな感じ。 兵器名称用制限漢字表 標準名づけ読 標準漢字表 標準漢字表の再検討 氏名等を平易にする法律試案 当用漢字表 戸籍法の全面改正 当用漢字字体表 子供の名づけに対する漢字制限は憲法違反か 衆議院の戸籍法第50条改正案 人名用漢字別表 人名用漢字への改名騒動 琉球政府の人名用漢字表と当用漢字表 悠ちゃん命名事件 人名用漢字追加表 常用漢字表 人名用漢字の平成2年改正 琉ちゃん命名事件 表外漢字字体表 ジカダンパン!責任者出てこい!

    karpa
    karpa 2011/01/31
  • 日経Linux、創刊から今までの編集記事をPDF化した全集を発行 | スラド

    日経Linuxが、1999年10月の創刊号から2010年9月号までの11年間分の編集記事をPDF化した全集をUSBメモリーで発行するとのこと(日経BP社のITpro書店の内容紹介)。値段は39,000円だが、2010年12月15日までは24,900円で販売するとのこと。 ただし、コピーガードがかかっており、ハードディスクへのコピーができないのみならず、LinuxMacや64bit Windowsでは動作しないとのこと。いくらプロテクトを解除する方法があるだろうとはいえ、デフォでこの制限は酷いような…。

    karpa
    karpa 2010/10/10
    日経Linuxと言ひ条、Linuxで読ませないってすばらしい企業姿勢ですね
  • 子の名には、常用平易な文字を用いなければならない | yasuokaの日記 | スラド

    人名用漢字の新字旧字のネタを拾うために、法務図書館で小澤文雄関係資料を漁っていたところ、昭和21~22年の戸籍法改正案が山のように見つかった。「常用平易」に関する条文の変遷と共に、これらの史料を一覧表にしておくことにする。 一部改正案(昭21.10.18) [文書番号C-13-2]

    karpa
    karpa 2010/09/07
  • 「玻」と「珂」の常用平易性 | yasuokaの日記 | スラド

    『家庭裁判月報』今月号(第62巻第8号)のpp.65-75に、「玻南ちゃん事件」の名古屋高等裁判所決定[平成21年(ラ)第86号、2009年10月27日決定]が無事、掲載された。実を言えば、この名古屋高裁決定は、人名用漢字の常用平易性に対して非常に偏った見解を示しており、誤判と言ってもいいようなシロモノである。特に以下の部分は、かなりヒドイ見解だと考えられるので、ここに晒しておくことにする。 また,「玻」の文字の平易性の点についても,抗告人らが上記③において主張するとおり,これを他の漢字から類推して「は」と読むことが容易であり,他の裁判例で認められた漢字の殆どに比べて画数が少なく,その構成要素である「王」も「皮」も平易な漢字であることは認められるが,例えば,同じく「王」を構成要素とする漢字で,「珂」,「玳」,「珥」などのように,偏も旁も平易な文字であり,画数が多いとはいえず,他の漢字から類

    karpa
    karpa 2010/08/26
  • 米フロリダで鉄道を撮影しようとした2人、「生涯出禁」をくらう | スラド

    米フロリダ州マイアミ・デイド郡メトロ鉄道の撮影規則を検証しようとしたジャーナリストが「今後一切メトロ鉄道に乗ってはいけない」という「生涯出禁」命令をくらったそうだ(家/.)。 この検証を行ったのはブログ「Photography Is Not a Crime(写真は犯罪じゃない)」の管理者Carlos Miller氏とフォトジャーナリストStretch Leford氏の2人。Leford氏は現在大学でマルチメディアジャーナリズムの学位を取得しているところだそうだが、メディア法の授業のためのメトロ鉄道での撮影が許可されなかったことから撮影規則を検証しようと思い立ったという。 2人が郡運輸局の警備責任者であるEric J.Muntan氏に事前確認したところ、マイアミ・デイド郡では商用でなければメトロ鉄道での写真撮影は問題ないとされており、教育目的のための撮影も許可されているという。2人はこのM

    karpa
    karpa 2010/07/07
  • SCOとNovellの訴訟、Novellが勝訴。SCOの訴えはすべて棄却 | スラド

    SCOとNovellがUNIXの商標の所有権を巡って争っていた問題で、米裁判所はUNIXの著作権(編注:当初は商標と誤記の為、修正)をNovellが所有していることを認め、SCOの訴えを棄却した(Novellの発表)。これにより、SCOがIBMを訴えていた問題についてもSCOは法的な根拠を失い、SCOのUNIX関連裁判は終了に向かうと思われる。

    karpa
    karpa 2010/06/14
  • アレゲ?tech?スタンス? (#1775049) | 映画「ザ・コーヴ」東京での上映館なくなる | スラド

    まぁ、とりあえず、事の是非は置いておくとして、政治的にナーバスな問題を 取り上げる勇気には一定の評価があって然るべきだとは思うが、/-.jでわざ わざ取り上げる問題であったのか、ちょっと不思議。 まぁそれも良しとしよう。しかし、一つ得心が行かない事がある。 これは、このエントリが「/.-jの政治的スタンス」と受け取られかねないコト コレを考慮したエントリでなかったのは頂けなかったかなぁ?と思う。 たしかに、都内で観賞出来なくなってしまった無念さは解らなくはないが それを、自称市民団体の視界の狭い抗議行動などと、わざわざフレームのもとに なるような煽情的な文章を使って表現する必要性があるのか甚だ疑問だし、 それが、/.-jの看板背負ってやっている立場の人の、一映画ファンとしての 個人的発言なのか、/.-jとしての政治的スタンスとしての発言なのか明記 されていないために、尚更フレームの素になり

    karpa
    karpa 2010/06/05
    勇気? geekなんてそんなもんではとか
  • エプソン、ユーザー側によるインク交換不可というインクジェットプリンタを発表 | スラド

    エプソンがインクジェットプリンタの新製品「EC-01」を発表した。オフィス向けの製品で、大容量のインクパックを搭載する代わり、ユーザーによるインクカートリッジの交換やインクの補充が行えない点が特徴。予想価格は6万円代中頃とのこと(PC Watchの記事、ニュースリリース)。 内蔵のインクパック(4色分)では約8000枚の印刷が可能で、同社のインクジェットプリンタ「PX-101」のインクカートリッジ91個分に相当するという。インクが無くなった場合、インク補充サービス(税込み5万2,500円)でインクの再充填が可能という。 インクジェットプリンタは「体価格を下げてインクカートリッジなど消耗品で元を取る」などとも言われており、低価格な非純正カートリッジをメーカーが敵視していたが、まさか「カートリッジ交換不可能」という対策を取るとは想像していなかった。他メーカーや家庭向け製品も追従するかどうかが

    karpa
    karpa 2010/05/14
  • OpenOffice.org日本語版のセキュリティ対策は不十分 | スラド

    OpenOffice.org日プロジェクトの中田真秀氏が「OpenOffice.org日語版のセキュリティ対策は不十分」と述べ、これを解決するためにユーザーの参加を呼びかけている。 実際、高知県庁ではOpenOffice.orgの導入が検討されたものの、サポートの不備や脆弱性情報が得られにくく、アップデート用のパッチの有無も自分で確認しないと分からないという点が課題となり、結局MS Officeの導入が行われている。 詳細は件の記事を参照してほしいが、問題としては セキュリティ脆弱性を修正したバージョンを日プロジェクトが毎回タイムリーにリリースできるとは限らないセキュリティ警告などの提供も現状タイムリーには行われていないリリース品質保証にセキュリティ脆弱性に関する評価をしていない の3点が挙げられている。そのため、ユーザーに対しリリース品質保証への参加や協力を求めている。

    karpa
    karpa 2010/04/24
    中田氏の記事を読め^^;