タグ

ブックマーク / srad.jp (24)

  • Unicode 10.0.0、リリースされる | スラド

    昨日(6月20日)付でUnicode 10.0.0がリリースされたとの連絡を、日時間の今日(6月21日)にいただいた。今回のリリースでは8518字が追加されていて、うちCJK統合漢字拡張Fが7473字(U+2CEB0~U+2EBE0)、変体仮名が285字(U+1B002~U+1B11E)の追加である。 私(安岡孝一)個人としては、これで戸籍統一文字と住民基台帳ネットワーク文字がほぼ一段落したのがありがたいが、5月23日・24日の日記にも書いたとおり、多少、問題が積み残しとなってしまった。また、絵文字の追加(U+1F900~U+1F9E6)や、「BITCOIN SIGN」の追加(U+20BF)は、今後、微妙な禍根を残す気がしないでもない。 まあ、とりあえずは、戸籍統一文字と住基統一文字のIVS提案を、早急に進めてもらうべきかしら。

    Unicode 10.0.0、リリースされる | スラド
  • 書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド

    私(安岡孝一)の2016年2月26日の日記の読者から、近江龍一・西原陽子・山西良典の『ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング』(人工知能学会第31回全国大会論文集, 2M2-OS-34a-1, 2017年5月24日)という論文を読んでほしい、との御連絡をいただいた。読んでみたのだが、書写言語研究におけるサンプルデータの重要性を全く理解していない論文で、正直、頭が痛くなった。 研究では猥褻な表現に関する文を集めるために,pixivに投稿されているR-18小説を用いた.R-18小説に分類される小説の中から,2016年10月のウィークリーランキングTop10の小説を選択し,分析に用いた. そんな偏ったサンプルデータ10で、まともな結果が出るわけが無いだろう。しかも、なぜpixivに限定しなければいけないのか、pixivに限定する意図は何なのか、この論文には全く書

    書写言語研究におけるサンプルデータの重要性と妥当性 | yasuokaの日記 | スラド
    tsysoba
    tsysoba 2017/05/25
  • Orarioに対する営業妨害と非識別加工情報 | yasuokaの日記 | スラド

    私(安岡孝一)の昨日の日記は、Orarioに対する営業妨害だ、との御意見をいただいた。まあ、そうだろう。来月30日以降Orarioが、学生の所属大学、所属学部・学科、性別、卒業年度、登録時間割の匿名加工情報を、第三者に販売営業するつもりなら、私の昨日の日記はOrarioに対する営業妨害だ。Orarioのプライバシーポリシーにおいて、「(4)統計データの作成および当該データの第三者への提供」の具体的利用態様がどうなっているか見てみよう。 当社は、左に記載の情報を以下の目的のために利用します。 ・左記情報を利用者が識別できないように加工した上で、利用者の利用形態等の統計データを作成するため。 当社から右記情報に関する統計データの提供を受けた第三者は、当該情報を以下の目的のために利用します。 ・当社または第三者の商品またはサービスの広告の開発または提供のため ・マーケティング調査、統計、分析のた

    Orarioに対する営業妨害と非識別加工情報 | yasuokaの日記 | スラド
  • NDL書誌情報における文字コード講座 | yasuokaの日記 | スラド

    『文字符号の歴史 欧米と日編』の第1章「電信符号の歴史」(pp.15-59)を読まなかったのかしら? この章でも示したとおり、文字コードは、もともと通信において文字を扱うためのものであって、その後コンピュータにも導入されたに過ぎない。もちろん、コンピュータにおける通信は「情報交換」という形で抽象化されていて、実際ASCII (American Standard Code for Information Interchange)とか、JIS C 6220-1969「情報交換用符号」とかいう規格名称にも反映されているわけだ。 日語用の文字コードとして最初に制定されたJIS文字コードには片仮名が含まれました。片仮名と日語固有の句読点を合わせると約60文字[3]になります。これをISO 646(現 ISO/IEC 646)の英数字128文字と同時に用いるためには、約190文字の文字集合が必要

  • 文部科学省の考えるコンピュータの歴史 | yasuokaの日記 | スラド

    文部科学省が公表した「諸外国におけるプログラミング教育に関する調査研究」(大日印刷、平成27年3月)が、あまりにブッ飛んでいて爆笑した。特に「はじめに」の第一文。 1942年、今日の電子計算機の原型の一つが、ペンシルバニア大学ムーアースクールのJ.P.エッカート、J.W.モークリーによって論文としてACM(Association for Computing Machinery)に発表され、1945年には弾道計算用の実用機ENIAC(Electronic Numerical Integrator and Computer)が開発された。 いや、もう、どこから突っ込んでいいやら。とりあえず、ACMの設立は1947年で、Journal of the ACMの発行開始は1954年。一方、エッカートが1942年に発表した文書となると、たとえば「Light Modulating Method and

  • 当水族館の飼育係です。 (#2353375) | 名古屋港水族館、マイワシの水槽に天敵クロマグロを投入 | スラド

    実は連日の報道の目的の部分「イワシに喝を入れるためにマグロ投入」はマスコミの創作です。 最初に記事を見て職員はみんな驚きました。そのような話はしていなかったからです。 もともとこの水槽には20尾くらいのマグロがいましたが、マグロの飼育は難しくだんだんと減ってきたので追加するというだけの話なのです。 マグロの搬入はほぼ毎年行っています。 これまでイワシが群れから離れることに飼育係が問題視したことはなく、ましてや危機感を抱いたことは一度もありません。そこも水族館の面白いところだと考えているからです。 イワシの群れに影響は出るとは思いますが、べられることはそうないことはわかっているのでそこに関心はあまりありません。 また、イワシより搬入したマグロの方がビビりな上にサイズも「60~70cm」と小さいですので影響が出るまで数か月かかると思います。 最初に朝日の記者が創作して、その記事をもとに取材陣

  • 鍋島藩における和文モールス符号 | yasuokaの日記 | スラド

    確かにこの「主婦」のおっしゃる通りで、武雄市には、もう蘭学館は不要だと思います。同様に、武雄市には、もう武雄鍋島文庫は不要なので、他機関に移管すべきでしょう。 とコメントしたところ、なぜ武雄鍋島文庫にそうまで粘着するのか、という趣旨の御叱正をいただいた。私(安岡孝一)が「粘着」しているとすれば、それは武雄鍋島文庫だけではなく、いわゆる「大」鍋島文庫全体だと思う。 『文字符号の歴史 欧米と日編』(共立出版、平成18年2月)の図1には、「日初の和文モールス符号」というキャプションを打ってある。実は、この図を『江戸』大正7年12月号で発見した際に、私が最も気にしたのは、これが当に「日初の和文モールス符号」なのかどうかだった。この和文モールス符号は、安政2年7月2日(1855年8月14日)の浜御殿での実験で、小田又蔵と勝海舟が使ったものだから、もちろん、かなり初期のものであるのは間違いない

  • 文化庁、国会図書館の蔵書を電子書籍化して無料配信する実験を行う | スラド

    あるAnonymous Cowardのタレコミより。 文化庁が2月1日より「文化庁eBookプロジェクト」を開始する。このプロジェクトでは「平治物語〔絵巻〕」や「コドモのスケッチ帖 動物園にて」、「エロエロ草紙」など13のデジタルコンテンツを電子書店を通じて配信するというもの。配信には紀伊國屋書店が協力する(読売新聞、ITmedia、報道発表PDF)。 閲覧には紀伊國屋書店のソフトが必要だが、基的に無料で作品を読むことができるという。

  • Re: 武雄市新図書館 蘭学館“閉鎖”へ 映画・音楽レンタル店に | yasuokaの日記 | スラド

    武雄市の樋渡啓祐市長は11日、来春からの市図書館民間委託に伴い、図書館にある歴史資料館内の「蘭学館」をCDやDVDの有料レンタルショップのスペースに提供する考えを明らかにした。これまで蘭学館は残す方向だったが、市民の声などを理由に方針を変えた。蘭学館の史料は隣接する企画展示室とメディアホールで展示し、再整備も検討するとしている。 いや、別に「方針を変えた」わけじゃなくて、元々の方針に戻っただけでしょ。私(安岡孝一)は、遅くとも8月30日の日記で「少なくとも武雄市議会は、歴史資料館の管理もカルチュア・コンビニエンス・クラブにまかせたわけで、そこから「歴史資料」が放り出されてしまっているに過ぎない」って書いたつもりだし。まあ、これで、エポカル武雄の中には、武雄鍋島文庫を閲覧できるようなスペースはなくなってしまうわけだ。もはや、宝の持ち腐れなんだから、武雄鍋島文庫を他機関に移管するしかないと思う

  • 武雄市図書館・歴史資料館と武雄鍋島文庫 | yasuokaの日記 | スラド

    一昨日の「Re: 武雄市図書館歴史資料館と佐賀県公共図書館協議会」に関して、何が目的で部外者が口を挟んでくるのか、という趣旨の御叱正を複数いただいた。気付いている人も多いと思っていたのだが、私(安岡孝一)の目的は、もちろん武雄鍋島文庫だ。 武雄市図書館歴史資料館が所蔵している武雄鍋島文庫は、佐賀県立図書館の鍋島家文庫や蓮池鍋島家文庫、佐賀大学の小城鍋島文庫などと並んで、いわゆる「大」鍋島文庫の一角をなす重要な史資料群だ。個人的なことを言わせてもらえば、たとえ武雄市のTポイント情報が流出しても、私は痛くもかゆくもない。しかし、武雄鍋島文庫が流出するのは困る。もし海外流出などしてしまったら、ショックで夜も眠れない。それほど重要な史資料群なのだ。 ただし、だからと言って、武雄鍋島文庫を閲覧禁止にして、そのまま死蔵されてしまうのは、もっと困る。私も含め、それでは研究にならないからだ。つまり、流

  • Re: 武雄市図書館・歴史資料館と佐賀県公共図書館協議会 | yasuokaの日記 | スラド

    昨日の「武雄市図書館歴史資料館と佐賀県公共図書館協議会」に関して、相互貸借はTポイントの対象外とすればいいのではないか、という御意見をいただいた。実は、問題点はそこではない。 カルチュア・コンビニエンス・クラブ+武雄市図書館歴史資料館の『事業計画書』(武雄市臨時市議会資料、平成24年7月18日)の最大の問題点は、武雄市図書館歴史資料館が他機関と共同でおこなっている、いわゆる「連携事業」に関して、記述が全くなされていないことだ。つまり、武雄市図書館歴史資料館が、現在どのような「連携事業」をおこなっていて、それを今後どのように進めるのかあるいは進めないのかが、この『事業計画書』には全く記されていない。正直なところ、「連携事業」に関する事業設計はおろか、要件定義も現状把握すら行われていない状態なのだ。 その結果、この『事業計画書』には、「佐賀県公共図書館協議会」も「日博物館協会」も、あ

  • 武雄市図書館・歴史資料館と佐賀県公共図書館協議会 | yasuokaの日記 | スラド

    カルチュア・コンビニエンス・クラブ+武雄市図書館歴史資料館の『事業計画書』(武雄市臨時市議会資料、平成24年7月18日)を読んでいたところ、相互貸借に関して、かなり不可思議なことが書いてあった。 「継続する」として、じゃあ、どうしてここに「佐賀県公共図書館協議会」の1文が出てこないのか。なぜ「佐賀県内の公共図書館」ではなく、「他の図書館」とかいう具体性を欠く表現なのか。「相互貸借」のことは書いてあるのに、「図書物流システム」や「雑誌保存分担」のことが書かれていないのは、なぜなのか。 武雄市長物語にもコメントしたが、正直なところ武雄市図書館歴史資料館は、もはや佐賀県公共図書館協議会を脱退するしか、道は残されていないように思う。少なくとも、相互貸借からは外れるべきだし、そうすると雑誌保存分担も外れざるを得ないだろう。さもないと、Tポイントを貯めたいヤカラが、相互貸借を使って武雄市図書館から

  • 日本語版Wikipediaに「ショールズ・アンド・グリデン・タイプライター」登場 | yasuokaの日記 | スラド

    語版Wikipediaに「ショールズ・アンド・グリデン・タイプライター」の項目ができた、と連絡を受けたので、さっそく見に行った。正直言って、かなりヒドイ。Abner Peelerも、Charles Edward Wellerも、Edward Payson Porterも、George Harringtonも、Daniel Hutchins Craigも、Thomas Alba Edisonも、ここには現れない。死ぬまでタイプライターに付きあったCarlos Gliddenが、開発途中で去ったことになってしまっている。Western Union Telegraphは当時シカゴにあったのに、ニューヨークのAmerican Telegraph Worksと混同されちゃってるし。 手を入れようかとも思ったのだけど、何かパラレルワールドの歴史を読んでるかのような不気味さで、どこから手を付けていい

  • 国会図書館がWikipedia編集を禁止 | yasuokaの日記 | スラド

    Wikipediaの「利用者:安岡孝一」に文献を追加しておこうと、国会図書館からWikipediaへのログインをおこなったところ このページは「i-FILTER」によりブロックされました。 このページは「i-FILTER」により送信サイズが制限されています。 ブロック理由: 個別ブラック除外リスト i-FILTER / © 1999-2009 デジタルアーツ株式会社 というメッセージが出て、Wikipediaへのログインを拒否された。仕方なく、ログインせずにIPuserで「利用者:安岡孝一」を編集しようとしたところ、またまた同じメッセージ。どうやら国会図書館は、Wikipediaをブラックリストに載せているらしい。でも、それだと、国会図書館で見つけた「出典」を手元に置いてWikipediaを編集する、ってのが無理になるんだけど…。

  • 米国の電子書籍市場は既に失速 | スラド

    Computerworldの記事によれば、既に米国における電子書籍の市場は成長から一転し、失速しているようだ。 米国出版者協会が発表した2011年11月の米国内書籍売買額における電子書籍のセールスは、ここ6カ月ほど月額約8,000万ドルのあたりで推移しているということで、AmazonKindle、BARNES & NOBLEのNookという電子書籍にフォーカスした端末がいくらヒットしても、もはや電子書籍の売上増には結び付かないということのようだ。 記事では、単に電子書籍化しても通常の書籍に負けるだけであり、電子書籍が売れるためには付加価値が必要としているが、それはもう書籍ではないかもしれない。

  • 書籍の非破壊複製がまずい理由 | akiraaniの日記 | スラド

    おそらく、大半の人はことの重要性が全く分かってないと思うんだけど、これを理解するためには音楽CDの世界で過去何が起きてどういう形で対処されたのかを知る必要がある。 現在、みんな当たり前のように音楽CDをTUTAYAなどでコピーしてきてオーディオプレイヤーなどに取り込んでいるが、そこに至るまでには著作権法を改正する必要があるまでの大騒ぎがあった。 まあ、最終的にどういう風に落ち着いたのかというと、だいたい以下のような形になっている レンタルショップが貸与権使用料のような形でレコード協会にみかじめ金を払う主要な録音専用メディアおよび録音機で私的録音録画補償金制度を運用する著作権法30条1項を追加し、公衆サービスからのコピーを違法化する実は、この対処方法というのは書籍ではどれも不可能に近い まず、1と2についてだが、音楽業界はテレビやラジオなどのメディアに対する権利管理の必要性があったため、包括

  • 文字情報基盤構築のフォント公募 | yasuokaの日記 | スラド

    経済産業省の『平成22年度電子経済産業省推進費(文字情報基盤構築に関する研究開発事業)に係る委託先の公募』に関して、この3週間というもの、あちこちから私(安岡孝一)のもとに質問があった。いいかげん、同じことばかり答えるのも飽きてきたので、今までに答えた内容を、ざっと、ここにまとめておくことにする。 事業は、(1)文字情報基盤の将来像や課題を整理するための調査研究と、(2)この調査研究を進める上での調査の素材となるフォントの整備の2つの内容により構成される。

  • 旧「私のしごと館」が競売に | スラド

    けいはんな学研都市に立地し、今年 3 月で営業を終了した「私のしごと館」の建物が、現在競売にかけられている (入札公告PDF、物件調書PDF) 。 2003 年開業、建設費 581 億円。同館は政府の無駄遣いの象徴とされ、民主党政権による「事業仕分け」を待つまでもなく、自民党政権時代に廃止が決っていた。同館に隣接する国立国会図書館関西館のサインデザインを手がけた平野湟太郎氏は「今後しばらく、このレベルの公共建築を作るのは難しくなるだろう。税金で作ったせっかくの建物、ふさわしい有効利用をしてほしい」と述べている。 建物の規模が大きく、ちょっとやそっとのことでは活用が難しいように思えるが、どんな利用方法が考えられるだろうか?

  • Twitterにおける「タイプライター キーボード」 | yasuokaの日記 | スラド

    『キーボード配列 QWERTYの謎』(NTT出版、2008年3月)の読者から、Twitterでタイプライター キーボードを検索してみてほしい、と連絡があった。検索してみたが、『キーボード配列 QWERTYの謎』のまえがきすら読んでない人がまだまだ沢山いることがわかって、微妙に悲しかった。まあ、こういうメディアでは、このテのガセネタは、いつまでたってもなくならないのだろう。

  • 文化庁ホームページの文字コード | yasuokaの日記 | スラド

    今日が「改定常用漢字表試案への意見」の〆切なので、景気づけに文化庁ホームページの「サイト内検索(e-Gov)」で、問題の4字を検索してみることにした。 「𠮟」検索不能 「塡」検索不能 「剝」検索不能 「頰」検索不能 …っていうか、このホームページ、そもそも文字コードがShift_JISなんだけど。その上、HIDDENパラメータの中に「JCODE=SJIS」ってのがあって、e-GovにはシフトJISしか渡せなくなってる。 仕方がないので、【改定常用漢字表試案への意見】テンプレートで最初に示した4字を、代わりに検索してみた。 「叱」31件ヒット 「填」65件ヒット 「剥」316件ヒット 「頬」6件ヒット ふーん。表外漢字字体表を9年前に答申して、5年10ヶ月前にはJIS X 0213まで改正させたのに、文化庁内部ですらまだこんな状態なのね。まあ、常用漢字表が改定されたら、e-Govの作り直し