タグ

文字に関するtonybinのブックマーク (278)

  • yasuokaの日記 | スラド

    2021年12月23日の日記の読者から、NDL古典籍OCR用RoBERTa-small ver.2という単文字日語モデルをお教えいただいた。以前、私(安岡孝一)が作ったroberta-small-japanese-aozora-charを再トレーニングして、TrOCRのデコーダーに使っているらしい。とりあえず、当該モデルをGoogle Colaboratoryで動かしてみよう。 !pip install transformers !test -f model-ver2.zip || curl -LO https://lab.ndl.go.jp/dataset/ndlkotensekiocr/trocr/model-ver2.zip !test -d model-ver2 || unzip model-ver2.zip from transformers import pipeline f

  • 文字コードチェッカー

    テキスト,xml,htmlファイルを選択してください(複数選択可能)。文字コードはUTF-8のみ有効です アップロードされたテキストの使用文字を集計して文字コードを表示します。CSVでダウンロードもできます。 使用文字の範囲や意図しない文字が含まれていないか等のチェックにご利用ください。 ※サーバに送信されたファイルはその場で破棄されます。集計情報はログとして保存されます。 以下表示サンプル

  • イッシュ文字がほぼ解読された件 京都大学ポケモンサークル

    お久しぶりです。Chelonです。 皆さんはこんな文字をご存知ですか? (映画 幻影の覇者ゾロアークのED) (BW47話 激走! バトルサブウェイ!!(前編)) 文字の数は約50種類あり、アルファベットだと多すぎるのでひらがなの可能性も考えていたのですが、ある時、一緒に使われる文字の組み合わせが2パターンあることに気づきました。 つまり、イッシュ文字はパターンAとパターンBに分かれていて、2つを混ぜて使うことはほとんどないのです。 そして今回、イッシュ文字をほぼ解読することに成功しました! 解読に至った経緯はどうでもいいでしょうから、結果だけのせます。 調べてみると先に解読した人もいらっしゃいました。先をこされてしまいましたが、この解読表はぼくが独自で作ったものです。参考にしたりとかしていません。 パターンAのVとX、パターンBのB,C,Jは単語にほとんど出てこなかったので、どちらがどち

  • 第24回「東洋学へのコンピュータ利用」研究セミナー

    東洋学へのコンピュータ利用 第24回研究セミナー とき:2013年3月15日(金)10:30〜17:10 ところ:京都大学人文科学研究所館1Fガラス張りセミナー室 主催:京都大学人文科学研究所附属東アジア人文情報学研究センター 問い合わせ:diccs@kanji.zinbun.kyoto-u.ac.jp プログラム 10:30〜10:40 開会挨拶 [USTREAM] 10:40〜11:25 平仮名字体通時データベースのために [USTREAM] 岡田一祐(北海道大学) 11:25〜12:10 甲骨文データベースのデジタル化諸要件と作業プロセスの検討 [USTREAM] 鈴木敦(茨城大学)・鈴木俊哉(広島大学) 13:30〜14:15 IVS vs UCS [USTREAM] 安岡孝一(京都大学) 14:15〜15:00 多粒度漢字構造情報のための包摂規準機械可読化の試み [USTREA

  • 漢字文献情報処理研究会第16回大会・総会 大会・講演会

    第十二回大会 開催要領 日時 2009年12月20日(日)13:00~ 場所 花園大学・拈花(ねんげ)館202教室 (アクセスマップ) 会員入場無料(非会員は参加費500円) 研究発表終了後、総会(会員の方のみ)および懇親会を行います。 プログラム 研究報告 13:00-15:00 (1) 高田智和(国立国語研究所) 「ア行の/e/・ヤ行の/je/を表わす仮名文字の標準化をめぐる諸問題」 概要:天暦年間(947-957)ころまでの日語(中央語)で、音韻上の区別があったとされるア行の/e/とヤ行の/je/を書き分けるための仮名文字が、2008年にISO/IEC 10646へ追加提案された。この提案については、(1)提案文字をコンピュータで扱う目的や想定される使用層が必ずしも明確でないこと、(2)「変体仮名」の追加提案を今後誘発する可能性があること、(3)活字字形としての安定と洗練が不足して

  • WindowsのKB2753842問題 - 実験る~む

    今日はえらいことに巻き込まれました。 昨日あった「Windows Update」のせいで、フォントの挙動がおかしくなったという……。 しかし昨日の時点でとあるサイトに報告があがってたという……ううっ、なんてことだ。 【重要】Windowsセキュリティパッチ適用による動作不良について 【重要】Windowsセキュリティパッチ適用による動作不良について 【キヤノンIDソリューションズ エディカラー/エディアンウィング】 一部フォントで空欄になっているところがありますが、これはなにをやっているかというと「文字の効果」を利用した結果。一番最後の行で青いフチつけてますが、これと同じことをしてたりします。 かけてる先は、上から和文OpenTypeフォント(Adobe-Japan仕様)、欧文OpenTypeフォント、Type1フォント、そしてTrueTypeであるMS UIゴシック。 自分が確認した限り

  • キンドル成功のカギはエロコンテンツ(上)

    電子書籍推進派が見落としていること これまで3回にわたって、日電子書籍の墓場であること、そして、命とされるアマゾンの電子書籍端末「キンドル」でさえ、大して売れないだろうということを書いてきた。 すると、「そんなことはない」という反論が山ほど寄せられた。ただし、その反論はキンドルに期待を寄せる先進的なユーザーや、メディア界でもこれまでこの問題を追求してきた優秀な記者の方々、ITジャーナリストなどの方々が中心で、私の問題意識とはズレがある。 私が問題にしているのは、日の電子出版市場の特殊性であり、これはキンドルとは、直接は関係ない。たとえば、著作権法の問題、制作が複雑でコストがかかる問題、紙の出版流通の特殊性などであり、その結果、実際にいま日で出来上がった電子出版市場はボーイズラブ(男性の同性愛を題材とした漫画など、以下BL)、ティーンズラブ(少女向けのセクシャルな描画を含む漫画など

    キンドル成功のカギはエロコンテンツ(上)
  • 【見た目がワンランクアップ!】フチ文字の隙間を埋めるIllustratorのアピアランステクニック

    出典:Twitter / hamko1114: フチ文字作るとこーゆー隙間、できるときありますよね。 ... なんかTwitter見ていたら気になることが見えたんですよ。 フチ文字作るとこーゆー隙間、できるときありますよね。特にタイトル周りだと私はこいつが憎くて憎くて仕方ないんですが、これが気になるDTPerさんは一体どのくらいいらっしゃるんでしょか。 twitter.com/hamko1114/stat… ― hamko(サンタモード)さん (@hamko1114) 12月 11, 2012 あ~、言われてみるとフチ文字の隙間は気になるかも…。 私も以前取引先のデザイナーさんに言われて以来気をつけるようになったんだけど。小さい文字の時はいいんだけど、タイトルとかに使ってて周りに装飾がゴテゴテあるとこういう隙間が目立ってすげーきもちわるいの。 ― hamko(サンタモード)さん (@ham

    【見た目がワンランクアップ!】フチ文字の隙間を埋めるIllustratorのアピアランステクニック
  • クリエイターのための総合情報サイト CREATIVE VILLAGE

  • [ idea-mag.com ] » idea magazine » IDEA No.356 : 文字デザインのマニエリスム

    《特集1》文字デザインのマニエリスム-1960,70年代レタリング,ロゴタイプ,新書体の諸相 1960年代,70年代は産業やメディアが飛躍的な発展とともに文字デザインの新しい可能性が探求された黄金期でもあった。当時のさまざまな試みや人物をふりかえり,日字デザインの豊かな潜在力を提示する。 《特集2》FUSEの20年 80年代末のデザインにおけるデジタル技術の登場は,長いあいだ職能的なバリアーに囲われていた書体制作という領域に風穴を開けた。1991年,ネヴィル・ブロディが中心となって立ち上げたプロジェクト「FUSE」は活字書体の新たな可能性を追求し,国際的に大きな影響力を発揮した。その全貌を詳細な解説とともにたどる。 文字デザインのマニエリスム-1960,70年代レタリング,ロゴタイプ,新書体の諸相 ◉連帯と運動 協会の結成/年鑑/機関誌 ◉研究と提案 明日の書体デザイン/アジア地

  • 論文の句読点にピリオドとかコンマを使うのはなぜ?

    横書きの文章で句点に「.」、読点に「,」を使うように指定してあるものがあります (昔の『心理学研究』とか。今は「。」と「,」)。なぜ、ふつうに「。」と「、」ではないのでしょう?

    論文の句読点にピリオドとかコンマを使うのはなぜ?
  • やさしさゴシックの魅力|可愛くて温かい商用可フリーフォント #LOVEFONT Advent Calendar 2012

    今回、WEBCRE8.jpの優さん企画の#LOVEFONT Advent Calendar 2012というイベントにお誘いいただきました。 愛するフォントの魅力を語る・詳しくなくても構わない、と優しい声をかけていただいて勇気がでたので、私も参加させていただくことになりました。 今回の企画、Advent Calendarと#LOVEFONTについては、WEBCRE8.jpさんの記事をご覧ください。 2012年、今年こそはAdvent Calendarに参加しよう!! |WEBCRE8.jp#LOVEFONT | WEBCRE8.jp#LOVEFONT Advent Calendar やさしさゴシックって…?その名の通り、やさしい雰囲気の「やさしさゴシック」。 好きなポイントはいろいろあるのに、そのフォントについて知っていることは、とても少なかったので調べてみることにしました。 やさしさゴシッ

    やさしさゴシックの魅力|可愛くて温かい商用可フリーフォント #LOVEFONT Advent Calendar 2012
  • テキストのメリハリをつける方法7つ

    私のデザイン修正で一番多い指示が、「メリハリをつけてください」で、以前はどうすれば良いかわからず困っておりました…。(今も時々わからなくなりますが…) 最近ようやくどうすればメリハリがつくかわかってきたので、その方法をまとめてみました。 「メリハリをつけてください」の修正意図は、目立つべきところが目立っていないので、重要な部分を視覚的にはっきりさせてください、ということだと思います。 例として、以下のような見出しとテキストをもとに考えてみます。 (メリハリをつける場合、サイト全体のバランスをみてつけることが必要ですが、ここではわかりやすくするため、見出しと説明文のみで考えています) (引用:Wikipedia: カメラ http://ja.wikipedia.org/wiki/%E3%82%AB%E3%83%A1%E3%83%A9) 私の場合、メリハリをつけるのは以下7つの方法が多いです。

    テキストのメリハリをつける方法7つ
  • 「ひとにくし…」 平安京跡で日本最古級の平仮名入り墨書土器発見 - MSN産経ニュース

    平安時代の貴族の邸宅跡(京都市中京区)から出土した9世紀後半(平安時代前期)の土器片約20点に、平仮名が墨書されているのが見つかり、京都市埋蔵文化財研究所が28日、発表した。10世紀に成立したとされていた平仮名が、9世紀後半に確立していたことを示す史料で、専門家は「今後の日語研究の基準となる希有(けう)な発見」としている。 墨書土器が見つかったのは、右大臣、藤原良相(よしみ)(813~867年)の邸宅跡。同時期の平仮名は、富山県や宮城県などでも断片的に見つかっているが、今回は出土量も多く、平安京跡でまとまって見つかったのは初めて。 仮名は9世紀以降、1音に1字を当てる万葉仮名、万葉仮名の草書体を用いた草仮名、そして平仮名の順に移行するとされる。今回の発見で、10世紀といわれていた平仮名の確立が約50年さかのぼることになる。 土器には、百文字を超える平仮名が墨で記され、1ミリ前後の細かな文

  • 平仮名:9世紀後半の土器から発見 最古のものか- 毎日jp(毎日新聞)

  • eoblogサービス終了のお知らせ

    eoblogは 2017年3月31日(金)15:00 をもってサービスを終了いたしました。 長年にわたりご愛顧いただき誠にありがとうございました。

  • 平仮名:供宴呪術?解読難航 土器に大量の文字、和歌見当たらず−−京都- 毎日jp(毎日新聞)

  • 出版状況クロニクル55(2012年11月1日〜11月30日) - 出版・読書メモランダム

    出版状況クロニクル55(2012年11月1日〜11月30日) 出版社・取次・書店という近代出版流通システムがスタートしたのは明治20年代、すなわち1890年前後であり、その歴史はすでに120年余に及んでいることになる。しかもそれが未曾有の危機に追いやられていることは周知の事実だといっていい。さらにまたその出版危機が日だけで起きている特異な現象だということも。 日の近代出版業界の流れは教科書、雑誌、書籍、戦後はコミックが加わり、形成されたと見なせるだろう。それらのインフラの中心は出版業界の三者ではあったとしても、とりわけ書籍に関しては、大正期の1910年代から古書業界が、流通販売だけでなく、生産に関しても大きな役割を果たし、リバリュー、リサイクルも含め、出版業界のバックヤードとして機能してきた。 それらの中でも赤、特価業界は出版に関して独特の位置を占め、貸、大衆小説、コミックの揺籃

  • 日本最古の説話集の巻頭部分か NHKニュース

    名古屋市内の寺から、日で最も古い説話集とされ、国の重要文化財の「日霊異記」の未発見の巻頭部分とみられる史料が専門家のグループの調査で見つかり、貴重な文化財として注目されています。 新たに史料が見つかったのは名古屋市にある大須観音です。 大須観音では、平安時代に書かれた日で最も古い説話集とされ、仏教の教えが書かれた国の重要文化財の「日霊異記」の写を所有していますが、これまでは巻頭部分がない状態でした。 名古屋大学などの専門家でつくる研究グループが行ったことしの調査で、大須観音の書庫の中から、巻頭部分とみられる史料が見つかったということです。 書庫の中からは、茶と禅を日に伝えたことで知られる臨済宗の祖、栄西が仏教をどう解釈するか論争した書物も見つかったということです。 調査を行った名古屋大学文学研究科の阿部泰郎教授は、「身近な大須観音に驚くほどのたくさんの重要な史料が眠っていること

  • 孫崎享『戦後史の正体』の本文組 - 日本語練習虫

    孫崎享『戦後史の正体』― 戦後史の正体 (「戦後再発見」双書1) 作者: 孫崎享出版社/メーカー: 創元社発売日: 2012/07/24メディア: 単行購入: 31人 クリック: 410回この商品を含むブログ (86件) を見る―について、「孫崎享著「戦後史の正体」は、日人全員必読の書だと思う。解り易く、また敬体で読み易い。が、字間行間が狭く活字も小さい。 結局は読み辛い。これもしかして、ア〇リカさんに睨まれないよう、出版社がわざとやっている!? 」と書いたツイートがあることを知った。 https://twitter.com/peergyntbot2/status/275405246371606529 これについては、「文字サイズや行間は、この手の論説としては標準的、字間はベタ。小さいの狭いのというのは、いわゆるベストセラーと比べての印象か」とするツイートも見かけたが、どのように標

    孫崎享『戦後史の正体』の本文組 - 日本語練習虫