タグ

日本語に関するnsyeeのブックマーク (14)

  • 長年の懸案だった“外字問題”が解決へ、6万字を1万字に対応付ける「縮退マップ」が完成 | IT Leaders

    IT Leaders トップ > 経営課題一覧 > データ活用 > 技術解説 > 長年の懸案だった“外字問題”が解決へ、6万字を1万字に対応付ける「縮退マップ」が完成 データ活用 データ活用記事一覧へ [技術解説] 長年の懸案だった“外字問題”が解決へ、6万字を1万字に対応付ける「縮退マップ」が完成 2015年9月30日(水)田口 潤(IT Leaders編集部) リスト 普段は意識しないが、データや情報のデジタル化、そして利活用に少なからぬ影響があるのが、語彙の定義や文字コードの問題だ。これらは今も、氏名を扱う情報システム、例えば電子政府や電子自治体などにおいて問題であり続けている。その解消に向けた大きな前進が、2015年9月末にあった。 業界や社会、国を超えてデータや情報を流通させ共有したい。そのためには何が必要か?──。この設問に対して、読者は何と回答するだろうか?「インターネットに

    長年の懸案だった“外字問題”が解決へ、6万字を1万字に対応付ける「縮退マップ」が完成 | IT Leaders
  • BLOGOS サービス終了のお知らせ

    平素は株式会社ライブドアのサービスを ご利用いただきありがとうございます。 提言型ニュースサイト「BLOGOS」は、 2022年5月31日をもちまして、 サービスの提供を終了いたしました。 一部のオリジナル記事につきましては、 livedoorニュース内の 「BLOGOSの記事一覧」からご覧いただけます。 長らくご利用いただき、ありがとうございました。 サービス終了に関するお問い合わせは、 下記までお願いいたします。 お問い合わせ

    BLOGOS サービス終了のお知らせ
  • 簡単のため(For simplicity)つぶやきまとめ

    「簡単のため」という表現("For simplicity"の英訳)のニュアンスや使用例に関するつぶやき ◆参考(きっかけとなったツイートまとめ) (1)甲状腺被ばく量の直接測定(喉元に線量計)は何をやっているのか http://togetter.com/li/770986 (2)“簡単のため” for simplicityをめぐって http://togetter.com/li/771717

    簡単のため(For simplicity)つぶやきまとめ
  • 「了解」は失礼か? - アスペ日記

    最近、「了解」は失礼だという説が出てきているようです。 どこの誰が言い出したのか知りませんが、ごく最近であることは確かです。 少し前のマナーには、そんなことは書いてありません。 たとえば、2003年のこれだけは知っておきたい! 改訂版 ビジネス・マナーハンドブックには、次のようにあります。 しかしそうしたルールができていない社外の人からのメールを受信したときには、「メール、受けとりました」「その件、了解しました」など、簡単でよいからすぐに返信し、… また、2005年の「こんなことも知らないの? 大人のマナー常識513」というマナーには、次のような記述があります。 内容に疑問のあるときにはその点を記して送信しますが、そうでなければ「メール拝見しました。○○の件は了解しました」などと簡単な返信でかまいません。 しかし、2008年の「信頼される社会人へのパスポート敬語検定」*1には、次のよう

    「了解」は失礼か? - アスペ日記
  • PPDB:Japanese - 日本語言い換えデータベース

    The Paraphrase Database : Japaneseは日英対訳コーパスから学習された日語の言い換えデータ集です。 ダウンロード 最新版:PPDB:Japanese 0.0.1 仕様情報 一行につき一つの言い換えを示す。 SOURCE:j ||| TARGET:j' ||| (FEATURE=VALUE)* ||| ALIGNMENT フレーズは形態素ごとに半角スペースで区切られ、また言い換え確率もそれぞれP(j'|j)とP(j|j')が半角スペース区切りで与えられます。 翻訳 さ れ た ||| 翻訳 ||| 0.0125435775455 0.00034585476357 ||| 37435 2 56 論文情報 以下の情報をご利用ください。 水上 雅博,Graham Neubig,Sakriani Sakti,戸田 智基,中村 哲. 日語言い換えデータベースの構築と

  • FONTFREE

    フォントフリーについて FONT FREE(フォントフリー)は、無料で使える日語フリーフォント投稿サイトです。 漢字やカタカナ、ひらがなをはじめとした日語の無料フォントを、明朝やゴシック、手書きなどのカテゴリーから探すことができます。紹介ページリンクからダウンロードもすぐにできます。 あなたの欲しかったフォントが、すぐに見つかりますように。

    FONTFREE
  • Island Life - 過去形

    About 南の島のプログラマ。 たまに役者。 Practical Schemeの主。 WiLiKi:Shiro 最近のエントリ 無限cxr高校受験Defense振り返ってみると2019年は色々学んで楽...覚えるより忘れる方が難しい(こともある)眼鏡のつると3DプリンタIris Klein Acting ClassSAG-AFTRA conservatory: Voice Acting創作活動って自分を晒け出さねばならないと...ループを使わずに1から100までMore... 最近のコメント shiro on 歳を取ると時間が速く過ぎるのは、新しいことに挑戦しないから? (2023/03/14)1357 on 歳を取ると時間が速く過ぎるのは、新しいことに挑戦しないから? (2023/03/01)ベアトリーチェ on ハイポハイポハイポのシューリンガン (2022/04/02)ベアトリーチ

    Island Life - 過去形
  • yebo blog: EPUB 3.0で日本語に対応

    2010/12/29 EPUB 3.0で日語に対応 マイコミによれば、国際電子出版フォーラム(IDPF)が、来年5月に完成予定の「EPUB 3.0」で日語の縦書き、句読点の禁則処理、ルビ表記などに対応するそうだ。他に、縦書き中国語、アラビア語やヘブライ語にも対応する。EPUB 3.0の策定状況はGoogle Code上のウェブサイトで見ることができる。策定作業はいくつかのサブグループに分かれて進められており、動画や音声などのリッチ・メディアへの対応、インタラクティブ性なども検討されている。サブグループ担当分野Annotations脚注、注釈、ルビ、正誤表、発音記号EGLS (Enhanced Global Language Support)世界の諸言語を扱えるようにする(縦書きはここ)MetadataEPUBに詳細なデータを指定できるようにするNavigationアクセシビリティの向

  • Craftworks Tech Blog » C::P::Session::State::URI で HTML::Entities に日本語をエスケープさせない方法

    Catalyst - Session管理とHTMLエンティティコード(数値文字実体参照) でも言及されているように、Catalyst::Plugin::Session::State::URI を使っていると、 <img alt="日語" /> などが、エスケープされてしまい、表示がおかしくなったりします。 これは、HTML::TokeParser::Simple::Token::Tag::Start が悪さをしているのですが、 HTML::TokeParse::Simple::Token::Tag::Start が呼んでいる HTML::Entities::encode_entities() の第二引数を設定できれば、この問題は回避できるのですが、HTML::TokeParser::Simple::Token::Tag::Start::rewrite_tag() を redefine し

  • 「敷居が高い」の誤用

    掲示板に戻る■ ■過去ログ倉庫めにゅーに戻る■ 「敷居が高い」の誤用 1 名前: 名無しさん 投稿日: 1999/11/21(日) 15:18 敷居が高いという言葉を誤用している人が多すぎる。 日人の半数以上の人は「レベルが高く自分には手が届かない」という 意味で使っているがこれは間違いだ。広辞苑には次のように書かれている。 しきいがたかい【敷居が高い】 不義理や不面目のため、訪問しにくくなる。 他の辞書でもこれと同じように説明されているだろう。 「訪問しにくくなる」とは、言葉を付け加えると 「一度は訪問した経験があるが、相手との仲が悪くなったりご無沙汰していて 訪問しづらい」という事である。ここで重要なのは「一度は経験がある」という 事であり、これが「敷居が高い」の最重要要素となる説明なのである。 これを踏まえた上で、下のリンク先をご覧になっていただきたい。「一度も経験がなく かつレ

  • 日本語の実力その2】日本語なしには成り立たない現代中国語 - Suzacu Late Show

    もっと評価されるべき日語の実力シリーズの第2回。今回は現代中国語が日起源の和製漢語なしには成り立たないというお話。やや硬い内容なので興味のある方はどうぞ。 漢字の特徴の一つとして高い造語能力があげられる。ところが歴史を見てみると漢字の造語能力を存分に活用した事例は意外に少ない。伝統的中国語(漢文)においては漢字一文字で一つの概念や事柄を表すのが普通で、二文字以上の熟語は実はそれほど多くない。そのため中国では思想活動の活発だった春秋戦国時代(紀元前770-前221年)と仏教用語を翻訳するときに二文字以上の新語を多く造りだした程度である。漢字の高い造語能力は近代に至るまでかなり低レベルでしか活用されてこなかった。 ベトナムや韓国はもっぱら中国式の漢文を忠実に受け入れてその枠の外に出ることはほとんどなかった。韓国独自の造語もあることはあるのだがその数は少ない。 日はまったくの例外である。漢

  • http://eclipsewiki.net/eclipse/index.php?%C6%FC%CB%DC%B8%EC%B2%BD

  • IPAフォントをインストール&他のフリーフォントと比較してみた - 2007-10-02 - もしもし、matsuuですが...

    IPAフォントがようやくダウンロードできるようになったので、早速インストール。他のフリーフォントと見た目を比較してみた。ソースはYahoo! Japan。環境はGentoo Linux + Firefox 2.0.0.6。 IPAフォント VLゴシックフォントファミリ さざなみフォント IPA P明朝 IPA Pゴシック VL Pゴシック さざなみ明朝 さざなみゴシック 個人的感想 やっぱり明朝が見やすいね。MS Pゴシックに慣れてるとどうしてもゴシック体を使いたくなるが、ここは是非IPA P明朝で。アンチエイリアシングが効くなら明朝体の方が見やすいですよ。 どうしてもゴシック体で行きたいのであれば、VLゴシックがオススメ。とくにひらがな、カタカナの見栄えのよさは素晴らしい。

    IPAフォントをインストール&他のフリーフォントと比較してみた - 2007-10-02 - もしもし、matsuuですが...
  • perl - Lingua::JA::Kana released! : 404 Blog Not Found

    2007年12月08日20:30 カテゴリLightweight Languages perl - Lingua::JA::Kana released! かなとローマ字をシンプルに相互変換するモジュールです。 dankogai's p5-lingua-ja-kana at master - GitHub @CPAN (as soon as PAUSED) 車輪の再発明ではあるのですが、どの車輪もちょっと不適当だったので。 私が欲しかったのは、お気軽にカナとローマ字の相互変換をするものだったのですが、Lingua::JA::Romajiは対象文字列がEUC-JPでないと駄目で古すぎで、KawaさんのLingua::JA::Romanize::*はちょっとヘビーウェイトすぎというわけで作りました。 ちょっと test suite が少なすぎるので、テスト募集中です。 Dan the Perl

    perl - Lingua::JA::Kana released! : 404 Blog Not Found
    nsyee
    nsyee 2008/01/22
    かなとローマ字を相互変換するモジュール
  • 1