タグ

日本語に関するshirotorabyakkoのブックマーク (10)

  • Other things to be careful of

    A static site to link people to when their code is displaying Japanese wrong. View the Project on GitHub heistak/your-code-displays-japanese-wrong Other things to be careful of Line breaking rules Line breaking, or word-wrapping, in Japanese contain a few new rules as well. Web browsers and TextMesh Pro both have correct JP line breaking rules built in, but if you are rolling your own text display

  • Your code displays Japanese wrong

    A static site to link people to when their code is displaying Japanese wrong. View the Project on GitHub heistak/your-code-displays-japanese-wrong Why am I here? If someone gave you a link to this page, that person probably thinks your code displays Japanese wrong. In short, from a native Japanese eye, yѳur ҭєxҭ lѳѳκs κιnd ѳf lικє ҭЋιs. This page will give you a brief description of the glyph appe

  • 高性能・高速・軽量な日本語言語モデル LINE DistilBERTを公開しました

    LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog こんにちは。LINEの小林滉河(@kajyuuen)です。NLPチームで固有表現抽出、有害表現の検知、LINEスタンプ推薦の改善など自然言語処理に関する仕事をしています。 この記事ではLINEが公開した言語モデル「LINE DistilBERT」について紹介します。 https://huggingface.co/line-corporation/line-distilbert-base-japanese https://github.com/line/LINE-DistilBERT-Japanese LINE DistilBERTは次のような特徴を持つ日語言語モデルです。 高性能・高速・軽量 Hugging Faceのtra

    高性能・高速・軽量な日本語言語モデル LINE DistilBERTを公開しました
  • 日本語組版処理の要件(日本語版)

    1.1 この文書の目的 すべての文化集団は,独自の言語,文字,書記システムを持つ.それゆえ,個々の書記システムをサイバースペースに移転することは,文化的資産の継承という意味で,情報通信技術にとって非常に重要な責務といえよう. この責務を実現するための基礎的な作業として,この文書では,日語という書記システムにおける組版上の問題点をまとめた.具体的な解決策を提示することではなく,要望事項の説明をすることにした.それは,実装レベルの問題を考える前提条件をまず明確にすることが重要であると考えたからである. 1.2 この文書の作成方法 この文書の作成は,W3C Japanese Layout Task Forceが行った.このタスクフォースは,次のようなメンバーで構成され,ユーザーコミュニティーからの要望と専門家による解決策を調和させるために様々な議論を行ってきた. 日語組版の専門家(“JIS

  • HOKYPOKY. | MULTICOL. jQuery Plugin

    MULTICOL. はHTMLで雑誌のような美しい段組みレイアウトを実現するだけのシンプルなjQueryプラグインです。 もちろん、日製のプラグインなので日語もきれいに段組みにします。 一 或春の日暮です。 唐の西の門の下に、ぼんやり空を仰いでいる、一人の若者がありました。 若者は名を杜子春といって、元は金持の息子でしたが、今は財産を費な身分になっているのです。 何しろその頃洛陽といえば、天下に並ぶもののない、繁昌は、まるで画のような美しさです。 しかし杜子春は相変らず、門の壁に身を凭かと思う程、かすかに白く浮んでいるのです。 「日は暮れるし、腹は減るし、その上もうどこへ行っても、泊めてくれる所はなさそうだし——こんな思いをして生きている位なら、一そ川へでも身を投げて、死んでしまった方がましかも知れない」 杜子春はひとりさっきから、こんな取りとめもないことを思いめぐらしてい

  • 『Sigilで作成した日本語ePUBコンテンツの文字化けを修正する方法』

    ブックデザインの感想の記事を書く前に電子書籍の記事を書くことになってしまいました。 SigilというオープンソースのePUBコンテンツのオーサリングツールが公開されました。 Sigilで日語ePUBコンテンツを作ることができます。 ただし、そのコンテンツをePUBコンテンツ閲覧プレーヤのAdobe Digital Editionsで表示させてみると・・・ Greeking japanese in ePUB made by Sigil 画像の通り、文字化けをしてしまい日語を読めません。; Adobe Digital Editions(ADE)は代表的なePUBコンテンツ閲覧アプリケーションです。 そのADEで文字化けしてしまうとなると、困りますね。 修正方法を少し調べてみました。 文字化けせずに日語を読めるようにする方法が分かりましたので、紹介します。 まずは言葉で簡単に手順を説明しま

    『Sigilで作成した日本語ePUBコンテンツの文字化けを修正する方法』
  • EPUB仕様の日本語組版拡張を目指して(Version 0.8)

    EPUB仕様の日語組版拡張を目指して(Version 0.8) 2010年6月1日 日電子出版協会(JEPA) EPUB研究会 村上 真雄(アンテナハウス)@MurakamiShinyu、村田 真(国際大学)@MurataMakoto この文書は、EPUB 仕様を日語組版に対応するように拡張することを目指して、その試案として書かれたものであり、なんら正式なものではありません。 1. 標準化戦略 日から提出したMinimal Requirements on EPUB for Japanese Text Layoutは、すでにIDPFおよび関係各国によく知られている。2010年いっぱいに作成するEPUB2.1においてアジア組版に対応することは、すでにIDPFの方針になっている。憲章に含まれているだけではなく、IDPF関係者がそう発言していることが報道されている。 今後はIDPF EPU

  • jQuery 日本語リファレンス

    jQueryとは、JavaScriptのコーディングを強力に支援するライブラリです。 $('.semooh a').hover( function(){ $(this).text('ヌ?'); }, function(){ $(this).text('ヌー'); } );

  • 「ういまご・はつまご」、正しい読みに決着 - @IT

    2007/07/02 「初孫」の読みは、「ハツマゴ」か「ウイマゴ」か。 読者にはハツマゴ派が多いかもしれないが、少しコトバにうるさい人なら、「それは新しい読みで誤読。正しくはウイマゴ」というだろう。日語能力の低下、コトバの乱れを指摘して、ため息をつくかもしれない。 しかし、実はハツマゴが「近頃の若者」の誤読だなどという事実はない。明治初期の三代目三遊亭円遊の落語、「三年目の幽霊」には「早く初孫(ハツマゴ)の貌(かほ)でも見たいと夫(それ)を楽しみに私は思って居るんです」との用例が見られる。 初孫をウイマゴと読む例は、17世紀の仮名草子にまでさかのぼる。では、より古いウイマゴの読みが正統かというと、もう少し話は複雑だ。平安時代の古典、栄花物語には「ハツムマゴ」の読みが見られ、むしろ「初」をハツと読むほうが古いからだ。 つまり、あえて決着を付けるとすれば、初孫はウイマゴ、ハツマゴのどちらの読

    shirotorabyakko
    shirotorabyakko 2007/07/03
    国内最大の日本語辞典がオンライン版を公開。小学館が長年作り育ててきた日本語辞典「日本国語大辞典 第二版」、通称「日国」(にっこく)のオンライン版サービスhttp://nikkoku.japanknowledge.com/
  • ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開ニュース - CNET Japan

    ヤフーは6月18日、開発者向けサイト「Yahoo!デベロッパーネットワーク」において、日語の文章を解析できるAPI「日形態素解析Webサービス」を公開した。 日形態素解析Webサービスは、ヤフーの日語処理技術部がYahoo! JAPAN研究所と共同で開発を進めてきた形態素解析エンジン「Web MA」を社外の開発者向けにAPIとして公開するもの。このエンジンは、ヤフーのブログ検索や商品検索などのテキスト処理、ブログ検索の「評判検索機能」、「まとめ検索機能」などのテキストマイニング処理にも利用されている。 このAPIを利用することで、開発者は解析対象となる日語の文章を形態素に分割し、品詞や読み、基形を取得できるほか、対象となる文章に多く含まれている単語、その文章を構成する特徴的な単語などを把握することが可能だ。 また、すでに公開済みのAPIから取得したデータを解析することもでき

    ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開ニュース - CNET Japan
    shirotorabyakko
    shirotorabyakko 2007/06/19
    ヤフーのブログ検索や商品検索などのテキスト処理、ブログ検索の「評判検索機能」、「まとめ検索機能」などのテキストマイニング処理にも利用。Yahoo! がWeb文章をどのように解析しているかSEOに使える。
  • 1