並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 16 件 / 16件

新着順 人気順

わかち書きの検索結果1 - 16 件 / 16件

  • 日本語におけるtext-wrapプロパティの運用

    CSSのtext-wrapプロパティを使うと、テキストの行の折り返し方法を変更できる。text-wrap: balanceを適用すると、適用しない場合と比べて次のように変化する。 CSS text-wrap: balance  |  CSS and UI  |  Chrome for Developers text-wrap: balanceが適用された下の例では、すべての行の長さが均等になるように制御されている。 しかし正確に言えば、すべての行の長さが必ずしもまったく同じになるわけではない。文字の適切な折り返し位置を考慮した上で、おおよそ同じくらいの長さになるように分配される、というのが正しい。その際、一つの英単語の途中で行が分割されるようなことは通常起こらない。これは、英語では単語の区切りに空白文字を挟んで記述されるが(わかち書き)、それが改行位置を決めるためのヒントとなるからである。

      日本語におけるtext-wrapプロパティの運用
    • 日本語の折り返しをJavaScriptで制御する - LIVESENSE ENGINEER BLOG

      インフラエンジニアの中野(etsxxx)です。今回はWebのフロントの話です。稚拙な部分はご容赦を。 はじめに 前提知識 解決案の候補 解決案1: 手でspanタグをつける 解決案2: サーバーサイドの処理 解決案3: クライアントサイドの処理 クライアントサイドで文節区切り 実装 結果と考察 さいごに はじめに 2020年12月、リブセンスにQ by Livesenseという広報ブログが誕生しました。このブログは明朝体と縦書きと長文にアイデンティティがあります。 Q by Livesenseはこういう見た目のブログです。 Q by Livesenseは縦書きということで、漢数字を使っていたり、写真やイラストを使わずに純粋な文体で記事を書いていたりと、書籍のような日本語らしさが求められるデザインとなっています。 縦書きはWebエンジニアにとっても珍しい実装ですが、読者にとっても慣れないUI

        日本語の折り返しをJavaScriptで制御する - LIVESENSE ENGINEER BLOG
      • JIS X 23761:2022(EPUBアクセシビリティ)が制定 | kzakza

        EPUBのアクセシビリティ要件をまとめたJIS X 23761:2022がISO/IEC 23761:2021に対応する規格として8月22日に制定されました。 日本産業規格(JIS)を制定・改正しました(2022年8月分) (METI/経済産業省) JIS X 23761:2022 EPUBアクセシビリティ― EPUB出版物の適合性及び発見可能性の要求事項 | 日本規格協会 JSA Group Webdesk JIS X 23761:2022は、 上のJSAサイトで購入できるほか、閲覧のみであれば、日本産業標準調査会(JISC)で可能です(なぜ日本規格協会のHPでは部分的にしか見られないのか・・)。 JIS X 23761は、2017年に策定されたIDPFのEPUB Accessibility 1.0 に由来しています。このEPUB Accessibility 1.0がベースとなり、国際規

        • 第602回 2020年になったのでテキストに半角スペースで暗号文を埋め込もう | gihyo.jp

          2020年が始まりました。「⁠2020」という数字列を見ると何か見えてきませんか。そう、半角スペースですね。そこで今回は2020年にちなんで、テキストファイルに半角スペースを用いて暗号文を埋め込む方法を紹介しましょう。 テキストファイルにメッセージを埋め込める「stegsnow」 半角スペースはASCIIコードで「0x20」となります[1]⁠。UTF-8な文化圏で生活している一般的なユーザーであれば、適当なファイルやストレージをバイナリダンプした際に、適度な間隔で「0x20」が登場するデータを見ることで「ここはなんか英文っぽいな」と判断することがよくあるでしょう[2]⁠。hdコマンドやhexdumpコマンドを使う場合はASCIIの印字可能な文字もセットでダンプするので、英文ぐらいなら一発でわかるのですが、そういうことができないケースもあるのです。 結果として「0x20」もしくはプレフィック

            第602回 2020年になったのでテキストに半角スペースで暗号文を埋め込もう | gihyo.jp
          • RustでwasmでWebWorkerでTypescriptな開発 - Qiita

            本記事はsudachiclone-rs開発の続編であり、Rustのコードをwasmにし、WebWorker内で状態を持ったまま使いつつ、Typescriptで開発する、ということをやる場合にハマりそうなところに悉くハマった気がするので、その備忘録です。 成果物 レポジトリ: Rustで開発したsudachiclone-rsをwasmにコンパイルし、WebWorker内で動くようにしたもののデモ。 デモページ: 上記をhostingしています。pipから辞書を取ってきてブラウザ上のみでわかち書きできるデモ。 使ったツール群 typescript-definition Rustのstructやfunctionからtypescriptのd.tsを生成してくれる優れもの。crates.ioにあるのもを使っていないのは今のRustでは動かないから。(詳しくはissue参照) wasm-bindgen

              RustでwasmでWebWorkerでTypescriptな開発 - Qiita
            • GolangでTrie木を車輪の再発明した話 - KAYAC engineers' blog

              こんにちは! Tech KAYAC Advent Calendar 2020 4日目を担当する荒賀(@ken39arg) です。 近況報告 毎年このアドベントカレンダーの場をかりて、趣味の長距離スポーツの結果を報告して承認欲求を満たしていたのですが、 昨年サブスリーを達成して今年はサブエガ1を目指していたフルマラソンの大会は中止となり、夏の趣味であるOWS2の大会も軒並み中止となってしまいました。 その代わりに今年は2018年に買って未クリアだったゼルダをプレイし、ハイラルの平和をなんとか今年中に取り戻せるように努力をしております。 Trie木が必要になった経緯 さて、アドベントカレンダーだからツリー → ツリーといえば我々の世界では木構造 → 木構造といえばトライ木ということではなく、 今年した仕事でTrie木を実装する機会があったので、その時の気づきを書いてみようかと思います。 今年ユ

                GolangでTrie木を車輪の再発明した話 - KAYAC engineers' blog
              • 名寄せの仕組み - astamuse Lab

                この記事は 自然言語処理 Advent Calendar 2020 の25日目の記事です。 こんにちは、rinoguchi です。今年の4月に こちらの記事 を書いて以来、半年ぶりの投稿になります。 当社では、特許・研究課題・論文など多くの知的財産データを保持しています。これらのデータを活用するには、データに含まれる同一組織・同一人物に対して同一IDを付与してデータをグルーピングすることが必要であり、この作業のことを名寄せと呼んでいます。 今回はこの名寄せの仕組みについて紹介したいと思います。 大まかな処理フロー 当社では名寄せ処理を、まずそれぞれのデータソース(例えば特許や論文など)の中で実行し、次に異なるデータソース間で実行することで、最終的に組織ID・人物IDに対して特許・研究課題・論文などを紐づけたデータを生成しています。 とはいえ、データソース内名寄せもデータソース間名寄せも仕組

                  名寄せの仕組み - astamuse Lab
                • マルコフ連鎖で自動文章生成をする【Pythonによる自然言語処理超入門】

                  ツリー形式で示すとこんな感じです。 マスク └── する └── なぜなら ├── マスク警察 │   ├── うるさい │   └── 防止 └── 花粉症 ├── うるさい └── 防止 さてここで! 「マスク する なぜなら 花粉症 うるさい」という文は、いかにもおかしな文章です。「花粉症」までは、まぁいいでしょう。しかし、「花粉症 うるさい」はもう錯乱していますよね、文学的です! これはなぜか。定義通りに過去の状態を全く考慮していないし、「花粉症」に連鎖するのは、「うるさい」、「防止」という単語から2分の1の確率だけで決まるからです。 作成手順概要 さぁ、簡単なイメージがつかめたところで、Python を使って実装していきます。マルコフ連鎖自体はmarkovify という専用ライブラリがあるので、それを使えば簡単にできてしまいます。しかし、今回はマルコフ連鎖の仕組みを体感をするため

                    マルコフ連鎖で自動文章生成をする【Pythonによる自然言語処理超入門】
                  • 文章にルビを振る

                    コピー&ペーストしたテキストに含まれた漢字に、学年を指定してルビをふったり、わかち書きできるページです。どうぞご利用ください。 特別支援教育ニーズのある小学校高学年、中学生、高校生向けに音声教材も製作・提供しています。 変換したい元の文章を以下のテキストエリアに入力して下さい ※1,300文字程度まで 何年生以上の漢字にルビを振りますか? 変換した文章(1) 漢字にかっこで読みがなを振った文章 コピー 変換した文章(2) 漢字をひらがなに置き換えた文章 この文章を分かち書きしたい場合はチェック コピーコピー 変換した文章(3) 漢字にルビを振った文章 ※Windows版Microsoft Wordに上記のルビつき文字をコピーして貼り付けると、そのままルビ付き文字列として貼り付けることができます。ただし、Office for MacのWordではルビがうまく認識されないようです(Word16

                    • Go Conference 2022 Spring Onlineにシルバースポンサーで協賛・2名登壇します - BASEプロダクトチームブログ

                      2022/4/23(土)にオンラインで開催されるGo Conference 2022 Spring Onlineにシルバースポンサーとして協賛し、2名のメンバーが登壇します。 Go Conferenceとは https://gocon.jp/2022spring/ Go Conference 2022 Spring Online Go Conferenceは一般社団法人Gophers Japanが主催し半年に1回行われるプログラミング言語Goに関するカンファレンスです。 前回に引き続き、オンライン開催です。 今回、弊社は前回に引き続きシルバースポンサーとして協賛します。 ※ The Go gopher was designed by Renee French. Illustrations by tottie. BASEとGo プロダクトの大半のサーバーサイドがPHPで実装されているBASE

                        Go Conference 2022 Spring Onlineにシルバースポンサーで協賛・2名登壇します - BASEプロダクトチームブログ
                      • 【超初心者向け】Pythonで顧客のアンケートデータを自然言語処理してみた|半蔵門と調布あたりで働く、編集者のおはなし

                        みなさんこんにちは!FOLIOアドベントカレンダーの8日目の記事です! 昨日は弊社の顧客基盤部でバックエンドエンジニアをされているmsawadyさんによる記事でした! 8日目の本記事は、FOLIO金融戦略部でコンテンツの編集&執筆をおこなっています設楽がお届けします。 この記事の目的・初心者向けに、Pythonを使ったデータ分析(自然言語処理)の初歩の初歩を伝える記事。 読者対象・Python初心者。データ分析初心者 ・アンケートとか顧客の声を分析してみたいと考えている人 私ですが、普段は弊社サービスを使って頂いているユーザー様向けに、投資や資産運用に関するいろいろな記事を執筆、編集しているという、データ分析とかプログラミングとは全然関係ない業務をおこなっています。 今回は、お客様から回答頂いているアンケートを使い、サービスがもっと良くなるためのヒントや、お客様がどういう点に困っていたり悩

                          【超初心者向け】Pythonで顧客のアンケートデータを自然言語処理してみた|半蔵門と調布あたりで働く、編集者のおはなし
                        • AWS Lambdaで簡単機械学習 = Lambdaコンテナ + serverless framework - Qiita

                          背景 Pythonでテキストからカテゴリを推定する関数をLambdaで作った際に、mecabの辞書ライブラリやpandas, numpyがでかすぎてデプロイできずに右往左往したのですが、serverless frameworkとLambdaコンテナのおかげで簡単にデプロイができたので、感動をお伝えするためにこの記事を書いていこうと思います。 やりたかったこと テキストがどのカテゴリに属するか、tf-idfとコサイン類似度を使って算出するというのが、今回やりたいことになります。 テキストは、S3のPUTされ、PUTイベントをトリガーに関数を走らせるようなイメージです。 以下はカテゴリ推定方法です。 テキストをmecabを使ってわかち書き わかち書きされたテキストをtf-idfでベクトル化 ベクタライザはカテゴリに含まれる単語のリスト化したものをつ使って事前計算したものを使う tf-idfベク

                            AWS Lambdaで簡単機械学習 = Lambdaコンテナ + serverless framework - Qiita
                          • 区切り文字 - Wikipedia

                            この項目では、コンピュータにおける区切り文字について説明しています。人間の言語の文字の区切り文字については「わかち書き」をご覧ください。 CSVフォーマットのテキストファイルの一部の抜粋。赤色で示したコンマがフィールド区切り文字として使用されている。 区切り文字(英語: delimiter、デリミタ)は、コンピュータ言語やデータ通信において独立した領域の境界を特定するために入れられる文字である[1]。例えば、コンマ区切りの文字列において、コンマ (,) は各フィールドの境界を表す「フィールド区切り文字」の役割をしている。 区切り文字は、データストリームで境界を指定する方法の1つである。別の方法として、各フィールドの先頭にフィールド長を記述する方法もある[2]。 概要[ソースを編集] 区切り文字は以下の2種類に分けられる。 フィールド区切り文字・レコード区切り文字(例: コンマや改行) 範囲

                              区切り文字 - Wikipedia
                            • ストックマークが公開した言語モデルの一覧と振り返り

                              こんにちは、Machine Learning部門の森長と申します。 Machine Learning部門は、プロダクト適用を目指した基礎研究&基礎研究のプロダクト適用の二軸を担当しています。基礎研究では、言語モデルの作成、文章のカテゴリ分類・クラスタリング、要約の検証等、プロダクトへの適用を見据えて研究テーマを設定しています。また、自然言語処理の盛り上がりに少しでも貢献できればと考え、言語モデルの公開を行っていますので、もしよろしければ使ってみてください。 今回は、弊社で公開している言語モデルについて書いていきます。 言語モデルとは言語モデルにも色々な種類のモデルがあり、一口でこれというのは難しいですが、簡単に言うとすると、「単語列に対して確率を計算するモデル」です。 厳密には各言語モデルで目的が違うため、呼称が少しずつ異なりますが、本投稿では言語モデルという表現で統一させていただきます。

                                ストックマークが公開した言語モデルの一覧と振り返り
                              • 梅棹式表記でのかきかたをかんがえる | Shiki’s weblog

                                2017/12/04 かかれる文章がよみやすいといわれる梅棹忠夫さん(1920-2010)。谷沢永一さんは、「二十一世紀における日本語の文章は、梅棹忠夫を見習う努力から始めなければならない。」としるされているそうだ(『梅棹忠夫の文章はなぜ明快なのか』)。 梅棹さんの文章はひらがなのわりあいがおおい。その表記法は「梅棹式」とよばれることがある。梅棹式表記の基本的なルールはふたつ(「漢字はやめたい」, 『日本語の将来』, p249; 「わたしの文章作法(さくほう)」, 『梅棹忠夫著作集 第11巻』, p309): 1) 漢語は漢字でかく。常用漢字を意識して、むずかしい漢字はさける。2) 和語はかなでかく。体言(名詞や代名詞)と、1音の動詞で意味が判別しにくいもの(例:切る、着る)は漢字の使用も許容する。 これにくわえて、 3) 副詞や形容動詞はもともとが漢語でもかなでかく。 ということもルール

                                • 【2023年11月更新】学生さん向け:ゲームUIデザイナー用語集【204語】 - ゲームアプリのUIデザイン

                                  (最終更新:2024/1/17) こんにちは、ちょこです。 このページでは、ゲームUIデザイナーを目指す学生さんが知っておいた方が良さそうな用語をまとめています。紹介する用語の基準としては、比較的初学者向けの書籍に登場する言葉を中心にしています。参考にした書籍についてはAmazonのリンクも併記しておくので、より詳しく知りたい方は読んでみても良いかもしれません。 言葉を知ることで人に伝えやすくなったり、検索しやすくなるため、覚えておいて損は無いかと思います。 感覚的ですが、ゲームUIデザイナーに必要な要素は以下の3つの要素を掛け算している印象なので、その項目ごとにまとめています。 【グラフィックデザイナー】×【UIデザイナー】×【ゲーム業界】 グラフィックデザイン 基礎…1語 1:デザイン4大原則 グラフィック…5語 1:あ…アイコン 2:い…インフォグラフィック 3:さ…サムネイル 4:

                                    【2023年11月更新】学生さん向け:ゲームUIデザイナー用語集【204語】 - ゲームアプリのUIデザイン
                                  1