[B! 日本語] masa_iwasakiのブックマーク

Stringiによる日本語と中国語のテキストの分かち書き

MecabやChasenなどのによる形態素解析が、日本語のテキストの分かち書きには不可欠だと多くの人が考えていますが、必ずしもそうではないようです。このことを知ったのは、quantedaのトークン化の関数を調べている時で、日本語のテキストをこの関数に渡してみると、単語が Mecabと同じように、きれいに単語に分かれたからです。 > txt_jp <- "政治とは社会に対して全体的な影響を及ぼし、社会で生きるひとりひとりの人の人生にも様々な影響を及ぼす複雑な領域である。" > quanteda::tokens(txt_jp) tokens from 1 document. Component 1 : [1] "政治" "と" "は" "社会" "に対して" "全体" "的" "な" [9] "影響" "を" "及" "ぼ" "し" "、" "社会" "で" [17] "生きる" "ひとりひと

masa_iwasaki 2020/06/01

リンク

Windows10を英語配列キーボードで使っている人向け日本語入力切り替えの変更方法｜システムエンジニアの技術LOG

LinuxMintを自宅内LANのサーバとして活用しようと考えて、奮闘中ですが、ちょっと脱線して、Windows10の日本語入力切替方法に関してです。現在、自宅の環境は、LinuxMint（自作デスクトップ）、Windows10（自作デスクトップ)、Mac（ノートPC）の三台のPC使っています。この三台をCPU切替器を使って、１セットのマウス、キーボードで使用しています。キーボードは、英語キーボードです。日本語キーボードではなく、英語キーボードなのは、最初に使ったキーボードが英語配列のキーボードだったためです。キーボードは英語配列ですが、入力する言語は主に日本語です。しかし、英語配列キーボードには、全角/半角キーは存在しないため、複数キーを組み合わせて全角/半角を切り替える必要があります。 LinuxMint、Windows10、Macのそれぞれの切り替え方は標準で下記のとおりで

masa_iwasaki 2019/08/13

英語キーボード利用時に Ctrl + Space でIME on/off 切り替えするための方法。MS-IMEのキーバインドを変えるだけなので副作用が少なめ。

リンク

どんな難しい計算や質問にも答えてくれる“WolframAlpha”、日本語版が公開／科学技術計算ソフト「Mathematica」の開発元、Wolfram Researchが運営するサービス

masa_iwasaki 2018/06/29

日本語

リンク

認識率98.66％？！たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた | Ledge.ai

記事ネタを集めていたところ、代官山で日本語の手書き認識ソフトウェアの開発に成功した外国人グループがいる。それもたった２か月で。という記事にあたりました。日本語の手書き文字のOCRを外国人が開発しているという驚き。気になりすぎたので、早速取材にいってみたところ、Reactive Inc.のデータサイエンティストのDavid MalkinさんとコアエンジニアのPhilip Irriさんにお話しを聞くことができたので、まとめてみました！非エンジニアにもわかるようにと噛み砕いて、システムの内容や今後の拡張計画ディープラーニングの可能性についてまでいろいろ話してくださいました。

masa_iwasaki 2017/02/06

リンク

日本語組版処理の要件（日本語版）

1.1 この文書の目的すべての文化集団は，独自の言語，文字，書記システムを持つ．それゆえ，個々の書記システムをサイバースペースに移転することは，文化的資産の継承という意味で，情報通信技術にとって非常に重要な責務といえよう．この責務を実現するための基礎的な作業として，この文書では，日本語という書記システムにおける組版上の問題点をまとめた．具体的な解決策を提示することではなく，要望事項の説明をすることにした．それは，実装レベルの問題を考える前提条件をまず明確にすることが重要であると考えたからである． 1.2 この文書の作成方法この文書の作成は，W3C Japanese Layout Task Forceが行った．このタスクフォースは，次のようなメンバーで構成され，ユーザーコミュニティーからの要望と専門家による解決策を調和させるために様々な議論を行ってきた．日本語組版の専門家（“JIS

masa_iwasaki 2015/01/15

リンク

はてなブックマーク

タグ

関連タグで絞り込む (5)

日本語に関するmasa_iwasakiのブックマーク (5)

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第3週）

今週のはてなブックマーク数ランキング（2025年4月第2週）

今週のはてなブックマーク数ランキング（2025年4月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス