こんにちは、東京大学の三輪敬太です。 私は2024年度に未踏IT人材発掘・育成事業として「ニューラル言語モデルによる個人最適な日本語入力システムの開発」というテーマで採択され、早稲田大学の高橋直希さんとともにmacOS上の日本語入力システムを作りました。今回はこの中でも中心的な開発テーマの1つであった「ニューラルかな漢字変換システム」の開発と、その成果について紹介します。 かな漢字変換とは? 日本語は通常、漢字やひらがな、カタカナ、数字、アルファベットなど、何千種類もの文字を使い分けて表記されます。これをわずか高々100個強のキーしかないキーボードで入力するために重要になるのが、日本語入力システムによる支援です。 多くの皆さんが使っている日本語入力システムでは、ローマ字を介してひらがなを入力し、それを変換して漢字かな交じり文とします。このひらがなによる入力から漢字かな交じり文を作る部分で行
先日Twitterで「大学生がスマートフォンでレポートを書いている」というツイートが話題になっており、それに対して反応している方達もほぼ全員が「スマートフォンでレポートを書くのは効率が悪い」という前提で話をしていることに大変違和感を覚えました。 なぜなら私はこのブログはもちろん、技術書を執筆するときでさえ主にスマートフォンで下書きをしているからです。 PCを使うのは、ほぼスクリーンショットの撮影と最後の仕上げだけです。 その方が、最初からPCで文字入力するのに比べて圧倒的に効率が良いです。 この記事では、iPhoneとAndroidそれぞれで音声入力を効率よくおこなう方法について解説します。 iPhone・iPadの場合 先に結論から申し上げると、iPhone・iPad・Macの日本語音声入力は、AndroidのGoogle音声入力に比べて認識精度が低く、認識できる単語が少ないです。 仕事
Intro OpenAI の API を用いて、長年の課題だった文書校正を VSCode 上で実現するプラグインを修作したところ、思った以上の成果だった。 文章校正と誤字脱字検出 執筆を補助するツールは多々開発されているが、基本は形態素解析を用いた品詞分析の延長で行うものが多かった。 よくある「助詞の連続」、「漢字の開き閉じ」、「一文の長さ」などは、ある程度の精度で検出可能ではあるが、結局執筆時に一番検出して欲しいのは「誤字脱字」だ。 文体をどんなに揃えたところで、誤字脱字があるとやはりクオリティが低く感じるし、そこさえ抑えられていれば、他のスタイル統一は訓練である程度なんとかなる。 英語のスペルチェックはかなり進んでいるが、日本語においてはそこまで革新的なものが見当たらない。あらゆるツールを試したが、結局満足のいく精度が出る誤字脱字検出は「Word の校正機能」しかなかった。 そこで筆者
序 2023-01-12にLinux界隈に激震が走ったらしい。 Linux環境(Unix環境を含む)の日本語入力を支えていた、Mozcdic-UTプロジェクトが終了したからだ。 まず、前提として私の立場を明確にしよう。 私は2017年から、従来のMozc-UTに代わる新しい(ライセンス上の懸念のない)Mozc辞書として誕生したMozc-NEologd-UTのFcitxバインディング、fcitx-mozc-neologd-utのAURパッケージをメンテナンスしてきた。 その後新生Mozc-UTが誕生してからはfcitx-mozc-ut-unifiedとfcitx-mozc-ut-unified-fullというふたつのパッケージを加え、計3つパッケージをメンテナンスしてきた。 その後、mozcdic-ut自体がfcitx4をサポートしなくなったこと、fcitx5は既にメンテナーがいたことから私
デイリーポータルZのライター、関係者が愛読している本を語ります。 今回はライターの唐沢さん。レコメンドは「日本語大博物館: 悪魔の文字と闘った人々」(ジャストシステム) 聞き手は安藤、佐伯、石川です。 では唐沢さん、お願いします。 なんでローマ字打たなあかんねん 唐沢:パソコンのキーボードで文字を打つ時って、まずローマ字を入力して、それをひらがなにして、さらに漢字に直すじゃないですか。ある日、「なんでローマ字打たなあかんねん」ってめっちゃ腹立ったんですよ。 安藤:はいはい(笑) 唐沢:小さいころにタイピングゲームでかな入力を練習したんです。そしたら親から、「ローマ字入力しか使わへんで」って言われて、あとでローマ字入力を覚え直して。 みんなやってるから覚えましたけど、よくよく考えたら「最初っからかな入力して、漢字に変換するほうが早くない?」と思って。 石川:たしかに。 唐沢:それに腹が立って
最近またLinux用の日本語IMEを作っている 本件は mozc の ut がどうこうとかは関係なくて、ふと linux desktop を使おうと昨年末に思いまして、昨年末からちまちまやってます https://github.com/tokuhirom/akaza かな漢字変換って作るの難しいのかなぁ、と思ったので作ってみている。これはまさに Just for Fun でやっている。 わりと普通に自分で常用してる分には困らないかな、というところまできている。 以下は、思ってることの垂れ流しという感じで、まとまってないですが。 「日本語入力を支える技術」という本が 2018年に出ていて、この本の内容を読めば、だいたいエンジン部分は実装できる。Amazon のレビューではこの本よんでも実装できないって書いてあるけど、変換エンジン自体は実装できます。 UI が辛い。けど。 エンジンは、ビタビア
2年半近く趣味として個人開発してきたiOS・iPadOS向けの日本語キーボードアプリ「azooKey」をオープンソース化しました。ライセンスはMIT Licenseです。 azooKeyは2年前からApp Storeで無料で公開し、開発を続けてきました。日本語対応のiOS向けキーボードアプリには、Simeji、Flickなど多くの先輩がいますが、標準キーボード志向で高機能なOSSとしては初めてのものではないかと思います。 技術的な特徴 azooKeyの技術的特徴としては、変換エンジンの独自実装、ライブ変換のサポート、独自に調整した辞書、強力なカスタマイズ機能などがあります。 IME開発の特色は幅広い技術的課題を扱えることにあります。競プロ的なアルゴリズムとデータ構造の問題もあればNLP的な話やGUIのデザインの問題もあり、めっちゃ楽しいです。 なお、azooKeyは全てSwiftで実装され
初稿: 2023-01-14 最近 Linux の日本語入力に関心をもたれた方が多く、そしてとてもうれしいことに、日本語入力ソフトウェアのひとつである Mozc を応援したいと考えてくださっている方もいらっしゃるようです。どうもありがとうございます。 でも、どういうふうに Mozc を応援すればよいかなと考えてくださっている方向けにいくつかの気軽に始められる方法を書きました。参考にしていただければと思います。 全部をする必要はありませんし、応援していただくことを検討していただいただけでもうれしいです。 GitHub にスターをつける なにから始めようかなと思われている方は、まずは GitHub を開いて、スターをつけてみるところからはじめられてはいかがでしょうか? https://github.com/google/mozc GitHub のプロジェクトを watch する GitHub
こんにちは。iOSの日本語入力アプリである「azooKey」を開発しているMiwaです。 azooKeyは最近macOS版の開発が進んでいます。このazooKey on macOSに、完全にローカルで動作するニューラルかな漢字変換エンジンである「Zenzai」を開発し、搭載します。この記事ではZenzaiの技術を解説します。 Zenzaiを搭載したazooKey on macOSは現在アルファ版としてリリースしています。macOSをご利用の方はぜひ入れて試してみてください! Zenzaiの概要 日本語入力に欠かせないかな漢字変換ですが、その歴史は長く、50年にも及びます。この間様々なアルゴリズムが提案され利用されてきましたが、近年の技術開発はやや落ち着きつつあります。オープンソースのかな漢字変換ソフトウェアで今でも広く利用されているものは数えるほどしかありません。 クローズドソースのシステ
富士通は5月19日、同社の親指シフトキーボードや関連商品の販売を終了すると発表した。1980年5月に発表した、親指シフトキーボード搭載日本語ワードプロセッサ「OASYS100」以来、40年の歴史に幕を閉じる。 販売・サポートが終わるのは、親指シフトキーボード2製品(FMV-KB613、FMV-KB232)と親指シフトキーボード搭載の企業向けノートPC1製品(FMCKBD09H)、親指シフト入力に対応したソフトウェア2製品(ワープロソフト「OASYS V10.0」とIME「Japanist 10」)。 ノートPCは21年3月、キーボードは21年5月に販売を終える。ソフトウェアは個人向けには20年9月まで、法人向けには21年5月まで販売する。ハードウェアのサポートは26年4~6月まで(ノートPCのみ4月まで、他は6月まで)で、ソフトウェアはOASYS V10.0の個人向けが23年9月、法人向け
序 この記事は本当は新年一発目に出そうかと思っていたのだけど、うまくいかなかった、という結果になったことからお蔵入りになりかけたものだ。 また、 この記事の前半部分ではMozcの状況について少し古い記述になっているが、後半につながる部分であること、この記事のもともとの部分は少し古いことを鑑みてご容赦いただけると幸いである Linuxと日本語変換 多くの人は意識していないかもしれないが、実はLinuxの日本語入力環境というのはかなり危うい。 多くの人はMozcを使っているだろうが、Mozcはかなり昔にその更新が止まってしまっている。 既にビルドも危うくなってきているくらいで、mozc-utでは割と苦労している。 Anthyはもうはるか昔のものと言っていいくらいで(ただし、熱心な人たちによってメンテナンスされているから意外と使える)、いつ使えなくなってもおかしくない(むしろ今でも使えていること
筆者はこれまでWindowsの日本語入力システムとしてATOKを使っていました。 新たに購入したMacでもATOKが使えるのでそのまま使うこともできたのですが、ライブ変換が使えるmacOS標準の日本語入力システムも気になる存在です。 そこで1カ月以上macOS標準の日本語入力システムだけを使ってみましたので、ATOKとの違いを比較したいと思います。 ライブ変換が自慢のmacOS標準日本語入力システム、AIを活用したATOK macOS標準の日本語入力システムの特徴といえばライブ変換です。 スペースバーや変換キーを押さなくても自動的にひらがなが漢字に変換されるため、流れるような文章入力が可能になります。 このライブ変換、技術的にはどのメーカーでも実装できそうなものですが、Apple以外のメーカーが採用している例を見たことがありません。特許で権利が守られているのでしょうか。 対するATOKの特
初稿: 2022-10-10 2021 年 10 月以降の Mozc に対する主な変更をまとめました。ドキュメントやコミットログ、 Issues に書かれているものをまとめただけで新しい情報はありません。抜けているものがあれば後で追記します。 Mozc の問題の報告や機能の要望等は、GitHub の Issues や Discussions へお願いします。 前回: 2020 年以降の Mozc に対する主な変更 次回: 2022 年10月以降の Mozc に対する主な変更 統計情報 コミット数: 509 クローズした issue の数: 91 (Issues · google/mozc) マージしたプルリクエスト数: 2 (Pull requests · google/mozc) ビルド関連 GYP から Bazel への移行 GYP はメンテナンスモード。今後は非推奨に。 GYP での
日本で流通しているキーボードの大半は日本語キーボードだ。日本語を入力する場合、都合のよいキーボードなのだが、ショートカットキーの活用においては不満が残るレイアウトでもある。ショートカットキーの使い勝手を考えると、英語キーボードのほうが便利だ。ただし、日本語環境で英語キーボードを使う場合、最初に行わなければならない設定がある。そこで、本稿では日本語環境で英語キーボードを使う場合に必須の設定を紹介しよう。 英語キーボードを選ぶ 日本で流通しているキーボードのほとんどは日本語キーボードと言われる種類のものだ。日本語入力を行うことを目的としており、ほとんどのPCでは日本語キーボードが使われている。もっとも、日本語キーボードは記号の配置に規則性がなく、記号の入力においては扱いにくいところがある。 また、キーボードを使った操作効率の大幅引き上げの要はショートカットキーの活用にあるわけだが、日本語キーボ
かな漢字変換は、日本語入力の最も重要な機能です。日本語自然言語処理で最も広く実用されているプロダクトの1つでありながら、その進化は翻訳AIや対話AIの進化と比べて鈍足です。 そこで、ChatGPTとGPT-4にかな漢字変換をやらせてみてみました。 性能の評価のため、比較的長い一文を用意しました。 ようしょうきからてにすすいえいやきゅうしょうりんじけんぽうなどさまざまなすぽーつをけいけんしながらそだちしょうがっこうじだいはろさんぜるすきんこうにたいざいしておりごるふやてにすをならっていた 幼少期からテニス水泳野球少林寺拳法など様々なスポーツを経験しながら育ち小学校時代はロサンゼルス近郊に滞在しておりゴルフやテニスを習っていた 多くの日本語入力では、1、2箇所の間違いに収まる文章です。これのかな漢字変換をお願いして、どれくらいしっかりやってくれるか調べてみます。 ChatGPT まずはChat
Windows 10 May 2020 Update(バージョン2004)やOctober 2020 Update(バージョン20H2)の機能アップデートを適用して、Microsoftの日本語入力システム(Microsoft IME)に違和感を持った人もいるのではないだろうか。 これまで機能アップデートを適用しても、それまでに設定したキー設定([Ctrl]キーなどと組み合わせたショートカットキーの設定)などは引き継がれていた。ところが、May 2020 Updateでは、Microsoft IMEが変更されたことに伴い、キー設定がデフォルトのMicrosoft IMEに戻ってしまった上、キー設定のテンプレートが「Microsoft IME」と「ATOK」の2種類からしか選択できなくなってしまった。 IMEのキー設定は、日本語入力の使い勝手を大きく左右するものだけに、この仕様変更で戸惑う人も
Illustrator、Photoshop、InDesignをはじめとしたDTP関連の情報サイト。2005年にスタート。 MacのJISキーボードには、[英数]、[かな]キーがあり、これを押すことで日本語入力ON/OFFを切り換えます。 一方、Windowsではキーボード左上の[半角/全角]キーを押して切り換えますが、次のような課題が生じます。 現在、どのモードになっているのかを意識する必要がある 覚えておく チラっとでも確認する [変換]キー、[無変換]キーを使って日本語入力のオンオフを切り換えられるようにすると、はかどります。 なお、ひとつのキーを使って、2つの機能を使い分けることを「トグル」といいます。 設定手順 Windowsキーの場合、「半角/全角」キーを使って、トグルで切り換えるのでデフォルト。 タスクバーの「あ」から、[プロパティ]をクリック [詳細設定]ボタンをクリック [
ビジネスを強くする教養 斬新な思考、創造性はアートからやってくる!美術や音楽、ワイン、さらには哲学や宗教などを、その世界のプロ達が、最新のトピックスにからめて、わかりやすく解説します。 バックナンバー一覧 1980年代から90年代末まで、ワープロの入力システムとして一定のシェアを獲得し、特に作家、ライター、速記者といったライティングのプロに愛用されていたのが「親指シフト」の入力システムとキーボードである。21世紀の現在も、おそらく親指シフトから離れられないプロが数百人くらいいるだろう。しかし、超少数派であることは事実で、いつか絶滅すると思われていたが、ついに発売元の富士通が昨年5月、「2021年5月までに順次販売を終える」と発表した。その5月まで目前に迫った。(ダイヤモンド社論説委員 坪井賢一) 今年の5月までに順次販売を終える 「親指シフト・キーボード」 目前に迫ったとはいうものの、実は
まとめページを作ってなかった。 azooKey azooKey - 自由自在なキーボードアプリ 1.9.3 分類: ユーティリティ,仕事効率化 価格: 無料 (敬太 三輪) 今年の収穫はazooKeyの発見でした。ライブ変換できます。キーを打っていくだけで日本語入力。確定しなくていい。慣れてくるとこれが自然なのです。 設定 azooKeyのオススメ設定は以下の3点です。 「ライブ変換」をオンにする。 「入力中のテキストを保護」をオンにする。 「より強力な学習を有効化」をオンにする。 とくに「テキストを保護」にしないとWeb上での入力でチャタリングが起きる。AppleのWebViewに問題がありそうだけど、修正される気がしないので、設定で対応。 操作について スペースバー長押しでスライドカーソルが出てきます。このギミック、好みです。 あと、削除キーを左フリックすると一括削除になります。句読点
記事内に広告が含まれています。This article contains advertisements. 物書堂がmacOS 14 Sonomaをサポートした日本語入力プログラム「かわせみ4」をリリースしています。詳細は以下から。 macOS用の日本語ワープロソフト「egword Universal 2」やmacOS/iOS対応の辞書アプリを開発する物書堂は日本時間2023年11月14日、日本語入力システム(IME)「かわせみ」シリーズの最新バージョンとなる「かわせみ4」を新たにリリースしたと発表しています。 「かわせみ4」は、ユーザーからの要望が高かった変換候補を一覧できる「全候補」機能や、英語候補の制限、英語略字候補の生成などの新機能を搭載。また、ショートカットキーを覚えていなくても搭載されている機能にアクセス出来る「ショートカットメニュー」機能、文字入力時や文字パレットで使用出来る「
iOS/iPadOS 17では日本語の手書きキーボードが追加され、縦書きのテキスト認識表示もサポートされるそうです。詳細は以下から。 Appleは世界開発者会議(WWDC23)の基調講演の中で次期iPhone, iPad用OSが「iOS 17/iPadOS 17」を発表し、このiOS/iPadOS 17ではTransfermer言語モデルとオンデバイスの機械学習を利用し、これまで以上に単語の自動修正やインライン予想が正確になると発表しましたが、 AppleのKaran Miśraさんによると、iOS/iPadOS 17では、この他にも日本語キーボードに手書きキーボードが追加され、中国と日本語の縦書きテキストもテキスト認識できるようになるそうです。 Karanさんは、それ以外にも日本語や中国語環境で着信や連絡先UIで縦書きをサポートし、日本語を含む複数の言語で折り返しの機能を強化(禁則処理?
Experience & Devices 開発統括部の古川です。本日は開発チームが力を入れてきた日本語入力の改善についてご紹介いたします。 日本語 IME (Input Method Editor) の候補ウィンドウの刷新 50 音タッチ キーボード レイアウトの導入 [あ]/[A] キー (ImeOn/ImeOff キー) の導入 日本語 IME の候補ウィンドウの刷新 日本語 IME は日本語入力を支援するソフトウェアであり、候補ウィンドウと呼ばれる UI に入力に応じた文字列を提示します。2021 年 2 月 12 日(米国時間) Windows Insider Preview ビルド 21313 以降の Dev チャネルの PC を対象に、Fluent Design を取り入れた新しい候補ウィンドウが有効になりました。新しい候補ウィンドウでは以下の変更が追加されました。 モダン デ
azooKey - 自由自在なキーボードアプリ Takaaki Miwaユーティリティ無料 azooKeyアプリのデザインが洒落ています。アズキーだから小豆なんですね。アプリ作成者のブログより アイコンとロゴについては幸いGlyphs Miniというフォント作成ソフトを持っていたのでこれを使って作成し、アイコンフォントとして書き出したうえで利用しています。シンプルでかわいいアイコンができました。豆としての小豆をイメージして作ったのですが、どことなくニコニコしているように見えるところが気に入っています。 Swiftで日本語入力できるキーボードアプリを作った - Qiita 変換候補の文字を拡大する 書き方や読み方がよく分からない漢字を確認したり他の人に伝えるのに便利な機能に文字の拡大があります。 1.入力した文字の漢字変換候補を長押しします 2.「大きな文字で表示する」をタップします 3.確
本記事は Fcitx5 をすでにインストールできていることを前提にした記事です。 Fcitx5 の公式 Wiki から抄訳しているだけなので、英語が読める方はこんなサイトよりも本家↓をご覧ください。 Fcitx 5 Setup (https://fcitx-im.org/wiki/Setup_Fcitx_5) 前書き Ubuntu や Fedora など、ほとんどの日本語入力に対応しているメジャーな Linux ディストリビューションは Redhat が開発を主導している IBus をデフォルトの IMF (Input Method Framework)として採用しています。そして IME(Input Method Editor)は Google が開発している Mozc が主流で唯一改造なしで実用に耐えうる変換性能を持っています。 しかし Arch Linux においては公式リポジトリに
新配列って何?自作キーボードって何?という方はまずこちら https://youtu.be/Xdq6rDKU8g0 計測に使用したサイト https://o24.works/atc/ 0:00 イントロ 1:54 mato式 https://note.com/mato_kb/n/nf57efe5d6ca0 mato https://note.com/mato_kb/ 4:46 DHSBことのは配列 https://note.com/myomyomyo4256/n/nc3ec243aae19 https://note.com/myomyomyo4256/n/ne1a0223940f8 Svalboard Alpha https://note.com/myomyomyo4256/n/ne78090d0e7a9 myomyomyo https://twitter.com/harigane
ライブ変換というのはMacの日本語テキスト入力をするのに 「スペース」キーを押して変換しなくても各文節が自動的にかな漢字変換されていく機能のことを言います。 またiPadOS 13.4からはiPadの外付けキーボードでも使えるようになっています。最近ではキーボードアプリのazooKeyを使ってiPadやiPhoneのソフトウェアキーボードでもライブ変換が使えるようになっています。 ライブ変換は以前から変換が不自然だったり誤変換が多いとAppleユーザーに不評です。自分も評判を信じて今まで利用するのを避けてきました。しかし使ってみると変換も自然で入力していくだけで自動で変換されていく快適さに魅了されてライブ変換のファンになりました。これには私があまり長文を入力しない(1000文字程度)事や確定の頻度が多いことがあって誤変換も少なく再変換などの修正が必要ないからだと思われます。 azooKey
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く