銀行口座や携帯電話の申込書、保険金の請求書――。ビッグデータ時代になっても手書きの文書は世の中にあふれる。文字のデータ化は膨大な作業。これを日本企業から請け負うのが大連などの中国人だ。1万人以上の作業者が日本人よりも速く正確に業務をこなす。日本企業の競争力を下支えする"進化する人海戦力"の現場を歩いた。日本語の申込書・請求書・診断書…カタカタカタ――。テニスコート16面分もあるフロアに500
![中国「人海入力」基地を見る 誤字率は0.01%以下 - 日本経済新聞](https://cdn-ak-scissors.b.st-hatena.com/image/square/991c32e28c547b1c4fb721e73c97d71b495e31bb/height=288;version=1;width=512/https%3A%2F%2Farticle-image-ix.nikkei.com%2Fhttps%253A%252F%252Fimgix-proxy.n8s.jp%252FDSXBZO7092528009052014000001-14.jpg%3Fixlib%3Djs-3.8.0%26auto%3Dformat%252Ccompress%26fit%3Dcrop%26bg%3DFFFFFF%26w%3D1200%26h%3D630%26s%3D515d77ab8cdb2e4deaed61cdef61974c)
中国教育部はこのほど、「2006年中国言語生活状況レポート」を発表した。同部によれば、インターネット上で使われる言葉は口語化の特徴が顕著に見られるという。 同レポートは、中国国家言語文字委員会副主任で教育部言語文字情報管理司長の李宇明氏が調査したもの。対象分野は、(ネット上の)ニュース、BBS、ブログの3種類。 李氏によると、インターネットにおける言葉は、一般メディアのそれに似ている。例えば、ネット言語の常用文字の3,500字中3,131字が現代漢語常用字表と一致しており、同7,000字中6,141字が現代漢語通用字表と一致していた。こうしたことから、ネット言語も一般メディアの用字と基本的には同じだということになる。 だが、ネット言語においては、一部の文字・単語の出現率が特に高いのが特徴だ。例えば、「爾」を含む高頻度ベスト10に、高爾夫(ゴルフ)、英特爾(インテル)、戴爾(デル)、などがあ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く