タグ

ブックマーク / huixing.hatenadiary.org (9)

  • PARCの技術を使った自然言語検索 - huixingの日記

    googleに匹敵する検索エンジン構築を目的に、ゼロックスのパロアルト研究所がスタートアップ企業powersetに自然言語技術提供とパテントのライセンス給与を行う。この技術を使うと英語やフランス語でキーワード検索ではなく、自然言語での検索を可能にできるがまだまだ課題は多く一般公開化は今年年末になる。過去にGUIやイーサーネットなどの革新的技術を開発してきたPARCの30年にわたる研究の歴史をもつ自然言語検索技術に期待がかかるが、これまでの自然言語検索エンジンは限られた状況下においてしか成功しておらず、googleのMarissa Mayerも今後5年間は自然言語検索の実用化は難しいと言っている。 The start-up, Powerset, is licensing PARC's "natural language" technology ― the art of making comp

    PARCの技術を使った自然言語検索 - huixingの日記
  • unicodeの改訂 - huixingの日記

    unicodeの母体となったのはxeroxとappleの文字コード共通化グループが合流したもの。unicodeの改訂には、少数派言語の追加、キャラクタに関して新たな情報の取得によりプロパティ変更の必要が起きた場合と、セキュリティ改善によるものがある。セキュリティに関しては初期バージョンのutf-8においてフォワードスラッシュ記号を悪用してディレクトリ構造に不正侵入することなどがあった。 Unicode標準が生まれる母体となったのは、1980年中盤にXeroxで進められていた中国語と日語の文字コードの共通化を目指していたグループと、Appleで進められていた文字コードの完全共通化に関するグループという、2つの独立した活動であった。そして1988年、これら2つのグループが合流し、共同で作業を進めることを決定した。[...] あるキャラクタに関して以前には知られていなかった情報が新たに得られた

    unicodeの改訂 - huixingの日記
  • 中国語コミュニケーション能力テストC.TEST - huixingの日記

    中国語の運用能力を測る手段としてHSKがあるけれども、新しく日常のコミュニケーション能力を測るためのC.TESTが開始される。両者の違いを例えれば、HKSが英語のTOEFLにあたるのに対してC.TESTはTOEICにあたる。また、HSKは試験内容は非公開なのに対し、C.TESTは試験終了後にテスト問題の内容を全公開することになっている。日中国での受験無料のテストを経て好評だったことから、来月から中国と日で実施される予定。 目前,这项新的考试已经在日中国内地举行过几次免费考试,受到了较高的评价。而首次正式收费考试将在下个月在中国和日的多个城市同时进行。 "C.Test"与中国汉语水平考试(HSK)相比,更加偏向实用性,听力比重更大,能力级别跨度更大。而且,"C.Test"考试不同于HSK试题保密的原则,会在考试之后向社会公开全真试题。 http://news.bbc.co.uk/

    中国語コミュニケーション能力テストC.TEST - huixingの日記
  • 中国初の女性ロボット誕生 - huixingの日記

    中国科学院自動化研究所先進機器人研究中心の開発による中国初の女性ロボット。英語、四川方言を話すことが出来る。日のアクトロイドや韓国のエバー1に並ぶものか。 参考国内众多美女容貌、可以移动行走、能够讲英语、说笑话……昨天,由中国科学院自动化研究所先进机器人研究中心花费了一年的时间研制,我国首台具有国际一流语音交互水平和复杂动作及智能运动控制水平的“美女”机器人正式亮相。 http://www.chinanews.com.cn/other/news/2006/08-04/768715.shtml http://japanese.chosun.com/site/data/html_dir/2006/05/04/20060504000056.html

    中国初の女性ロボット誕生 - huixingの日記
  • 検索ポータルと中国語入力法 - huixingの日記

    検索ポータルが中国語入力法を開発するのが今後の流れになるのかどうか分からないが、捜狗が中国語入力法を開発した。入力法と検索は親和性がよいのでポータルの戦略に合致する。つまり検索エンジンによる統計結果から最もよく使われる単語がトップに来るようになり、最新のワード・バンクと入力法プログラムが自動的にアップデートされるようになる。google中国でのローカル化を進める上で中国語入力法をその戦略の一項目に加えているが、短期間で市場を固めるため自己開発でなく、拼音加加を買収する形になるかもしれないといわれている。いずれにせよ紫光拼音と拼音加加といったピンイン入力法がポータルが選択する入力法になる。 LinuxRen 写道 "搜狗推出了中文输入法的公测版,不论是使用起来还是设置界面根紫光拼音如出一辙,但是选词率好像非常高,几乎不用选词,非常棒的一款输入法。Google什么时候出自己的中文输入法?"

    検索ポータルと中国語入力法 - huixingの日記
  • アンチperlな自然言語アプローチを取ったゲーム言語inform 7 - huixingの日記

    アンチperlな自然言語アプローチを取ったゲーム言語inform 7。 It's been ten years since Graham Nelson released Inform 6. Now he's released Inform 7, and the changes are dramatic. From basing the programming language itself on English to using rules to define the behavior of the game world, Inform 7 has a different approach to interactive fiction authorship than any other language. In many respects, I7 is the anti-Perl. It'

    アンチperlな自然言語アプローチを取ったゲーム言語inform 7 - huixingの日記
  • 新しい広東語入力法Cantoinput - huixingの日記

    新しい広東語入力法Cantoinputは広東語を習っているソフト作者の不満から生まれた。広東語の入力法にはすでにいくつかあるものの、どれも中国語バージョンのwindowsが必要かbig5やGBなどユニコードでないコードを使っている。また倉頡入力法にしても学習には相当の時間と労力を要する。Cantoinputはユニコード・ベースでイェール方式かJyutping方式の2種類の広東語ローマ字法案と普通話ピンイン方式を使って、繁体字と簡体字両方を入力できる他、JAVAなのでプラットフォームを選ばず広東語文字を入力することが可能。 While there already exist excellent phonetic input methods based on Mandarin Pinyin pronunciation, there is a general lack of support fo

    新しい広東語入力法Cantoinput - huixingの日記
  • 中国による独立インターネットの萌芽 - huixingの日記

    中国独自の中国語によるドメインネームは政府との独占契約でベリサインの資も入っている国立シンガポール大学のI-DNSが実際の割り当てをする。中国の独自ドメインはインターネットの独立性を主張するとか統制を狙ったものではなくドメインネームの取引によるマーケットの活性化を狙ったものだとの意見もある。しかしIT専門家によれば中国のドメインネーム・システムによるサイトへのアクセス制限は深刻な脅威になる。アクセスしようとするとリダイレクトされて政府承認の検索エンジンに飛ばされる。中国ではほとんどのインターネット・サービス・プロバイダーは政府がコントロールしているので全く別個のルート・ドメインを立ち上げることができてしまう。いずれ中国のインターネットは最初の独立したインターネットになるだろう。 The new domains will be offered by the Chinese Governme

    中国による独立インターネットの萌芽 - huixingの日記
  • 中国のニューメディア電子雑誌 - huixingの日記

    中国で最大発行数の流行雑誌は中国版ELLEでも中国版VOGUEでも中国版マリー・クレールでもなく、毎期百万を越すダウンロード数を数える電子雑誌である愛美麗MEだ。中国のニューメディアである電子雑誌にはpoco、zcom、xplusなど数種類あってユーザーは専用リーダーをダウンロードしておけば、毎回新規雑誌が発行されるたびにp2pを通じダウンロードして無料で読めるほか、自分で雑誌をつくることもできる。専用リーダーは読者の指向をトラッキングしているので広告主にとってはターゲットを絞った広告を出すことができる。新数通の開発したxplusでは中国で最初のブログを中心の読み物にした博客雑誌を購読することもできる。 通过阅读器记录用户的阅读行为,分析确定用户的消费偏好和喜欢的广告特征,发行商可以进行有针对性的投放。夏鸿说:“这事实上是运用技术实现广告和内容的分离,打破传统杂志内容和广告必须捆绑在一起

    中国のニューメディア電子雑誌 - huixingの日記
  • 1