サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
アメリカ大統領選
kotoba.nuee.nagoya-u.ac.jp
本システムは、既知の人名対訳データに基づいてカタカナ訳を推定しますが、その訳が必ずしも適切であるとは限りません。最終的な判断は、使用者である人間が行うことを前提としています。自己責任でご利用ください。 本システムを利用した結果、推定結果が得られない、もしくは得られた結果によって被ったとされるいかなる損失、損害についても、一切責任を負いません。
第3回応募作品『コンピュータが小説を書く日』と『私の仕事は』は、 書籍『コンピュータが小説を書く日-AI作家に「賞」は取れるか』に収録されました。 出版物で引用する場合、および、放送等で作品の一部を放映・朗読する場合の許諾依頼は、版元の日本経済新聞社の版権担当者に申し出てください。 (日経出版社の代表番号03-3270-0251から「日経出版社の版権担当者」にとお伝えいただければ、担当部署につながるとのことです。) 2019.04.03: 第3回星新一賞の応募作品、みかん愛の『私の仕事は』の英訳が 短編小説サイトNecessary Fiction に掲載されました。 2017.03.14: 第4回星新一賞への応募作品を公開しました。- ウェブページ 2017.03.14: 日本語テキスト生成ツールHaoriBricksのビデオを公開しました。 2017.03.10: 第5回星新一賞応募に向
2017.03.14: 言語処理学会第23回年次大会において、応募作品の作成方法を、制作者の松山諒平が発表しました。 2017.03.14: 作成方法を紹介するビデオをYouTubeに掲載しました。 2017.03.14: 応募作品はこちらです。5月発売の文春文庫にも掲載される予定です。 2016.09.30: 第4回星新一賞にコンピュータを用いて制作した作品を応募しました。 選択された人狼ゲームのログに基づいた小説を生成します 人狼ログ(1-100)を入力してから実行してください FILE No. GO ● プロローグ ● 本編はプロローグからの続きとなります 人狼ゲーム。それはプレイヤーが村人と人狼に分かれて行うゲーム。人狼は正体を隠して村人の中に紛れ込んでいる。プレイヤーは全員で昼間に会議をし、紛れている人狼を見つけ出して処刑する。夜になると人狼は本性を現し、ひっそりと村人を襲撃する
難易度スケール: B9 & T13 B9 <均衡コーパスに基づく9段階相対評価> 一般用 T13<13段階の学年区分> 教育用途用 チャートの表示: 表示する 表示しない 2016.07.18: ページを再開しました。 2012.09.14: システムを、obi-2からobi-3にバージョンアップしました。 2012.07.04: 難易度スケールB9を、「日本語書き言葉均衡コーパス」公開版に基づく新しい版(2012年版)に変更しました。 2008.08.22: 難易度スケールB9を追加しました。 2008.08.06: システムを、obi-1からobi-2にバージョンアップしました。
難易度スケール: T13<13段階の学年区分> B9<均衡コーパスに基づく9段階相対評価> チャートの表示: 表示する 表示しない
難易度の規準には、小中高大の教科書127冊から抽出した1478サンプル、約100万字のコーパス(教科書コーパス)を用いています。 プログラムは、まず、それぞれの難易度に対する尤度を、連続する2文字の生起確率(文字bigram)に基づいて計算します。 得られた尤度のうち、最大の尤度をとる難易度が、求める難易度となります。 実際の難易度の計算は、もう少し複雑です。 あるテキストに対して、文字の生起確率から計算された13個の尤度を難易度順にプロットしたのが、下のグラフの点線です。 理想的には、なめらかな曲線を描くはずですが、実際には、そうはなりません。 そこで、これら13個の値に対して、スムージングを適用します。 スムージングによって得られた結果を、青線(4次多項式)および赤線(2次多項式)で示しています。 スムージングを適用した結果に対しても、最大の尤度をとる難易度を求めます。 こうして、難易
まえがき 辞書の編纂作業を100%自動化することはできるでしょうか? ここで想定しているのは、人名、地名、組織名、製品名など固有名詞の辞書や特定の分野・領域で使われる専門用語の辞書です。我々は、このような辞書を人間が編纂するのには限界があると考え、編纂作業を自動化する技術の開発に取り組んできました。 このウェブページで公開する外国人名対訳辞書は、我々が開発した技術で100%自動編纂された辞書です。この辞書は、「紬クローラー」と名付けられたシステムが、 約5か月に渡ってウェブから収集した人名対訳集合を、クリーニングすることによって作成されています。 まだまだ改良すべきところは多々ありますが、既存の辞書を凌駕する収録数と十分に使用に耐える品質に達したと判断し、広く公開することにしました。 自動編纂された本辞書には、誤りが含まれています。本辞書の利用は、使用者の責任において行なって下さい。 本辞
ことば不思議箱 - 佐藤研究室 - (c) Satoshi Sato and his laboratory at Nagoya University, 2007-2009.
ここで、「複合辞」とは、「に対して」や「なければならない」のように、複数の語から構成され、かつ、全体として機能語のように働く表現のことです。 我々は、機能語と複合辞を総称して、「機能表現」と呼ぶことにします。 機能表現の数 日本語には、いったいどれくらいの機能表現があるのでしょうか? 実は、これに答を与えるためには、「何を同一とみなすか」ということを厳密に定義する必要があります。 たとえば、「に関する」と「にかんする」は同一表現でしょうか? これは、単に漢字表記とかな表記の違いですから、同一表現と考えるのが自然のように思えます。 では、「に関する」と「に関して」は同一表現でしょうか? 「Aに関する調査」と「Aに関して調査した」は、意味的に対応しますから、同一表現と考えたくなります。しかし一方で、前者は連体助詞相当(「Aの調査」)であるのに対し、後者は格助詞相当(「Aを調査した」)ですから、
難易度の規準には、小中高大の教科書127冊から抽出した1478サンプル、約100万字のコーパス(教科書コーパス)を用いています。 >>使用した教科書リストを見る(エクセルファイル) プログラムは、まず、それぞれの難易度に対する尤度を、文字の生起確率(文字のunigram)に基づいて計算します。 得られた尤度のうち、最大の尤度をとる難易度が、求める難易度となります。 実際の難易度の計算は、もう少し複雑です。 あるテキストに対して、文字の生起確率から計算された13個の尤度を難易度順にプロットしたのが、下のグラフの点線です。 理想的には、なめらかな曲線を描くはずですが、実際には、そうはなりません。 そこで、これら13個の値に対して、スムージングを適用します。 スムージングによって得られた結果を、青線(3次多項式)および赤線(2次多項式)で示しています。 スムージングを適用した結果に対しても、最大
最終更新:2017年11月29日 >>English 日本語テキストの難易度を測る 第1の箱 [2007.10.10/2016.7.18 updated] コンピュータが小説を書く日 第7の箱 [2016.03.23] 日本語FSD: 日本語辞書定義文型 第8の箱 [2016.07.22] 人狼知能能力測定テスト 第9の箱 [2017.03.14] 綴:外国人名のカタカナ表記推定 第10の箱 [2017.11.29] (c) Satoshi Sato, 2007-2017.
チャートの表示: 表示する 表示しない カタカナを考慮: カタカナを無視する カタカナを考慮する 貢献度の表示: 表示しない 文字単位 文字クラス単位 ことば不思議箱 - 佐藤研究室 - (c) Satoshi Sato and his laboratory at Nagoya University, 2007-2008.
このページを最初にブックマークしてみませんか?
『ことば不思議箱』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く