タグ

languageに関するmkawanoのブックマーク (12)

  • JUMAN++ - LANGUAGE MEDIA PROCESSING LAB

    形態素解析システム Juman++ † Juman++は言語モデルを利用した高性能な形態素解析システムです.言語モデルとして Recurrent Neural Network Language Model (RNNLM) を用いることにより,単語の並びの意味的な自然さを考慮した解析を行います.それにより JUMAN,MeCab に比べ大きく性能が向上しています.文法・辞書・出力フォーマット等は JUMAN から引き継いだものを利用しています.システムは CREST「知識に基づく構造的言語処理の確立と知識インフラの構築」の支援により開発されました. ↑ 使用方法 † たとえば,次のようなテキストを入力すると, % cat sample.txt 外国人参政権 私もあさって日曜最終日 以下の解析結果が得られます. % cat sample.txt | jumanpp 外国 がいこく 外国

  • 手書き漢字の多様性 詳しい解説書作成へ NHKニュース

    手書きした漢字の「とめ」や「はらい」など細かな点が、印刷された文字と違うという理由で戸籍などの窓口で認められずトラブルになるケースがあるとして、文化庁の審議会は、手書きの漢字の多様性を広く知ってもらおうと、詳しい解説書を作成する方針をまとめました。 例えば「令」という漢字は、印刷文字では書き順の最後の一筆が垂直におろされますが、手書きではカタカナの「マ」のように書くことがあり、どちらも間違いではありません。しかし、漢字の書き取りテストや戸籍などの行政窓口、それに金融機関の窓口で、印刷文字と違うという理由で認められずトラブルになるケースがあるということです。 文化庁の審議会は、こうした現状を受けて、手書きの漢字の多様性を広く知ってもらおうと、詳しい解説書を作成する方針をまとめました。パソコンや携帯電話の普及で印刷文字を中心とした生活になっているからこそ、手書きの文化を守るために、細かな点にこ

  • Microsoft Word - 大村_文体練習_.docx

    1 卒業研究 ( 文体練習 ) 日近代文学 柴田勝二ゼミ 外国語学部 南・西アジア課程 トルコ語専攻 8507260 大村真央 2 ( 文体練習 )目次 0 素 1 ひらがな 2 カタカナ 3 ローマ字 4 ギャル文字 5 2ちゃんねる 6 Twitter 7 100 字 8 なんか 9 え~ 10 英訳 11 重複 12 アメリカ人きどり 13 短歌 14 某 15 とても 16 星新一調 17 オノマトペ 18 誤変換 19 ~じゃないですか 20 レストランにて 21 はんたい 22 漢文風 23 和製英語 24 数値 25 漫才 26 あいうえお作文 27 田舎の母への手紙 28 なぜかよめてしまう 29 小学生の日記 30 類義語 31 別の視点からⅠ 32 別の視点からⅡ 33 別の視点からⅢ 34 別の視点からⅣ 35 客観 36 古文風 37 お嬢様 38 事情聴取 39

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • 古いプログラミング言語がなくならない理由 | readwrite.jp

    今日よく知られているプログラミングの多くは、古い言語として取り上げられるに十分な歴史を持っている。PHPは20年、Pythonで23年、HTMLは21年で、RubyJavaScriptは19年だ。Cなどは42年もの歴史がある。 誰もこの様な事になるとは思いもしなかっただろう。今でも出版されている、世界で最初のCの教の共著者であるコンピューターサイエンティスト、ブライアン・カーニハンですらだ(C自体は同じの共著者であるデニス・リッチーによるものだ。彼は2011年に亡くなっている)。 「編集者とこのを5000部売れたらなという話をしたのをなんとなく覚えている。もっといいものにも出来たが、学生が2014年になってもあのを使っているなど考えもしなかったことだ」と、カーニハンは最近のインタビューで答えてくれた。 Cがあまりに長く使われていることから、グーグルが今でもCを使って解決する問題を

    古いプログラミング言語がなくならない理由 | readwrite.jp
  • EC2014で「平均文字は美しい」という研究発表を行いました | 中村聡史研究室

    この研究は,まず下記の大きな仮説(今回は明らかに出来ていませんが,将来的に明らかにしたいと考えている仮説)から成り立っています. ひとは頭のなかに理想とする文字があるが,手が思い通りに動かず毎回ぶれているのではないか? 多くのひとが考える理想的な文字があるが,ひとはそれぞれそこからぶれているのではないか? つまり,ぶれているのであれば,回数を重ねて平均化すると美しくなるのではないか?というのが研究のスタートです. この研究では,下記の仮説を明らかにするため実験をしています. ユーザ平均文字はその人の理想的な文字であり,実際に書いた文字より綺麗だと評価される 多くの人の全体平均文字は,そのそれぞれの平均文字よりも綺麗だと評価される どの文字を綺麗と判断するかは人により異なる 平均文字を生成するため,稿ではスプライン補間とフーリエ級数展開を使っています.ざっくりとした平均文字生成の方法は下記

    EC2014で「平均文字は美しい」という研究発表を行いました | 中村聡史研究室
  • LINE乗っ取り犯の「整理日本語言.txt」に見る「母語の干渉」 - 違いのわかる日本語――日本語教師の日本語メモ

    LINEのアカウントを乗っ取り、その知人に金券カードを買わせるという詐欺行為が頻発している。その乗っ取り行為を行っている犯人は中国語圏出身者であるというが、その「台」が誤って送られてきたという記事があった。 まさかの誤爆!LINE乗っ取り犯が“台”を送信、その全文を公開 - 週アスPLUS その文字起こしをした方もいる。 週刊アスキーが報じたLINE乗っ取り台「整理日語言(1).txt」の文字起こしと分類をしてみた。 - piyolog 日語教師としては、この不自然な日語訳に、日々接している中国人留学生の誤用と共通するものを見る。(※もちろん、私の接している中国人留学生たちを犯人扱いする気は毛頭ないどころか、このような悪事とは無関係であると信ずる。たまたまLINE乗っ取り犯と彼らの母語が一致しただけのことであって、「これだから中国人は……」というような悪しき一般化を行ってはなら

    LINE乗っ取り犯の「整理日本語言.txt」に見る「母語の干渉」 - 違いのわかる日本語――日本語教師の日本語メモ
  • ビジュアルプログラミング言語「ビスケット」のカンファレンスが初開催

    プログラミング教育に関するカンファレンス「第1回ビスケットユーザーズカンファレンス」が筑波大学東京キャンパス文京校舎で2014年7月13日に開催された。ビジュアルプログラミング言語ビスケット(Viscuit)の普及を目的に、ビスケットを使った教育を実践しているプログラミング学習促進団体や教育関係者が登壇、活用事例などを発表した(写真1)。

    ビジュアルプログラミング言語「ビスケット」のカンファレンスが初開催
  • [iOS] 新言語SwiftがObjective-Cよりも良いところ - Qiita

    さきほどWWDCにて新言語 Swiftが発表されました。 The Swift Programming Language (iBooks Store) で言語ガイドが公開されていたのでザッと目を通してみました。 Objecitve-Cと比較してSwiftがイケてそうなところをパッと気になったところだけ書いていってみます。 変数/定数の型推論がある Objective-Cのように明示的に型を書かなくても型を推論してくれます。 推論で問題ないケースも多いと思うのでタイプ数がかなり減らせそうですね。 ( 変数を宣言する際はvar、定数を宣言する際はletで宣言します。 ) // 型推論 var name = "Shinji Ikari" // 変数の型は推論によりString型になる var age = 14 // 変数の型は推論によりInteger型になる let height = 141.5

    [iOS] 新言語SwiftがObjective-Cよりも良いところ - Qiita
  • ネットに広がる「正しい」日本語 - アスペ日記

    ネットで日語を観察していると、「正しさ」を求めて知恵袋などで質問する人がいます*1。 「ラジオを『つける』というのはどう書くのが正しいの?」 「『分かる』『解る』『判る』はどう使い分けるのが正しいの?」 一方で、ネットではいろいろな「正しさ」の主張も目にします。「訊く」や「目をみはる」については、これまでここで扱いました。 「正しさ」の主張としてよくあるのは、「来はこう書くのが正しいが、当用・常用漢字によってそれがゆがめられた」というものです。 ただ、そういう人が思う、ゆがめられる前の「正しい」日語というのは、実は昔から「スタイル」のひとつにすぎないということが多いのです。 以前記事にした「訊く」はその典型ですが、今回は 失(な)くす*2 点(つ)く・点(つ)ける 保(も)つ の三つを取り上げます。 この三つに共通するのは、「これまで平仮名で書かれることが一般的だった」ということです

    ネットに広がる「正しい」日本語 - アスペ日記
  • 撮って翻訳 - Google 翻訳アプリがさらに進化しました

    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

    撮って翻訳 - Google 翻訳アプリがさらに進化しました
  • 中学生レベルの英語力の奴が4ヶ月でTOEIC「Bクラス」を出す方法 (b) - log

    ここでいう“Bクラス”っていうのはスコアが730~860のスコアレンジの事(860以上がAクラス)。とりあえずまずは、簡略化した4ヶ月の流れを早見チャートとしてまとめときます。中学生レベルがどうとか、各ステップの詳細や背景的な話はそれ以降に。 その他TOEIC関連書籍 各ステップの早見チャート(詳細は「各ステップの詳細」を参照) 1:基礎文法力をつける 基礎中の基礎を以下ので一気にやる。これをやらないと次の単語帳の例文が理解できない。 使用書籍: TOEIC TEST文法完全攻略 / 石井 辰哉 期間:1週間 2:基礎単語力をつける 気でキツいんだけど、どうにかして1ヶ月でDUO3.0の例文を完全にマスターし、音声も完全に聞き取れるようにする。 使用書籍:DUO3.0 期間:1〜1.5ヶ月(1日6時間くらいやればいける) 3−A:Part5対策 これは3-Bと平行してスタート。澄子

    中学生レベルの英語力の奴が4ヶ月でTOEIC「Bクラス」を出す方法 (b) - log
  • 1