タグ

languageに関するtakisokのブックマーク (8)

  • 言語学者・金田一秀穂が今「若者言葉」より気になっているもの | AERA dot. (アエラドット)

    言語学者 金田一秀穂(きんだいち・ひでほ) 1953年、東京都生まれ。83年、東京外国語大学大学院博士課程修了。日語学専攻。中国大連外語学院、コロンビア大学などで日語を教える。ハーバード大学客員研究員を経て、現在、杏林大学外国語学部教授。専門は日教育、言語行動論、意味論。近著に『このい「言い回し」で10倍差をつける』(小学館新書)。8月8日、『金田一家、日語百年のひみつ』(朝日新書)が発売予定(撮影/写真部・工藤隆太郎)この記事の写真をすべて見る 金田一秀穂さん(左)と林真理子さん(撮影/写真部・工藤隆太郎) 言語学者の金田一秀穂氏が、作家の林真理子氏と対談した。 *  *  * 金田一:僕、あんまり腹が立たないほうなんですが、昔すごく腹が立った発言があって。柳沢(伯夫)さんという厚生労働大臣をやってた人がいたでしょう。「女性は子どもを産む機械だ」と言った人です。 林:はい。 金

    言語学者・金田一秀穂が今「若者言葉」より気になっているもの | AERA dot. (アエラドット)
    takisok
    takisok 2014/07/28
    わけがわからない、変なものを見つけたら採集するのが研究者として正しい態度だよなー
  • 人生でいちばん欲しかったもの

    今まで生きてきた中で1番欲しいと思ったもの。 それは小学校の時に好きだった男の子が作っていた、 手の平サイズの辞書。 自分達だけの言語を作って、それを小さなメモにまとめて 男子の仲間に配りそれぞれ確認しながら話していた。 何を話しているのか先生も女子もわからない。 めちゃくちゃ、死ぬほど、その豆が欲しかった。 私も、その男の子の考えた言葉で話してみたかった。 何十年もたった今でも思い出す。

    人生でいちばん欲しかったもの
    takisok
    takisok 2014/07/18
    こうして内輪受けのために使われていた言葉の一部が他の人に伝えられ、時代を経て権威的になり、「正しい表現」が定義されて、様々な言語へと分化して行ったのだろうなぁ。バベルの塔がなくても話は通じなくなる。
  • 自然言語処理の最新手法"word2vec"で艦これ加賀さんから乳を引いてみる - あんちべ!

    概要 この記事は自然言語処理という分野の最新手法word2vec を利用して誰でも遊べるようにするための手順を説明するものです。 word2vecを利用すると意味の計算が実現できます。 例えば"king"から"man"を引いて"woman"を足すと"queen"が出てきたり、 "東京"から"日"を引いて"フランス"を足すと"パリ"が出てくるという面白い手法です。 自然言語処理とは人間が日常的に用いる自然言語をコンピュータに処理させ、 翻訳や要約、文字入力支援や質問応答システムを作るなどに活用されている分野です。 自然言語処理と言うと耳慣れない言葉かもしれませんが、 実は検索や推薦などで私たちが日常的に利用しているなじみ深い技術でもあります。 自然言語処理の適用範囲や要素技術は幅広いのですが、 その中でもword2vecの特色は、 冒頭でも挙げたように「意味の計算」が出来ることです。 これ

    自然言語処理の最新手法"word2vec"で艦これ加賀さんから乳を引いてみる - あんちべ!
    takisok
    takisok 2014/03/10
    てっきり龍驤がオチに来ると期待してたのに……!自然言語処理は気になるのでword2vec試してみたい。
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
    takisok
    takisok 2014/02/07
    この分野詳しくないので勉強になる/とは言え単細胞生物ですら「食べられる」「食べられない」「敵だ逃げろ!」くらいの意味を利用して生きている訳で、記号と意味は進化的にとてつもなく遠い気がする
  • 「汚名返上」の用例はゼロ、汚名は雪ぐもの - こりゃ、ほたえな

    この記事は【こりゃ、ほたえな: 「汚名返上」の用例はゼロ、汚名は雪ぐもの】に移しました。

    「汚名返上」の用例はゼロ、汚名は雪ぐもの - こりゃ、ほたえな
    takisok
    takisok 2013/02/16
    つまりあれだ、「テレビで言ってたし、俺が納得しているのに文句つけるとは何事だ!」ってバカが文句つけてるだけ。大学まで出てるのに学術的な議論が出来ない人々には、本当にがっかりする。
  • 10/22ブログ 原電という言葉知ってますか 上関原電の話 | もりのようちえんぴっぱらとおとじろうのひび

    たかすのおとじろうとぴっぱらのひびのしょうかいぶろぐです。 メールアドレスはzourairu@agate.plala.or.jpです。 知らなかった笑えないほどこっけいな話 『週刊金曜日』の中で、 「上関に、中電サンが原発を作ろうって騒ぎになって・・・・、中電サンは原発って言わないんだって。原発の『発』が『爆発』につながるんで、『原電』て言ってるんですよ」 という言葉を見て、「えっつ、うそー」と思いながら、ネットで調べてみたら、ありました!!これが、上関に建てられた看板です。 『上関町へ来ないで!』という文言も、橋を若い人達がにこやかに渡ってくる絵も、その露骨さと品位のなさに唖然としますが、それより何より、確かに『原電』という言葉がしっかりと書かれています。 そして、もう少し「原電」について調べていると、「えっつ、うそー」という中国新聞のニュースを見つけました。 http://www.ch

    takisok
    takisok 2012/07/18
    まあ、実際に爆発してますからね。言葉だけ言い換えても、ね。
  • 米スタンフォード大が機械学習と人工知能に続き,自然言語処理と確率モデルの講義を一般公開 - nokunoの日記

    表題の通り,米スタンフォード大が自然言語処理と確率モデルの講義のオンライン公開を始めるようです.Natural Language ProcessingProbabilistic Graphical ModelsNLPを担当するManning先生は,この分野では知らぬものはいない教科書「Foundation of Statistical Natural Language Processing」の著者でもあります.これは必見ですね. なお,以前から公開されていて既に講義や課題が始まっている機械学習人工知能の講義はこちら.Machine LearningIntro to AI - Introduction to Artificial Intelligence - Oct-Dec 2011 スタンフォード大学のオンライン講義 - nokunoの日記ツイートする

    takisok
    takisok 2011/11/19
    ちょうど自然言語処理の勉強始めようと思ってたところ。これはチェックしておきたい
  • 本当に必要なN-gramは2割しかない - nokunoの日記

    Entropy-based Pruning of Backoff Language Modelsを読んだ.単語N-gramはとてもよくできていて言語モデルとしての性能はかなりのものなのだが,なんの枝刈りもせずに中規模〜大規模なデータに適用しようとするとサイズが馬鹿でかくなってしまう.そのための対策としてよくあるのが語彙のサイズを制限する方法と,N-gramの頻度が一定以下のものを切り捨てるという方法(後者の場合は語彙も自動的に制限される).Google語N-gramなども頻度20以上のものが配布されており,効率よくデータサイズを減らすためには頻度でカットオフする方式がよく使われていると思う(語彙だけだとかなり制限しないとサイズが減らない).しかしカットオフしすぎると性能はかなり落ち込むので,うまい方法はないものかと考えられたのがこの論文の手法である.N-gramのデータには頻度の高い

  • 1