タグ

言語に関するmo_sanのブックマーク (28)

  • 言語処理100本ノック 2015

    言語処理100ノックは,実践的な課題に取り組みながら,プログラミング,データ分析,研究のスキルを楽しく習得することを目指した問題集です 実用的でワクワクするような題材を厳選しました 言語処理に加えて,統計や機械学習などの周辺分野にも親しめます 研究やデータ分析の進め方,作法,スキルを修得できます 問題を解くのに必要なデータ・コーパスを配布しています 言語はPythonを想定していますが,他の言語にも対応しています

  • https://ir.lib.osaka-kyoiku.ac.jp/dspace/bitstream/123456789/3485/1/KJ482300147.pdf

    mo_san
    mo_san 2015/05/12
    「将来的には日本語でも冠詞が出来るだろう。ただし指示代名詞からでなくて、間投詞からの発展で。」というおはなし。
  • gr.jp

    This domain may be for sale!

    mo_san
    mo_san 2015/05/12
    1970年代から2005年までの出版物・ブログ記事から採ったコーパス。日本語の用例を検索できる。
  • 言語の進化は、話す者の数によって決まるのかもしれない | ライフハッカー・ジャパン

    毎年、世界中で辞書に追加される新しい言葉がある一方で、私たちの語彙から外れていく言葉もあります。最近のある研究で、言語が新しい言葉を追加したり、古い言葉を失ったりするスピードについての検証がなされました。研究者は、生物学的進化と同様に、言語もその言葉を話す人の人口数により、異なるスピードで進化することを発見しました。言語における人口数と進化の関係を紐解くため、研究者たち(オーストラリア国立大学の言語学者と進化生物学者のグループ)は、ポリネシア地域の20の異なる言語を比較しました。人類史においては、ポリネシアへの定住は比較的新しいことであり、その言語群も相対的に新しいため、研究対象として理想的なのです。ポリネシア言語群は異なる島々にまたがり急速に多様化し、ポリネシア言語間の関係性は過去に徹底的に研究されてきました。そのため研究者は、この言語群の中で異なる人口数を持つ言語を比較し、その語彙がど

    言語の進化は、話す者の数によって決まるのかもしれない | ライフハッカー・ジャパン
    mo_san
    mo_san 2015/02/14
    話者数が少ないと、語彙が、減る。維持しない。
  • Xenom's English Database (英語データベース)

    - '21/04/14 「英独仏冠詞:通念」に「(33) 固有名詞(形容詞修飾・付置規定等)」を追加。このシリーズの追加は一旦終了。 - '21/04/13 「英独仏冠詞:通念」に「(32) 固有名詞(事象等)」を追加 - '21/04/12 「英独仏冠詞:通念」に「(31) 固有名詞(企業・組織)」を追加 - '21/04/11 「英独仏冠詞:通念」に「(30) 固有名詞(建造物)」を追加 - '21/04/10 「英独仏冠詞:通念」に「(29) 固有名詞(自然物)」を追加 - '21/04/09 「英独仏冠詞:通念」に「(28) 固有名詞(人名・国名等)」を追加 - '21/04/04 「英独仏冠詞:直接規定」に「属格(A の B)(11)」を追加。このシリーズの追加は終了 - '21/04/03 「英独仏冠詞:直接規定」に「属格(A の B)(10)」を追加 - '21/04/02 

    mo_san
    mo_san 2015/01/06
    英(独仏も)文法、特に冠詞の解説。あの関口氏にも並ぶほどの詳しさ。
  • Python - Perl + Java = ? はてなブログのデータとパソコン工房のPCを使って「word2vec」で遊んでみた - はてなニュース

    統計処理用のマシンを使って、自然言語処理で遊ぼう! BTOパソコンで有名な「パソコン工房」から「統計処理用のPCを企画しているので、何かできないか」と相談された編集部は、はてなエンジニア相談して「word2vec」を使って遊んでみることに。はてなブログのデータとかっこいいパソコンを使って、最新の自然言語処理で楽しむ様子をお楽しみください! 記事の終わりには2TBの外付けHDDが当たるプレゼントのお知らせも。 (※この記事は株式会社ユニットコムによるPR記事です) ―― BTOパソコンのショップ/サイトで有名な「パソコン工房」さんから、以下のような依頼が来ました。 データサイエンティスト向けに、統計処理用に使えるパソコンをいろいろと考えています。なので、何か面白い処理に使って、PR記事にしてほしいんです! ▽ 【パソコン工房公式サイト】BTOパソコン(PC)の通販 ―― ということで、はて

    Python - Perl + Java = ? はてなブログのデータとパソコン工房のPCを使って「word2vec」で遊んでみた - はてなニュース
    mo_san
    mo_san 2014/07/18
    コンピューターと連想ゲームが出来るのかね。面白そうなので自分でも試してみたいね。しかしまずどこから元データを集めればいいやら。
  • 二重母音と二連母音の違いを教えて下さい - ------「二連母音」:読んで字のごとく、母音2つの連続①■ああ/あい/あ... - Yahoo!知恵袋

    https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1049341760 ------ 「二連母音」:読んで字のごとく、母音2つの連続 ① ■ああ/あい/あう/あえ/あお ■いあ/いい/いう/いえ/いお ■うあ/うい/うう/うえ/うお ■えあ/えい/えう/ええ/えお ■おあ/おい/おう/おえ/おお ②あ行以外+あ行による2音も 母音が連続すると言える。 例 【おかあさん】⇒<ka+a>⇒ aa 【貝】⇒<ka+i>⇒ ai ------ 「二重母音」:始めと終わりで音色が2つ現れる1音の母音。 ※二連母音とは別物 ※日語には二重母音は 文字として現れないが存在する。 ※※「や・ゆ・よ」「ゃ・ゅ・ょ」は二重母音と言えなくもないが、二重母音とは言わない。 二連母音のうち、下記のものは、二重母音で発音されることがある。 ■あい/X

    二重母音と二連母音の違いを教えて下さい - ------「二連母音」:読んで字のごとく、母音2つの連続①■ああ/あい/あ... - Yahoo!知恵袋
    mo_san
    mo_san 2014/05/29
    知恵袋のくせに役に立つなんて悔しい
  • 反対語大辞典|対照語・対義語の検索

    反対語・対照語・対義語の検索 反対語大辞典へようこそ。 反対語・対義語が簡単に検索できます。索引か検索フォームよりご利用ください。 ・ランダムピックアップ 腰 (ほんごし)⇔及び腰(およびごし)企画部門 (きかくぶもん)⇔実施部門(じっしぶもん)宣告刑 (せんこくけい)⇔法定刑(ほうていけい)オーラルコミュニケーション (おーらるこみゅにけーしょん)⇔ビジュアルコミュニケーション(びじゅあるこみゅにけーしょん)真っ黒 (まっくろ)⇔真っ白(まっしろ) キーワードをランダムでピックアップ 歳旦・見残す・陣後・確信・売り方・老い人・organic・見せびらかす・雌捻子/雌螺子・承継取得・上値・株式取引所・這いあがる・寝かせる・一気に・天然・bull・座礼・イミテーション・両辺一 反対語大辞典の索引 あ い う え お か き く け こ さ し す せ そ た ち つ て と な に ぬ ね

    mo_san
    mo_san 2014/05/24
    こういうのって面白いよね。言葉を覚えると世界が広がる。ただ、語義の説明が無いから例の大先生に頼らないと
  • marges de la linguistique

    クリストの梱包芸術 1)「梱包芸術」というジャンルがある。第一人者としてはブルガリア出身のアーティスト、クリストとそのパートナー、ジャーヌ=クロードが有名だ。ともかく何でも梱包してしまうというのがコンセプトで、古くは1969年にオーストラリアで「海岸を梱包」して世間の度肝を抜いた。また1985年にはパリの「ポン・ヌフ」を梱包した。ベルリンのライヒスターク(帝国議会議事堂)を梱包したこともある。 小さなところではスヌーピーの小屋が梱包されたこともあった。 (Peanuts 1978/11/20 ワシントンポスト他各紙;画像参照元は Peanuts オフィシャルサイト) (さらに…)

    marges de la linguistique
    mo_san
    mo_san 2014/03/30
    身近な疑問から、言語学への端緒を開く
  • 「4歳になる娘」は3歳なのか?

    澤村 圭一 @onarapooh 今日やった英作文の問題。「うちの4才になる娘は人見知りがきつくて…」 驚いたことにこの娘の年齢を生徒の大半が「3才」と捉えていた。「4才だよな?」とバイトの東大生に聞いたら、「3才だと思います。先生の言い分もわかりますが」と言われた。言い分てw 日語詳しい方、解説ぷりーず! 2013-11-18 23:38:53

    「4歳になる娘」は3歳なのか?
    mo_san
    mo_san 2014/01/21
    他の人も指摘するように、「になる」の「に」が余計なのでしょう。それが誤解の原因。僕は、ええ、5分前まで3歳派でしたけど。
  • Ghoti - Wikipedia

    ghoti (フィッシュ)は、英語の綴りの不規則性を示すために作り出された語。ジョークである。英単語 fish の音を異なる綴りで表したものであるため、 fish と同じく [ˈfɪʃ] と発音する。 概要[編集] ghoti は以下の三つの部分からなる。 gh - laugh (ラフ [læf], [lɑːf]) における gh と同様、[f] の音を表す。 o - women (ウィミン [ˈwɪmɪn], [ˈwɪmən]) における o と同様、[ɪ] の音を表す。 ti - nation (ネイシャン [ˈneɪʃən]) における ti と同様、[ʃ] の音を表す。 同じように、colonel (カーネル, [ˈkɝnəl]) の olo を付け加えた ghotiolo は fisher (フィッシャー [ˈfɪʃɚ]) と発音する。これには歴史的な経緯が深く関係している。 英

  • 飛騨弁一覧

    ■ 飛騨弁講座 ■ '08 Jul. 27 更新   1語追加、  合計648語に ■何故に突然、飛騨弁か ? H15年の正月に、相方の実家へご馳走になりに行き、義父と義兄、甥っ子と飲んだ時、話の中で、甥っ子が「ねぶか」「いしな」という、よく使われている筈の飛騨弁が全く通じないことに驚きました。高校卒業後は、飛騨で暮らしていないので、この世代間(約30年間)の落差に全然気づきませんでした。長い間、都会暮らしの中で、飛騨弁に封印をして過ごしてきた者としては、忸怩たる思いさえしたのでした。そして、とりあえず自分の覚えている飛騨弁を残して置きたい、という気持ちが強くなり、単なる羅列ですがまとめてみました。中には、私は使わなかったが、親が使っていた飛騨弁<おほね(尾根)、いわす(岩、磐)、だけ(嶽)等>も入っています。 ただ、私は方言と思っている言葉も、実は共通語で、単に普段の生活で使用しない言葉

    mo_san
    mo_san 2013/05/23
    よくこれだけ集められたなあ。面白いです。
  • フランス語の部屋

    <BODY> <P>このページを表示するには、フレームをサポートしているブラウザが必要です。</P> </BODY>

    mo_san
    mo_san 2013/03/12
    フランス語アルファベットの入力方法を探してたどり着いた
  • Languages Online

    Engaging interactive tasks and printable worksheets that introduce, reinforce and recycle vocabulary. Ideal for students from Years 3 – 8. Topics are based on common beginner-level themes. Activities are self-paced, self-correcting and help students practise listening, speaking, reading and writing. Free! No logins or registration! Includes online vocabulary flashcards and songs Go here to access

  • http://www.ne.jp/asahi/wonder-island/wahhahha/timespace/hiero/

    mo_san
    mo_san 2011/06/15
    以外にも簡単な仕組みなのですね
  • はてなブログ | 無料ブログを作成しよう

    週報 2024/04/28 川はただ流れている 4/20(土) 初期値依存性 さいきん土曜日は寝てばかり。平日で何か消耗しているらしい。やったことと言えば庭いじりと読書くらい。 ベランダの大改造をした。 サンドイッチ 一年前に引っ越してからこんな配置だったのだけど、さいきん鉢を増やしたら洗濯担当大臣の氏…

    はてなブログ | 無料ブログを作成しよう
    mo_san
    mo_san 2010/10/31
    言語についてと、その習得に必要である現地の事情。
  • 主に言語とシステム開発に関して

    ※この記事は,GoogleのGetting Started Tutorialを日語訳したものです。 Chromeアドオンは,複数のコンポーネントによって成り立っています。 コンポーネント同士は,互いに関連性があります(cohesive)。 コンポーネントの種類としては, background script content script option ページ UI element その他のロジックを記述したファイル などがあります。 アドオンのコンポーネントは,HTMLCSSJavaScriptといったWeb開発の技術を用いて作成されます。 アドオンごとに機能が異なりますので,必要となってくるコンポーネントも変わってきます。 このチュートリアルでは,一つのアドオンを作ります。 developer.chrome.com のドメイン上にある任意のページ上で,ページの背景色を変更することが可

    主に言語とシステム開発に関して
  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

    mo_san
    mo_san 2010/09/13
    なぜにまついひでき。
  • フランス語簡単講座

    Leçon facile de français (フランス語簡単講座) このコーナーは,身近に転がっているフランス語から 徐々にフランス語を理解していこうという おそらく日で初めての試みです(??) Leçon 1 フランス語は音だ! 音から入るフランス語 (Commencez la prononciation du français) フランス語を簡単に学ぶとは言っても,少なくとも文字の読みくらいはできないと困ってしまいます。と言うのも,フランス語は,同じロマンス語圏の言語でありながら,イタリア語やスペイン語などと違って,ローマ字そのままの読み方では通用しないところが多いからです。また,フランス語の持っている母音や子音などの「音」も,日人にとってなじみのないものが多いので,どうしても多くの日人にとって「フランス語=難しい」という図式が成り立ってしまうのです。 しか

    mo_san
    mo_san 2010/09/10
    クェスクセ?
  • 東外大言語モジュール

    Introduction TUFS言語モジュールは,東京外国語大学大学院の21世紀COEプログラム「言語運用を基盤とする言語情報学拠点」の研究成果を活かして開発した,新しいインターネット上の言語教材です。英語以外の言語教材は,主として大学生が初めて新しい外国語を学ぶための教材を想定しています。英語については,小学校での総合学習や中学校で初めて学ぶ外国語としての英語を念頭において開発しました。 2004年6月に「発音モジュール」が12言語で公開され,それに先立つ2003年12月には「会話モジュール」が17の全ての言語で公開されました。 続く2006年4月には,「文法モジュール」が10言語で公開され,「語彙モジュール」も2言語で公開中です。 これらの教材は,東京外国語大学の教員,大学院生および学外協力者を含む100名以上の協力によって開発されました。 詳しくは開発者一覧をご覧ください。 さらに