並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 69 件 / 69件

新着順 人気順

助動詞 使う 意味の検索結果41 - 69 件 / 69件

  • 人工無能の作り方

    書いた人 INA 人工無能とは? 人間っぽく話すプログラムのこと。会話を理解しているというよりは、なんかそれっぽいことを話すだけのものが多い。 今回は「日本語のようなものを話す人工無能」を作ってみたので、その簡単な仕組みと工夫した点について少し書いてみることにする。 動機 うちのサークルのメンバーがよく集まってるチャット。とてもマニアックな どうしようもない 会話が繰り広げられているわけだが、ちょっと物足りない。 そうだ! 萌キャラがいないじゃないか! 「ないなら作ればいいじゃない?」 材料 MeCab 形態素解析エンジン 難しいことは知らなくても問題ない。 「私は変な人ではない」 ↓ 私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 変 名詞,形容動詞語幹,*,*,*,*,変,ヘン,ヘン な 助動詞,*,*,*,特殊・ダ,体言接続,だ,

    • イスラエル政府の言うような "human animals" なんかじゃない。彼ら・彼女らの言葉を伝える翻訳ハッシュタグ - Hoarding Examples (英語例文等集積所)

      【「日本国際ボランティアセンター (JVC)」さんの緊急支援要請】 ガザ地区での活動実績がしっかりしている日本のNGOです https://www.ngo-jvc.net/news/news/202310_gaza.html 起きたことに、衝撃を受けすぎて、言葉にならない、ということは、日常にあふれている。ネットなどでよく、「語彙力をなくす」というスラングで描写されるあれである。 10月7日の出来事は、その最たるものだった。 Twitterのログを見返したが、そのときのものは何もない。最近はMastodonに切り替えつつあるのでMastodonに書いたかと言えば、そっちにもない。速報としてスマホに配信されてきた短い文面を見て、「え」と声に出したことは覚えている。そのあとは「マジで?」と思い、BBC Newsの速報を一読して「何これ」と思い、もう一度読んで「は?」と思った。 そして「いやいや

        イスラエル政府の言うような "human animals" なんかじゃない。彼ら・彼女らの言葉を伝える翻訳ハッシュタグ - Hoarding Examples (英語例文等集積所)
      • 昭和の映画に「いやだわ ○○さんったら」ってセリフが頻繁に出てくるんだが昭和人はそんなしゃべり方してたのか? : 哲学ニュースnwk

        2019年04月25日20:00 昭和の映画に「いやだわ ○○さんったら」ってセリフが頻繁に出てくるんだが昭和人はそんなしゃべり方してたのか? Tweet 1: 名無し募集中。。。 2019/04/24(水) 09:45:02.55 0 もはや別民族 2: 名無し募集中。。。 2019/04/24(水) 09:50:52.04 0 女は本来 ~だわ ~なの そうよ そうね ~なのよ これが本来の大和撫子の言葉使いだ 昭和の歌謡曲でもこういうしゃべりの歌詞だろ? 96: 名無し募集中。。。 2019/04/24(水) 12:08:44.32 0 >>2 全て使っているわ 145: 名無し募集中。。。 2019/04/24(水) 20:07:40.55 0 >>2 つんくと森高千里が書く詞はほぼこれ 173: 名無し募集中。。。 2019/04/25(木) 15:56:13.07 0 >>2

          昭和の映画に「いやだわ ○○さんったら」ってセリフが頻繁に出てくるんだが昭和人はそんなしゃべり方してたのか? : 哲学ニュースnwk
        • iPhoneアプリ「中学英文法総復習 パターンで覚える 瞬間英文法」がなかなかいい感じ - ビジョンミッション成長ブログ

          iPhoneアプリ「中学英文法総復習 パターンで覚える 瞬間英文法」 iPhoneアプリで、英語を学ぶ。細切れ時間などにも勉強できますし、いい方法でしょう。 「中学英文法総復習 パターンで覚える 瞬間英文法」は、iPhoneで、中学英語の英文法を復習できるアプリです。 中学英文法総復習 パターンで覚える 瞬間英文法 RareJob Inc. 教育 ¥240 英文法を学ぶと、英語を話したり、理解するのに役立ちますね。 効率的な英語学習の6つの手順『第二言語習得論に基づく、もっとも効率的な英語学習法』佐藤 洋一 第二言語習得論に基づく、もっとも効率的な英語学習法 (ディスカヴァー携書) 作者: 佐藤洋一 出版社/メーカー: ディスカヴァー・トゥエンティワン 発売日: 2015/12/26 メディア: 新書 こちらの第二言語習得論についての本でも、英文法から学ぶと効率的とありました。 「中学英文

            iPhoneアプリ「中学英文法総復習 パターンで覚える 瞬間英文法」がなかなかいい感じ - ビジョンミッション成長ブログ
          • 「気まずい沈黙」を回避するには?プロの通訳が使う英会話の黄金テクニック3選 | English Lab(イングリッシュラボ)┃レアジョブ英会話が発信する英語サイト

            英語で発言を求められ、話し始めたはいいものの、会話の途中でちょうどいい単語が思い浮かばずフリーズ状態に。必死で頭の中の日本語を英語に置き換えようとしても、肝心なときに該当する単語が出てこないまま、一秒、また一秒と時間が過ぎていく……皆さんは、こんな経験ありませんか? 英語でコミュニケーションするときに、何よりも避けたいのが「気まずい沈黙」です。特に、英語圏の国々では、会話中の沈黙が否定的なメッセージとして解釈されてしまう場合もあるため、注意しなくてはなりません。 このような沈黙を避け、自然にかつ即座に相手の言葉に反応して会話を繋げていくために使えるのが、プロの通訳者が実践しているテクニックです。瞬発力が命である通訳の現場では、知らない単語や表現をその場で調べることは絶対にできません。瞬時に判断し、言葉を発していく必要があります。 今回の記事では、とっさの言い回しが出ないときに使える万能表現

              「気まずい沈黙」を回避するには?プロの通訳が使う英会話の黄金テクニック3選 | English Lab(イングリッシュラボ)┃レアジョブ英会話が発信する英語サイト
            • 「前置詞」の勉強ってしたことある?『熟語本位 英和中辞典』への道 - Write off the grid.

              0.はじめに いきなりですが、あなたは talk away という熟語の意味がわかりますか? talk は「話す」、away は「離れて」という意味で、これは知っていると思います。 が、これじつは、「ぺちゃくちゃ喋りまくる」って意味なんです。 なぜこんな意味になるのか? それは away に「継続」、「どんどん~する」という意味があるからなんです。 これを知ってた人も知らなかった人も、こういった馴染み深い簡単な単語こそ奥が深いということは、なんとなく知ってたと思います。 たとえば、もし中学や高校で良い教師に恵まれれば、「on を「上」と覚えてはいかん」ということで、a picture on the wall(壁にかかった絵)、a fly on the ceiling「天井にとまったハエ」などの例を挙げたうえで、これらより、「on は「接触」を意味するのじゃ」と教わったことがあるかもしれませ

                「前置詞」の勉強ってしたことある?『熟語本位 英和中辞典』への道 - Write off the grid.
              • 漢文ブロックバスター、あの訳が分からない訓読が一体何をしていたのかを説明する

                少女:このまえの近代デジタルライブラリーの話だけど。 無料で手に入る実力→近代デジタルライブラリーから迎えた40の辞書たちを紹介します 読書猿Classic: between / beyond readers 少年:うん。 少女:百科事典とか説話の『大語園』は現代文だから読めるけど、イチオシだった『古事類苑』とか『広文庫』とか『和漢三才図会』って、結局、漢文が分からないと読めないじゃない? 少年:うーん、近代に入るまで公式な文書や学術文献からプライベートな手紙まで基本的に漢文で書くものだったから。日本だけじゃなく、中国はもちろん、朝鮮半島からベトナムあたりまで。ヨーロッパだとラテン語にあたると思う。 少女:じゃあ聞くけど、どうやって読んでるの? 少年:うーん、やっつけだけど。英語みたいな感じ。 少女:ちゃんと語学として勉強しろ、ってこと? 少年:まじめに言えばそうなんだろうけど、漢文って語

                  漢文ブロックバスター、あの訳が分からない訓読が一体何をしていたのかを説明する
                • (実況中継)英文精読はここまでやるー精読とはコンテキストを補完しながら読むこと

                  精読とは、ただ細かく詳しく読むことではない。 テキストに徹底的に寄り添いながら、そこに書いていないことを、読み手自らが補完しながら読むことである。 こうした読み方は、あなた向けに書かれた訳ではないものを読むときに必要となる。 時代背景も、直面している課題も、異なる時間空間で書かれたテキスト(たとえば古典)は、このようなものの一例である。 以前書いた言い方を繰り返せば、 プラトンはあなたのことなど何も知らない。 デカルトはあなたを読者として想定していない。 逆に、完全にあなたのために書かれたあなた向けのテキストを読むときには、こうした読み方をする必要はないだろう。 書き手は、あなたが何を知っているか/知らないかをある程度理解しており、あなたに理解してもらうためには、どのようなことが前提にできるか/できないかについても知っている。 理解に必要なことで、あなたが知らなさそうなこと、知っているとは

                    (実況中継)英文精読はここまでやるー精読とはコンテキストを補完しながら読むこと
                  • 一年の計は元旦にあり! Udemy新年のビッグセールで2024年に学びたいこと、挑戦したい資格、新しいスキルを見つけよう - はてなニュース

                    ※ Udemy「新年のビッグセール」は終了しました。はてなによるAmazonギフトカードプレゼントキャンペーンもそれにあわせて終了しています。ご応募ありがとうございました。 あけましておめでとうございます。これまでもUdemyの大きなセールでは目玉の講座を紹介してきた当ニュースですが、2024年1月1日から1月10日まで開催される「新年のビッグセール」では、新しい年にふさわしい夢とキャリアが広がる講座を紹介します。 各種資格試験の対策講座をはじめとして、マスターしたいプログラミング言語や開発手法、昨年から引き続き話題の生成AI、ウェブ解析やプロジェクトリカバリ、簿記や会計、英会話など多様なビジネスキャリアに直結する講座をピックアップ。映像制作や3Dモデリング、GA4や3Dアニメーション制作といった講座も取り揃えています。 一年の計は元旦にあり。みなさんが2024年に挑戦したい目標や習得した

                      一年の計は元旦にあり! Udemy新年のビッグセールで2024年に学びたいこと、挑戦したい資格、新しいスキルを見つけよう - はてなニュース
                    • きまぐれ日記: Yahoo!の形態素解析をMeCabで無理やり再現してみる

                      MeCabで形態素解析器を作りたい場合は以下の二つの言語リソースが必要です。 1. 辞書 (単語と品詞のペアの集合) 2. 入力文と、それに対応する正解出力ペア(正解データ) 現在公開している mecab-ipadic は、ipadicとRWCPコーパスという正解データを使っています。 ここから分かるとおり、少なくともMeCabを使う場合は、コスト値を丹念にチューニング するといった職人芸は要りません。形態素解析への入力文とそれに対応する(理想)出力 があればコスト値を機械学習的なアプローチで構築することができます。 さらに、正解データを人手で作る必要は必ずしもありません。 すなわち、Yahoo!の形態素解析器の出力結果を「擬似正解」とみなして MeCabの学習プログラムを走らせれば、Yahoo!の出力を高い精度で再現できる MeCab用辞書を作成することが原理的に可能です。 ふだんはあま

                      • livedoor Techブログ : wikipediaのデータや顔文字辞書からmecabのユーザ辞書を作成するフレームワーク

                        突然ですが,mecabの辞書 (mecab-ipadic) をデフォルトのまま使って,mecab意外と使えねぇとか文句言ってる悪い子はおらんかね? mecab-ipadic は比較的お行儀のよい日本語をベースに作られているので,そのままでは web上の口語文体のテキストはうまく扱えないことがあります。本来は教師データを用意し,学習させるといった手法を使うのが正攻法だと思いますが,とりあえず名詞を充実させるだけでも実用度はだいぶ上がるでしょう。 人間の話す言語には,動詞の語幹や名詞には日々新しく語彙が増えるけど,助詞や活用のルールは簡単には変化しない,という特性があります。特に「いま最もつぶやかれている単語ランキング」といった集計をするような場合は,名詞の範囲の切り出しさえ間違えなければそれなりの結果を出せることも多いのです。 ただ,辞書への単語追加はここにある通り簡単にできるのですが,単語

                        • のび太の「~かしら」は女性的? 言葉の歴史を紐解いてみた

                          「ドラえもん」の作者として知られる藤子・F・不二雄氏の漫画について、「男性が『~かしら』という言葉を使っている印象がある」などと指摘するツイートが、2019年8月下旬に投稿され、話題になった。 投稿者のユーザーは、「女性的な言葉だと思うが、F先生の口癖だったのかしら?」と疑問を投げかける。そもそも「~かしら」はいつから使われ始めたのだろうか。J-CASTニュースでは、過去の文献を振り返るとともに、識者に見解を聞いてみた。 「坊っちゃん」や「少年探偵団」にも登場 「広辞苑 第七版」(岩波書店)によると、「かしら」は助詞。「『...か知らぬ』の転。明治以降の語。主として女性が用いる」としている。体言と同等の語に続いて、不審や疑問の意を表す。否定の助動詞「ない」「ぬ」に続いて、願望や依頼の意も示す。「かしらん」とも表記されるようだ。活用語の連体形に続いて、危ぶむ意も表すという。 ツイッター上では

                            のび太の「~かしら」は女性的? 言葉の歴史を紐解いてみた
                          • sacrificeの語義は「犠牲を払う」か? (バッハIOC会長発言をめぐって) - Hoarding Examples (英語例文等集積所)

                            今回は、予定を変更して、今ホットな話題について(もう過去の話かもしれないが)。例のIOC会長による「犠牲」発言である。ちなみに原文では "We have to make some sacrifices to make this possible." である。 最初にお断りしておくと、個人的に五輪には関心がないので五輪に関する情報を入れようとしておらず、それどころか、積極的に見ないように環境を作ってあって、Twitterでは「五輪」やそれに類することばは、日本語でも英語でもミュートしてある。加えて、昨日5月24日は暑さにやられて全く使い物にならない状態だったので、この発言が昨日までに話題になっていたことは何となく把握していたが、まともに調べたのは、今日25日になってからだった。 なお、以下は分析の結果の私の解釈を示すものであり、「これが唯一絶対の正しい解釈」とするつもりは毛頭ない。解釈は多様

                              sacrificeの語義は「犠牲を払う」か? (バッハIOC会長発言をめぐって) - Hoarding Examples (英語例文等集積所)
                            • Rubyによる形態素解析エンジンokura 0.0.1をリリースしました - <s>gnarl,</s>技術メモ”’<marquee><textarea>¥

                              12月にさくさくテキストマイニングで発表したpure Rubyによる形態素解析エンジンをgem化しました。 まだ発展途上で機能が少なかったりパフォーマンスが悪かったりしますが、いちおう動くレベル*1になったので公開します。 注意事項 バージョン0.0.xのうちは、インタフェースや辞書フォーマットは頻繁に変更される予定です。 ある程度安定したら0.1.0出します。 今のところ、Ruby1.9系専用です。 取得 gem install okuraでインストールできます。 ソースは https://github.com/todesking/okura 使い方 MeCabフォーマットの辞書データを使用します。 動作確認はMeCab用NAIST辞書で行いました。 最初にokura compileコマンドで辞書をコンパイルします $ okura compile mecab-naist-jdic-0.6

                                Rubyによる形態素解析エンジンokura 0.0.1をリリースしました - <s>gnarl,</s>技術メモ”’<marquee><textarea>¥
                              • 【人を動かす】D・カーネギー【道は開ける】 : 哲学ニュースnwk

                                2013年09月01日23:55 【人を動かす】D・カーネギー【道は開ける】 Tweet 1:無名草子さん:2010/10/25(月) 01:40:00 落ちてたので立てました。 デール・カーネギー - Wikipedia http://ja.wikipedia.org/wiki/デール・カーネギー 2:無名草子さん:2010/10/25(月) 21:26:26 批判も批難もしない。苦情も言わない。 大事にされる人、好かれる人の特徴 http://blog.livedoor.jp/nwknews/archives/4051962.html 誰も憎まない、悪口言わないことを目標にする人 http://blog.livedoor.jp/nwknews/archives/4047564.html 10:無名草子さん:2010/11/18(木) 02:01:06 >>2 これってある意味、正しいん

                                  【人を動かす】D・カーネギー【道は開ける】 : 哲学ニュースnwk
                                • うまくクラス名を付けるための参考情報 - Qiita

                                  クラス名には、多くの場合"名詞"を用います。メソッド名の場合は動詞や助動詞を用いて命名しましたが、クラス名は何かしらの責務を持つモノとして捉えるため、名詞を用いることになります。 一方、インタフェースの宣言をする場合、そのインタフェースの名前に"形容詞"を用いることがあります(例:Iterable、Closeable等)。形容詞を用いることで、クラスの持つ性質を説明的に見ることができるようになります(Iterableな配列のList実装 -> ArrayList等)。 この記事は、どのような名詞や形容詞がクラス名やインタフェース名として用いることが出来るかを一覧し、できるだけクラスやインタフェースの役目を端的に表せるようなリファレンスとして活用できるものを目指していきたいと思います。 自分自身がクライアントアプリケーションのバックグラウンドを持っている為、多分にそこで用いる命名方法が含まれ

                                    うまくクラス名を付けるための参考情報 - Qiita
                                  • 文章の書き方・文書の作り方

                                    短文は、A4版の紙1枚に収まる量です。これより長い連絡文書をもらっても、忙しい中で読み手にきちんと読んでもらえる保障はないでしょう。 伝えたいことを整理して、絞り込んで伝えましょう。 ◇ 文書構成の階層表現 報告書など論理的な構成をおこなう文書は、章・節・項のような構成を番号付けして示します。ルールをはっきりさせていないと読者は混乱します。一般に論理構成は3層までにするのがわかりやすいです。 一番わかりやすい階層表現は、以下の例のような番号構成です。 1. 1.1 1.1.1 1.1.2 1.2 2. 3. 数字だけで構成せず「章」の文字を入れることもあります。また、カナやアルファベットなど異種の記号を下位の構成に入れたりすることもあります。 1章 ・・・ 1.・・・ 2.・・・ ア.・・・ イ.・・・ 文書の論理構成を表す数字と、リストに列挙したものにつける数字とが混乱しないようにしなけ

                                    • ワードサラダ技術について

                                      後半部分が重要で、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である ということです。 さて、実例です。たとえば次の文章を考えてみます。 「通信販売大手セシールは9日、生命保険の販売に本格参入する方針を明らかにした。」 まず形態素解析するとこんな感じになります。 通信 名詞,サ変接続,*,*,*,*,通信,ツウシン,ツーシン 販売 名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ 大手 名詞,一般,*,*,*,*,大手,オオテ,オーテ セシール 名詞,固有名詞,組織,*,*,*,セシール,セシール,セシール は 助詞,係助詞,*,*,*,*,は,ハ,ワ 9 名詞,数,*,*,*,*,9,キュウ,キュー 日 名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ 、 記号,読点,*,*,*,*,、,、,、 生命 名詞,一般,*,*,*,*,生命,セイメイ,セイメイ 保険 名詞,一般

                                      • Amazon RDS for MySQL と全文検索 | DevelopersIO

                                        こんにちは、藤本です。 先日開催された Developers.IO 2017 で「Amazon Elasticsearch Service の使いドコロ」というタイトルで登壇しました。 Developers.IO 2017セッション「Amazon Elasticsearch Service の使いドコロ」で話しました #cmdevio2017 資料を作成する中で MySQL 5.7 から追加された全文検索の日本語対応に関して調べました。せっかくなのでまとめた内容をブログに書き出すとともに、RDS だとどこまでできるのかということを追加調査してみました。 MySQL 5.7 の日本語全文検索に関しては公式ドキュメントや、Oracle の方のスライドに詳しく説明されていますので、詳しく知りたい方は下記をご参照ください。 12.9 Full-Text Search Functions MySQL

                                          Amazon RDS for MySQL と全文検索 | DevelopersIO
                                        • 「つらみ」の分析 - それより牛丼の話しようぜ!

                                          名詞化接尾辞「-み」についての仮説色々。何度か追記しました。 今年のはじめくらいからよくみるようになった「死にたみ」「つらみ」「ねむみ」といった表現について、接尾辞の観点から色々考えてみました。 僕のTLでこの表現そのもののニュアンスが話題になったこともあって、ちょっと気になっていたので。 1は分析道具の紹介なので、分析結果だけ関心ある人はいきなり2から読んでもらってもかまいません。 1 名詞化接尾辞「-み」の生産性と特徴について 先ほど挙げた例で使われている表現の共通点は、形容詞(助動詞「-たい」も含む)に名詞化接尾辞「-み」を付与したものだということ。この派生過程自体は、通常の「-み」の用法と同じであり、特に違反性はない。例えば「あたたかみ」「赤み」「苦み」などの表現は一般的に用いられており、また独立した語彙として辞書に記載されているものもある。なぜ、一見同様の派生条件を持っているにも

                                            「つらみ」の分析 - それより牛丼の話しようぜ!
                                          • わたし(たち)はなぜ英語がヘタなのか? | タイム・コンサルタントの日誌から

                                            小学校4年生の時のこと。ある日、食卓の上に、大きくて重たい箱形の見慣れぬモノがあり、それを前にした父が、「これからはこれで英会話を勉強するように」と、おごそかにわたしに告げた。器械は特殊なマルチトラックのテープレコーダーで、幅広の、今にして思えば1インチ幅の茶色いテープをかけて使うようになっていた。東京エデュケーショナルセンター(TEC)、別名「ラボ」の英会話自習用の装置だった。勤め人にとって決して安い買い物ではない。父は最初のレッスンの冒頭10分くらいをかけ、わたしが使えて、ついて行けるのを確かめた。そして、1レッスン約15分、毎日きくように命じた。 わたしは当時まだ素直な子どもだったし、父もこわかったので、一応命じられたとおりほぼ毎日その器械に向かった。ナレーターが、簡単なストーリーや説明をした上で、短い文章を発音し、聞き手がその後について自分でも声に出してみる。そういう作りだった。後

                                              わたし(たち)はなぜ英語がヘタなのか? | タイム・コンサルタントの日誌から
                                            • 英語の「現在完了形」は、現在時制(テンス)+完了相(アスペクト)と考えると理解しやすいし、未来表現も相(アスペクト)が利用できる: 極東ブログ

                                              英語の「現在完了形」は、現在時制(テンス)+完了相(アスペクト)と考えると理解しやすいし、未来表現も相(アスペクト)が利用できる 昨日だったか、はてなブックマークで「直感で学べる!英語ネイティブの11個の現在完了の使い方 - 大人気美女ブロガーミカエラさんの動画で英語学習」(参照)という記事に、644のブックマーク(参照)がついて目立っていたので覗いてみた。コメントが異常なほど多く付いているというわけではない。英語学習関係のブックマークは1000を越えるものも多いので、どっちかというとそれほど話題というものでもないだろう。ただ、アスペクトを教えているのかなと興味を持ったのだった。 該当のエントリーだがそれなりに面白いし(女性がカワユス)、説明が間違っているというものでもないが、アスペクトの話はなかった。 そういえば、学校英語ではいまだに「現在完了形」というのを教えているのだろうか。現在完了

                                              • 【Python】MeCabと極性辞書を使ったツイートの感情分析入門 - StatsBeginner: 初学者の統計学習ノート

                                                負のオーラを自動検出したい 前回のエントリで、著作権侵害にあたる違法アップロード動画を自分のTwitterで拡散してしまっている懸念を考えて、YouTube動画のリンクが貼ってあるツイートをまとめて削除しました。 前回のエントリでも言いましたが、著作権侵害モノ以外にも、「残しておくとまずいツイート」は色々ある可能性があり、たとえば誹謗中傷の類いがあるかと思います。誹謗中傷ツイートを自動抽出する方法はにわかには思いつきませんが、たぶん「クソ」とか「死ね」とか「バカ」とかそういう悪口の辞書が必要になりそうです。 ところで、言語データの分析手法として、単語ごとに感情特性を評価した辞書というものがあちこちで作られていまして、これを使ってツイートがどのような感情を帯びているか分析するということが、よくやられています。Yahoo!がそういうツールを提供してたりもします(参考リンク)。 Yahoo!のリ

                                                  【Python】MeCabと極性辞書を使ったツイートの感情分析入門 - StatsBeginner: 初学者の統計学習ノート
                                                • MeCab互換な形態素解析器Vibratoの高速化技法 - LegalOn Technologies Engineering Blog

                                                  こんにちは。LegalForce Researchで研究員をしている神田 (@kampersanda) です。 LegalForce Researchでは、MeCab互換の形態素解析器Vibrato(ヴィブラ〰ト)を開発しています。プログラミング言語Rustで実装しており、高速に動作することが主な利点です。Vibratoはオープンソースソフトウェアとして以下のレポジトリで公開しています。 github.com 本記事では、Vibratoの技術仕様を解説します。以下のような方を読者として想定します。 自然言語処理の要素技術に興味のある方 データ構造・アルゴリズムに興味のある方 Rustでの自然言語処理に興味がある方 Vibratoについて 最小コスト法による形態素解析 単語ラティスの構築 最小コスト経路の計算 高速化の取り組み 辞書引きのキャッシュ効率化 実装での注意点 連接コスト参照のキャ

                                                    MeCab互換な形態素解析器Vibratoの高速化技法 - LegalOn Technologies Engineering Blog
                                                  • 僕が半年でTOEIC550→840に上げた勉強法を教える - レコメンタンク

                                                    私は TOEIC が 自己啓発 兼 趣味なのですが、きっかけは大学院入試に TOEIC スコアが必要だったからでした。 大学3年で初めて受けたスコアは550…。 旧帝大 院試のライバルは700台、800台も多く、これじゃマズイ!と思いましたが… 問題集を解くものの、文法は忘れ、単語はわからん、リスニングは意味不明、という体たらく。 ですが、下記の勉強法を継続したことで、 3月に550だった TOEIC スコアを7月に745、9月に840まで上げました 。 今は一応900ホルダー(ギリギリ)です。 証拠↓↓↓ 下記の TOEIC 勉強法を 実践できれば 、特に今400〜600台の人は、800台までなら一年足らずで到達できまっせ! お試しあれ! 記事を読む前に さてさて、勉強法を細かく書く前に、ざっくりと言ってしまうと、 TOEIC スコアアップの秘訣は、 『30分でも良いから、ほぼ毎日欠かさ

                                                      僕が半年でTOEIC550→840に上げた勉強法を教える - レコメンタンク
                                                    • 言語処理100本ノックを(第5章まで)やってみた - フツーって言うなぁ!

                                                      久しぶりに技術関係のネタ書きます. 「言語処理100本ノック」という,自然言語処理関係の問題集があることを知ったので取り組んでみました. これは,東北大学の乾・岡崎研究室でのプログラミング勉強会にて使われている教材だそうです. 「100本ノック」の言葉通り,100問の問題からなる問題集をこなすことで,自然言語処理に関する基礎力と,プログラミング言語運用能力が同時に培えるようになっています. こういうものが公開されるとは,「いい時代になったなー」と純粋に思います. www.cl.ecei.tohoku.ac.jp 内容は,自然言語処理だけでなく,データベース,機械学習など,今の言語処理関係の研究に必要なスキルがこれ1つで身につくように設計されています. 対象プログラミング言語はPythonのようですが,基本的に他の言語でも問題なく進められるようにはなっていると思います(言語処理に強いプログラ

                                                        言語処理100本ノックを(第5章まで)やってみた - フツーって言うなぁ!
                                                      • なぜネイティブ英語が聞き取れないのか?原因は? 単語耳と英語舌の作り方・外国語認知メカニズム - ポリグロットライフ | 言語まなび∞ラボ

                                                        はじめに 今回はなぜネイティブの英語・子音が聞き取れない?その原因や英語耳と英語舌の作り方を解説していきます。まぜ、日本人がネイティブの話す英語や子音を上手く聞き取れないのか?という原因について考えていきながら、外国語の認知メカニズムを明らかにします。まずは、外国語聴解に必要な要素(英語が聞き取れない原因)を整理します。その次は、理解される外国語音声の表出するために意識するべきことを確認します。それらの基礎理論を踏まえ、ネイティブの英語耳・英語舌を作りのための具体的なトレーニング方法を説明していきます。最後に、発音の学び方として、トレーニングにおすすめの教材を紹介していきます。 今回のブログではリスニング力の音声認識・認知メカニズムに焦点をあてています。頭の中で日本語から英語に翻訳してしまうなどの問題に対してはチャンク学習(パターンプラクティス)がおすすめです。 www.sunafuki.

                                                          なぜネイティブ英語が聞き取れないのか?原因は? 単語耳と英語舌の作り方・外国語認知メカニズム - ポリグロットライフ | 言語まなび∞ラボ
                                                        • 英語音声・字幕なしで映画を楽しめるリスニングスキルは、こう勉強して身に付けた - こんにゃくマガジン

                                                          はじめに 英語のリスニングに関して「ネイティヴの会話が速くて聞き取れない」「単語は聞き取れるけど、言ってる意味が分からない」という悩みを持っている方も多いかと思います。 英語の勉強を大学受験から本格的に始めた私は、大学受験後は、英語音声字幕なしで映画を見れるようになりたいというモチベーションで英語の勉強をしていました。漠然とした目標なのでサボっている期間もありましたが、TOEIC900も取れて、いつの間にか大体の映画を字幕なしで見れるようになっていました。その過程を思い出しつつポイントをまとめましたので皆様の参考にしていただければ幸いです。 ポイントは以下の目次にある通りなのですが、基礎から順に一つずつ積み上げていくことが重要だと思います。TOEICのリスニングで伸び悩んでいたりする人の話を聞くと、音の聞き分けもリズムもいまいちつかめていない状態で、単語はなんとなく聞き取れているからといっ

                                                            英語音声・字幕なしで映画を楽しめるリスニングスキルは、こう勉強して身に付けた - こんにゃくマガジン
                                                          • Microsoft Word - 大村_文体練習_.docx

                                                            1 卒業研究 ( 文体練習 ) 日本近代文学 柴田勝二ゼミ 外国語学部 南・西アジア課程 トルコ語専攻 8507260 大村真央 2 ( 文体練習 )目次 0 素 1 ひらがな 2 カタカナ 3 ローマ字 4 ギャル文字 5 2ちゃんねる 6 Twitter 7 100 字 8 なんか 9 え~ 10 英訳 11 重複 12 アメリカ人きどり 13 短歌 14 某 15 とても 16 星新一調 17 オノマトペ 18 誤変換 19 ~じゃないですか 20 レストランにて 21 はんたい 22 漢文風 23 和製英語 24 数値 25 漫才 26 あいうえお作文 27 田舎の母への手紙 28 なぜかよめてしまう 29 小学生の日記 30 類義語 31 別の視点からⅠ 32 別の視点からⅡ 33 別の視点からⅢ 34 別の視点からⅣ 35 客観 36 古文風 37 お嬢様 38 事情聴取 39