タグ

解析に関するvivit_jcのブックマーク (4)

  • 自分の英語文書をマイニングして次に学ぶべき単語リストを自動生成する方法(暦本式語彙増強法) - NextReality

    英単語の語彙をどうやって増やしたらいいだろうか。やみくもに単語集みたいなものを順に覚えていくのも道程が長そうだ。また、一般論ではなく自分がよく書く分野に特化して語彙を増やしたい。ということで、テキストマイニングを使ってやる方法を考えてみた。方針は以下の通りである: 自分が今までに書いたすべての(英語)の文書を解析して、品詞ごとに出現回数でソートする。 つぎに、自分の所属するコミュニティの文書(たとえば自分がよく参加する学会に掲載される論文など)をなるべく大量にあつめて、同じように品詞ごとに出現回数でソートしておく。 両者を比較して、そのコミュニティでは使用頻度が高いにも関わらず、まだ使ったことのない単語を抽出して自分専用の「単語集」をつくる。 こうやって抽出された単語集を勉強すれば、一般的な単語集を使うよりも効率がいいのではないだろうかという目論みだ。対象となる分野を選んでいるのは、たとえ

    自分の英語文書をマイニングして次に学ぶべき単語リストを自動生成する方法(暦本式語彙増強法) - NextReality
    vivit_jc
    vivit_jc 2014/01/15
    面白い やってみたいけど自力で書いた英文がなさ過ぎて><
  • AVタイトルの特徴分析 その2 - oscillographの日記

    前回の記事はこちら(形態素解析に基づくAVタイトルの特徴分析) ニコニコ学会から「内容的に全年齢対象で発表は無理」と言われてしまったので こちらで結果の報告をさせていただきたいと思います。 特徴的な語に関する経年変化 まず、単純な集計結果をもとに特徴のある単語を3パターンに分類し それぞれについて見ていこうと思います。 年々割合が上がっている単語(供給Up) どうですか、この供給量アップ。 「○出し」はいったん割合が落ち込みましたが2010年を境に徐々に回復しつつあります。 年々割合が下がっている単語(供給Down) 私は「女子高生」好きなんですけどね。 年々割合が上がっても下がってもいない単語(安定供給) 「素人」についての予想ですが、「素人が来る!」と考えて2011年に多く出したのが失敗して年々下がっていると考えられます。 人、熟女は比較的安定していますね。 主成分分析による各年の特

    AVタイトルの特徴分析 その2 - oscillographの日記
  • mylinuxdiary.tk

  • 裏CHUNSOFT

    裏CHUNSOFT ようこそ 裏CHUNSOFTはSFC版風来のシレンの改造・解析を扱っているサイトです。管理人はオヤジ戦車です。 当サイトはSFC版風来のシレンを一通り遊んだ方を対象にしています。 まだフェイの最終問題をクリアしていない方には、他のサイトに行くことをお勧めします。 改造の方法が書かれたページは、エミュレータ上で風来のシレンの操作が可能な環境にあり、尚かつ16進数等の知識があることを前提にしています。 それらの初歩的な解説は行いませんので分からない方は勉強しましょう。 目次 データ集 通常のプレイでも役に立つかも知れないデータ集です。 スクリプト ゲーム中の計算をJavaScriptでシミュレートします。 コード表 改造に必要となる様々なコードの表です。 セーブデータ・RAM改造 SRMファイルを改造したり、改造コードを使います。 ROMイメージ改造・解析 ROMイメージを

  • 1