タグ

2012年12月4日のブックマーク (19件)

  • あるディレクトリ以下の全てのbinディレクトリにPATHを通したい時 - 元RX-7乗りの適当な日々

    Linuxの開発/検証環境とかで色々とプロダクトをインストールした時って、毎度環境変数のPATHを設定するの面倒くさいですよね。 そんな時は、片っ端からbinとかsbinディレクトリにパスを通しちゃいます(^^;) $ export PATH=$PATH:`find /usr/local -type d -name '*bin' | paste -s -d : -` findで引いてきたものをpasteする時に、"-d"オプションで区切り文字に":"を使っておけば良いわけですね。 ちょっとしたTIPSでした。 =͟͟͞͞(๑•̀=͟͟͞͞(๑•̀д•́=͟͟͞͞(๑•̀д•́๑)=͟͟͞͞(๑•̀д•́

    あるディレクトリ以下の全てのbinディレクトリにPATHを通したい時 - 元RX-7乗りの適当な日々
  • 英文中から英単語を集める: どこか別の★

  • https://www.jnlp.org/

    kyopeco
    kyopeco 2012/12/04
  • 形態素解析ツール– 英語と TreeTagger

    形態素解析ツール – 英語と TreeTagger を中心に – 田中省作∗ 1 はじめに コンピュータで自然言語を処理する研究 (自然言語処理: 以後, 言語処理と書きます) も歴史 を重ね,現在, 仮名漢字変換などを代表に, その成果が様々な場面で使用されています. 実際, 後述する形態素解析, 統語解析のレベルであれば, 実用的なツールが公開され, 場合によっては フリーで使用することができるようになってきました. そこで, 稿では, 言語処理の最も基礎 的な要素技術である形態素解析についてお話し, その具体的なツールとして TreeTagger を紹介 します. 2 形態素解析の概略 節では, 形態素解析の言語処理における位置づけを簡単に説明します. 既に形態素解析を 知っている方, ツールに興味がある方は, 節を読み飛ばしても構いません. 言語処理における一般

  • TreeTaggerを使ったときの覚書 - kensuke-miの日記

    とある課題でTreeTaggerを使ってhogehogeしなさい。というのがあったので、やった。 その時の覚書。 使った素材は http://www.gutenberg.org/cache/epub/41425/pg41425.txt Under star-spangled banner 邦訳にすると「星条旗の元で」なのかな? まず、TreeTggerの使い方は http://taichino.com/engineer-life/linux/365 そして、結果を頻度順に並べる http://fuktommy.com/linux/tools そして、上位100件だけを表示する http://linux.just4fun.biz/逆引きUNIXコマンド/指定した範囲の行を取得する方法.html さらに、同じ単語なのに、ちがう品詞を持つ単語(つまり、同じ単語で違うPOSの単語をリストアップする

    TreeTaggerを使ったときの覚書 - kensuke-miの日記
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • はてなブログ | 無料ブログを作成しよう

    2024/09/23 ロッキン2024 サザンライビュで夏の終わりを感じた話。 2024/08/09(ライビュ発表) 2024/08/23(チケット申し込み) 2024/09/14(チケット当選) 2024/09/16(チケット発券) 2024/09/23(ライビュ当日) 2024/08/09(ライビュ発表) サザンの夏フェス出演が最後だと発表されましてやきもきしていると、全国の映画館でライ…

    はてなブログ | 無料ブログを作成しよう
  • TreeTaggerMemo - 投野由紀夫 授業用ホームページ

  • HOME > 語学 > 英語 > Awk でコーパス遊び

    HOME > 語学 > 英語 > Awk でコーパス遊び Awk でコーパス遊び GNU Awk を使い、コーパス(ただのテキストファイルだ)から、KWIC 式のコンコーダンスを作成。出力を複合ソートしたり、CSV に変換して表計算ソフトに読み込んだり、タグ付きコーパスを使って品詞を指定した検索をしてみたりした。 まあ、コーパスツールは GUI でユーザ・フレンドリなものがいくらもあるのだけれど、標準出入力のファンとしてはそれらは豪華すぎるので…… (感謝 to コーパス遊びのキッカケをいただき、またこれらのスクリプトを試用くださりたるH先生) kwic.awk スペースで区切られた単語によって構成されるテキストファイルの各行から(一続きの)単語を検索し、KWIC 整列したテキストを出力する GNU Awk 用のスクリプト。(ptx みたいなもんだよ) こんな感じ $ gawk -f kw

  • Loading...

  • Python: コマンドライン引数の取得 – sys.argv変数

    コマンドラインで与える引数によってプログラムの挙動を変えたいという場面はよくあります。Python ではコマンドライン引数は sys モジュールの argv 属性に文字列を要素とするリストとして格納されています。そして、リストの先頭要素(sys.argv[0])はスクリプトファイル名となっています。 ソースコード # coding: Shift_JIS import sys # モジュール属性 argv を取得するため argvs = sys.argv # コマンドライン引数を格納したリストの取得 argc = len(argvs) # 引数の個数 # デバッグプリント print argvs print argc print if (argc != 2): # 引数が足りない場合は、その旨を表示 print 'Usage: # python %s filename' % argvs[0]

    Python: コマンドライン引数の取得 – sys.argv変数
  • 「入門自然言語処理」を読む準備をする

    うーむ。あんまり時間かけたくないので、この記事を参考にyumでpython26としてインストールした。 RPM置き場はこちら。記事の時点とはファイル名が変わってるので注意。 % wget http://dl.iuscommunity.org/pub/ius/stable/Redhat/5/i386/epel-release-1-1.ius.el5.noarch.rpm % wget http://dl.iuscommunity.org/pub/ius/stable/Redhat/5/i386/ius-release-1.0-6.ius.el5.noarch.rpm % sudo rpm -i epel-release-1-1.ius.el5.noarch.rpm % sudo rpm -i ius-release-1.0-6.ius.el5.noarch.rpm % sudo yum in

  • NLTK :: Natural Language Toolkit

    Natural Language Toolkit¶ NLTK is a leading platform for building Python programs to work with human language data. It provides easy-to-use interfaces to over 50 corpora and lexical resources such as WordNet, along with a suite of text processing libraries for classification, tokenization, stemming, tagging, parsing, and semantic reasoning, wrappers for industrial-strength NLP libraries, and an ac

  • 学振特別研究員は常勤研究職への近道 - 空飛ぶ教授のエコロジー日記  (Y日記)(研究業務用)

    学術振興会プログラムオフィサー(正式には学術システム研究センター生物系科学専門調査班専門研究員:名簿はコチラ。このメンバーで科研費・学振特別研究員の審査員を選ぶ)をつとめているので、かねてから知りたかった特別研究員の「個体群動態」に関する資料が入手できる。 会議の配布資料とウェブサイトに公表されている資料から、将来の見通しを推測して、先日の会議で報告した。良くも悪くも、委員の「感覚」とかなりかけはなれた実態がある。 きちんとした数字の裏づけにもとづいて、政策決定をする必要があるのだが、現実には必ずしもそうなっていない。私で可能な範囲で、改善の努力をしたい。 いくつか、これまでに判明した重要なポイントを要約しておく。 1 学振特別研究員に採用された者は、就職率が抜群に良い。 平成15年度終了者(平成13年採用)の場合、PDでは43%が常勤研究者、19%が非常勤研究者、27%が他のポスドク

    学振特別研究員は常勤研究職への近道 - 空飛ぶ教授のエコロジー日記  (Y日記)(研究業務用)
  • 日本学術振興会特別研究員――その光と影

    この原稿を書くにあたり、横山さん(仮名)をはじめとした日学術振興会特別研究員の方々より情報を提供していただきました。お礼を申し上げます。また、他に参考になるご意見を頂戴した数多くの方にも、感謝いたします。 この原稿では、日学術振興会特別研究員(通称「学振」=がくしん)について書いています。ただし、学振を受けようとしている大学院生向けのものではありませんので、くれぐれも誤解しないでください。(そういう方は、もっとためになるページを見てください)と思いましたが、途中に学振申請マニュアルのようなものを載せることになりました。そこは参考になるかも知れません。(これは学振に採用された方に匿名で書いていただいたものです。協力してくださった方に感謝します) この原稿を書くに当たっては、学振に採用された方と採用されなかった方からそれぞれ情報を提供していただきました。それぞれ複数名からの証言に基づいて書

  • taichino.com – 永遠のネバーランド

    データサイエンスな人たちがRでゴニョゴニョしていろんなデータをグラフにしてくれてるんですけど、僕のいるチームからの視点だと、ちょっとカユいところに手が届いてないんですよね。 なんですけど、データサイエンスな人たちのリソースは貴重で、気軽に色々お願い出来ない雰囲気なので、まぁリポジトリも社内には公開されているし、自分でやるかっていうのでRscriptをちょっと触ってみる事にしました。 Continue reading “Hello Rscript World” 今日はGoogle CodejamのQualificationラウンドでしたね。 張り切って参加したもののMinesweeper Masterが、解けそうで解けなかったので書いときます。マインスイーパが1クリックで解ける条件として、空のセルは1つの領域に固まってる必要があって、それをボードのサイズで細かく場合分けして行く感じでした。

  • アホみたいに楽しく★100%英会話を身につける方法

    こんにちはーCozyです。 今日は最近注目されているAI人工知能ChatGPTを使って どのように英語学習を効率化できるかついてお話しします。 先日新しくリリースされた『GPT-4o』が 使えるようになったことをお伝えしました。 GPT-4oは音声会話機能が非常に優れており、 まるでネイティブと話しているのではないかのような スムーズな会話が可能です。 これは英語学習にものすごく使えるのではないか? ....そう考え1週間ほどGPT-4oを使い倒してみました。 その体験レポートを今回もお届けします。 いろいろな声のGPT-4oと会話する方法 オンライン英会話だと、いろいろな先生と話せるから、 いろいろな英語の話し方に慣れることができる。 でも、GPT-4oだと、 結局1つの声だしな....と思っていたのですが なんと、 【4人の声に切り替えて会話することができます】 やり方は、、、 1

    アホみたいに楽しく★100%英会話を身につける方法
  • naoyaのはてなダイアリー

    ときどき、たまたま自分がそのとき考えていたことについてそれを補強するような材料が偶然たくさん集まってくる、なんてことがあります。そんな出来事があったので、ちょっとブログを書いてみようかなと。 以前に HBFav を作ったときこんなことを書きました。 Mark Zuckerberg は、いずれみんな、ニュースは友人知人経由で知ることになるだろうと言っていました。自分もそうなるだろうと思います。 4年ぐらいが経ちましたが、その思いは以前よりも増して確信めいたものになってきています。 ところで先日、Twitter の iOS アプリに「ニュース」という機能が追加されました。人によっては出てないそうなのでまだテスト中か、もしくは既に削除されているのかもしれないですが。 この機能についての自分の感想は以下のようなものでした。 もうすこし補足します*1。 Facebook や Twitter のような

    naoyaのはてなダイアリー
  • liber studiorum

    音楽とその他」改め科学教室:「能動的に学んで」 学生ら100人が受講--岡山 /岡山  高校、大学生に科学に親しんでもらう連続講座「楽しむ科学教室」が20日、岡山市駅前町2のサン・ピーチOKAYAMAであり、参加者約100人が第一線で活躍する科学者の知見に触れた。 ノーベル物理学賞の小柴昌俊東大名誉教授が理事長を務める平成基礎科学財団が主催。小柴名誉教授は「“楽しむ”とは能動的に学ぶこと。先生から聞いたことを自分で問い直し、さらに先生に質問をぶつけてほしい」とあいさつした。 著書「生物と無生物のあいだ」などで知られる分子生物学者、福岡伸一・青山学院大教授が「生命観を問い直す」と題して講義。福岡教授は狂牛病問題の例を挙げて「草動物の牛に、羊や牛の死体を加工した肉骨粉を与えることで、人間はある種の共いを生み出した。この結果、来、羊にしかなかった病気が種の壁を超えて牛に感染し、その影