タグ

2008年2月19日のブックマーク (7件)

  • MODULE.JP - 日本語に絡むUnicodeブロックとスクリプト(正規表現)

    といった感じ。ちなみにjava.util.regexとPerlのUnicodeブロックは接頭子Inを使うが、.NETの場合は接頭子Isを使う、という差異があります。 Unicodeスクリプトとブロックの違いがビミョーに見えるけど、ブロックがコードブロックをゴリッと指定したものに対して、スクリプトは特定言語に関係する文字の種類を直接指定するものなのでブロックよりも断定的、って感じで見れば良かなと。ちなみにUnicode関連のドキュメントによるとUnicodeプロパティとスクリプトで日語の文章を表そうとすると m/(?:(?:\p{Hiragana}|\p{Katakana}|\p{Han}|\p{Latin}|\p{Common}) (?:\p{Inherited}|\p{Me}|\p{Mn})?)+/x; こんな感じになるそうな。実際流通している文章はこれより多様なので現実とは微妙に乖離

  • http://module.jp/dist/web%20db-press19-regex1.pdf

  • Hephaestus: CMU Speech Software Collection

    Flite (festival-lite) is a small, fast run-time synthesis engine developed at CMU and primarily designed for small embedded machines and/or large servers. Flite is designed as an alternative synthesis engine to Festival for voices built using the FestVox suite of voice building tools. Flite 1.4-release is now released as source. Flite offers: Completely in C (no C++ or Scheme) for portability, siz

  • HOME > 馬鹿 > 日本語テキスト読み上げ(ガイジン風)

    HOME > 馬鹿 > 日語テキスト読み上げ(ガイジン風) 日語テキスト読み上げ(ガイジン風) まずは、サンプルをどうぞ(mp3)。カビパン男と私、東京都特許許可局、金太負けるな。 日語読み上げのフリーなツールが何かないものかと、考えた。英文用のなら、Linux 環境でも簡単に手に入るのだが…… そこで、アメリカ人が読めるような形でアルファベット表記してやれば、英文用の読み上げソフトが使えそうだと、まあ安易に考えたわけだ。 まず、漢字かな交じりの文を kakasi で平仮名にして、sed のスクリプトでアルファベット化(kakasi でローマ字出力しただけでは駄目駄目なのだ)。それを flite というアメリカ英語読み上げソフトで読ませてみた。費用0円。 $ echo "カビパン男と私" | kakasi -JH -KH | sed -f nihongo.sed | flite -

    koki-h
    koki-h 2008/02/19
    かっこいい。
  • HOME > 電算 > sed メモ

    HOME > 電算 > sed メモ sed メモ sed メモ(第二版)があります。そちらを見て下され。(2015-5-26) 2014-10-04 一部更新 私はこの小さな働き者が大好きだ。 gnu.org にある "sed, a stream editor" (http://www.gnu.org/software/sed/manual/sed.html) が何かと有用。日語訳が、http://www.bookshelf.jp/texi/sed/sed-ja_toc.html にあったよ。 目次 sed と改行 2 行にわたるパターンにマッチさせる sed で段落内改行を削除 sed で改行コードの変換 コマンドたち ホールドスペースの利用 数字をインクリメントする ○○行ごとに区切る 一行の字数をそろえる URL の抽出 sed と改行 こちらに新版があります(2015-5-26

    koki-h
    koki-h 2008/02/19
    Tips集。侍が書いている。
  • エレコムわけありショップ

    お買得なわけありアイテムを探そう! iPhoneシリーズケース&フィルム スマホシリーズケース&フィルム スマホアクセサリケーブル・充電器・バッテリー iPadシリーズケース&フィルム タブレットケース&フィルム ヘッドホン・イヤホンマイク付・ワイヤレス 電子タバコアクセIQOS・glo・Ploom TECH ネットワーク・LAN関連ルーター・ケーブル バッグ・ポーチカメラバック・ケース パソコン周辺機器マウス・キーボード

    koki-h
    koki-h 2008/02/19
    安い
  • 課題、ペイン、そしてソリューション(2) IT産業の中核問題とは | タイム・コンサルタントの日誌から

    知り合いの大学教員にきいた話だが、この2~3年、「情報」が名前についている学科の入学志望者数が急減しているという。これが一部の大学だけの話なのか、あるいは全般的な傾向なのかは、定かではない。しかし、いっとき学部学科名に「情報」だとか「システム」だとかつけるのが流行したものの、ここにきて曲がり角にさしかかっているらしい。 『情報』と名のつく学科への志望者が減っている理由は、おそらくIT産業ならびに情報処理技術者にたいするイメージダウンと関係がある、というのがその知人の意見だ。つまり、プログラマとかシステム・エンジニアになって就職しても、低賃金・長時間労働の業界で、すり減るまでこき使われるだけだ、というイメージがしだいに定着してきているらしい。もちろん、よほど結構な大学を出て大企業に就職できれば、システム構築業務といっても、外注先にわたす仕様書だけ書いていればいいわけだ。しかし、そうでない一般

    課題、ペイン、そしてソリューション(2) IT産業の中核問題とは | タイム・コンサルタントの日誌から