タグ

speechに関するtarchanのブックマーク (20)

  • 知ってた?!あなたのMacの中にSteve Jobsの有名なスタンフォード大学卒業式のスピーチ全文が隠されていたことを! | ゴリミー

    Appleファンの中には猛烈なSteve Jobs氏信者という人もいる。僕はそれほど詳しくないが、今のAppleがSteve Jobs氏の思想がもととなっていることを考えると尊敬できる部分は多いと感じる。亡くなった今もなおその思想が社内で受け継がれていることが彼の偉大さを物語っているのではないだろうか。 Steve Jobs氏と言えば各種新製品発表イベントで登壇した際に心動かされるプレゼンをすることで有名だが、特に有名なのはスタンフォード大学卒業式で卒業生に向けたスピーチではないだろうか。 実はこのスピーチ、もしあなたがPages.appをインストールしている場合、全文があなたのMacの中にあることを知っていただろうか。そう、あなたのMacの中にかの有名なスタンフォード大学卒業式のスピーチ全文が隠されているのだ! OS X Dailyがこのイースターエッグを取り上げていたので、そのスピーチ

    知ってた?!あなたのMacの中にSteve Jobsの有名なスタンフォード大学卒業式のスピーチ全文が隠されていたことを! | ゴリミー
    tarchan
    tarchan 2014/08/22
    >/Applications/Pages.app/Contents/Resources/Apple.txt
  • JavaScriptでMacに歌ってもらう - Okiraku Programming

    最近のChrome, SafariのJavaScriptには音声合成APIが入っています。 使い方は簡単で、JavaScriptコンソール等で var msg = new SpeechSynthesisUtterance('こんにちは!'); msg.lang = "ja-JP"; // 言語指定 window.speechSynthesis.speak(msg); のようにするだけで喋ってくれます。 音声エンジンを変えることも可能です。使える音声の一覧を var voices = speechSynthesis.getVoices(); で取得すると、voicesに音声オブジェクトのリストが返ってくるので、この中のlangやnameを見て使いたいものを msg.voice = voices[3]; などとSpeechSynthesisUtteranceオブジェクトのvoice属性に指定す

    JavaScriptでMacに歌ってもらう - Okiraku Programming
    tarchan
    tarchan 2014/05/26
    >最近のChrome, SafariのJavaScriptには音声合成APIが入っています。
  • IDEA * IDEA

    ドットインストール代表のライフハックブログ

    IDEA * IDEA
  • https://jp.techcrunch.com/2011/03/23/20110322chrome-11-beta/

    https://jp.techcrunch.com/2011/03/23/20110322chrome-11-beta/
  • 音声検索 API を使った Android アプリ開発

    先日リリースして以来、多くの皆さんに好評をいただいている Google 音声検索ですが、開発者の方の中には、この認識エンジンを使っていろいろなアイディアを実現したい、と思われた方もいらっしゃるのではないでしょうか。 実は、Google 音声検索の認識エンジンを使った Android アプリケーションは、どなたでも開発できるようになっています。Recognizer Intent API (サンプルコード)を使えば、さまざまなサービスに音声認識を組み合わせることができます。例えば、天気予報のアプリで場所の設定を声でできるようにしたり、乗換案内のアプリで駅名を音声入力できるようにするなど、さまざまな可能性があります。 なお、Google 音声検索の認識エンジンは、検索キーワードの認識に特化しているため、複数のキーワードを認識するのに適しています。逆に、会話の聞き取りなどには適していません。このよ

    音声検索 API を使った Android アプリ開発
  • SayKana - Mac用音声合成プログラム

    SayKanaは、Mac OS X上で動作する日音声合成ソフトウェアです。OS Xに付属の say コマンド(英語音声合成)と同様の機能を実装しています。 AquesTalk音声合成エンジンをMac OS X 上に移植したもので、基的に『かな』からの音声合成であり、漢字かな交じり文は読み上げられません。 商用でなければ無償でご利用いただけます。 特徴 sayコマンドと同様の使用方法・インターフェース 女声/男声の声種切替可能 音声のAIFF保存 発話速度の変更 制限の少ない入力文字列 フロントエンドに簡易読みモジュールを含めましたので、音声記号列の表記仕様に合致しない文字列からでも、適切な読み上げを行うことができます。

    tarchan
    tarchan 2009/12/13
    ゆっくりしていってね?
  • 音声入力に魅せられて:難聴者にとって「音声入力」は役に立つのか? (NO.122)

    今まで聞こえていた音が突然聞こえなくなる、聞こえにくくなる、これが難聴の症状です。難聴者は、身近な人々との会話で、相手の話が聞こえなくなってしまうのですから、それは深刻な話です。決定的に不便な生活を余儀なくされます。 「音声入力」を長いことやっている私のところに、最近、難聴者の方々からのお問い合わせが増えてきております。この難聴者に接して、彼らが「音声入力」に何を求めているのか?どういう使い方をすれば「音声入力」が難聴者によって有効なのか?今回のブログではこの問題を中心に「音声入力」が難聴者の福音になるのか、この問題について考えてみようと思います。 (1)難聴者が「音声入力」に求めるものは過大すぎます。 多くの難聴者の人たちが「音声入力」に期待することは、他人の会話、スピーチ、講演などの音声をレコーダー(例えばDPM9620)に録音し、それを音声認識ソフトにかければその音声が自動的に文章化

    tarchan
    tarchan 2009/11/25
    アナウンサーの声を登録すればニュースのテキスト変換は可能なのかな?
  • 第78回 音声言語情報処理研究会 (SIG-SLP)

    第78回 音声言語情報処理研究会 (SIG-SLP) (第5回 音声言語情報処理技術デベロッパーズフォーラム) 日時: 平成21年10月23日(金) 会場: 早稲田大学 理工学部/西早稲田キャンパス(旧大久保キャンパス)55号館N棟1F大会議室 (〒169-8555 東京都新宿区大久保3-4-1) 地理案内 10月のSLP研究会は、この数年にわたりご好評を頂きました 「音声言語情報処理技術デベロッパーズフォーラム」として開催し、 音声認識音声合成などの実用化に焦点を置いた議論を行いたいと思います。 特に、 ユーザビリティ、ユーザエクスペリエンス、ユーザ習熟度、ユーザプロファイル、 次世代音声UI(適応型、ポータブル、自然性等)など、 日頃あまり議論されることのない、ユーザ志向のトピックスの議論を深める イベント企画を計画しております。 プログラム: ***当日予稿集*** (IDとパスワ

  • 【イベントレポート】 【Microsoft Open House 2009レポート】Windows phone/Microsoft Auto編 ナイトライダーを彷彿とさせる車載用音声認識/合成音声機能のデモなど

  • ケロ録 -ケロログに音声投稿できる iPhoneアプリ-

    価格 : 無料 最新バージョン : 1.00 対応デバイス : iPhone, iPod touch(第2世代) ケロ録は、iPhoneやiPod touchで「ケロログ」への音声投稿ができる無料アプリです。 シンプルな操作で音声を録音、すぐに記事を作成して、簡単に音声ブログを更新できます。 外出先で起きた出来事をリアルタイムに録音・投稿したり、音声メモとして便利に使う事もできます。 ユーザ情報の設定 まずは、「設定」画面でケロログのユーザ情報を入力します。 「設定保存」ボタンで設定完了です。 入力フィールドの下に現れるボタンをタップすると、 あなたのケロログページをSafariで確認することができます。

  • 音声入力に魅せられて:「音声入力」は考える力を後押しする (NO.118)

    文章作成の作業は、頭脳の働きと密接な関係にあることは古くからいい伝えられてきております。私も今から30年ほど前、ひらがなタイプライターをブラインドタッチで叩いていた頃、私の頭脳の一部が指先に移っているのではないかと錯覚する思いをして、頭脳の存在が意外に身近にある経験をしました。今まで未知の世界の代表として、いわばブラックボックスの扱いをしてきた頭脳の一部が、文章作成を行う作業を通して、とても身近な存在に思えたことに、ひどく感動したのでした。 その後、日語ワープロで「漢字変換キー」を叩くことになってしまってから、指先に私の頭脳の一部が存在する意識は薄らいでしまったようです。ところが「音声入力」技術にのめり込むようになり、この方法で文章を作るようになってから、またまた頭脳の存在が私にはとても身近なものになってきました。 今号のブログでは、「音声入力」魅力シリーズの第8弾として、「音声入力」法

    tarchan
    tarchan 2009/08/19
    音声入力の研究
  • ゆっくり百人一首 for iPhone リリース | N.Yamazaki's blog

    AquesTalkを利用したiPhoneアプリ『ゆっくり百人一首』をリリースしました。 これは、百人一首の読み手として使うためのアプリで、以前にWindows版を期間限定でリリースしたものをiPhone/iPod touch上に移植したものです。 開発中に『ミク百人一首』が販売され、先を越された感はありますが・・・ ゆっくり百人一首 AquesTalkは、既にSayKana でMac OS X上に移植済みですが、iPhoneプラットフォーム上でのAquesTalkは、今回が初めてのリリースとなります。 といっても、どちらもLinuxに近いので、開発に際してのAquesTalk音声合成エンジン自体はコードをいじることなく再コンパイルするだけなんですけどね。 iPhoneアプリを作るのは初めてでしたが、プログラム開発よりもリリースの手順に戸惑いました。しかしながら、オンラインだけでリリースから

    ゆっくり百人一首 for iPhone リリース | N.Yamazaki's blog
  • Engadget | Technology News & Reviews

    Anker's 3-in-1 MagSafe foldable charging station drops back down to its Prime Day price

    Engadget | Technology News & Reviews
    tarchan
    tarchan 2009/07/27
    ふりがなはマメに入力してるけど、滑舌悪くてうまく使えない><
  • VoiceOverの音声合成エンジンは? | N.Yamazaki's blog

    新しい iPod shuffle の目玉の機能の VoiceOver 規則音声合成技術って、これまであまり目立った存在ではなかったのですが、Appleのこの製品によって、今まで触れることのなかった非常に多くの方々がこの技術に触れることは間違いないでしょうね。 さて、Appleはこの音声合成に何処製のエンジンを使っているのでしょう? (ということは、少なくともウチのエンジンではないということ。残念!) Appleのホームページによれば、iTunesのMac OS X Leopard版とWindows版では前者のほうが『非常に優れた英語の音声』と書いてあるので、英語のエンジンは少なくとも2種類存在するのですが、日語の場合もMacWindowsでは異なるのでしょうか? 今回は、Windows版の日語のエンジンだけをざっくり調べてみました。 で、判定結果は Nuance製 "REALSPEA

    VoiceOverの音声合成エンジンは? | N.Yamazaki's blog
    tarchan
    tarchan 2009/06/03
    アーチスト名の読みはiPhoneで見るようになってから入力するようにしてるな
  • 高音質で思い通りのフレーズを歌わせることができるクワイア(合唱団)音源 | クリエイティブ | マイコミジャーナル

    初回出荷分のみ専用拡張音源「Voices of Apocalypse」が付属。名称通り、黙示録の歌声を収録した音源キットだ ハイ・リゾリューションは、米EastWestのクワイア(合唱団)音源「EastWest/Quantum Leap Symphonic Choirs」を発売した。価格はオープンプライスで、実売予想価格は5万9,800円。 製品は、オーケストラ音源の定番「EastWest/Quantum Leap Symphonic Orchestra」と同じ制作チームが手がけ、収録も同じホールで行ったという世界最高峰を標榜する合唱団音源。録音は至近距離用「クローズ・マイク」、中距離用「ステージ・マイク」、遠距離用「ホール・マイク」の3カ所で行い、それぞれ24bitステレオレコーディング。データ総容量37GBという高品位なサウンドライブラリだ。従来の合唱団音源では、抽象的なフレーズしか

  • ケータイ動画から多言語ブログ自動作成 NECが新システム

    NECは3月30日、携帯電話のカメラで撮影した動画をサーバにアップロードすると、動画中の音声をテキスト化して外国語に翻訳した上で、関連する映像やBGMを付けたブログを自動作成できる「多言語マルチメディアブログ創作システム」を開発したと発表した。 音声認識エンジンで、動画中の日語音声をテキスト化。雑音を含む音声メッセージも高精度に認識できるという「耐雑音音声認識技術」を導入し、屋外など雑音が多い環境で撮影された動画の音声も、高精度で認識できるようにした。 音声から抽出した日語テキストは、英語中国語など多言語に自動翻訳。翻訳されたテキストを解析し、関連するイラストや映像、音楽BGMなどの素材をネット上から検索する。 新システムを使えば、動画を撮影するだけで外国語で情報発信でき、世界中の人々と交流できるとしている。早期の実用化を目指して研究を進める。

    ケータイ動画から多言語ブログ自動作成 NECが新システム
  • 全文翻訳は適法か - 理系兼業主婦日記

    知的財産 |  先頃、村上春樹氏がイスラエルの文学賞である「エルサレム賞」を受け、その受賞スピーチが注目を集めました。日の各紙を含めて多くの報道機関が部分的な引用のみにとどまった中、イスラエルのHaaretz紙のみが、氏のスピーチの全文を掲載しました。 これを受けて、日のブロガーたちが次々とその全文翻訳を試み、配信し、多くの読者を集めたようです(村上春樹さんの受賞スピーチ、日のブロガー陣がスピード翻訳 「ハルキ風」も (ITmedia))。一部では、日の報道機関が全文を配信しなかったことについての批難の声も上がっていました。  インターネットが普及した今日、このような民間のボランティアによる知の共有に一定の利点があることは否定しません。しかし、あくまで現行の著作権法に照らした場合、このような行為は適法であるといえるのでしょうか?  現行の著作権法が、現在の著作物の利用実態に即したも

  • 三大紙によるオバマ演説の翻訳比較は勉強になるなあ:栗原潔のテクノロジー時評Ver2:オルタナティブ・ブログ

    はてな匿名ダイアリーにオバマ大統領就任演説の原文、そして、朝日、読売、毎日による翻訳文を列挙してまとめて下さっている方がいます(1、2、3、4、5、6、7、8、9、10)。 これは素晴らしい試み。 この種の演説は英文としては翻訳しにくい部類に属すると思いますが、三紙を比較してみると翻訳テクニックの勉強になります。三紙それぞれ良いところも悪いところもあるのですが、たとえば: Forty-four Americans have now taken the presidential oath (M)これまで、44人の米国人が大統領としての宣誓を行った。 (A)これで(私を含め)44人の米国人が大統領の宣誓をしたことになる。 (Y)これで44人の米国人が大統領就任宣誓を行った。 ちょっと微妙ですが、これに関しては毎日の誤訳(少なくとも誤解される表現)と言ってよいでしょう。現在完了形とnowのニュア

    三大紙によるオバマ演説の翻訳比較は勉強になるなあ:栗原潔のテクノロジー時評Ver2:オルタナティブ・ブログ
  • Obamaのスピーチライター Jon Favreau @ 米国 - 関心空間

    Obamaのスピーチライター Jon Favreau @ 米国 セルフインフォ とは? このキーワードの内容に関わる方が 書いたキーワード(記事)です。 詳しくはヘルプをご覧ください。 昨日のオバマの就任式。 「スピーチが素晴らしかった!」と涙で語っていたブラックのおばちゃん達。 いや・・・スピーチライターが素晴らしいんだって・・・と冷めた目でみていた私ですが、このスピーチライターのジョン君27歳は、昨年からオバマよりもアメリカの若い女の子たちの注目の的なわけで。 ファッション雑誌などに取り上げられるほどの人気。 「セクシー、キュート」と書いてありました。 彼が随筆につかうスターバックスの店長のインタヴューもあり、ミーちゃん&ハーちゃんとしてはジョン君行きつけのスターバックスへ行きたい衝動にかられたものです。。。 というワケで、オバマのスピーチが素晴らしいのではなく、「オ

  • グーグル、音声で検索可能な「iPhone」アプリをまもなく発表へ

    Googleは米国時間11月14日、「iPhone」向けのモバイル検索アプリケーションのバージョン2をリリースする見込みだ。新しいバージョンでは、古いバージョンと同じように、「Safari」ウェブブラウザのモバイル版を開かずにGoogleで検索したり、連絡先を探したり、現在位置から検索結果を絞り込んだりすることができる。大きな変更点は、キーボードをまったく使わずに検索可能な音声検索が追加されたことだ。 Googleは、音声とキーボード入力を実に巧みに区別している。iPhoneの加速度センサーと近接センサーを使って、利用者が携帯電話を口元に持っていったことを判別できる。後は声を出すだけで、ユーザーの音声が処理されて検索クエリに変換される。これにはGoogleGOOG-411番号案内サービスと同様に、推測変換も含まれる。音声検索はウェブ検索と連絡先の両方に対応しており、連絡先の音声検索アプリ

    グーグル、音声で検索可能な「iPhone」アプリをまもなく発表へ
    tarchan
    tarchan 2008/11/15
    本体が音声対応しないと使いにくくないだろうか?
  • 1