並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 34765件

新着順 人気順

recognitionの検索結果81 - 120 件 / 34765件

  • くらげ@ものをかく38歳児 on Twitter: "人工内耳をつけて「これまで使わなかった脳が成長する」って経験をした身からすると乙武洋平さん(@h_ototake )がいまやってる義足プロジェクトがどんだけきっついかわかるんで応援したい。金ないけど。サイボーグの先輩としてアドバイスさせてくれないかな。"

    人工内耳をつけて「これまで使わなかった脳が成長する」って経験をした身からすると乙武洋平さん(@h_ototake )がいまやってる義足プロジェクトがどんだけきっついかわかるんで応援したい。金ないけど。サイボーグの先輩としてアドバイスさせてくれないかな。

      くらげ@ものをかく38歳児 on Twitter: "人工内耳をつけて「これまで使わなかった脳が成長する」って経験をした身からすると乙武洋平さん(@h_ototake )がいまやってる義足プロジェクトがどんだけきっついかわかるんで応援したい。金ないけど。サイボーグの先輩としてアドバイスさせてくれないかな。"
    • 秋元@サイボウズラボ・プログラマー・ブログ: reCAPTCHA - キャプチャを利用した人力高性能OCR

      reCAPTCHA という新サービスはすごい。その構想力には感動させられた。 念のためにCAPTCHA(キャプチャ)について説明しておくと、スパムプログラム(bot)と人間のユーザを見分けるための簡単な(しかし機械にとっ […] reCAPTCHA という新サービスはすごい。その構想力には感動させられた。 念のためにCAPTCHA(キャプチャ)について説明しておくと、スパムプログラム(bot)と人間のユーザを見分けるための簡単な(しかし機械にとっては難しい)クイズのことだ。ある程度ウェブを使っている人なら、ネットサービスの登録時やコメントの書き込み時などに、読みにくく加工されたアルファベットを読まされたりした経験があるだろうと思う。 それらのサイトでは、あなたが人間にしかできないクイズを解いたのを見て、ユーザ登録やコメントの投稿を受け付けたりする仕組みになっているわけだ。文字を読む以外のC

      • Graphic Design Links | Best Graphic Design Links | 80+ Graphic Design Links | Outlaw Design Blog - A Graphic Design Blog

        Enhancing Tourism Experience: The Role of Graphic Design in Hotels and Tourism Applications The Importance of Graphic Design in Tourism In today's highly competitive tourism industry, graphic design plays a crucial role in attracting and engaging travelers. From brochures and websites to mobile applications and signage, visually appealing design elements are essential for capturing the attention o

        • 2016年のディープラーニング論文100選 - Qiita

          これはFujitsu Advent Calendar 2016の11日目の記事です。 掲載内容は個人の意見・見解であり、富士通グループを代表するものではありません。なお、内容の正確性には注意を払っていますが無保証です。 はじめに この記事では先月今年発表されたディープラーニング論文(ArXivでの発表時期、発表された国際会議が2016年開催またはジャーナル掲載が2016年のもの)から私が個人的に重要だと思った論文を収集しています。また、2015年末ごろの論文も重要なものは採用しています。 以下の投稿も合わせてご覧ください。 2017年のディープラーニング論文100選 DeepLearning研究 2016年のまとめ 2016年の深層学習を用いた画像認識モデル foobarNet: ディープラーニング関連の○○Netまとめ NIPS2016実装集 ディープラーニングにとっての2016年 20

            2016年のディープラーニング論文100選 - Qiita
          • iPhone・Androidで高速に日本語音声入力するためのベストプラクティス

            先日Twitterで「大学生がスマートフォンでレポートを書いている」というツイートが話題になっており、それに対して反応している方達もほぼ全員が「スマートフォンでレポートを書くのは効率が悪い」という前提で話をしていることに大変違和感を覚えました。 なぜなら私はこのブログはもちろん、技術書を執筆するときでさえ主にスマートフォンで下書きをしているからです。 PCを使うのは、ほぼスクリーンショットの撮影と最後の仕上げだけです。 その方が、最初からPCで文字入力するのに比べて圧倒的に効率が良いです。 この記事では、iPhoneとAndroidそれぞれで音声入力を効率よくおこなう方法について解説します。 iPhone・iPadの場合 先に結論から申し上げると、iPhone・iPad・Macの日本語音声入力は、AndroidのGoogle音声入力に比べて認識精度が低く、認識できる単語が少ないです。 仕事

              iPhone・Androidで高速に日本語音声入力するためのベストプラクティス
            • スウェーデンの教科書に書いてある「子ども」の詩の本質はなにか、スミレの花を - ネットロアをめぐる冒険

              子供の育て方については百家争鳴という感じでしょうが、「スウェーデンの教科書より」という、こんなツイートがバズっていました。 「スウェーデンの教科書より」 pic.twitter.com/k865kbdwRN — ひろ (@6YJtuu0VgnbF4ND) April 14, 2019 画像を書き出すと、以下のようになります。 批判ばかりされた子どもは、非難することをおぼえる 殴られて大きくなった子どもは、力にたよることをおぼえる 笑いものにされた子どもは、ものを言わずにいることをおぼえる 皮肉にさらされた子どもは、鈍い良心の持ち主となる しかし、激励をうけた子どもは、自信をおぼえる 寛容にであった子どもは、忍耐をおぼえる 賞賛をうけた子どもは、評価することをおぼえる フェアプレーを経験した子どもは、公正をおぼえる 友情を知る子どもは、親切をおぼえる 安心を経験した子どもは、信頼をおぼえる

                スウェーデンの教科書に書いてある「子ども」の詩の本質はなにか、スミレの花を - ネットロアをめぐる冒険
              • Why .TV | Bassir.io

                .TV domain names are highly valuable to media networks that prioritize content creation because they offer a unique and specific online presence. The .TV extension explicitly signifies a platform for audio-visual content, making it a natural fit for media networks looking to showcase their multimedia offerings. It provides a clear and concise branding opportunity that immediately communicates the

                  Why .TV | Bassir.io
                • GANによる超解像がもたらす新しい方向性と「The Perception-Distortion Tradeoff」の話 - Think more, try less

                  CVPR2018にて超解像分野において極めて重要そうだなと感じた論文がありました。Yochai Blauらによる下記の論文です。 [1711.06077] The Perception-Distortion Tradeoff この内容を踏まえて最近の超解像研究の流れをまとめたいと思います。 超解像とは? 超解像について振り返ります。多くの方がwaifu2xというソフトウェアで一度は目にしたことがあるかもしれません。下記イメージのように低解像の画像を高解像の画像に変換する方法を 超解像(Super Resolution)と呼ばれます。 (参照元:二次元画像を拡大したいと思ったことはありませんか? - デー) このwaifu2xがざっくりどのように超解像を行っているかというと、ベースはSRCNNというConvolutional Neural Netoworkを使った超解像手法であり、下記のよう

                    GANによる超解像がもたらす新しい方向性と「The Perception-Distortion Tradeoff」の話 - Think more, try less
                  • Web 2.0 Badges - Useful collection of stylish web 2.0 badges and badge generator.

                    Nowadays, real estate professionals are increasingly turning to social media marketing as a powerful tool to connect with potential buyers, sellers, and renters. Using platforms like Facebook, Instagram, and LinkedIn, realtors can expand their reach, build brand awareness, and ultimately drive sales. In this article, we’ll explore effective strategies and creative post ideas for successful real es

                    • はじめてのGAN

                      今回はGAN(Generative Adversarial Network)を解説していきます。 GANは“Deep Learning”という本の著者でもあるIan Goodfellowが考案したモデルです。NIPS 2016でもGANのチュートリアルが行われるなど非常に注目を集めている分野で、次々に論文が出てきています。 また、QuoraのセッションでYann LeCunが、この10年の機械学習で最も面白いアイディアと述べていたりもします。 “The most interesting idea in the last 10 years in ML, in my opinion.” –Yann LeCun GANは聞いたことはあるけれどあまり追えてないという人向けに基礎から解説していきたいと思います。それでは順に見ていきましょう。 目次 基礎理論 DCGAN 実装 論文紹介 まとめ 基礎理

                        はじめてのGAN
                      • MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介

                        OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。 デモサービスで試せます 今回紹介するオープンソース・ソフトウェアはNHocr、日本語OCRシステムだ。Google Code上にホスティングされ、まだソースコードは一部しか開示されていないが、デモサービスは公開されている。 デモサービスでは、BMP/JPEG/PBM/PGM/PPMのファイル(さらに各ファイルをGZip圧縮していても可能)をアップロードすると、それを解析した結果を日本語表示してくれる。日本語OCRとあって、漢字/ひらがな/片仮名/英語などが判別可能になっている。 読み取らせた画像 手書き文字であっても認識率はそこそこ高い。正式リリースがまだという段階にあ

                          MOONGIFT: » 待ちに待ったオープンソースの日本語OCR「NHocr」:オープンソースを毎日紹介
                        • 「ソーシャルグラフとインタレストグラフ」の違いを徹底解説! | ソーシャルリクルーティングの世界

                          「ソーシャルリクルーティング」 という言葉をご存知でしょうか? ソーシャルリクルーティングとは、企業活動上、最も重要である「人材採用手法」において、SNSを活用した採用手法 を意味します。つまり、企業が人財を採用するための方法の一つです。具体的にはTwitter、Facebook、Instagram、YouTubeなどのSNSを活用して行う採用のやり方を指します。 2011年5月は、米Likedinの上場により、有象無象の新サービスがグローバル規模で生まれ、ソーシャルリクルーティングという概念が若干ながら日本国内でも話題になった1ヶ月でしたが、一体世界ではどの程度利用されているのでしょうか? 企業の73%が、採用活動に広義のSNSを活用 この数字は、JOBVITE社が2010年春にアメリカの採用業務の関係者600人以上に対して調査した、企業におけるソーシャルリクルーティングの活用度に関する

                            「ソーシャルグラフとインタレストグラフ」の違いを徹底解説! | ソーシャルリクルーティングの世界
                          • OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能

                            画像生成AI「DALL・E 2」や文章生成AI「GPT-3」といった高性能AIを開発してきたAI開発組織のOpenAIが、新たに音声を超高精度で認識して文章に書き起こせるAI「Whisper」を発表しました。発表と同時に公開されたサンプルでは「早口のセールストーク」や「ハイテンポな曲の歌詞」などの音声でも問題なく文字起こしできる性能の高さが示されています。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper Whisperはインターネット上から収集された合計68万時間におよぶ音声データでトレーニングされた文字起こしAIです。OpenAIのブログ記事には「早口のセールストーク」「K-POPの曲」「フランス語」「独特なアクセン

                              OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能
                            • クラスタリング (クラスター分析) - Toshihiro Kamishima

                              クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基本的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.

                                クラスタリング (クラスター分析) - Toshihiro Kamishima
                              • コンピュータビジョンのソースコード/ライブラリのまとめ - takminの書きっぱなし備忘録 @はてなブログ

                                今まで自分が見つけたコンピュータビジョンの研究に役に立ちそうなフリーのライブラリやソースコードをまとめてみました。自分ではまだ使っていないものも多いので、そこはご容赦を。主にC/C++が中心です。 またライブラリ形式でない、いわゆる学会で発表した研究のコードをそのまま公開しているという人がたくさんいて、それに関しては特にメジャーなもののみ紹介しています。なにぶん僕の観測範囲は限られてますので、「このライブラリに触れないのはおかしい」、「説明が間違っている」等、ご意見大歓迎です。 定番(Standard) OpenCV 定番中の定番です。コンピュータビジョンに関して広範なアルゴリズムが実装されています。 http://code.opencv.org/projects/OpenCV/wiki/WikiStart Point Cloud Library 3次元点群データを扱うならこれ。Kinec

                                  コンピュータビジョンのソースコード/ライブラリのまとめ - takminの書きっぱなし備忘録 @はてなブログ
                                • kikulog

                                  kikulog 記事一覧 カテゴリー別記事一覧201410 2014/10/22 江本勝氏の死去 201409 2014/09/12 生協の「書評対決」の書評 201407 2014/07/04 「いちから聞きたい放射線のほんとう」サポートページ 201406 2014/06/04 「いちから聞きたい放射線のほんとう」訂正箇所 201404 2014/04/23 朝日新聞に書評が出るようです [kikulog 647] 2014/04/09 理研CDBの騒動について [kikulog 646] 2014/04/07 博士論文中での剽窃について [kikulog 645] 201403 2014/03/17 「いちから聞きたい・・」のあとがき [kikulog 644] 2014/03/03 論文: Structural flexibility of intrinsically disord

                                  • 「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 - - ill-identified diary

                                    この文章は pandoc-hateblo で tex ファイルから変換しています. PDF 版はこちら 2021/10/15 追記: 後半のベイジアンブートストラップに関する解説はこちらのほうがおそらく正確です ill-identified.hatenablog.com 概要挑発的なタイトルに見えるかも知れないが, 私はしらふだしこれから始めるのは真面目な話だ — 正直に言えばSEOとか気にしてもっと挑発的なタイトルにしようかなどと迷ったりはしたが. 「全数調査できれば標本抽出の誤差はなくなるのだから, 仮説検定は不要だ」という主張を見かけた. いろいろと調べた結果, この問題を厳密に説明しようとすると最近の教科書には載ってない話題や視点が必要なことが分かった. ネット上でも勘違いしている or よく分かってなさそうな人をこれまで何度か見かけたので, これを機に当初の質問の回答のみならず関

                                      「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 - - ill-identified diary
                                    • Deep Learningの教材 - こんな夢を見た

                                      Deep Learningを勉強するにあたって内容がまとまっている教材についてリスト化しました。 無論ここに挙げたもの以外にも充実した教材は多数存在します。また、全てを読んだり観たりしたわけではありませんので、コメントは参考程度に考えてください。 (追記) ときどき追記/編集していきます。 (以下、一部敬称略) Bengio オンライン本 Yoshua Bengio, Ian Goodfellow and Aaron Courville http://www.iro.umontreal.ca/~bengioy/dlbook/version-07-08-2015/dlbook.html 現在Web上で閲覧可能。 いつか出版される。終盤はまだ執筆中。 これ一冊で根っこの理論はバッチリそう。天下のBengioさんなので情報の信頼性、網羅性、深みは高い。全部やると分量すごい。 Nielsen オン

                                        Deep Learningの教材 - こんな夢を見た
                                      • iOSと機械学習 - その後のその後

                                        ビッグデータとかの機械学習隆盛の背景にある文脈や、その拠り所となるコンピュータの処理性能から考えても「モバイルデバイス向けOSと機械学習を紐付けて考えようとする」ことはそもそもあまり筋がよろしくない・・・とは思うのですが、やはり長くiOSだけにコミットしてきた身としては、新たに興味を持っている機械学習という分野と、勝手知ったるiOSという分野の交差点はないのかなと考えずにはいられないわけでして。。 そんなわけで、「iOS と機械学習」について雑多な切り口から調べてみました。 iOSで使える機械学習ライブラリ DeepBeliefSDK コンボリューショナルニューラルネットワークを用いた画像認識ライブラリ。iOSとかのモバイルデバイスで処理できるよう、高度に最適化してある、OpenCVと一緒に使うのも簡単、とのこと。 https://github.com/jetpacapp/DeepBeli

                                          iOSと機械学習 - その後のその後
                                        • REALKYOTO - 2017年フランス大統領選挙の後で

                                          浅田 彰(あさだ・あきら) 1957年、神戸市生まれ。 京都造形芸術大学大学院学術研究センター所長。 同大で芸術哲学を講ずる一方、政治、経済、社会、また文学、映画、演劇、舞踊、音楽、美術、建築など、芸術諸分野においても多角的・多面的な批評活動を展開する。 著書に『構造と力』(勁草書房)、『逃走論』『ヘルメスの音楽』(以上、筑摩書房)、『映画の世紀末』(新潮社)、対談集に『「歴史の終わり」を超えて』(中公文庫)、『20世紀文化の臨界』(青土社)などがある。 最新のエントリー 19.05.01 昭和の終わり、平成の終わり 19.03.29 原美術館のドリス・ファン・ノーテン 19.03.07 マックイーンとマルジェラ――ファッション・ビジネスの大波の中で 18.12.07 映画のラスト・エンペラー――ベルナルド・ベルトルッチ追悼 18.11.03 トランプから/トランプへ(5)マクロンとトラン

                                          • 【AI動画生成】Sora 要素技術解説

                                            もう全部OpenAIでいいんじゃないかな はじめに 月間技術革新です。 ということで、昨日OpenAIから発表された新しい動画生成AI「Sora」が非常に話題となっていますね。 圧倒的な一貫性の保持と1分間に及ぶ長時間動画が生成可能という事で、現状の動画生成技術を圧倒的に凌駕する性能を持っているようです。 在野エンジニアの小手先テクニックなど一笑に付すような圧倒的性能を Soraの凄さは色んなエンジニアやインフルエンサーがたくさん語っているのでそちらを見てもらうとして、この記事ではSoraを構成する各技術について簡単に解説していければと思います。 Soraの技術構成 論文が公開されているわけではないですが、OpenAIが要素技術の解説ページを公開してくれているため、そのページを参考にしていきます。 原文を見たい方はこちらからどうぞ 全体構成 Soraは以下の技術要素で構成されているとのこと

                                              【AI動画生成】Sora 要素技術解説
                                            • 今のGoogleピカサは全ての写真の人物の顔を識別して「人物分け」出来るレベルなの知ってた?

                                              Googleが提供する写真管理ソフト。 それがGooglePicasa(グーグルピカサ)という無料で使えるフリーソフトです。 現在Picasaは3までバージョンアップしているのですが、3.6から、これがまたとんでもない機能が追加されているのをご存知でしょうか?今回、サラッとアップデートして、サラッととんでもない事をやっているPicasa3の新機能をご紹介します。 どんな些細な顔でも引っ張ります。 例えば30人くらいの集合写真とかあるとビビリます。 このGooglePicasaをインストールすると、最初はマイピクチャー辺りの全ての画像ファイルなんかを拾ってきます。 同時に、【顔】さえあれば、人物カテゴリーを勝手に作り始めます。 本当にとんでもない性能で、顔の部分だけを大小とわず、個人の顔写真アルバムが完成します。 ちょっと想像してみてください。 例えば10人くらいで飲み会があって、パシパシ2

                                                今のGoogleピカサは全ての写真の人物の顔を識別して「人物分け」出来るレベルなの知ってた?
                                              • 「ああ、覚えてくれてた…」ライオンの子供を保護した女性、預けた動物園で数年ぶりに再会(動画) : らばQ

                                                「ああ、覚えてくれてた…」ライオンの子供を保護した女性、預けた動物園で数年ぶりに再会(動画) コロンビアのサーカスで虐待を受けていたというライオンの子供を、女性が保護したそうです。 しかしながら相手はライオン、個人で育てるには余りに大きくなってしまい、動物園に引き取ってもらうことになりました。 女性とライオンが、数年ぶりに再会を果たしたときの映像をご覧ください。 Woman Lion Injured Forest Columbia - YouTube もう覚えていたかどうかなんて、言うまでもありませんね。 ライオンが大きすぎてドキッとなりますが、これ以上ないほどに全身を使って甘えています。 人と動物の間にも愛は生まれるようです。 【Amazon.co.jp限定】劇場版 STEINS;GATE 負荷領域のデジャヴ 超豪華版(新録ドラマCD付)(完全数量限定) [Blu-ray]角川書店 売り

                                                  「ああ、覚えてくれてた…」ライオンの子供を保護した女性、預けた動物園で数年ぶりに再会(動画) : らばQ
                                                • 野上武志が『ガルパン』などのキャラ原案画を一挙公開【前編】 | アニメイトTV

                                                  .TV domain names are highly valuable to media networks that prioritize content creation because they offer a unique and specific online presence. The .TV extension explicitly signifies a platform for audio-visual content, making it a natural fit for media networks looking to showcase their multimedia offerings. It provides a clear and concise branding opportunity that immediately communicates the

                                                    野上武志が『ガルパン』などのキャラ原案画を一挙公開【前編】 | アニメイトTV
                                                  • ベイズ学習の勉強に参考になる資料 - 作って遊ぶ機械学習。

                                                    おつかれさまです.今回はタイトルの通り,ベイズ学習を勉強する上で参考になる教科書やウェブの資料,論文等を紹介したいと思います. ベイズ学習は確率推論に基づいた機械学習アルゴリズムの構築論です.ベイズ学習を使えば,あらゆる形式のデータに対して,未観測値の予測や隠れた構造を発見するための統一的なアプローチをとることができるため,特に現代の機械学習アルゴリズムを深く理解し使いこなすためには必須の方法論になっています. 1, ベイズ学習の位置づけ まず,データサイエンスにおける他の方法論と,ベイズ学習の位置づけを簡単に俯瞰したいと思います. 僕の知る限り,ベイズ学習は1990年代ごろから登場してきた機械学習の方法論で,既存の学習アルゴリズムを確率モデルによって構築し,学習や予測の計算をすべて確率推論(条件付き分布と周辺分布の計算)で解決してしまおうという試みによってはじまりました.これにより,従来

                                                      ベイズ学習の勉強に参考になる資料 - 作って遊ぶ機械学習。
                                                    • jkondoの日記 - 顔が認識できるアルバムサービス、Riyaが凄い

                                                      顔を自動認識できるというウェブアルバムサービス、riyaが使えるようになっていると知ったので使ってみました。 http://riya.com/ これは凄いです。 写真をアップロードすると、勝手に「顔がどこにあるか」を認識してくれます。それが誰かをriyaに教えていくと覚えてくれて、他の写真も「その顔は誰か」を認識してくれます。 さらに、写真の中にあるテキスト(この写真だとかばんにある「Emerging」とかの文字)も自動的に認識してくれて、あとから検索できます。 "People"ページでは自分が名前をつけた人たちが一覧で表示されて、まだriyaに誰かを教えていない人がリストアップされるので、そこからさらにその人を教えていくとどんどん自動で認識していってくれます。 これが僕のアルバムの中の"Naoya Ito"の写真一覧。 顔が認識されていく様子が楽しくて、ついついどんどんアップロードしてし

                                                        jkondoの日記 - 顔が認識できるアルバムサービス、Riyaが凄い
                                                      • About this Collection | World Digital Library | Digital Collections | Library of Congress

                                                        This collection contains cultural heritage materials gathered during the World Digital Library (WDL) project, including thousands of items contributed by partner organizations worldwide as well as content from Library of Congress collections. The original World Digital Library site (preserved in LC’s Web Archives here) and all descriptive metadata were translated from English and made available in

                                                          About this Collection | World Digital Library | Digital Collections | Library of Congress
                                                        • しゃべった内容を文章に変換する無料のiPhoneアプリ『Dragon Dictation』

                                                          海外で先に公開され、その認識率の高さで話題となったiPhoneアプリ『Dragon Dictation 』がついに日本語に対応。App Storeで無料で公開されています。 iPhoneに向かってしゃべった内容をテキストに変換してくれるので、タッチパネルでの文字入力が苦手なひとでも、素早くかつストレス無く大量のメモや長文メールを書くことができます。 アプリの初回起動時に、使用規約への承諾などを求められます。アドレス帳の連絡先をアップロードすると個人名の認識率が高くなるようですが、必須ではありません。 こちらが開発元によるデモ動画。 マイクからの音声入力をサーバーに送信して処理するため、Wi-FIまたは3G回線でネットワークに接続している必要があります。 使用法はいたってシンプルで、録音ボタンを押してマイクに向かってしゃべるだけです。 「完了」ボタンをタップするとデータがサーバーに送信され、

                                                            しゃべった内容を文章に変換する無料のiPhoneアプリ『Dragon Dictation』
                                                          • はじめるDeep learning - Qiita

                                                            そうだ、Deep learningをやろう。そんなあなたへ送る解説記事です。 そう言いながらも私自身勉強しながら書いているので誤記や勘違いなどがあるかもしれません。もし見つけたらご連絡ください。 Deep learningとは こちらのスライドがとてもよくまとまっています。 Deep learning つまるところ、Deep learningの特徴は「特徴の抽出までやってくれる」という点に尽きると思います。 例えば相撲取りを判定するモデルを構築するとしたら、普通は「腰回りサイズ」「マゲの有無」「和装か否か」といった特徴を定義して、それを元にモデルを構築することになります。ちょうど関数の引数を決めるようなイメージです。 ところが、Deep learningではこの特徴抽出もモデルにやらせてしまいます。というか、そのために多層、つまりDeepになっています。 具体的には頭のあたりの特徴、腰のあ

                                                              はじめるDeep learning - Qiita
                                                            • (主に)ディープラーニングの成果を利用したAPI集(自分用) - Qiita

                                                              ディープラーニングなどの成果を活用したAPI一覧 個人の整理用なので、分類や説明は大雑把です。 画像解析 IBM Watson AlchemyVision 機能・特徴 画像内で見つかった物体・人・文字を返す 試してみる IBM Watson Visual Insights(2016年6月末廃止予定) 機能・特徴 消費者の興味、活動、趣味、ライフイベント、製品に関連した洞察を抽出するためにオンラインの画像、ビデオを分析する 試してみる IBM Watson Visual Recognition 機能・特徴 画像中に映った代表的なものの関連する分類のスコアを返す 試してみる GOOGLE CLOUD VISION API 機能・特徴 画像からさまざまな情報を引き出す 画像を数千のカテゴリ(たとえば、「ヨット」「ライオン」「エッフェル塔」など)にすばやく分類する 画像に映る個々の物体や人物の顔を

                                                                (主に)ディープラーニングの成果を利用したAPI集(自分用) - Qiita
                                                              • TensorFlowで顔検出器を自作する - すぎゃーんメモ

                                                                19日に行われた Kyoto.なんか #3 で発表・デモをさせていただいた内容まとめです。 はじめに: 検出器の重要性 アイドル顔識別 をずっとやっている中で、顔の識別・分類(Classification)はCNNを使って出来ているけれど まだ上手く出来ていない別のタスクがあって。 それが画像内からの顔領域の検出 (Detection, Localization)。 「画像内に写っている人物が誰であるか」を識別するためには、まずはその画像に写っている「顔」を検出する必要がある。 その検出された顔それぞれについて分類器にかけて「この顔は○○さん」「この顔は××さん」と分類していくことになるわけで。 分類器に与える入力画像を切り抜いて抽出するのにもまず顔領域を検出する必要があるし、その分類器を学習させるためのデータセットも、様々な画像から顔領域を検出して切り抜いてそれぞれに対してラベル付けする

                                                                  TensorFlowで顔検出器を自作する - すぎゃーんメモ
                                                                • 21世紀を感じさせる魔法のLiveScribeペン | ガジェット | nobi.com (JP) | nobi.com

                                                                  今年2月のMACWORLD EXPOで購入してきて以来、講演会場やさまざまな懇親会で披露しては、大好評を得ている自慢のガジェットがある。 米LiveScribe社のPulse SmartPenという製品だ。 実は昨2009年のMACWORLD EXPOにも出展していて1度は紹介したのだが、その時は買いそびれてしまっていた。今回、13ヶ月の空白を経て、価格がこなれてきたこともあってついに買って見た。 このペンの何が凄いかを知りたい人には、とりあえず上の動画を見てもらうのが手っ取り早い。 何をしているところかと言うと、このペンで専用のノートにピアノの絵を描くと、そのピアノが弾けてしまうのだ(鍵盤をペンで触れると、音が出る)。 実は、これはまだ本の序の口で、実はこんなこともできる(下の「続きを読む」以下で紹介)。 そう、こちらのデモではノートに私の汚い字で書いた英単語を、ちゃんと文字認識して、ス

                                                                  • 「嫌われる勇気」ありますか? 承認欲求を否定するアドラー心理学とは

                                                                    「誰かに嫌われたい」と思って毎日を過ごしている人はいないだろう。できたら好かれた方がいいし、やっぱりみんなに愛されたい、そしてFacebookでは「いいね!」を押してもらいたい……と思っている人が多いことと思う。 関連情報を含む記事はこちら しかし『嫌われる勇気 自己啓発の源流「アドラー」の教え』(岸見一郎、古賀史健/ダイヤモンド社)によると、誰からも嫌われないためには、周りの人全員に忠誠を誓い、誰にも悪い顔をしないことしか答えがないという。最初のうちはなんとかなるが、すべての人の希望や期待に応えようとすると、それが仮にできないとわかっていても「できる」と嘘をつかなくてはいけなくなり、自分にも周りの人にも嘘をつき続けることになって最後には信用を失い、苦しい人生になってしまうという。みんなに好かれようとするとみんなから嫌われ、最後には自分のことまで嫌いになってしまうという悪循環! 自由とは、

                                                                      「嫌われる勇気」ありますか? 承認欲求を否定するアドラー心理学とは
                                                                    • Imagine Cup - 学生の開発者ツール、リソース、エクスペリエンス | Imagine Cup

                                                                      Meet the 2024 Imagine Cup World Champion Learn about this year's winner of the Imagine Cup trophy, USD 100,000 cash prize, and a mentorship session with Microsoft Chairman and CEO, Satya Nadella. FROM YOUR EYES Empowered by GPT-4 and advanced image recognition, FROM YOUR EYES has built a mobile application and API, delivering immediate visual translations for users with a vision disability. An adv

                                                                      • Google、人工知能に機械学習モデルの設計を生成させる「AutoML」で設計した大規模な画像分類と物体検出に適応するアーキテクチャ「NASNet」を論文発表。人間が設計してきたモデルより高精度

                                                                        Google、人工知能に機械学習モデルの設計を生成させる「AutoML」で設計した大規模な画像分類と物体検出に適応するアーキテクチャ「NASNet」を論文発表。人間が設計してきたモデルより高精度 2017-11-03 Google Brainの研究者らは、数ヶ月前、機械学習モデルの設計を機械学習で自動化するアプローチ「AutoML(Auto Machine Learning)」を発表しましたが、今回は、これまで小規模にテストしてきたAutoMLを大規模な画像分類と物体検出に適応した論文を発表しました。 Learning Transferable Architectures for Scalable Image Recognition(PDF) 「AutoML」とは、人工知能に機械学習のコードやアルゴリズムを生成させる新しい開発アプローチで、ニューラルネットワークがニューラルネットワークを設

                                                                          Google、人工知能に機械学習モデルの設計を生成させる「AutoML」で設計した大規模な画像分類と物体検出に適応するアーキテクチャ「NASNet」を論文発表。人間が設計してきたモデルより高精度
                                                                        • 明日からの臨床に役立たない(?)が思わず二度見する論文集2016 | EARLの医学ノート

                                                                          だいぶ間があいてしまいましたが,久々の「明日からの臨床に役立たないが思わず二度見する論文集」です.抄読会にぜひどうぞ. ■独身の幸せとは・・・ Girme YU, Molloy PR, Overall NC. Repairing Distance and Facilitating Support: Reassurance Seeking by Highly Avoidant Individuals Is Associated With Greater Closeness and Partner Support. Person Soc Psychol Bulletin 2016; 42: 645-61 意見の不一致や衝突を避けるタイプである回避型の人は一生独身でも幸せでいられる.4024例の24年間前向き観察研究. いやそう言われましてもですね・・・(独身) ■10代で充実した恋愛をすると精

                                                                            明日からの臨床に役立たない(?)が思わず二度見する論文集2016 | EARLの医学ノート
                                                                          • 未経験から独学でプログラミングを身につけて新卒でグーグルに入った話

                                                                            google.md 2008年に新卒でソフトウェアエンジニアとしてグーグルに入社しました。2019年時点ですでに退職しています。 学生時代 東京大学の電子電気情報学科という申し訳程度にコンピューターサイエンスをかじっているところから、そのまま修士課程に進学しました。研究分野は自然言語処理でした。大学がつまらなくて行かなくなった時期があり、留年して学部2年生を2回やっています。ただ勉強はかなりできたほうだと自覚しています。線形代数の試験で満点を取って授業中に名前を読み上げられたのを覚えています。大学院に進学してからは研究が面白くて土日や正月も関係なく研究室に通っていました。1月3日にどうせ誰もいないだろうと思いながら研究室に行ったら普段は忙しくて姿を見せない教授がいたのには驚きました。 プログラミングの経験 プログラミングは大学に入ってから99%独学で身につけました。所属していたサークルのウ

                                                                              未経験から独学でプログラミングを身につけて新卒でグーグルに入った話
                                                                            • 落花生 ― April 11, 2011, 09:58:56 kikulog - 少ないものをどれほど減らしても多いものには影響しないわけで

                                                                              kikulog 記事一覧 カテゴリー別記事一覧201410 2014/10/22 江本勝氏の死去 201409 2014/09/12 生協の「書評対決」の書評 201407 2014/07/04 「いちから聞きたい放射線のほんとう」サポートページ 201406 2014/06/04 「いちから聞きたい放射線のほんとう」訂正箇所 201404 2014/04/23 朝日新聞に書評が出るようです [kikulog 647] 2014/04/09 理研CDBの騒動について [kikulog 646] 2014/04/07 博士論文中での剽窃について [kikulog 645] 201403 2014/03/17 「いちから聞きたい・・」のあとがき [kikulog 644] 2014/03/03 論文: Structural flexibility of intrinsically disord

                                                                              • 機械学習で使うベクトルや行列の微分を使った公式の導出 - Qiita

                                                                                はじめに 機械学習の勉強をしていると,次のようなベクトルや行列を使った公式達を使わなければならない場面が出てくると思います.機械学習の本の巻末に書いてあることが多いと思います.(これらはPattern Recognition and Machine Learning (Bishop著, 2006)の巻末に載っている公式です) \frac{\partial}{\partial\boldsymbol{x}}(\boldsymbol{x}^\mathrm{T}\boldsymbol{a}) =\boldsymbol{a} \\ \frac{\partial}{\partial\boldsymbol{A}}\mathrm{Tr}(\boldsymbol{A}\boldsymbol{B})=\boldsymbol{B}^\mathrm{T} \\ \frac{\partial}{\partial\b

                                                                                  機械学習で使うベクトルや行列の微分を使った公式の導出 - Qiita
                                                                                • BLOG::broomie.net: 機械学習の勉強を始めるには

                                                                                  thriftとかhadoopなど,何やらいろいろと手を出してしまい,ここのところブログの更新が滞ってしまっていますが,今日は前から書きたかったトピックについて自分へのメモの意味も含めて記しておきたいと思います. はじめに 最近,といっても結構前からなのですが,海外のブログなどで「機械学習の勉強を始めるガイドライン」についてのエントリーがいくつか見られ,かつ,議論も少し盛り上がっています.僕は機械学習が好きなだけで,専門というにはほど遠いのですが,僕も一利用者としてはこのトピックに関してはとても興味があります. 機械学習というと,色々な数学的な知識が必要であったり,統計学や人工知能の知識も必要になったりしまったりと,専門的に学ぶ機会が無かった人にとっては興味が湧いてもなかなか始めるには尻込みしてしまうことかと思います.今日紹介するエントリーは,そんな方々にヒントになるような内容になっていると