Create professional videos using just a still image with text or audio powered by AI.
Do you need to digitize handwritten notes to edit or index them? Or would you like to copy text from the picture of a handwritten quote? What you need is something called an optical character recognition (OCR) tool. OCR tools analyze the handwritten or typed text in images and convert it into editable text. Some tools even have spell checkers that give additional help in the case of unrecognizable
初投稿です 追記(20171031) HTMLを出力する際のエンコードがasciiだったため日本語が文字化けしていましたが、UTF-8をサポートするようになったようです! 下記に文字化け対策の文章がありますが、読み飛ばしていただければ幸いです。 導入 セクシーなデータサイエンティストの皆様におかれましては、日々の業務で様々な機械学習のモデルを構築しておられるかと思います。それは例えば、あるサービスのユーザ情報を用いてコンバージョンするかしないかを予測していたり、またある時は年収を回帰で予測していたり、またあるときはユーザが投稿した画像情報についての二値分類やテキストデータについてのネガポジ分類をしていたりすることでしょう。 これらにつきものなのが、この予測モデルを実装する際の関係者への説明です。このモデルはどうしてこのような結果を出しているのか、なんでこのユーザは低い年収だと判定されている
「プログラムが自動で文章を生成する」 昔からこれにロマンを感じてる。 やってて面白い。 暇つぶしになるし、副次的に色んなことの勉強になるし、もしかしたらいつかいいプログラムが作れてお金になるかもしれない、なんてぼーっと考えてる。 今年に入ってからNN/深層学習を少しかじり出したのでRNN/LSTMで挑戦中。楽しい。 でも実際はなかなかまともな文なんて出来やしない。 前の文字列or単語のみを素性としてRNN/LSTMに与えて学習させるだけのモデルでは、まずまともな文が出てこないという結論に至った。どんだけテキストを増やしても、どんだけ学習回数を増やしても無駄っぽい。 この場合の「まともな文」の定義だけど、 1.文法が正しい (○明日はとても暑い ×明日にが暑い) 2.意味が通る (○今日はトマトを食べた ×今日はトマトが走る) 1と2をどちらも同時に満たすのが「まともな文」だと定義づければ、
こんにちは。@iizukak です。この記事は、KLab Advent Calendar の 7 日目の記事です。 私は最近 Hierarchical Temporal Memory (HTM) という、大脳新皮質のモデル化及びコンピュータ上への実装を目指す Machine Intelligence の理論について調べたり実験したりしています。この記事では、HTM 自体と、HTM について学んでいく上で有用だと思われる情報へのリンクを紹介したいと思います。情報へのリンクは、HTM の理論を学びたい方と、応用・実装を学びたい方へ分けて掲載してみました。 私は HTM のスペシャリストではありません。なるべく誤りのないように心がけていますが、この記事には誤った情報が含まれるかもしれません。そのような誤りを見つけた場合は、コメント欄にて教えていただけると幸いです。 HTM とは何でしょう 概要
先日、IBMの大和研究所が移転して、新たに豊洲に東京ラボラトリーを開所したとのおしらせをいただき、記念セミナーに呼んでいただきました。 IBMの研究所といってもいろいろあるそうなんですが、東京ラボラトリーは基礎、ハードウェア、ソフトウェア、3つが揃っていて、強力なんです、というお話がメインだったわけなんですが、個人的に、俄然、興味があったのが、基礎の部分で、IBMが誇るコンピュータ「ワトソン」のお話でした。アメリカでクイズ王を倒した、クイズを解くすごいコンピュータ「ワトソン」の開発に係わった武田さんのお話を聞けるということで、とても楽しみにいってきました。ということで、その部分だけブログしてみました。 ワトソンのプロジェクトが始まったのは2006年。lBM 100周年にあわせたグランドチャレンジということで、武田さんも本当にできるのかなと、当初は思ったそうです。ちなみに、IBM のグランド
はじめに この記事はフューチャーアーキテクト Advent Calendar 2015の12/22です。 弊社副社長も書いていたと公言するPrologに関して書きます! 私も大学生の時に書いていたので、Prologとは?から書き始めたいと思います。 Prologとは? Prologは1972年に登場した老舗の非手続き型のプログラミング言語であり、主にAIに特化して作られています。Prologという名前の由来は、PROgramming in LOGicからきています。その名の通りPrologでは論理的に物事を解釈するようにプログラムを書きます。 Prologなんてオワコンじゃない? Go言語やRustなどから比べると40年近く前に登場した言語であり、AIに特化した言語ということもあり、知名度が低く、利用者も少ないですが、教育機関(大学など)で主として論理学の教材として利用され続けているのです
前回の記事に引き続きRaspberry Piネタ。マルコフ連鎖により文章を自動生成しLCDに出力してみた。 人工無脳とは 考えてるように見えて考えてない。ただ確率に従い文章を生成するプログラム。それでも人間から見ると、意味のある文章に見える文章が生成される。 基本的な生成手順は 元データを形態素解析して形態素毎に分割 マルコフ連鎖により再構成 形態素解析 自然言語で書かれた文を、形態素 (言語で意味を持つ最小単位) ごとに分割し、各形態素の品詞を特定することを形態素解析と呼ぶ。プログラムで自然言語を扱う場合、よく使われる技術の一つ。細かいことはWikipedia でも見てください。 日本語の形態素解析を行うためのツールは以下の様なものがある。 MeCab bi-gram マルコフモデル 学習モデルはCRF ChaSen 可変長マルコフモデル 学習モデルは隠れマルコフモデル(HMM) KyT
5. ご質問 http://www.facebook.com/youichiro.miyake Twitter: @miyayou 感想・ご質問は メイルtwitter やfacebookまで ゲームAI千夜一夜 http://blogai.igda.jp/ 三宅陽一郎 論文・講演資料集(4) http://blogai.igda.jp/article/92899318.html 6. Books Precomputed Pathfinding for Large and Detailed Worlds on MMO Servers Fabien Gravot, Takanori Yokoyama, and Youichiro Miyake http://www.crcpress.com/product/isbn/9781466565968 Table of Contents Genera
SLAM(Simultaneously Localization and Mapping)とは 各種センサから取得した情報から、自己位置推定と地図作成とを同時に行う方法。 周囲の環境形状を把握し、その形状データをもとにロボットの自己位置も推定する。 自律移動ロボットや海軍の水雷探知UUVに利用される。 (今回は自律移動ロボットでの利用に関して記述する) 技術背景 日本のロボット市場は、近年、約5000億円前後で推移しており、その大半を産業用ロボットが占めている。産業用以外のロボットについては、一部にエンターテイメント用ロボットの市場が存在するが、その市場規模は約70億円程度に止まっており、今すぐに大きな市場の伸びが期待できるとは言い難いのが現状である。 その中、2005 年に行われた愛知万博において、実証試験を兼ねて様々なロボットが運用され、展示された。実証試験を経て、当該市場を牽引すると
データ分析から導き出されたインサイト無しにAI(人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって本当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ
「人が考えASIMOが動く」-ホンダ、ATR、島津製作所、新BMI技術を開発 ~移動可能な装置を使って2方式で脳活動を計測・デコード ホンダの子会社である株式会社ホンダ・リサーチ・インスティチュート・ジャパンと株式会社国際電機通信基礎技術研究所(ATR)、株式会社島津製作所は、脳の活動を読み取ることでロボット(ASIMO)を動かすことに成功したと発表し記者会見を行なった。 頭皮上の電位変化を計測する「脳波計(EEG)」と、脳血流の変化を計測する「近赤外光脳計測装置(NIRS)」の2つの手法を世界で初めて併用して脳の活動を同時計測。かつ、計測した情報を統計処理して抽出する技術を新規に開発し、使用することで、考えるだけでロボットを制御できる「ブレイン・マシーン・インターフェイス(BMI)」技術を開発したというもの。「将来的には、知能化技術やロボット技術などとの融合による、より人に優しい製品開発
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く