タグ

ブックマーク / xtech.nikkei.com (72)

  • 話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった

    インタビューや会議の際に発言内容をメモしながら、後で間違えないよう録音もする人は少なくないだろう。だが、録音した音声を聞いてテキストに起こす作業はかなりの手間がかかる。筆者の場合は聞き取りづらい箇所を繰り返し再生したり、パソコンに文字を打ち込む操作が遅れて音声の再生を一時停止したりしているうちに、実際の録音時間の何倍もかかってしまう。作業が終わるころには疲れてうんざりしていることもある。 筆者と同じように「骨の折れる文字起こし作業を何とか楽にこなしたい」と考える人は、洋の東西を問わず多いのかもしれない。最近はAI人工知能)によって音声を解析して自動的に文字起こしするツールが国内外で増えてきた。中でも大きな注目を集めているのは、米OpenAI(オープンAI)の音声認識AIWhisper」だ。 同社は米テスラ創業者のイーロン・マスク氏らが設立したAIの研究開発企業で、2020年に発表した言

    話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった
  • 作業者が歩く代わりに800台のAGVがひたすら働くモノタロウの物流倉庫

    MonotaRO(モノタロウ)は2022年4月から稼働を開始した物流拠点「猪名川ディストリビューションセンター」(猪名川DC、兵庫県猪名川町)を2022年5月24日に公開した(図1)。800台もの無人搬送車(AGV)を導入し、作業者の歩行を徹底的に削減して生産性を向上させる。機械製品や電気製品の組み立て・加工工場ではなかなか見られない、物流倉庫ならではの方法でAGVを運用している。

    作業者が歩く代わりに800台のAGVがひたすら働くモノタロウの物流倉庫
  • 対話不足が深刻に 切り札は「1on1」

    在宅勤務の長期化でコミュニケーション不足という課題が見えてきた。新しい働き方を確立しようとする先進企業は、この解決に乗り出している。「1on1」を切り札に、非対面で対話する機会の創出に動いている。 テレワークありきの新しい働き方を確立する上で、まず解決すべきはコミュニケーション不足という課題である。この課題を強く感じて解決策を講じてきた1社が電子書籍販売サービスなどを手掛けるイーブックイニシアティブジャパンだ。2020年2月以降、社員約180人の多くが新型コロナ対策でテレワークに取り組む中、それまで月2回だった上司と部下の個人面談「1on1ミーティング」をWeb会議サービスで実施し、週1回に増やすといったコミュニケーションの活性化策を講じた。「情報共有が進むなど効果が得られている」とイーブックイニシアティブジャパンの今井輝夫執行役員コーポレート部長は話す。 同社は2019年2月、社オフ

    対話不足が深刻に 切り札は「1on1」
  • 「部族」に再編、ファストリ元CIOがアクサ生命で進めるIT部門改革

    アクサ生命保険がIT部門の改革を加速させている。2018年1月に組織体制やメンバーの役割、開発プロセスなどを一新。目的は意思決定や情報システムの構築スピードを速め、新サービス・商品の開発期間を短縮することだ。一連の改革によって2018年4月には新商品の開発期間を33~40%短縮するなど、早くも効果が表れている。 「従来のスピードでは遅い」。アクサ生命のIT部門を統括する玉置肇執行役員ITデリバリー部長は、抜改革に踏み切った理由をこう話す。システム開発のスピードを速め、魅力的な企画を素早く商品化することが競争力に直結するからだ。玉置氏はファーストリテイリング元CIO(最高情報責任者)。2017年1月からアクサ生命のIT部門をけん引している。 玉置執行役員が危惧するのは他業界のディスラプター(破壊者)。ネット企業が買収などを通じて保険業を手掛けるケースも多く、今後の競争も激化する一方だ。「

    「部族」に再編、ファストリ元CIOがアクサ生命で進めるIT部門改革
  • 3大AIスピーカーの設計、プロの評価は「天才」「秀才」「初心者」

    前回の記事はこちら 電機メーカーや部品メーカーでの勤務経験を持つ“熟練”のエンジニアたちの協力を得て実施したAIスピーカー(スマートスピーカー)主要3機種の分解。エンジニアたちは設計に関して、米グーグルGoogle)社の「Google Home」を「天才」、米アマゾン・ドット・コム(Amazon.com)社の「Amazon Echo」を「秀才」、そしてLINEの「Clova WAVE」を「初心者」と形容した。 同じAIスピーカーでありながら、どういった違いがこのような印象の差を生んだのか。具体的には、全体設計や製造コストに直結する部品点数、AIスピーカーで重要になる音声の処理の違いなどにあるという。 「まるでパズルのようだ」 「まるでパズルを組み合わせたかのように無駄がない。なんか天才的なエンジニアが、“これでもか”という感じでシンプルな設計を追求した感じがする」 分解されたGoogle

    3大AIスピーカーの設計、プロの評価は「天才」「秀才」「初心者」
  • スクラムできる対話能力の高い人を望む、Sansanのエンジニア採用

    Eightは、既に名刺交換でつながった人とだけでなく、これからつながるべき人や企業を提案する機能を提供しようとしています。そのためには、大量のデータ分析が必要です。データ分析に基づくレコメンデーション機能の実装から、Eightサービスの運用に必要な広告配信、人材獲得を支援するリクルーティング機能のマネタイズ施策など、Eightに関わる幅広い開発に携わってもらいます。 Eightの開発には、(アジャイル開発手法である)スクラムを採用しています。現在、主要機能ごとに、七つのスクラムチームを編成しています。各チームには、エンジニアとリーダー役のプロダクトオーナー、調整官役のスクラムマスターをはじめ、データサイエンティストやUI(ユーザーインタフェース)を設計するデザイナーも所属するなど、一つのチームで開発が完結する編成です。1チームの人員は8人前後です。 新たに採用したエンジニアも、このチームの

    スクラムできる対話能力の高い人を望む、Sansanのエンジニア採用
  • AIスピーカー、ここを工夫すればもっと「賢く」なる

    AIスピーカーが登場したことで、音声のやり取りによる「音声インターフェース」が新たなUI(ユーザーインターフェース)として定着するのでは、との見方がある。一方、現時点では実用性に疑問の声も多い。AIスピーカーの課題と今後の発展の可能性はいかに。各種機器のUIUX(ユーザーエレクスペリエンス)を専門に手掛けるソフトディバイスを率いる同社 代表取締役の八田晃氏に聞いた。 AIスピーカーを実際に使ってみた第一印象は「まだまだコマンドライン(キーボードだけで操作する画面上の入力行)レベル」というものだった。 コマンドライン的な音声入力に対応している機器といえば、カーナビなど結構前からある。カーナビは目的が決まっていて、地名を除くとコマンドも限られていた。AIスピーカーはそこから進化し、より自然な言葉を理解しもっと広く使えるインターフェースとして登場したということだったが、現時点ではやはり質的に

    AIスピーカー、ここを工夫すればもっと「賢く」なる
  • 「スーツはエンジニアの敵」と指摘され一からプログラミングを学び始めた

    ITに全く関係ない分野からITに飛び込んで活躍しているエンジニア」や「非エンジニアながら、プログラミングを仕事に生かしている人」など、IT技術における何らかの“越境”を経験している人を「越境エンジニア」と名付け、1カ月に一人ずつインタビューを掲載する。今月取り上げるのは、ウェルスナビ 代表取締役CEOの柴山和久氏。同社はロボット(プログラム)による資産運用の自動支援サービスを提供している。柴山氏は、プログラミングを一から学び、提供したいサービスのプロトタイプを自ら作って起業した。今回は、プログラミングを学ぶきっかけや学んで得たことを聞いた。

    「スーツはエンジニアの敵」と指摘され一からプログラミングを学び始めた
  • Googleの「Firebase」でリアルタイム掲示板を作ってみよう(前編)

    従来、掲示板などのWebアプリを作るには、HTML/JavaScriptを記述するだけでなく、Webサーバーを準備したり、Webサーバー上で動くプログラムやデータベースにアクセスするプログラムを作る必要がありました。しかし、今なら「Firebase」がそれらすべてを提供してくれます。今回は、JavaScriptのプログラムさえできれば、手軽にWebアプリを作って公開できるサービス「Firebase」について紹介します。Firebaseを使えば、自前でサーバーを用意することなく、比較的手軽にWebアプリを公開できます。 Firebaseのサービスは、Googleが運営しており、稿執筆時点では1GB分のデータベースを無料で利用することができます。そのため、個人でちょっとしたアプリを作る分には無料枠で十分ですので試してみましょう。 FirebaseのWebサイト [URL] https://f

    Googleの「Firebase」でリアルタイム掲示板を作ってみよう(前編)
  • ディープラーニングの仕組みと応用

    脳の神経回路の構造を模倣 ディープラーニングは、大量のデータを学習するために、人間の脳の神経回路の構造を模倣(モデル化)した情報処理の仕組みであるニューラルネットワークを用いる。図3のニューラルネットワークは、「入力層」「隠れ層」「出力層」という3層で構成している。また、学習データは入力データとなる手書き文字の画素データと、正解データがセットになっている。 このニューラルネットワークのモデルを学習させるには、まず手書き文字画素データをピクセル単位に分割した上で、各ピクセル値を入力層に入力する。図3のモデルでは縦横28ドットで分割していることから、784個が入力層に並ぶ。 入力データを受け取った入力層は、受け取った値に「重み付け」をした上で、後段にある隠れ層のニューロン(神経細胞。CPUのような役割を担う)に伝達する。 同様に隠れ層の各ニューロンは、入力層から受け取った値をすべて加算し、その

    ディープラーニングの仕組みと応用
  • ひどい会議は上司のせい

    会議がイマイチ盛り上がらない。若い部下が発言しない。いつまでもダラダラと時間がかかる─。会議に対する不満は、どの企業でも共通している。 「やれやれ。ウチの会議は全然良くならないよ」と思っている管理職の方たちも多いことだろう。そんな人にこそ、声を大にして言いたい。 「そのグダグダ会議、あなたのせいですよ!」 管理職ではなくても、部下や仲間を抱えるリーダーも同じだ。会議の出席者で1番立場が上の人が「会議の雰囲気を作る」のである。 普段の会議を思い出してほしい。重鎮のような人が仕切る会議は暗く、重くないだろうか。話好きで活発な人が仕切る会議は盛り上がるかもしれないが、総じて議論が発散しがちではないか。 良くも悪くも、影響力のある人、特に上司の振る舞い方一つで会議の質は決まってしまうのである。 もう一度、言おう。あなたのチームの会議の雰囲気は間違いなく、上司であるあなたが作っている。つまり、上司

    ひどい会議は上司のせい
  • あなたのスキルは職人気質型?バランス型?コミュ型?

    前回、現在の企業活動に必要な三つの要素として、パッション(情熱)、スキル、スモールチームを挙げた。社会的な課題を解決する情熱を持ち、実現に必要なスキルを身に付け、密接に働く小さなチームを組んでサービスを提供していく。これは、スタートアップ企業だけでなく、大企業でも製品やサービスの単位で当てはまる。 スモールチームを中心とした働き方がこれからのスタンダードになっていくだろう。こう考えたとき、個人としての行動をどう変えていったらよいのか。自分の意見を押し殺してでもチームに貢献すべきなのか。 それは違うだろう。チームの能力はあくまで個々のメンバーのスキルの上に成り立つものだ。パッションとスキルを持つ強いリーダーによって統率されるチームは、リーダーに依存する弱さも併せ持つ。しかし、短期決戦では強いとしても、中長期では継続性に難点がある。強いリーダー1人よりも、個々のメンバーが自らのパッションとスキ

    あなたのスキルは職人気質型?バランス型?コミュ型?
  • JavaScriptの深層学習ライブラリを使って「肥満判定プログラム」を作ってみよう

    JavaScriptの深層学習ライブラリを使って「肥満判定プログラム」を作ってみよう JavaScriptで簡単に実践できる深層学習(2) 近年、第三次人工知能ブームが巻き起こっています。特に、深層学習(ディープラーニング)と呼ばれる技術で目覚ましい成果を上げています。稿では、難しいと思われている機械学習(深層学習)を、お手軽プログラミング言語JavaScriptで実践してみます。難しい数式や理論は後回しにして、まずは、気軽に機械学習に触れてみましょう。 前回は、深層学習とは何かを概観してみました。なんとなく、雰囲気がつかめたでしょうか。今回は、実際にニューラルネットワークのライブラリを利用して、肥満かどうかを判定させてみましょう。 Node.jsとsynaptic.jsをセットアップしよう 深層学習ブームのおかげで、ゼロから深層学習を実装する必要はなくなっています。便利なライブラリやフ

    JavaScriptの深層学習ライブラリを使って「肥満判定プログラム」を作ってみよう
  • 深層学習(ディープラーニング)で何ができるかJavaScriptで体験してみよう | 日経 xTECH(クロステック)

    深層学習(ディープラーニング)で何ができるかJavaScriptで体験してみよう JavaScriptで簡単に実践できる深層学習(1) 近年、第三次人工知能ブームが巻き起こっています。特に、深層学習(ディープラーニング)と呼ばれる技術で目覚ましい成果を上げています。稿では、難しいと思われている機械学習(深層学習)を、お手軽プログラミング言語JavaScriptで実践してみます。難しい数式や理論は後回しにして、まずは、気軽に機械学習に触れてみましょう。 今、注目を集める深層学習 冒頭で言及したように、近年、第三次人工知能ブームが巻き起こっています。囲碁のAI人工知能)が、碁の世界チャンピオンを破ったり、コンピューターに大量のYouTube動画を学習させたところネコの概念を学習することができたりなど、人工知能の分野で驚くようなニュースを目にすることが多いものです。 こうしたニュースの背後に

    深層学習(ディープラーニング)で何ができるかJavaScriptで体験してみよう | 日経 xTECH(クロステック)
  • アマゾンの電子書籍読み放題、日本上陸は福音か凶報か

    画面●米アマゾン・ドット・コムは米英仏独などで既に「Kindle Unlimited」を月額9.99ドル(米国の場合)で提供している 米アマゾン・ドット・コム日法人が、電子書籍が定額で読み放題になる新サービスを開始するとの観測が広がっている。メディア業界専門誌の文化通信が6月27日に報じ、ほかの一部報道機関も後を追った。料金は月額1000円前後で、早ければ8月にも開始する意向だという。 電子書籍の定額サービスが、今まで日になかったわけではない。例えばNTTソルマーレは、コミックを対象に月額780円(税抜き)から提供中だ。ヤフーも月額400円(税抜き)でコミックや書籍が読み放題の「Yahoo!ブックストア」を手掛ける。NTTドコモの「dマガジン」のように、最新号約160誌以上の雑誌を対象にしたものもある。 米国では100万タイトルが読み放題 アマゾン参入のインパクトは、読める書籍数が競合

    アマゾンの電子書籍読み放題、日本上陸は福音か凶報か
  • 6000人が作ったシステムは必ず動く:ITpro

    最盛期の開発要員6000人,開発工数11万人月,投資額2500億円,取引件数1日1億件。三菱東京UFJ銀行が「Day2」と呼ぶ,勘定系システム一プロジェクトの成果物である。6000人のシステムズエンジニア(SE)が作り上げた巨大システムは,2008年5月の連休明けに必ず動くはずだ。 23年間にわたって情報システム開発プロジェクトの取材を続けているが,6000人のSEを集めた事例は過去に一度も見聞きしたことがない。世界を見渡してもおそらく例がないはずだ。これから何年間,記者を続けるのか分からないが,今回の三菱東京UFJ銀行を除けば,6000人を動員するプロジェクトを取材する機会は二度とないだろう。 6000人のSEが同時期に集まったのであって,「6000人月」ではない。開発工数は先に書いた通り,11万人月である。この数字も凄い。一体何を作ったのかと思ってしまう。正確にはこのSEパワーは開

    6000人が作ったシステムは必ず動く:ITpro
  • Node.jsでCSVファイルを徹底的に編集しよう(前編)

    10年以上前に作ったデータで、今でも現役で使っているファイルってあるでしょうか。もちろん、同じ仕事を10年以上続けていれば、そうしたデータもあることでしょう。しかし、データだけがあっても、それを読み書きするアプリケーションがなくなっては元も子もありません。OSはどんどんバージョンアップしていきますので、最新のOSでも常に、そのデータを読み書きするアプリケーションがなくてはなりません。そうして考えると、10年以上前に作ったデータが今も使えるというのは、とても汎用的な形式であることが分かります。 今回は、汎用的なデータ形式の中でも、特に長い年月を生き残っているデータ形式のCSV形式を紹介します。というのも、先日の連載で、Node.jsでライブラリの作り方を示したときに、簡単な例としてCSVファイルの読み書きを行うプログラムを紹介したのですが、「もっと詳しくCSVライブラリの使い方を知りたい」

    Node.jsでCSVファイルを徹底的に編集しよう(前編)
  • ハッカーの祭典「Hack Day 2016」開催、300人超がプロトタイプ開発を競う

    国内で開催される数あるハッカソンの中でも「日最大級」との呼び声が高い「Hack Day 2016」が2016年2月13日と14日の2日間、東京・秋葉原で開催された。ヤフーが主催するこのイベントには、プログラマーやデザイナー、クリエイターなど85チーム333名が参加。2月13日午前9時から14日午前9時までの24時間にわたり、スマートフォンのアプリやIoT(Internet of Things)デバイスなど、「動くプロトタイプ」を実際に開発し、アイデアや技術を競い合った。 参加者が自らの成果を披露する発表会は14日の午前10時からスタート。会場には、一般参加者もあわせて数百人もの来場者が詰めかけ、場内は熱気に包まれた(写真1)。

    ハッカーの祭典「Hack Day 2016」開催、300人超がプロトタイプ開発を競う
  • 「自動化やGitHubの導入は本質ではない」、技術顧問の先駆けが語る、その“役割” | 日経 xTECH(クロステック)

    技術顧問」という言葉をご存じだろうか。自身のシステム開発の経験を生かし、契約した企業に対して開発に関するアドバイスを行う職業だ。この言葉が注目されるきっかけになったのが、Web業界でその名を知らない人はいない有名エンジニアの伊藤直也氏。同氏は、Webサイト改善サービスを提供している「Kaizen Platform」、宿泊予約サービスの「一休」、就活サイトなどを運営する「ハウテレビジョン」、求人情報の「リクルートジョブズ」といった企業の技術顧問を務めている。同氏に技術顧問という役割の質を聞いた。 最初に技術顧問になった企業を教えてほしい。 最初に技術顧問になったのは、求人サイトなどを運営する「じげん」だ。2012年頭から1年間、コンサルティングを行った。具体的には、1週間か2週間に1回、1~2時間のミーティングを実施した。これで当に何か変わるのかイメージできなかったが、たったこれだけで

    「自動化やGitHubの導入は本質ではない」、技術顧問の先駆けが語る、その“役割” | 日経 xTECH(クロステック)
  • 高速で柔軟なJavaScriptエンジン「Node.js」入門:Webサーバーを作ってみよう

    毎回、JavaScriptを使って、仕事に役立つプログラムを紹介しているこの連載ですが、今回は、Node.jsというJavaScriptエンジンを利用する方法を紹介します。Node.jsを使うことで、JavaScriptでできることの幅がぐっと広がります。今回は、Node.jsのインストールから、簡単なWebサーバーを作るところまでを紹介します。 Node.jsとは? まず、Node.jsについて紹介します。「Node.js」は、もともとWebサーバーなどのネットワークプログラムを記述するために開発された、JavaScriptの実行環境です。その心臓部には、Google Chromeに搭載されているJavaScriptの実行エンジンV8が搭載されています。V8はGoogleが開発するオープンソースのJavaScript実行エンジンで、高速に動作することで有名です。また、WebブラウザーのJ

    高速で柔軟なJavaScriptエンジン「Node.js」入門:Webサーバーを作ってみよう