ブックマーク / www.itmedia.co.jp (12)

  • スマートニュース、国会議案データベースを無償公開 過去20年分をGitHubで

    スマートニュースは7月1日、国会の過去20年分以上の議案データ約1万8000件を収集・整理し、オープンデータ化した国会議案のデータベースを、GitHubで無償公開(衆議院、参議院)した。GitHubを利用しない人向けに、閲覧用のWebページ(衆議院、参議院)も公開した。 国会で審議された法案や予算案、条約、決議案といった議案は、衆参両議院のWebサイトに掲載されている。提出者や審議された委員会、賛成・反対した政党(衆院のみ)などの情報も確認できるが、国会の回次ごと、また議案ごとにページが分かれているため、集計や検索、一覧が難しかった。 今回、同社の「メディア研究所」が、各議案のページに掲載されている情報を収集、整理し、CSVファイルとJSONファイル形式で公開。MITライセンスに準拠し、商用・非商用を問わずオープンデータとして誰でも無償で使えるようした。 主に報道機関や研究者に、選挙報道や

    スマートニュース、国会議案データベースを無償公開 過去20年分をGitHubで
    gengohouse
    gengohouse 2022/07/02
    “スマートニュース、国会議案データベースを無償公開 過去20年分をGithubで”
  • 言語モデル「GPT-3」、APIの人数制限を撤廃 誰でもすぐに利用可能に

    AI研究企業のOpenAIは11月19日(現地時間)、大規模自然言語処理モデル「GPT-3」のAPIを利用する際の人数制限を撤廃し、誰でもすぐに利用できるようにしたと発表した。 ガイドラインを更新し、ヘイトスピーチやアダルトコンテンツについては使用を禁止。コンテンツフィルターなど安全装置を設けた上で人数制限を撤廃した。 同社は「何万人もの開発者が、GPT-3を通じてさまざまなAIモデルを活用している。APIへのアクセスを開放することで、より多くの開発者が有用なアプリや未解決な問題に、AIを使った創造的な方法を見つけられると信じている」としている。 GPT-3は、イーロン・マスク氏が共同会長を務める非営利のAI研究企業であるOpenAIが開発した大規模自然言語処理モデル。文章の次の言葉を予測する訓練を重ねており、少ない学習量で人間が書いたような文章を生成できる。関数名やコメントからコードを

    言語モデル「GPT-3」、APIの人数制限を撤廃 誰でもすぐに利用可能に
  • せりふの“あのキャラ度”をAI診断、ゲームシナリオ作りに活用 「ライター多数の現場も楽に」

    せりふの“あのキャラ度”をAI診断、ゲームシナリオ作りに活用 「ライター多数の現場も楽に」(1/2 ページ) 「Fate/Grand Order」などのヒットを契機に増えた、ストーリーをメインに据えたスマートフォンゲーム。さまざまな企業が開発を進める一方、プロジェクトが巨大化すると複数のライターが必要になり、キャラクターの言動に細かいぶれが出るといった問題もある。バンダイナムコグループの研究開発機関、バンダイナムコ研究所(東京都江東区)は、この課題に自然言語処理AIを活用して立ち向かっている。 「現場からは『せりふを把握し続ける負担が減って楽になった』『この人に聞かないとキャラ特有の言い回しが分からない、ということがなくなった』などの声もある」──バンダイナムコ研究所の中野渡(なかのわたり)昌平さん(イノベーション戦略部プロデュース部事業プロデューサー)は、自社開発したツール「AIセリフ

    せりふの“あのキャラ度”をAI診断、ゲームシナリオ作りに活用 「ライター多数の現場も楽に」
  • pixiv、小説の本文検索を廃止へ 文字数が700億超えでサーバに負荷

    ピクシブは9月16日、小説イラストの投稿サービス「pixiv」で、小説文に含まれるワードから作品を検索できる機能を段階的に終了すると発表した。投稿作品の文字数が計700億文字を超えていることから、検索によるサーバの負担も大きく、作品を表示するのに時間がかかるなど悪影響があったためという。 「これまでにも多くの問い合わせがあり、負荷解消に取り組んできたが、根的な問題が解決できなかった」(同社)としている。発表を受け、Twitterでは9月16日夜に「文検索」が日のトレンドに入った。 関連記事 コミケで使える決済アプリ「pixiv PAY」終了へ 「リアルイベントの在り方が変わり継続は困難」 ピクシブがコミックマーケットなどで使える決済アプリ「pixiv PAY」(iOS/Android、無料)のサービスを12月1日に終了する。「リアルイベントの在り方が変わり、サービス継続は困難と

    pixiv、小説の本文検索を廃止へ 文字数が700億超えでサーバに負荷
    gengohouse
    gengohouse 2021/09/17
    700億文字ぐらいになると、さすがに転置行列を作るのも大変だったいう意味だと思いますが、何か工夫ができたのではと思ってしまう。
  • Googleアシスタントとより自然な会話が可能に BERT最新版搭載で

    Googleは4月28日(現地時間)、音声アシスタント「Googleアシスタント」の3つの改善を発表した。いずれも人間がアシスタントのために分かりやすい言い方を考えなくても、アシスタントに人間の意図を理解させ、自然な会話を成り立たせるのが目的だ。 アラームとタイマーの設定で途中の訂正に対応 例えば、「OK Google、5分の、あ、やっぱり9分のタイマーをセット」などと言うと、アシスタントはこれまでは「はい、『5分の、あ、やっぱり』という9分のタイマーをセットします。スタート」と対応していたが、改善後は「はい、9分のタイマーですね。スタート」と意図した通りに作動する。 また、10分のタイマーと20分のタイマーを続けてセットし、「2つ目のタイマーをキャンセル」と言うと、アシスタントはこれまでは「タイマーは2つあるようです。どちらをキャンセルしますか?」と聞いてきたが、改善後はどちらのことを

    Googleアシスタントとより自然な会話が可能に BERT最新版搭載で
  • 話し言葉を手話に自動変換 なめらかな生成を実現──英研究

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 英サリー大学の研究チームが開発した「Progressive Transformers for End-to-End Sign Language Production」は、深層学習で音声言語から手話の動きを生成するフレームワーク(Sign Language Production、SLP)だ。

    話し言葉を手話に自動変換 なめらかな生成を実現──英研究
  • Googleを解雇されたAI倫理研究者が指摘していた「大規模言語モデル」の危険性

    Google解雇されたAI倫理研究者が指摘していた「大規模言語モデル」の危険性:Googleさん(2/2 ページ) ディーンさんの言い分では「論文が公開の基準に満たなかったから」撤回を要求した、と。一応理由も説明していて、論文で指摘している問題点は、その後の研究でかなり改善されているのにそれに触れていない、とか。で、ゲブルさんの直属の上司、ミーガン・カコリアさん(白人女性)と相談して論文撤回を決めてゲブルさんに告げたところ、ゲブルさんが上記のような条件を出してその条件を飲まなければGoogleを辞める、と言ったので、(条件は飲まずに)彼女の決断を尊重したのだそうです。 うーん。なるべく公平に見たいですが、この説明はやっぱりなんだか不自然。騒ぎはさらに広がり、2018年の抗議デモの際に有名になった#GoogleWalkoutの有志が署名運動を開始。 これを書いている、署名運動開始後3日の時

    Googleを解雇されたAI倫理研究者が指摘していた「大規模言語モデル」の危険性
    gengohouse
    gengohouse 2020/12/08
    この件、自然言語処理に大いに関係ある話でした。GPT-3が内容を理解せずに単に言語を操作しているだけなのに儲かるから投資し続けている、と言ったらGoogleを怒らせたらしい。
  • Google、医療関係者向け文書解析サービスをプレビュー公開 機械学習で単語を抽出、文書検索をアシスト

    Google、医療関係者向け文書解析サービスをプレビュー公開 機械学習で単語を抽出、文書検索をアシスト 米Googleはこのほど、機械学習を利用して、医療文書から治療や研究に役立つデータを抽出するサービス2種類をプレビューとして公開した。 医療機関で保管している患者のデータは、カルテに文章の形で記入して保存するなど、構造化できていないことがほとんど。特定のキーワードで検索することや、キーワードごとにデータを分類して管理することはできない。必要なときは、医師などの専門知識を持つ人間が、長い時間をかけて大量の文書を読んで特定のデータを探すしかないのが現状だ。 Googleが今回プレビューとして公開したサービスは「Healthcare Natural Language API」と「AutoML Entity Extraction for Healthcare」の2種類。どちらもREST形式のAP

    Google、医療関係者向け文書解析サービスをプレビュー公開 機械学習で単語を抽出、文書検索をアシスト
  • 通訳デバイス「ポケトーク」、翻訳エンジンに「DeepL翻訳」採用

    DeepL翻訳は独スタートアップのDeepLが開発した翻訳サービス。2017年に公開し、20年3月には日語に対応した。ポケトークの翻訳エンジンの一部にDeepL翻訳を採用することで、以前に比べて翻訳の精度が向上するという。 ポケトークは、音声入力した言葉を通訳できるデバイス。クラウド上の翻訳エンジンとAIを活用し、58の言語をテキストと音声、24言語をテキストに翻訳可能。Wi-Fiか4G LTEでネット接続して使う。 今回のソフトウェアアップデートでは、対応言語にアルバニア語やボスニア語、英語をゆっくり発話する「英語(ゆっくり)」などを追加する他、発音練習の機能やハンズフリーの翻訳機能などに対応する。 関連記事 江東区立の全幼稚園、通訳デバイス「ポケトーク」導入 東京都江東区立の全幼稚園が、通訳デバイス「POCKETALK S」を導入。日語を話せない園児や保護者とのコミュニケーションを

    通訳デバイス「ポケトーク」、翻訳エンジンに「DeepL翻訳」採用
  • Google、同時通訳もする無線イヤフォン「Pixel Buds」を日本で8月20日発売

    Googleは8月4日、昨年10月の「Made by Google」イベントで発表し、米国では4月に発売した無線イヤフォン「Pixel Buds」を日でも発売すると発表した。価格は2万800円(税込)で、8月20日にオンラインのGoogle Store他、ソフトバンクとau、主な量販店で発売する。 スマートフォン(AndroidおよびiOS)やPCBluetoothで接続し、Pixel Budsのマイクに「Hey Google」と発声するか、パッドを長押しすることで「Googleアシスタント」を起動して様々な操作を行える。 PixelシリーズあるいはAndroid 6.0以降搭載のスマートフォンとの組み合わせでは、リアルタイム翻訳機能を利用できる。現在、日語、英語を含む40カ国語に対応する(対応言語一覧)。 パッドでの操作はGoogleアシスタントの起動の他、1回のタップで再生中の

    Google、同時通訳もする無線イヤフォン「Pixel Buds」を日本で8月20日発売
    gengohouse
    gengohouse 2020/08/04
    24年前に音声翻訳研究所にいた人間にとっては、ついにこんな時代が来たかという感じ。
  • 革命かパンドラの箱か、新AIツールGPT-3の波紋

    革命かパンドラの箱か、新AIツールGPT-3の波紋:星暁雄「21世紀のイノベーションのジレンマ」(1/5 ページ) 米シリコンバレーのテクノロジー好きな人々の間で、ひとつの新技術が大きな反響を呼び起こしている。米サンフランシスコに拠を置くAI人工知能)開発の非営利組織OpenAIが開発した最新AIツール「GPT-3」だ。 OpenAIが2020年6月にGPT-3をインターネット経由で利用できるインタフェース(API)を限定公開したところ、試した人々は想像を越える応用範囲の広さに驚いた。そこからソーシャルメディア経由で話題が広がり、より大勢の人々に刺激を与える形となった。 GPT-3は、英単語や短い文章をインプットすると、関連する「それらしい」テキストを自動生成するツールだ。文章だけでなく、プログラムコードや楽譜を自動的に生成するデモンストレーションも登場した。 プログラムを自動生成でき

    革命かパンドラの箱か、新AIツールGPT-3の波紋
  • Google、ネット上で“未回答”の検索ワードを表示する新ツール まずは医療向けに提供 新型コロナで

    Google法人は7月7日、医療従事者や医療情報を発信する組織に対し、一般ユーザーがよく検索するキーワードや、適切な情報が見つけられていないと考えられるキーワードを表示するツール「Question Hub」(クエスチョン ハブ)を提供すると発表した。Google検索のユーザーに対し、信頼性の高い情報が継続的に創出される環境を目指す。 Question Hubは、任意のトピックでユーザーが適切な情報を見つけられていないと考えられる“未回答”の検索キーワードを自動収集して表示するツール。 まずはβ版として、新型コロナウイルス感染症の関連情報をネット上で発信をしている医療従事者や、医療情報サイトを運営するメディカルノート(東京都港区)、メドレー(同)に提供。ユーザーの興味があるトピックの理解と、検索されるキーワードの把握を容易にすることで、ニーズがある検索キーワードに対し、正確な情報を発信し

    Google、ネット上で“未回答”の検索ワードを表示する新ツール まずは医療向けに提供 新型コロナで
    gengohouse
    gengohouse 2020/07/13
    これは技術的にはちょっとしたことだが重要な話。こんな話からも、技術(モデル)からその背後にあるデータに着眼点が向かいつつあることを感じる。
  • 1