並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 27 件 / 27件

新着順 人気順

メディア研究の検索結果1 - 27 件 / 27件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

メディア研究に関するエントリは27件あります。 AI開発自然言語処理 などが関連タグです。 人気エントリには 『#この記事は実在しません GPT-2 Text Generation Demo:朝日新聞社メディア研究開発センター 人工知能研究の取り組み』などがあります。
  • #この記事は実在しません GPT-2 Text Generation Demo:朝日新聞社メディア研究開発センター 人工知能研究の取り組み

    この記事は弊社の機械学習モデル(GPT-2言語モデル)が自動で生成したものをそのまま掲示したフィクションであり、実在の人物・団体・商品等とは何ら関係ありません。 GPT-2言語モデルは、朝日新聞記事で事前訓練した後に、日本語Wikipedia記事を用いてfine-tuningしています。詳細はこちらまで。 この記事はあらかじめ弊社の言語モデルに生成させた結果を蓄積し、スクリプトにより表示したもので、リアルタイムに生成させているものではありません。リロード、もしくはこちらをクリックすると、新しい記事が出てきます。 HOME PRODUCTS ABOUT PUBLICATIONS API利用停止 サイトポリシー プライバシーポリシー CONTACT 当サイトに掲載された内容は、日本の著作権法並びに国際条約により保護されています。掲載記事・写真・データ等の無断転載を禁じます。 Copyright

      #この記事は実在しません GPT-2 Text Generation Demo:朝日新聞社メディア研究開発センター 人工知能研究の取り組み
    • 長文要約生成API:朝日新聞社メディア研究開発センター 人工知能研究の取り組み

      概要 本APIは、入力された記事本文(最大2,000文字まで入力可能=製品版)を機械学習を用いて要約するものです。過去30年分の記事データを、ディープラーニングの機構を用いて学習させています。長文を要約するときにお役立てください。 本APIの機能は、 指定した長さごとに生成型要約 すべての文の長さを揃える すべての文を圧縮する 重要な文を抽出する 重要な文を抽出後圧縮して、指定した長さにする の5つです。より詳細はこちらに解説記事を載せています。 九州電力玄海原発3、4号機(佐賀県玄海町)の運転差し止めを住民らが求めた仮処分申し立ての即時抗告審で、福岡高裁(山之内紀行裁判長)は10日、住民側の抗告を棄却した。主な争点は、耐震設計の基になる基準地震動(想定される最大の揺れ)の合理性、原発周辺の火山の噴火リスク、配管の安全性の3点。 住民側は「基準地震動が過小評価されている」と主張。原子力規制

      • 【番組考察】NHKスペシャル『ジャニー喜多川 “アイドル帝国”の実像』(2024/10/20放送)~メディア研究者として - 35produce - 田淵俊彦

        私が出演したNHKスペシャル『ジャニー喜多川 “アイドル帝国”の実像』(2024/10/20放送)について、〝出演者として〟ではなく、メディア研究の研究者として考察、論考をしたい。 そのためには、今回の番組の当初の経緯から話しておかなければならない。 私は最初にNHKのディレクター・中川雄一朗氏から「今回は、ジャニー氏とメリー氏の人となりを描きたい」という説明を受けていた。中川氏は「クローズアップ現代」に所属時の2023年5月には、ジャニーズ性加害問題をいち早く報じ、継続的な取材によって同年9月に事務所を性加害の事実を認め謝罪をする会見に追い込んだ立役者である。 そして「ジャニー氏とメリー氏を知る人物にインタビューをして、そのインタビューで構成するドキュメンタリーを考えている」というような説明をしてくれた。私は、「モンスターの姉弟がどうやって作られたのか」「どこでこの姉弟が道を踏み外したの

        • 言語モデル:朝日新聞社メディア研究開発センター 人工知能研究の取り組み

          概要 言語モデルとは、人間が話したり書いたりする「言葉」を、単語の出現確率でモデル化したものです。昨今ではニューラルネットワークによる言語モデル (ニューラル言語モデル) が広く使われています。言語モデルには、左から右に順々に単語を予測するCausal Language Model (CLM) と、文中の単語を一部隠して「穴埋めクイズ」を解くMasked Language Model (MLM) があります。大規模な言語データを用いて、CLMやMLMのような方式で学習することで、高品質な言語モデルの構築が可能になります。 最近では、MLMのBERTやCLMのGPT-3などがメディアに取り上げられることも多くなってきました。メディア研究開発センターでは、過去30年にわたって蓄積してきた記事データを用いて言語モデルの構築と、自動要約や文書分類などのタスクへの応用研究を行っています。 各言語モデ

          • 最近公開された日本語LLMを要約生成タスクで検証してみる|朝日新聞社 メディア研究開発センター

            こんにちは。メディア研究開発センター(M研)の田口です。 最近、大規模言語モデル(以下、LLM)に関するニュースが毎日のように出ています。直近約1ヶ月の間にもOpenAIのAPIのアップデートが発表されたり、日本語のLLMが公開されたりしました。 少し前(といっても4月末)に「ChatGPT/OpenAI API/LLM活用事例~NewsPicksと朝日新聞の合同勉強会を公開」でLTをしました。このときはChatGPTの見出し生成の簡単な性能検証をしただけなので、この記事では最近公開されたLLMモデルの検証をしてみました。 ※この記事では社内データでなく公開データされているデータセットで実験しています LTの資料はこちらになります。 日本語LLMを要約タスクで検証するさっそく本題に入りましょう。今回は5月以降に発表された以下の日本語LLMを要約タスクで評価してみようと思います。 cyber

              最近公開された日本語LLMを要約生成タスクで検証してみる|朝日新聞社 メディア研究開発センター
            • 恥ずかしい誤字脱字に効く!校正支援ツール「TyE」|朝日新聞社 メディア研究開発センター

              メディア研究開発センター(M研)の田森です。 今回は、M研で開発中の校正支援ツール「TyE(たい)」の紹介をしたいと思います。ネーミングは先に開発した「TSUNA(つな)」の兄弟分、ということでお察しください。 TyEとはTyEができることはシンプルで、日本語で書かれた文の「誤っていそうな箇所」を指摘します。APIで提供しているので、様々なアプリケーションやサービスに適用できます。下記の例は、作成中のデモ画面でのチェック結果です。 TyEによる検知結果TyEの特徴を以下にまとめました。 検知のためのルール辞書を必要としません。 日本語のルールから逸脱している部分を自動的に検知します。 助詞や「同音異義語」といった、ルールにしづらいものも検知できます。 「文字の追加が必要」「誤った文字が入力されている」「余計な文字がある」ことを検知できます。 上記の例では、それぞれ赤、緑、青で示しています。

                恥ずかしい誤字脱字に効く!校正支援ツール「TyE」|朝日新聞社 メディア研究開発センター
              • 巷にあふれる情報を一括管理したい!|朝日新聞社 メディア研究開発センター

                いつもM研テックブログをご覧いただきまして、ありがとうございます。朝日新聞社メディア研究開発センター(M研)の田森です。 このテックブログも全体で100号目、私も勤続20年目となりました。弊社でR&D活動を初めてちょうど10年、私にとっては切りのいい数字が並びます。いまではこのテックブログも、弊社のR&Dもいろいろと成果も出てきています。振り返ると、まさに「connecting the dots」の世界だと思っています。 今後も、メディアにおけるR&Dの活動とはどうあるべきか、メディア内のR&Dに携わる技術者はいかにあるべきか、M研のメンバーや弊社に所属するすべての技術者と一緒に考え続けて行きたいと思います。引き続きよろしくお願いします。 さて、現在の私の立場としては7〜8割を管理業務に当てつつ、残りの時間で実際に手を動かしたり、M研メンバーと一緒に方針を考えるような時間を送っています。1

                  巷にあふれる情報を一括管理したい!|朝日新聞社 メディア研究開発センター
                • 日本地図で地名の分布を見てみた|朝日新聞社 メディア研究開発センター

                  メディア研究開発センターの新妻です。 ※本記事はQiitaの朝日新聞社アドベントカレンダー(6日目)にも参加しています。 字名(あざな)はその土地の地形や地質を表している?地名はその土地の特徴が由来している、なんて話を聞いたことがないでしょうか。例えば、台地に位置しているような場所には、東京都文京区の「目白台」や奈良県生駒市の「白庭台」といった◯◯台といった地名がついていたりします。そんな話を聞くと、なんとなーく日本地図で地名の分布を見たくなりませんか?自分は見たくなってしまったんで、サクッと作ってあれこれ見てみました。 その結果、こんな感じのマップができました。 ©︎mapbox ©︎OpenStreetMapマップ作成に利用したデータは、Geolonia 住所データです。 本データは、Geoloniaによって国土交通省位置参照情報サービスをベースに作成されたCC BY 4.0で提供され

                    日本地図で地名の分布を見てみた|朝日新聞社 メディア研究開発センター
                  • (インタビュー)8月ジャーナリズム考 メディア研究者・米倉律さん:朝日新聞デジタル

                    毎年8月にあふれる戦争・平和報道。半ば揶揄(やゆ)を込めて「8月ジャーナリズム」と呼ばれ、内容の定型化も言われて久しい。メディア研究者の米倉律さんは、その膨大な記事や番組の分析を通じ、この社会の映し…

                      (インタビュー)8月ジャーナリズム考 メディア研究者・米倉律さん:朝日新聞デジタル
                    • オープンデータ分析してみたら、「日本を少し変えちゃった」話|朝日新聞社 メディア研究開発センター

                      朝日新聞社デジタル機動報道部でデータジャーナリズムの取り組みに携わっている山崎です。もともとエンジニアとして入社した背景を武器に、データの分析やそのビジュアライゼーションを記事の執筆に活かしています。 今回はちょっとこちらのNoteにお邪魔して、4月に朝日新聞デジタルで配信がスタートした、オープンデータ分析による大型連載(←自分で言うな)「みえない交差点」のテクニカルな部分を紹介したいと思います。 1.そもそもどんな連載?分析の元データとなったのは、警察庁がオープンデータとして公開している「交通事故統計情報のオープンデータ」です。 警察では、事故が起こった際に、天気や場所、日時、当事者の年代など、どのような人身事故だったかを詳細に記録しているのですが、個人情報などをのぞいた一部のデータを2019年分から公開しています。 このオープンデータに含まれる緯度・経度を活用して、事故が多発している場

                        オープンデータ分析してみたら、「日本を少し変えちゃった」話|朝日新聞社 メディア研究開発センター
                      • yabaiとskhdで爆速ウィンドウ操作環境を構築してみた|朝日新聞社 メディア研究開発センター

                        はじめにこんにちは。 メディアラボチームで新規事業に取り組んでいる市野です。 PCを利用する上で避けられないウィンドウ操作 (アプリケーションを開いたときに表示されるあれです) 。表示されたあとに、適切なサイズに変更したり、他のウィンドウと被らないように位置を変更することも多いのではないでしょうか。 これって地味に時間がかかる細かい作業ですよね、、、 もし、マウスを使わずにキーボードショートカットだけで適切な位置・サイズに変更できたら、、、 もし、なんならキーボードすらも使わず、表示されているウィンドウ群を自動で適切なサイズ・位置に変更できたら、、、 実はそのようなことを可能にしてくれるツールが開発・公開されています。自称効率厨の私としては、頻繁に行うウィンドウ操作の効率化は見逃せません。大きな可能性を秘めている "ウィンドウマネージャー" について今回はご紹介します。 本記事では私が主に

                          yabaiとskhdで爆速ウィンドウ操作環境を構築してみた|朝日新聞社 メディア研究開発センター
                        • GA4移行のためにGTMのタグ情報収集ツールを作成した話 GoogleAnalytics/GoogleTagManager|朝日新聞社 メディア研究開発センター

                          メディアデザインセンターの山本剛史と申します。普段はWebメディアのアクセス解析や、ABテストによる改善検証など、サイトグロースを担当しています。 朝日新聞社のWebメディアとしては朝日新聞デジタルが有名ですが、それ以外にも多様なWebメディアを運営しています。そうした多様なメディアの運営を行っているのがメディアデザインセンターです。 今回、メディアのアクセス解析で利用しているGoogle Analytics(GA)のGA4移行に伴い、タグ管理ツールのGoogle Tag Manager(GTM)でも移行作業が発生したため、GTMで設定したタグ情報の収集ツールを開発したので紹介します。 Google Analytics(GA)でアクセス解析運営メディアではアクセス解析ソフトのGoogle Analytics(GA)を使い、日々サイトを分析しています。GAはアクセス解析ソフトとしては最も利用

                            GA4移行のためにGTMのタグ情報収集ツールを作成した話 GoogleAnalytics/GoogleTagManager|朝日新聞社 メディア研究開発センター
                          • 記者に特化した音声認識モデル(Whisper)を作った話|朝日新聞社 メディア研究開発センター

                            こんにちは、メディア研究開発センターの山野陽祐です。 先日、朝日新聞の記者に特化したWhisper (音声認識モデル)を構築し、3月末から社内向けツール「YOLO」にて運用を開始しました。それに至るまでの道のりをこちらの記事でご紹介します。 なお、学習データとして活用するファイルは、社内会議や公の記者会見とし、個人情報やセンシティブな情報が含まれるファイルは使用しておりません。 データ「YOLO」は音声や動画の文字起こしをする社内向けのサービスで、約2年前にリリースしました。この間にアップロードされた音声ファイルや動画ファイルは数千時間におよび、そのうち学習に使えるデータも多くあります。 ここでは、YOLOで蓄積されたデータを紹介し、続いて学習データや評価データについても述べます。 YOLOデータアップロード時、ユーザーにファイルの"ジャンル"を指定してもらうようなサービス設計をしています

                              記者に特化した音声認識モデル(Whisper)を作った話|朝日新聞社 メディア研究開発センター
                            • 勿忘草 on X: "戦前のメディア研究にあたり当時の新聞ばかり対象にするとこうなるという危険性を示すポスト。紙の発給権を軍部が握っていたこと、反戦ではなく国防方針について軍部を批判しただけの新聞記事でも軍部と一心同体の在郷軍人会が不買運動を起こし全面屈服した歴史を知っている人はこういう結論に達しない"

                              • Tesseract v4に特定のフォントを学習させる ~ 画像のデノイジング処理を添えて ~|朝日新聞社 メディア研究開発センター

                                メディア研究開発センターの倉井です。 最近Tesseractを使ってOCRをしたいことがあったのですが、新たにフォントを学習させたい場合など、いくつか初見では難しい設定をする必要があったので、備忘録的に残したいと思います。 合わせて元の画像のノイズをopenCVを使って取り除き、綺麗にする方法も共有したいと思います。 なお、検証に当たって大いに参考にさせていただいたWebページのリンクを最後にまとめています。 TesseractをインストールするTesseractは記事執筆時点(2022.05.31)で、v5.1.0まで公開されています。 5系ではモデルのfinetuneをしたい場合、文字の写っている画像とその文字のアノテーションデータが必要となり(筆者調べ)、その準備が大変です。 一方で4系では学習させたい文字列とフォントさえ準備すれば、学習用のデータを自動で生成してくれるので、追加学習

                                  Tesseract v4に特定のフォントを学習させる ~ 画像のデノイジング処理を添えて ~|朝日新聞社 メディア研究開発センター
                                • これが自動要約エンジン「TSUNA」  開発裏側を紹介|朝日新聞社 メディア研究開発センター

                                  みなさま、はじめまして。朝日新聞社の田森と申します。私は「メディアラボ」という部署の研究チームで、私含め6名のチーム員とともに朝日新聞社の中にあるリソースを利用した研究開発を日々進めています。今回は、我々が開発した自動要約生成エンジン「TSUNA」と、その開発の裏側をご紹介できればと思います。 なお、今回のエントリのタイトルはTSUNAが実際に出力した見出しです。他にも下記のようなものを出力しました。多少変なものも混じっていますが、それっぽいものは出せているのではないでしょうか。 「メディアラボ」の研究開発 TSUNAとの裏側を紹介 リソースとTSUNAの開発 「メディアラボ」の裏側 私の「メディアラボ」の裏側 リソース研究、私含め6名チーム TSUNAとリソースが結ぶ裏側、私も開発したら... 生成エンジンの裏側とは? 「メディアラボ」開発を日々進む 「メディアラボ」の研究開発 TSUN

                                    これが自動要約エンジン「TSUNA」  開発裏側を紹介|朝日新聞社 メディア研究開発センター
                                  • アノテーションツール「Label Studio」のご紹介【無料でどこまでできる?】|朝日新聞社 メディア研究開発センター

                                    Label StudioはHeartexという会社が提供しているオープンソースのアノテーションツールです。様々な種類のデータ(音声・画像・テキスト・時系列データ…)、幅広いタスクに対応しています。 Label Studioは基本的に無料で使用できます。 機能拡張やサポートが受けられる有償版もあるようですが、個人で使う分には無料機能で十分な印象です。詳しくは下記ページなどをご参照ください。 なお、今回は他ツールとの比較などは行っていませんので悪しからず…。 というのも、筆者がアノテーションツールとしてLabel Studioを使い始めたのに、特別な理由などはありません。たまたまです。 とはいえ、環境構築が難しいツールも多い中(お恥ずかしいことに他のツールでうまくいかなかった経験あり)、これまで特に不自由なく利用できてきたので、これも何かの縁ということで今もお世話になっています。 何ができる?

                                      アノテーションツール「Label Studio」のご紹介【無料でどこまでできる?】|朝日新聞社 メディア研究開発センター
                                    • LLMを使ったかな漢字変換|朝日新聞社 メディア研究開発センター

                                      こんにちは。メディア研究開発センターの山野です。私は普段は音声処理や自然言語処理やそれらの技術を使ったプロダクト開発などに従事しています。 さて今回は朝日新聞記事データを使ったニューラル仮名漢字変換について簡易な実験をしたのでその結果を共有します。 はじめに多くの問題を解くことができるLLMですが、ひらがな列Xをかな漢字混じり文Yへ変換する仮名漢字変換については、単語の読み方とその表記の関連性を学習する必要があり、現時点(2024年7月8日)ではLLMでもうまく解くことができません。 実はほとんど全てのオープンな日本語LLMはかな漢字変換が全く出来ません。 出典: https://zenn.dev/azookey/articles/ea15bacf81521e(ちなみに私はiPhoneのキーボードをazooKeyに変更してしばらく経ちますがとても使い勝手/心地が良いのでオススメです。) そ

                                        LLMを使ったかな漢字変換|朝日新聞社 メディア研究開発センター
                                      • 勿忘草 on X: "戦前のメディア研究にあたり当時の新聞ばかり対象にするとこうなるという危険性を示すポスト。紙の発給権を軍部が握っていたこと、反戦ではなく国防方針について軍部を批判しただけの新聞記事でも軍部と一心同体の在郷軍人会が不買運動を起こし全面屈服した歴史を知っている人はこういう結論に達しない"

                                        • 大容量ファイルのアップロードってどうやるの?【署名付きURL×マルチパートアップロード】|朝日新聞社 メディア研究開発センター

                                          こんにちは。メディア研究開発センター(M研)の新美です。 最近イベント用のグッズでTシャツを購入しましたが、肝心のイベントのチケットが外れて日の目を浴びられないことが確定したため少しやさぐれております。 さて、そんなやさぐれ女が今回ご紹介するのは署名付きURLを用いた大容量ファイルのアップロード方法についてです。私が開発に携わっている社内向け文字起こしサービス「YOLO」では、長時間の録音ファイルや動画ファイルなど大容量のファイルのアップロードが求められるようになってきました。 そこで従来採用していたアップロード方法を見直し、より大容量のファイルを高速にアップロードできる手法を検討しました。詳細な実装方法や速度比較の結果について、以下で詳しく解説していきます。 YOLOについての詳細は下記の記事をご覧ください。 従来のアップロード方法現行のYOLOでは、フロントエンドから実体ファイルを含ん

                                            大容量ファイルのアップロードってどうやるの?【署名付きURL×マルチパートアップロード】|朝日新聞社 メディア研究開発センター
                                          • AWS Inf1上でBERTモデルの推論を走らせる―モデルコンパイルから速度比較まで|朝日新聞社 メディア研究開発センター

                                            今回のテックブログは、BERTの系列ラベリングをサンプルに、Inferentia、GPU、CPUの速度・コストを比較した結果を紹介します。Inf1インスタンス上でのモデルコンパイル・推論の手順についてのお役立ちチュートリアルも必見です。 AWS Inf1とは こんにちは。メディア研究開発センター (通称M研) の田口です。今回はAWSのInf1インスタンス上でBERTモデルを動かす際の流れをご紹介したいと思います。 さて、みなさんは機械学習モデルの推論をどこで走らせていますか? BERTのようなサイズの大きいモデルを走らせる場合、コスト上問題なければTPU・GPUを使いたいですよね。とはいえ、できるだけコストは抑えたいのでCPUを選択すると「推論速度が…」という悩みがでてきます。そこでM研では、GPU・CPUに代わる選択肢としてInferentiaというチップを搭載したAWS Inf1の検

                                              AWS Inf1上でBERTモデルの推論を走らせる―モデルコンパイルから速度比較まで|朝日新聞社 メディア研究開発センター
                                            • Imaginary Dictionary -未来を編む辞書|朝日新聞社 メディア研究開発センター

                                              はじめに こんにちは、メディア研究開発センターの浦川です。 この記事では、本日12月21日から東京・六本木にあります21_21 DESIGN SIGHTで開催される「2121年 Futures In-Sight」展にて展示中の作品「Imaginary Dictionary -未来を編む辞書」についてご紹介します。 この作品は、デジタル技術を生かしたアート作品の制作などを行うQosmo, Incとの共作による「未来を編む=未来に存在している(かもしれない)語の収められた辞書をつくる」といったプロジェクトです。 はたして、どういった過程を経て「未来を編む辞書」がつくられているのか。今回はその裏側についてお話ししてまいります。 作品について 作品(撮影:Qosmo, Inc.)作品(撮影:Qosmo, Inc.)展示風景(撮影:吉村昌也) この作品は、未来に存在しているかもしれない新しい言葉や、

                                                Imaginary Dictionary -未来を編む辞書|朝日新聞社 メディア研究開発センター
                                              • 【AWS】Lambda Powertoolsを布教したい!|朝日新聞社 メディア研究開発センター

                                                現在対応している言語はPython・Java・TypeScript・.NETです。この記事のサンプルコードは全てPythonになります。 ちなみにYOLOでは、メイン機能である音声認識まわりをLambdaに移行するタイミングでPowertoolsを導入しました(2023年3月、下記記事もご覧ください)。 導入して感じたメリットはざっとこんな感じでしょうか。 構造化ログが簡単に生成される バリデーションを自前で実装しなくて良くなる API Gatewayとの統合がいろいろ楽になる それぞれ後ほど紹介したいと思いますが、とにかくよしなにやってくれるのです。 インストール方法と使い方導入はとても簡単で、Lambdaレイヤーかpipから使えます。 AWSコンソールでサクッと使う「AWSレイヤー」にPowertoolsのレイヤーが用意されています。使いたいLambda関数でこのレイヤー追加するだけで

                                                  【AWS】Lambda Powertoolsを布教したい!|朝日新聞社 メディア研究開発センター
                                                • SFCにある礼拝スペース|政策・メディア研究科委員長補佐 野中 葉|慶應義塾大学 湘南藤沢キャンパス(SFC)

                                                  よく知られているように、SFCは、様々なバッググラウンドを持った学生、教員、職員が集う場だ。留学生の数で言っても、2022年6月現在、総合政策・環境情報・看護、それから大学院の政策・メディア、健康マネジメント合わせて400人以上 、実に多様な国籍、言語、信仰、文化、慣習を持った人たちが集まっている。誰もが過ごしやすいキャンパスを目指して、ハード面も少しずつ整備が進んでいる。そうした取り組みの中から今回は、すでに10年ほど前に整備され、日常的に使われている、けれども、どうやら学内でもあまり知られていない、イスラーム教徒たちの礼拝スペースを紹介しよう。 イスラーム教徒は、明け方、昼、午後、日没、夜と一日5回の礼拝をする。明け方や夜の礼拝はもちろん自宅でできるが、昼や午後、授業の取り方によっては日没の礼拝の時間も、キャンパスで過ごしているイスラーム教徒が多い。このイスラーム教徒たちが礼拝を行える

                                                    SFCにある礼拝スペース|政策・メディア研究科委員長補佐 野中 葉|慶應義塾大学 湘南藤沢キャンパス(SFC)
                                                  • 「般若心経」をT5(Text-to-Text Transfer Transformer)を使って現代語訳してみた!|朝日新聞社 メディア研究開発センター

                                                    「般若心経」をT5(Text-to-Text Transfer Transformer)を使って現代語訳してみた! ICTRADの山野です。 この記事は、 T5という自然言語処理の手法を用いて、 漢文形式の般若心経を現代語訳にチャレンジした、 いわゆる「やってみた」系の記事です。 「漢文」って、書き下しのルールや意味が理解できれば、普段使う日本語の深さも教えてくれるものですが、ちょっととっつきづらいイメージがありますよね。なので技術を使って簡単に現代語訳することができたら、身近に感じられるんじゃないかと思い、まずは「般若心経」でチャレンジしてみました。 あわせて、「朝日新聞ってなんだか堅そう」、「新聞社のエンジニアって普段何してるかわからない」っていう方は、ぜひこの記事を見て「ICTRAD」の研究開発チームが何をやっているかちょっとでもわかってもらえればなと思います! ※すぐに現代語訳の結

                                                      「般若心経」をT5(Text-to-Text Transfer Transformer)を使って現代語訳してみた!|朝日新聞社 メディア研究開発センター
                                                    • mackerelでオンプレサーバーの監視を強化してみたら幸せになった|朝日新聞社 メディア研究開発センター

                                                      いつもM研テックブログをご覧いただきまして、ありがとうございます。朝日新聞社メディア研究開発センター(M研)の田森です。 さて、M研では研究用のGPU搭載サーバーをはじめとして、何台かのオンプレサーバーやNASが存在します。 見えなくなるまで続く(うそ)弊社サーバールーム結構台数があるので、それなりの管理が必要なのですが、中でも困っているのは 各ストレージはどれくらい使われているのか? GPUはどのサーバーででどのくらい動いているのか? がなかなか分かりづらい。これらの項目を含めて、サーバーの状況を包括的に監視できるものを探していたのですが、 mackerel というサービスで実現できそうなことがわかり、試してみました。 Disclaimer当記事の内容については、mackerelを運営されている株式会社はてな様の保証や推薦を得たものではなく、弊社で独自に実施した内容をまとめたものです。

                                                        mackerelでオンプレサーバーの監視を強化してみたら幸せになった|朝日新聞社 メディア研究開発センター
                                                      • 【自然言語処理】アノテーションがぐっと楽になる! お助けツールprodigyについて|朝日新聞社 メディア研究開発センター

                                                        一方、私たちのチームで使っているprodigyをがっつり紹介した記事はあまり見かけません。有償のハードルはやはり高いのか、日本ではあまり浸透していないのかわかりませんが、1回購入でずっと使えて※、長い目で見ればコスパは良いという実感もあるので、この場で紹介してみたいと思います。 ※無料アップグレードは12ヶ月、など制限もありますので詳細は公式サイトを確認ください。 prodigyとは prodigyを提供しているのは、Explosionというソフトウェア会社です。同社が提供するspaCyという自然言語処理用ライブラリなら聞き覚えがあるという方も多いかもしれません。 prodigyで行えるアノテーションタスクや料金など、詳細は以下の通りです。 アプリタイプ: webアプリケーション 入出力データ形式: jsonl(ndjson) 料金(1回購入):personal:$390 company:

                                                          【自然言語処理】アノテーションがぐっと楽になる! お助けツールprodigyについて|朝日新聞社 メディア研究開発センター
                                                        1

                                                        新着記事