並び順

ブックマーク数

期間指定

  • から
  • まで

281 - 320 件 / 321件

新着順 人気順

言語処理の検索結果281 - 320 件 / 321件

  • 今年の書初めコーディングはAITuberを創る!

    はじめに あけましておめでとうございます。去年は何といってもAIの年でした。ChatGPTやStableDiffusionが2022年末に登場してから、想像を超えてAI周りが進化しましたね。今回は年の初めという事もあり、前から興味のあったAITuberを作ってみる事にしました。 「AITuberを作ってみたら生成AIプログラミングがよくわかった件」 って本も買ったし。LLM部分だけでは無く、OBSやYouTubeのコメント取得などAITuberに必要な内容が一式揃っていて非常に参考になりました。 また、私はプログラミングは多少できますが、イラストや音楽に関しては全くスキルの無い人間です。そのためそのあたりに関してはStable DiffusionやSunoAIの力を借りて作っているので、結果的にオール生成AIという感じですね。そのあたりも含めて記事にまとめたいと思います。 TL;DR 素の

      今年の書初めコーディングはAITuberを創る!
    • 今年のGoogleスゴすぎない?

      2021: More than OK! 今年もGoogle(Alphabet)にお世話にならない日はありませんでした。このインフォグラフィックによると、人類は毎分570万回もGoogle検索し、約69万時間分の動画をYouTubeで見ていたそうです(YouTubeはGoogle傘下、GoogleはAlphabet傘下)。 それだけでもヤベェ会社だなと思いますが、今年はコア以外の部分もすごかった! コスパも技術もエゲツない Google Pixel 6Image: Sam Rutherford/Gizmodo USGoogle謹製のAndroidスマホが日本市場デビューを果たしたのが2018年。Pixel 3は、ソフトの力で群を抜いてキレイな写真が撮れるシンプルイズベストなスマホでした。ただしメモリ容量やバッテリー持ちがちょっと物足りない記憶。 2019年のPixel 4は、Soliレーダー

        今年のGoogleスゴすぎない?
      • MeCab互換な形態素解析器Vibratoの高速化技法 - LegalOn Technologies Engineering Blog

        こんにちは。LegalForce Researchで研究員をしている神田 (@kampersanda) です。 LegalForce Researchでは、MeCab互換の形態素解析器Vibrato(ヴィブラ〰ト)を開発しています。プログラミング言語Rustで実装しており、高速に動作することが主な利点です。Vibratoはオープンソースソフトウェアとして以下のレポジトリで公開しています。 github.com 本記事では、Vibratoの技術仕様を解説します。以下のような方を読者として想定します。 自然言語処理の要素技術に興味のある方 データ構造・アルゴリズムに興味のある方 Rustでの自然言語処理に興味がある方 Vibratoについて 最小コスト法による形態素解析 単語ラティスの構築 最小コスト経路の計算 高速化の取り組み 辞書引きのキャッシュ効率化 実装での注意点 連接コスト参照のキャ

          MeCab互換な形態素解析器Vibratoの高速化技法 - LegalOn Technologies Engineering Blog
        • 無料、独学で機械学習エンジニアになる!~機械学習が学べる無料サイト、書籍~ - Qiita

          こんにちはkamikawaです 今回は無料で利用できる機械学習、データサイエンスに関するサイトや書籍をまとめました 私自身も機械学習プロジェクトに関わった経験があるのですが、ここに載せたサイトや資料を勉強に使っていました 機械学習エンジニアを目指す人必見です 入門者レベル〜応用・発展レベルまで幅広く載せていますレベルは個人の見解です。(あくまでも参考程度に) 日本語のものと英語のものを紹介します 海外の大学の講義もあるので英語の勉強にも使えます 海外でのキャリアを考えている方も必見です 対象読者 機械学習を学びたいけどお金をかけたくない人 独学で機械学習を身につけたい人 機械学習エンジニアになりたい人 発展的な機械学習を学びたい人 日本語 Python 三重大学奥村教授のサイト 機械学習、様々な分析、スクレイピング、データ可視化、地図データ、CV、統計など幅広い分野を扱っている R編もある

            無料、独学で機械学習エンジニアになる!~機械学習が学べる無料サイト、書籍~ - Qiita
          • 【初心者向け】無料でPythonの基本文法を5時間で学ぼう! - Qiita

            はじめに この記事は、AI AcademyのPython文法速習編とPython プログラミング入門編の内容をベースに一部修正を加えたものです。 この記事を読み進めることで、Pythonの基本文法の基礎を学ぶことが出来ます。 Pythonを学び終わった方は、無料(一部のコンテンツのみ有料だが基礎コンテンツはほぼ全て無料)でAI・機械学習が学べるAI Academyも活用ください。 オンライン機械学習スクールはこちら なぜPythonなのか? AI Academyでは人工知能(AI)分野を中心とした学習コンテンツを扱っており、その人工知能分野においてPythonは機械学習・ディープラーニングを容易に扱うことができるからです。 また、The 2018 Top Programming Languagesの記事でも、プログラマーの年収は1位でした。 The 2018 Top Programming

              【初心者向け】無料でPythonの基本文法を5時間で学ぼう! - Qiita
            • セマンティック検索の活用で、Elasticsearchの検索が根本的に変わる!? - Taste of Tech Topics

              こんにちは、@shin0higuchiです😊 業務では、Elasticsearchに関するコンサルティングを担当しています。 最近すっかり春らしく、暖かくなってきました。 新年を迎えたばかりの感覚でしたが、あっという間に時が経ちますね。 さて、今回の記事では、Elasticsearchの検索を根本的に変える可能性を秘めたセマンティック検索に関して書かせていただきます。 概要 Elasticsearchは元々、キーワードベースのアプローチを主に取っており、クエリで指定されたキーワードを対象のドキュメント内で検索し、それらの出現頻度や位置に基づいて結果をランク付けしています。この方法では、文脈や意図に関係なく、単純にキーワードの一致度に基づいて検索結果が返されます。 一方、セマンティック検索とは、ユーザーのクエリの背後にある文脈と意図を理解しようとする検索手法で、キーワードだけに頼るのではな

                セマンティック検索の活用で、Elasticsearchの検索が根本的に変わる!? - Taste of Tech Topics
              • プロと読み解く Ruby 3.1 NEWS - クックパッド開発者ブログ

                技術部の笹田(ko1)と遠藤(mame)です。クックパッドで Ruby (MRI: Matz Ruby Implementation、いわゆる ruby コマンド) の開発をしています。お金をもらって Ruby を開発しているのでプロの Ruby コミッタです。 本日 12/25 に、ついに Ruby 3.1.0 がリリースされました(Ruby 3.1.0 リリース )。今年も Ruby 3.1 の NEWS.md ファイルの解説をします。NEWS ファイルとは何か、は以前の記事を見てください。 プロと読み解く Ruby 2.6 NEWS ファイル - クックパッド開発者ブログ プロと読み解くRuby 2.7 NEWS - クックパッド開発者ブログ プロと読み解くRuby 3.0 NEWS - クックパッド開発者ブログ 本記事は新機能を解説することもさることながら、変更が入った背景や苦労な

                  プロと読み解く Ruby 3.1 NEWS - クックパッド開発者ブログ
                • 時系列データのための大規模言語モデル

                  近年の大規模言語モデル(LLM)の出現は、自然言語処理(NLP)においてパラダイムシフトをもたらし、ChatGPTをはじめとする様々な革新的サービスを生み出している。LLMの急速な進化は、NLPの領域を超えて、より広範なデータモダリティへのLLMの適用可能性を探る研究への発展を促している。その中で今回注目したのが、時系列データへのLLMの適用である。例えば、[Gruver+, 2023] では、GPT-3やLLaMA-2などの既存のLLMが、ダウンストリームタスクで教師あり学習した時系列モデルの性能に匹敵するか上回るレベルで、zero-shotで時系列予測ができることを報告しており、大変興味深い。本ブログでは、2024年に公開されたサーベイ論文「Large Language Models for Time Series: A Survey」を参考にLLM for Time Seriesの全

                    時系列データのための大規模言語モデル
                  • Ruby に Software Transactional Memory (STM) を入れようと思った話 - クックパッド開発者ブログ

                    技術部でRubyインタプリタの開発をしている笹田です。コロナの影響で、リモート勤務などに移行し、新しい生活スタイルを満喫されている方々がたくさんいらっしゃるんじゃないかと思います。ただ、私は以前から自主的に自宅勤務することが多かったので、正直生活がぜんぜん変わっていません。 さて、家で私が何をしているかというと、Ruby 3の準備です。その中でも、数年取り組んできた Ruby で並列処理をするための仕組みである Ractor の開発をしています(以前は Guild というコードネームで呼んでいました)。Ractor という名前は、Ruby の Actor みたいな意味で付けました。Erlang とか Elixir で有名な Actor model というアレです。厳密には、Actor model でよく言われる特性をすべて備えているわけではないのですが、並列で動く Ractor を複数作る

                      Ruby に Software Transactional Memory (STM) を入れようと思った話 - クックパッド開発者ブログ
                    • 【第5回】「型」はウェブシステム開発に「エンドゲーム」をもたらすか | GeeklyMedia(ギークリーメディア) | Geekly(ギークリー) IT・Web・ゲーム業界専門の人材紹介会社

                      伊藤直也さんが「今逢いたい」ソフトウェアエンジニアに声をかけて対談を重ねてきたシリーズの最終回は、これまでの対談の文章化を手がけたラムダノート株式会社の鹿野桂一郎さんとの異色対談です。コンピュータ技術書や記事の編集者であると同時に仕事や趣味でHaskellのプログラムも書く鹿野さんの視点を通し、現代のウェブシステム開発に伊藤さんが何を見ているのか、特に「型」と「エンジニアの学び」というこれまでの対談に通底するテーマについて掘り下げます。 ・伊藤 直也さん / 株式会社 一休 執行役員 CTO 新卒入社したニフティ株式会社でブログサービス「ココログ」を立ち上げ、CTOを務めた株式会社はてなでは「はてなブックマーク」などの開発を主導。グリー株式会社では統括部長としてSNSを担当した。2016年4月、一休に入社し執行役員CTOに就任。 ・鹿野 桂一郎さん / ラムダノート株式会社 代表取締役社長

                      • LLMのRAG(外部知識検索による強化)をまとめた調査報告 | AIDB

                        LLMのRAG(外部知識検索による強化)についての調査結果が報告されています。 基本フレームワークと各構成要素の詳細、評価、そして今後の発展について言及されており網羅的です。 本記事では、その報告内容を抜粋してお届けします。 参照論文情報 タイトル:Retrieval-Augmented Generation for Large Language Models: A Survey 著者:Yunfan Gao, Yun Xiong, Xinyu Gao, Kangxiang Jia, Jinliu Pan, Yuxi Bi, Yi Dai, Jiawei Sun, Haofen Wang 所属:Tongji University, Fudan University URL:https://doi.org/10.48550/arXiv.2312.10997 本記事の関連研究:LLMにナレッジグ

                          LLMのRAG(外部知識検索による強化)をまとめた調査報告 | AIDB
                        • プッシュ通知のタイミングを制御する話 〜 ユーザーの空気を読む通知

                          ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog Yahoo! JAPAN研究所 坪内と申します。今日は通知の話です。 プッシュ通知に気づかなかったり、タイミングが悪くてイラっとしてしまうことはないでしょうか? 最適なタイミングで通知する研究結果をご紹介します。 みなさんが目にする、ヤフーの広告の表示や、オススメの情報は、パーソナライズされています。つまり、過去のユーザーの行動履歴から「この人は釣りが趣味の人だ」と推測し、釣りに関するニュースや、釣竿のレコメンデーションをしています。これはプッシュ通知もしかりです。プッシュ通知は表示できる文字数や送信できる通知数に制限があります。ユーザーの興味などから、この人にはこの通知だ! というのを送ります。ここまでは、広告やレコメンデーショ

                            プッシュ通知のタイミングを制御する話 〜 ユーザーの空気を読む通知
                          • アフターコロナの世界でソフトウェアエンジニアの未来はどう変わるのか? 転職市場動向から見る、企業と求職者の今 - はてなニュース

                            世界に大きな影響を与えたコロナ禍、そしてスマートフォン誕生以来の衝撃ともいわれる「ChatGPT」の登場──。エンジニアを取り巻く環境は、激動の真っ只中にあります。 アフターコロナとも言われる状況になった今、エンジニアの働き方や企業の動きにはコロナ禍とはまた違った変化が見られています。例えばリモートワークからハイブリッド出社、完全出社に切り替えた企業もあり、働き方や技術トレンドの変遷に合わせた対応や、それらに伴いこれからの時代において必要となるスキルセットも注目されています。 経済や市場をはじめとした外的環境の変化に対応し、キャリアを積むために、エンジニアはどのような考えのもとで行動すべきなのでしょうか。また企業はどのようにして優秀なエンジニアを見つけて採用すればいいのでしょうか。 今回はエンジニア転職サービス「Findy」を提供するファインディ株式会社CTO・佐藤将高さん(写真右)と同社

                              アフターコロナの世界でソフトウェアエンジニアの未来はどう変わるのか? 転職市場動向から見る、企業と求職者の今 - はてなニュース
                            • AIベンチャーPFN、美少女育成アプリ「MEMES」をリリース 容姿や発言内容に深層学習を活用

                              ミームズの容姿の生成には、深層学習を使った画像生成モデルの1つである敵対的生成ネットワーク(GAN)からPFNが開発したキャラクター生成プラットフォーム「Crypko」を利用。バリエーションは無限だという。また、発言内容の生成には自然言語処理を活用している。 PFNはこれまで、線画自動着色サービス「Petalica Paint」やアニメ背景美術制作支援ツール「Scenify」などエンターテインメント領域の事業も手掛けてきた。今回配信するMEMESでは、深層学習を使った今までにないエンターテインメントの提供を目指す。 関連記事 “PFNのAI”搭載お掃除ロボ登場 柔軟な自律走行と高い洗浄力両立 アマノと共同開発 AIベンチャーのPreferred Networks(PFN)の子会社で、ロボット開発を手掛けるPreferred Roboticsは、自律移動する小型床洗浄ロボット「HAPiiBO

                                AIベンチャーPFN、美少女育成アプリ「MEMES」をリリース 容姿や発言内容に深層学習を活用
                              • 使える統計モデル10選(前編) | AIdrops

                                使える統計モデル10選(前編) 統計モデリング(statistical modelling)はデータ解析の方法論の1つです。データ解析の目的は、通常はただの数値や記号の羅列であるデータから、人間が何かしらの判断を行うために有益な情報を引き出すことにあります。データ分析者は、そのままでは意味をなさないデータに対して、折れ線グラフやヒストグラムなどを用いて、人間が判断を行いやすいようにデータの可視化を行います。一方で、時にはニューラルネットワークのような複雑な計算モデルを使ってデータを解析し、まだ観測されていない将来の値を予測させたりします。このように、データから有益な情報を引き出すために、データに対して人為的な視点や事前知識、数学的な仮定などを設計する作業をモデリング(modeling)と呼びます。 統計モデリングによるデータ解析では、データ自体や解析の目的に合わせて分析者が適切なモデルを設

                                  使える統計モデル10選(前編) | AIdrops
                                • BERTのAttentionは何を見ているのか?

                                  3つの要点 ✔️BERTのAttention機構の分析手法の提案 ✔️Attentin機構は全体的には区切り文字や[CLS]、[SEP]を見ている ✔️特定のAttention機構では「動詞とその目的語」、「名詞と修飾語」、「前置詞とその目的語」などの簡単な文法関係から、照応関係などの複雑な文法関係も獲得している 前書き 現在の自然言語処理ではTransformer以降、Attention機構を用いたモデルが流行となっています。その中でも最近はBERTなどの巨大な事前学習済みのモデルが大きな成功を収めています。 それらモデルが何を学習しているのかを分析する取り組みは行われてきましたが、モデルの出力自体や隠れ層でのベクトル表現に焦点を当てた分析手法が中心でした。 この論文では、Attention機構が何を見ているのかに焦点を当てたモデルの分析手法が提案されており、BERTのAttention

                                  • 「“課題を見つけて分解する力”と“コードを書いて解決する力”は全然違う」 増井雄一郎氏が明かす“エンジニア力”の本質と鍛え方

                                    「Windowsもインターネットも全然普及してない時からプログラミングに夢中だった」 “まずはやってみる”を大事にする、増井雄一郎氏の原動力とは 自分の強みは「新しいことをおもしろがって勉強できる」こと ーー増井さんご自身が考える、自身のエンジニアとしての強みはどこでしょうか? 増井雄一郎氏(以下、増井):新しいことを覚えられるというのは、やはり強みとしてあるなと思います。 1つの技術の初めから終わりまでは、だいたい20年でワンサイクルだと思っているんですよ。要するに、本当に初期から関わればその技術はだいたい20年ぐらい使える。逆に半分ぐらいから入ると10年ぐらいしか技術のライフタイムがもたないんですよね。 一昔前の35歳定年説みたいな話があったのもそうで、社会人の2年目、3年目ぐらいはたくさん覚えることがあるからたくさん勉強するじゃないですか。だけど、だいたい技術は10年ぐらいで陳腐化す

                                      「“課題を見つけて分解する力”と“コードを書いて解決する力”は全然違う」 増井雄一郎氏が明かす“エンジニア力”の本質と鍛え方
                                    • 日本語に強い大規模言語モデル「Swallow」を公開 英語が得意な大規模言語モデルに日本語を教える

                                      要点 日本語能力に優れビジネスにも安心して活用できる大規模言語モデルを公開 継続事前学習により大規模言語モデルの日本語能力を改善 高度な日本語処理が求められる多くの場面で、生成AI技術の利活用を推進 概要 東京工業大学(以下、東工大) 情報理工学院 情報工学系の岡崎直観教授と横田理央教授らの研究チームと国立研究開発法人 産業技術総合研究所(以下、産総研)は、日本語能力に優れた生成AIの基盤である大規模言語モデル[用語1]「Swallow」を公開した[参考リンク1]。本モデルは現在公開されている日本語に対応した大規模言語モデルとしては最大規模であり、オープンで商用利用が可能であるため、ビジネスに安心して用いることができる。 東工大と産総研の研究チームは、英語の言語理解や対話で高い能力を持つ大規模言語モデル(米Meta社 Llama 2)の日本語能力を拡張することで「Swallow」を構築した

                                        日本語に強い大規模言語モデル「Swallow」を公開 英語が得意な大規模言語モデルに日本語を教える
                                      • AIが三国志を読んだら、孔明が知力100、関羽が武力99、を求められるのか?をガチで考える物語(自然言語処理編) - Qiita

                                        吉川英治の「三国志」@青空文庫をINPUTとして、 「自然言語処理」と「機械学習」によって上記のように、 武力や知力などのパラメータを推論する。 三国志小説の機械学習結果として、 1つの武将を50次元ベクトルに変換し、そのベクトルを、 全く同じ「式」に入れて出てきた値が、上記の表。 このような方法:「小説(自然言語)」⇒「数値化」⇒「式」 によって、武力/知力を求めることが出来るか? という実験&研究が今回のテーマ。 他の成果としては、 以下のような武将名の「演算」が楽しめる。 (これも実際の出力結果より抜粋) 諸葛亮に近い人は誰? ⇒ 姜維、司馬懿、陸遜、周瑜、魏延、馬謖 劉備にとっての関羽は、曹操にとって誰? ⇒ 袁紹、張遼 ※若いころの馴染み的な意味や対比が多いので袁紹? 孫権にとっての魯粛は、劉備にとって誰? ⇒ 司馬徽(水鏡先生)、徐庶 ※賢者を紹介するポジションなのか? 精度の

                                          AIが三国志を読んだら、孔明が知力100、関羽が武力99、を求められるのか?をガチで考える物語(自然言語処理編) - Qiita
                                        • メンタルレキシコンとは?わかりやすく解説・心理学との関係 英語学習への効果とは? - ポリグロットライフ | 言語まなび∞ラボ

                                          はじめに 今回はメンタルレキシコンについてわかりやすく解説していきます。メンタルレキシコンとは、どのような意味や性質を持ち、学ぶ意義は何なのかを考えていきます。心理学との関係や英語学習及び語彙学習への効果についても考えていきます。メンタルレキシコンを正しく理解して、正しい効率的な語彙学習をぜひ取り入れてみてください。 ↓↓第二言語習得研究に基づく英語学習動画をアップしていきます。 www.youtube.com メンタルレキシコンとは? メンタルレキシコンの意味 メンタルレキシコンの性質 メンタルレキシコンを学ぶ意義 メンタルレキシコン内の語彙知識モデル 階層的ネットワークモデル 活性化拡散モデル 母国語のメンタルレキシコン 子供の語彙の増加 即時マッピング 第二言語学習への示唆 バイリンガルの語彙発達 バイリンガルの言語的特徴 バイリンガルレキシコン メンタルレキシコンと心理学 二重符号

                                            メンタルレキシコンとは?わかりやすく解説・心理学との関係 英語学習への効果とは? - ポリグロットライフ | 言語まなび∞ラボ
                                          • 【2020年版・初心者向け】独学でAIエンジニアになりたい人向けのオススメの勉強方法 - Qiita

                                            AI Academy Bootcamp 6ヶ月35,000円にてチャットで質問し放題の環境で、機械学習やデータ分析が学べるサービスを提供しております。 数十名在籍しているデータサイエンティストや機械学習エンジニアに質問し放題の環境でデータ分析、統計、機械学習、SQL等が学べます。AI人材に必要なスキルを効率よく体系的に身に付けたい方は是非ご検討ください! https://aiacademy.jp/bootcamp この記事の対象者 ・将来Pythonでデータ解析をしたいと考えているが、何から手をつけたら良いか知りたい方 ・将来、人工知能に関連した業務に携わりたいと検討中の初学者の方 ・未経験者からAIエンジニアになりたく、そのためにどのような知識が必要か知りたい方 ・AIプログラミングスクールや専門学校に進学しようか考えているが、独学で勉強できる方法を知りたいという方 対象ではない方 ・既

                                              【2020年版・初心者向け】独学でAIエンジニアになりたい人向けのオススメの勉強方法 - Qiita
                                            • 無料SEOツール「SEO ZERO」リリース!有料級の豊富な機能を搭載

                                              無料SEOツール「SEO ZERO」リリース!有料級の豊富な機能を搭載〜内部分析・検索順位確認など簡易SEO施策はこれ一つで完結~ ​約1,700社のWebマーケティングを支援中の株式会社Faber Company(ファベルカンパニー/本社:東京都港区、代表取締役:稲次正樹、古澤暢央)は2022年11月16日(水)、無料SEOツール「SEO ZERO」の提供を開始したことをお知らせいたします。「競合分析」や「被リンク・検索順位の確認」、「テクニカルSEO」など簡易的なSEO施策に必要な機能を、無料でご利用いただくことが可能です。 ▼「SEO ZERO」を無料ではじめる:https://seo-zero.com/ ※利用ポイントを大幅増量中! 会員登録いただくと、月額利用のポイント枠が増加します。今ならリリースを記念し、ポイント大幅増量中です。また、別の方を招待いただくと、ポイントを増量する

                                                無料SEOツール「SEO ZERO」リリース!有料級の豊富な機能を搭載
                                              • 脳科学で実証!「画面」に勝る「紙」の優位性とは? | ダイレクトマーケティングラボ | リコー

                                                トレンドの移り変わりが激しいデジタルマーケティングについて、マーケターが押さえるべきトレンドをまとめました。デジタル変革期に欠かすことの出来ない最新情報をぜひご覧ください。 「紙」に印刷すると間違いに気づく理由とは?「あれっ!こんなところを間違えてる」―。パソコンの画面上で何回も見直して間違いはなかったはずなのに、紙に印刷すると原稿のミスを発見!こんな経験、皆さんにもあるのではないでしょうか? 新型コロナウイルスの感染拡大に伴い、リモートワークが増えてからは、より一層それを強く感じるようになった気がします。リモートワークではプリンターが無かったり、あっても印刷作業自体が面倒だったり、会社のプリンターに比べるとスピードが遅くて印刷に手間取ったり・・・。そんなわけで、紙でのチェックが怠りがちになってミスが生じる、いつもより目を凝らして画面とにらめっこ・・・なんてこと、増えているかもしれません。

                                                • 「サイバーパンク2077」のようなリアルタイム翻訳システムをWhisperやDeepLを駆使して実現した猛者が現る

                                                  「サイバーパンク2077」をプレイしたというエンジニアのマルチン・エランコウスキ氏が、同作で登場するリアルタイム翻訳システムのような「話者の上にリアルタイムで会話内容が表示され翻訳まで行ってくれる翻訳システム」の開発に取り組んでいます。 GitHub - elanmart/cbp-translate https://github.com/elanmart/cbp-translate エランコウスキ氏は「話者の上にリアルタイムで会話内容が表示され翻訳まで行ってくれる翻訳システム」を開発するにあたり、以下のような条件を処理できるシステムを構築することにしたそうです。 ・ショート動画を処理可能 ・複数のキャラクター(話者)の会話内容を翻訳可能 ・英語とポーランド語の両方の音声を認識・文字起こし可能 ・会話を任意の言語に翻訳可能 ・各フレーズを話者に割り当て可能 ・画面に話者を表示する ・サイバー

                                                    「サイバーパンク2077」のようなリアルタイム翻訳システムをWhisperやDeepLを駆使して実現した猛者が現る
                                                  • 連休のお供にいかが? 米Microsoftが「PyTorch」の初学者向け教材を無償公開中

                                                    米Microsoftは、機械学習ライブラリ「PyTorch」を使った、初学者向けのディープラーニングの教材を公式Webサイトで無償公開している。対応言語は英語のみだが、4時間13分で機械学習モデルの構築方法や自然言語処理、音声認識の概要などを学べるという。教材の利用に、外部ファイルのインストールは不要。Webページのみで完結する。 PyTorchは、米Facebookが2016年に開発したPython向けのオープンソースの機械学習ライブラリ。Microsoftは、2020年にWindows版PyTorchのメンテナーに就任し、2021年5月には「PyTorch Enterprise」を発表。Microsoft Azure上でPyTorchを使う企業へのサポートサービスの提供を始めていた。 無償公開している教材もMicrosoftとPyTorchが提携して作成しており、今後も企業とユーザー、

                                                      連休のお供にいかが? 米Microsoftが「PyTorch」の初学者向け教材を無償公開中
                                                    • 「短いブログ」としてのTwitterから「長いTwitter」としてのブログへ、そして - 誰がログ

                                                      はじめに 「短いブログ」としてのTwitter 「バズる」ことによる評価 「長いTwitter」化したブログ? ブログ(長いテキスト)の評価法 おわりに はじめに 以下、あまり専門的な裏付けや見通しはないブログの一書き手としての雑感です。 タイトルはちょっと何言いたいか分からない感じですね。どうもしっくりくるタイトルが思い浮かびませんでした。私の考えていることの概要はだいたい次の通りです。 Twitterが即時的なリアクションやとにかく注目を浴びることが評価につながる傾向を加速させた ブログはTwitterの前からあるにもかかわらず、今はその評価方法に乗せられてしまっている:「長いTwitter」化 ブログが長く書けることを強みの1つにするのなら、別の評価方法がほしい なお、「Twitter」と「X」という名称は必要に応じて使い分けますが、それほど厳密な区別はしていません。 「短いブログ」

                                                        「短いブログ」としてのTwitterから「長いTwitter」としてのブログへ、そして - 誰がログ
                                                      • イベント「教員向け ChatGPT 講座 ~基礎から応用まで~」 5/13 開催報告と振り返り

                                                        2023年5月13日13:00~17:00 に、イベント「教員向け ChatGPT 講座 ~基礎から応用まで~」(開催の広報記事)。この記事では、その開催報告と振り返りを記します。 注: 本イベントの動画や資料は、各大学や教育機関などの勉強会、研修、FD・SD などで是非ご活用下さい(何件かご連絡いただいておりますが、事前の確認などは必要ございません)。 概要人と「対話」する人工知能 ChatGPT は教育にも大きな影響を与え始めています。数多くの情報が出てきていることをふまえて、教育における活用を検討する上で有用であろう情報を吉田なりにまとめて提供する講座を開催しました。 コロナ禍における教育オンライン化対応のように、多くの教員が困るだろうと感じ、できる限りの情報提供をしたいと思い、長くなってしまい恐縮ですが渾身の4時間イベントとしました。 内容としては、ChatGPTの使い方などの基礎

                                                          イベント「教員向け ChatGPT 講座 ~基礎から応用まで~」 5/13 開催報告と振り返り
                                                        • ポートフォリオや個人開発で使えそうなアイデア - Qiita

                                                          はじめに 個人的にアイデアを考えるのが好きで思いつくたびにメモしたりツイートしたりしていたのですが、大量にたまってきたのでまとめて共有しようと思います。 「勉強やポートフォリオ作成のためになんか作りたいけど、これといって作りたいものはないな」という方、ぜひご利用ください。 ちなみに著作権とか諸々の権利を主張する気は一切ないのでご自由にどうぞ。 *技術記事ではないので消すかもしれません。 カテゴリ別 ビジネス 会社の元社員と繋がれるサービス。現役の人からは聞きにくい質問、やめた理由等を聞ける。転職、就活生向け リファラル採用専門サービス 社長の位置情報を常に見れるアプリ。社員向け。社長がなんの仕事をしてるかわかる。 ペルソナを設定すると当てはまる人10人くらいとのインタビューを自動で設定してくれるアプリ。商品出すときインタビュー開いて探す手間を省ける 学部長とか社長とかに提言できる社内ツール

                                                            ポートフォリオや個人開発で使えそうなアイデア - Qiita
                                                          • ゼロから作るDeep LearningシリーズはGoogle Colaboratoryで写経して学習するのがおすすめ - karaage. [からあげ]

                                                            「ゼロから作るDeep Learningシリーズ」が最高 ゼロから作るDeep Learningは、TensorFlow、Keras、PyTorchといったディープラーニングのフレームワークを一切使わず、基本PythonとNumpyのみでディープラーニングのアルゴリズムを作って理解していくというハードコアな内容です。 シリーズは3冊出ていて、1が画像認識、2が自然言語、3がフレームワークに重点を置いた内容です。 ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装 作者:斎藤 康毅発売日: 2016/09/24メディア: 単行本(ソフトカバー) ゼロから作るDeep Learning ❸ ―フレームワーク編 作者:斎藤 康毅発売日: 2020/04/20メディア: 単行本(ソフトカバー) ゼロから作るDeep Learning ❷ ―自然言語処理編 作

                                                              ゼロから作るDeep LearningシリーズはGoogle Colaboratoryで写経して学習するのがおすすめ - karaage. [からあげ]
                                                            • 効率よく学習するための20のルール

                                                              何かを学び、身につけることは時間がかかるものです。限られた時間の中で、効率よく多くのことを学ぶにはどうすべきかを、ポーランドの研究者で間隔を空けた反復学習法、SuperMemoの発案者であるピョートル・ウォズニアック氏が解説しています。 Effective learning: Twenty rules of formulating knowledge https://www.supermemo.com/en/archives1990-2015/articles/20rules ◆01:分かりにくい教材で勉強しない 学習用の教材はよくできているように見えて、実際は分かりづらい内容になっているものが多くあります。「いつか役に立つだろう」と無理して自分に合わない教材で勉強するのではなく、自分の身の丈にあった教材を探す必要があります。 ◆02:暗記する前に学ぶ 説明や解説をそのまま暗記するのではな

                                                                効率よく学習するための20のルール
                                                              • 夢中になった技術が「打ち込める仕事」になるまで ─ OSS検索エンジンの開発にコミットし事業にも貢献する - Findy Engineer Lab

                                                                はじめまして、 @mocobetaと申します。 パッケージソフトウェアベンダー、コンサルティング会社、Webサービス企業などを経て、現在は株式会社LegalForceというスタートアップの研究開発セクションでソフトウェアエンジニアをしています。 個人としては、Python形態素解析ライブラリjanomeを開発するとともに、OSS検索エンジンライブラリApache Luceneのコミッターをしています。ちなみに本記事のアイキャッチ画像は、絵師さんに描いてもらったjanomeのキャラクターです。とてもかわいく描いていただいて、お気に入りの1枚です。 この記事では、進路とエンジニアとしての力不足に悩んでいた私の若手時代から、10年(以上)の模索期間を経て、ライフワークにしたいと思える技術に出会い、なんとか好きな仕事で食べていけるようになるまでを振り返ります。アップダウンの激しいIT業界において、

                                                                  夢中になった技術が「打ち込める仕事」になるまで ─ OSS検索エンジンの開発にコミットし事業にも貢献する - Findy Engineer Lab
                                                                • クローラー運用を楽にするためのクラウドサービス比較 - ZOZO TECH BLOG

                                                                  こんにちは!最近気になるニュースはスピノサウルスの尻尾の化石が発見されたこと1な、SRE部エンジニアの塩崎です。ZOZOテクノロジーズの前身となった会社の1つであるVASILYでは数多くのクローラーの開発・運用の担当をしてきました。 今回はその知見を生かして、クローラーを楽に運用するためのクラウドサービスを紹介します。 概要 データ解析を円滑に進めるためには、CSVやWeb APIなどの構造化されたデータが必要です。しかし全てのWebサイトにあるデータが構造化データを提供しているとは限りません。むしろ提供していないケースの方がはるかに多いです。そのため、Webクローラーを作成して構造化されていないWebページを解析し、構造化データを生成する必要があります。 しかし、Webクローラーの運用には数多くの「つらみ」があります。特に大量のWebページを1日1回などの頻度で定期的にクロールする際には

                                                                    クローラー運用を楽にするためのクラウドサービス比較 - ZOZO TECH BLOG
                                                                  • インフラ一筋のおじさんが画像生成AI“Stable-Diffusion”を読み込んでみる件 | IIJ Engineers Blog

                                                                    地方拠点の一つ、九州支社に所属しています。サーバ・ストレージを中心としたSI業務に携わってましたが、現在は技術探索・深堀業務を中心に対応しています。 2018年に難病を患ったことにより、定期的に入退院を繰り返しつつ、2023年には男性更年期障害の発症をきっかけに、トランスジェンダーとしての道を歩み始めてます。 なんだかAIって流行ってますよねー こんにちわ。九州支社で細々と遊んで検証業務にいそしんでいるとみーです。 2022年3月から、どーしても「名前だけ知ってる状態」ってのにもやもやしていて、Deeplearningに手を付けたものの、あまりに内容が奥深すぎて沼にドはまりして周囲に「たすけてぇ、たすけてぇ」って叫んでいる素敵な日々を過ごしています。 取りあえず画像処理としてディープフェイク、NLP(Natural Language Processing:自然言語処理)として簡易チャットボ

                                                                      インフラ一筋のおじさんが画像生成AI“Stable-Diffusion”を読み込んでみる件 | IIJ Engineers Blog
                                                                    • Rust の DI を考える –– Part 2: Rust における DI の手法の整理 - paild tech blog

                                                                      paild 社でお手伝いをしている yuki です。前回に引き続き Dependency Injection 略して DI の話題を書いていきたいと思います。今回は Rust における DI についていろいろと考えてみました。今回紹介する実装はかなり単純な例を用いたもので、この記事からさらにみなさんのアプリケーションの実装状況に合わせていくつか工夫は必要になるかもしれません。ただ、とっかかりとしては十分なものになっていると思うので、DI でお困りの方はぜひ参考にしてみてください。 今回実装したいアプリケーションのお題について 今回紹介する技法の種別について コンストラクタインジェクション 静的ディスパッチを用いたもの 動的ディスパッチを用いたもの 静的ディスパッチと動的ディスパッチの利点・欠点 shaku (DI コンテナ)を用いたインジェクション shaku の利点・欠点 余談: DI

                                                                        Rust の DI を考える –– Part 2: Rust における DI の手法の整理 - paild tech blog
                                                                      • 日本語形態素解析器 MeCab を Python から利用する際の語彙データ(UniDic)が AWS 上で Open Data として公開されました | Amazon Web Services

                                                                        Amazon Web Services ブログ 日本語形態素解析器 MeCab を Python から利用する際の語彙データ(UniDic)が AWS 上で Open Data として公開されました 多くの機械学習デベロッパーの方々が、AWS 上でさまざまなアルゴリズムの開発やモデルの構築を行なっています。中でも自然言語処理を行う際には、対象言語の特性に即した形で前処理を行う必要があります。日本語の自然言語処理を実施する際には、形態素解析と呼ばれる文章の分解処理を前位処理として一般的に行います。日本語形態素解析を行うためには、日本語の語彙データが必要となりますが、このデータは通常 GB 以上のサイズに及ぶ大きなサイズとなります。またこれらを用いた計算の際にも大量の GPU および CPU を必要とするため、従来こうしたモデルを構築する際には常にストレージおよびコンピューティングのリソースの

                                                                          日本語形態素解析器 MeCab を Python から利用する際の語彙データ(UniDic)が AWS 上で Open Data として公開されました | Amazon Web Services
                                                                        • IT技術が社会に与える影響って実はそこまで大きくなくない?

                                                                          最近、chatGPTとかStableDiffusionとかAI技術が話題だけど、こういったIT技術が社会に与える影響ってどのくらいなんだろう? 個人的にははてなやネットで騒がれてるほどインパクトはなくて、世の中がちょっと便利になるくらい。 これまでを振り返ると、 2000年ごろ:P2P/ブロードバンドNapster、WinMX、WinnyなどのP2P技術が登場し、ブロードバンド環境が整ってきて、音楽や映画は(当然違法だけど)オンラインで簡単に手に入るようになった。 TVニュースで「宇多田ヒカルが新曲を発表」と聞き、Winnyで検索したらものの5分でダウンロードできた時には、これは時代が変わるって興奮したことを覚えてる(怖くなって後からCD購入した)。 1~2年もすればCD/DVDなんかなくなるし、レンタルCD/DVDなんて消え去るだろうって思った。 その後、サブスクサービスは発展したけど、

                                                                            IT技術が社会に与える影響って実はそこまで大きくなくない?
                                                                          • Python関係の「○○100本ノック」のまとめ - Qiita

                                                                            「○○100本ノックとは」? プログラミング関係のエクササイズ集・Tips集的なものです。ちょっとしたテクニックや、基礎がまとまっているので解いてみると練習になります。 最初にやるのは退屈かもしれませんが、学習の停滞期にやってみると、思わぬ発見があるのではないかなと思います。 この記事では、Python関係の100本ノックを簡単にまとめてみました。自分が知っているのは、以下くらいですが、他にも良いもの(絶対ある気がします)知っている人はぜひコメントなどで教えてください。 画像処理100本ノック 画像処理100本ノック!! 追記:本家が惜しくも無くなってしまっていたので、fork(?)されていたものにリンク張り替えました。 解説・Google Colaboratoryで実行するときは以下記事参考にしてみてください。 ディープラーニング ∞本ノック 注:元サイトが消えてしまったので、私がfor

                                                                              Python関係の「○○100本ノック」のまとめ - Qiita
                                                                            • Teslaはカメラを使ってどのように世界を認識しているか

                                                                              はじめに TURINGの井ノ上です。TURINGは「We Overtake Tesla」をミッションに、完全自動運転EVの開発・製造を行っています。TURINGはEnd-to-Endな深層学習モデルでLv5完全自動運転車の開発を目指しています。現在、TURINGではカメラセンサから得た画像を用いて車体の操作や経路選択、安全性の判断を行えるAIモデルの開発を行っています。(実際の車を動かす事例はこちらの記事やこちらの記事をご覧ください。) この記事では私達が目標としているTeslaの自動運転のAIモデルについて紹介します。 Teslaの自動運転 こちらは2022年に公開されたTeslaの自動運転をユーザーが使っている動画です。 車の中央にあるディスプレイにはAIが道路や車を認識してどういった経路を進むかを示しており、その情報をもとに自動運転している様子があります。Teslaの自動運転の能力の

                                                                                Teslaはカメラを使ってどのように世界を認識しているか
                                                                              • AIはハチ=米津玄師を見破れるか ? -J-popアーティストの歌詞を分析してみた- - Qiita

                                                                                はじめに 一年前にこんな記事を書きました。未だにちょくちょくいいねを頂いているので、自然言語処理の練習を兼ねて久しぶりに遊んでみた系の記事を投稿しようと思います。 やったこと 歌詞データのクローリング Mecabによる分かち書き tf-idfによるベクトル化 ベクトル化した歌詞によるアーティストのクラスタリングとUMAPでの可視化 (おまけ) fastTextでハチ=米津玄師を見分けられるのか? 分析にはJupyter Labを用いました。 歌詞データ 今回用いる歌詞データについて説明します。 クローリングで取得 先立って歌詞データのクローリングをしました。とある人気アーティスト順に歌詞を取得できるサイトより、45人のJ-popアーティストにつき、最大50曲分の歌詞を取得しCSVに保存しました。 実際にクローリングに用いたコードを公開するのもどうかと思うので、ここでは割愛します。。。Bea

                                                                                  AIはハチ=米津玄師を見破れるか ? -J-popアーティストの歌詞を分析してみた- - Qiita
                                                                                • GPT-3の学習データはどのように作られたか - moriyamaのエンジニアリング備忘録

                                                                                  OpenAIが発表した言語モデルGPT-3はパフォーマンスの高さから各方面で注目されており、ついにはMicrosoftが学習済みモデルの利用を独占化しました。 私個人の所感としてこれまで学習済みモデルは無料公開するという流れを無視し、(アーキテクチャではなく)学習済みモデルが商品化するのはAIビジネスの一つの転換期と感じています。 深層学習による自然言語処理分野で巨大化していくモデルを十分に学習させるためにはWebデータの活用が大きな役割を果たしています。一方、その量に関する話題はあるものの、利用にあたっての細かな前処理に関する議論はあまりなされていない印象です。 そこで本記事は学習データの構築にフォーカスします。 GPT-3の論文でも言及されている通り、学習データはGoogle Researchが発表したT5のデータを踏襲したと書かれていますので、まずはT5のデータから見て行きましょう。

                                                                                    GPT-3の学習データはどのように作られたか - moriyamaのエンジニアリング備忘録