「言語処理」を検索 - はてなブックマーク

241 - 280 件 / 4308件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

言語処理の検索結果241 - 280 件 / 4308件

文系出身の若手SIer社員が放送大学で情報学を勉強してレベル上げした話｜lumpsucker
- 145 users
- note.com/lumpsucker
- 学び
- 2021/01/24
はじめにこの記事は、文系出身の若手SIer社員が放送大学で情報学を勉強した記録です。主に似たような境遇の方への情報共有を目的に執筆しました。こんなやり方もある、という参考になれば嬉しいです。簡単に自己紹介通信会社の名前が頭につくシステムインテグレータ（SIer）で、フロントエンドエンジニア兼UIUXデザイナーとして働いています。私立大学の文系学部を卒業後、研究留学を経て東京大学の学際情報学府という大学院で修士を取得し、2018卒として新卒入社して現在3年目ですそうこうしてるうちに5年目になりました。大学院は広い意味での情報系ではあったものの、「社会情報学」と呼ばれる分野で、いわゆるコンピュータサイエンスではありませんでした（ICT4Dと呼ばれる国際開発学と情報学の合いの子のような分野の研究をしていました）。入社前には応用情報技術者試験にも合格し、何とかついていけるかなと思っていました。
- 放送大学
- 勉強
- あとで読む
- 大学
- 教育
- 数学
- 技術
PFNのML/DL基盤を支えるKubernetesにおける自動化 / DevOpsDays Tokyo 2021
- 145 users
- www.slideshare.net/slideshow
- テクノロジー
- 2021/04/16
Preferred Networks（PFN）は深層学習などの最先端の技術を最短路で実用化することで、これまで解決が困難であった現実世界の課題解決を目指しています。コンピュータビジョン、自然言語処理、音声認識、ロボティクス、コンパイラ、分散処理、専用ハードウェア、バイオインフォマティクス、ケモインフォマティクスといった幅広い分野で研究開発を行っており、それを支えているのが Kubernetes を用いて構築しているオンプレミス/ベアメタルの GPU クラスタです。本セッションでは、PFN が Kubernetes を用いてクラスタを運用するなかでどのような障害が起きるのかを紹介し、また障害対応をどのように自動化しているのかを具体的に使用/開発したソフトウェアを含めてご紹介します。また Kubernetes クラスタの管理、アップグレードの自動化にも取り組んでおり、それを実現する Clus
- kubernetes
- あとで読む
- MLOps
- 運用
- pfn
- GPU
- availability
- gke
- slide
- 機械学習
データライフサイクルとトレードオフ | フューチャー技術ブログ
- 143 users
- future-architect.github.io
- テクノロジー
- 2023/03/17
ソフトウェアの中身を大きく2つに分解すると、プログラムとデータに分かれます。コードコンプリートやA Philosophy of Software Designなど、評判の良いソフトウェア設計の本はいくつかありますが、それらはどれもプログラムの説明がメインでデータのライフサイクルについての説明はなかったと思います。しかし、データの表現にもいくつもの方針があって、それによるトレードオフがあるな、というのはもやもやと考えていたので、その考えをまとめて文章にしてみました。データといっても、処理中の短期間の間では変わらない、いわゆるマスタデータ的なデータです。ジャーナルというか、トランザクション的なデータはここでは触れません。この記事では、それぞれのトレードオフについて考えていきます。即値（リテラル）定数コマンドライン引数環境変数設定ファイルダウンロードコンテンツオンラインデータベ
AWS re:Invent 2020で発表された新サービス/アップデートまとめ - Qiita
- 143 users
- qiita.com/nasuvitz
- テクノロジー
- 2020/12/02
AWS re:Invent 2020の会期中に発表された新サービス/アップデートのまとめです。今年も、後から出来るだけ素早く簡単に振り返ることができるようにまとめました！凡例 (無印) 新サービス (Update) 既存サービスのアップデート (APN) パートナー制度に関連したリリース/アップデート 12/1 (火) 今年の開幕は「Amazon EC2 Mac instances」でした。 Amazon EC2 Mac instances macOS用のAmazon Elastic Compute Cloud （EC2） Macインスタンス EC2 Macインスタンスを使用すると、iPhone、iPad、Mac、Apple Watch、Apple TV、Safari用のアプリ開発者は、macOS環境を数分でプロビジョニングしてアクセスし、必要に応じて容量を動的に拡張し、AWSの従量課
- aws
- あとで読む
- qiita
- developer
- productivity_weekly
- サービス
- amazon
- エンジニア
- EC
- イベント
機械学習モデリングの広辞苑的書籍「Kaggleで勝つデータ分析の技術」が良かったので筆者に媚を売る - Stimulator
- 143 users
- vaaaaaanquish.hatenablog.com
- テクノロジー
- 2019/10/05
- はじめに - 当ブログでは恒例になっている、献本されたので筆者に媚を売るシリーズです。今回は10/9に発売予定の「Kaggleで勝つデータ分析の技術」という書籍なんですが、既に発売前にしてAmazonベストセラー1位。豪華著者陣とKaggleにおいては日本有数の起業と言っても過言ではない、DeNA株式会社の豪華レビュワー。筆者がブログを書いていたり、u++さんがめちゃくちゃ丁寧な書評を書いていたり、Kaggle Grand Master各位の薦めツイートも出てきた段階で、もう私が媚を売る必要すらないと思いますが、良かったので感想だけでも残しておければと思います。 Kaggleで勝つデータ分析の技術作者: 門脇大輔,阪田隆司,保坂桂佑,平松雄司出版社/メーカー: 技術評論社発売日: 2019/10/09メディア: 単行本（ソフトカバー）この商品を含むブログを見る端的に言えば、テーブ
- kaggle
- あとで読む
- 本
- データ
- book
- 機械学習
- data
- 学習
【文春オンライン「ChatGPTには逆立ちしてもできないことがある」平井鳥取県知事が誤解覚悟で「使用禁止」を訴えた真意】の記事を読んで｜ppp
- 142 users
- note.com/sakura3345
- テクノロジー
- 2023/05/19
【文春オンライン「ChatGPTには逆立ちしてもできないことがある」平井鳥取県知事が誤解覚悟で「使用禁止」を訴えた真意】の記事を読んで ■5/22追記　投稿したのは数日前なのに、なんだこれ？ちょっと怖い。 ■はじめに　日曜日、chatGPT-4（以下「GPT」）のプロンプトや拡張機能を色々と試していました。また、GoogleのBardも使えるようになっていたので、素人なりに試行錯誤していました。朝から何時間も試行して疲れたので、ちょっと気分転換にTwitterの”おすすめ”に流れてくるツイートを漫然と見ていました。すると、見出しの記事が流れてきました。別に私は鳥取県知事に対して好意も悪意もない・・・というか、あの時おすすめツイートが流れてこなければ、他組織の首長のインタビューを読むことは恐らくなかったでしょう。北海道知事や沖縄県知事が何をしようと関心ないし、それと同じ程度に関心ないも
- ChatGPT
- AI
- あとで読む
- 人工知能
- LLM
- 学習
- アイデア
- 勉強
TypeScriptでGPT-3.5を使ってChatGPTクローンを作る1 - GPTで検索エージェント
- 141 users
- zenn.dev/erukiti
- テクノロジー
- 2023/01/16
OpenAI が提供している ChatGPT は非常に面白いですね。今年以後、GPTやChatGPT周りがさらに流行ると思います。この記事は、TypeScriptでChatGPTクローンを作る第一弾です。長くなりすぎるため、この記事では、GPTを使った検索エージェントを実行するまでを取り上げます。検索エージェントは「ぼっち・ざ・ろっくの作者は？」と尋ねたら検索エンジンとGPTを使って「はまじあき」という結果を生成できる技術です。またこの記事や、続く記事でLangChainのプロンプトをあれこれ読み解いていこうと考えています。筆者は機械学習の初心者であるため、間違ったことが書かれている可能性があります。間違いがあった場合は、ぜひご指摘いただけると幸いです。なお、この記事では添削にChatGPTおよびGPT-3.5を使っています[1]。どうやってTypeScriptでChatGPT
- TypeScript
- ChatGPT
- AI
- あとで読む
- 自然言語処理
- api
- LLM
- 文章
- 機械学習
- 言語
コサイン類似度とは？　新しい検索体験を支えるベクトルDBの基本技術を押さえる
- 140 users
- xtech.nikkei.com
- テクノロジー
- 2024/08/22
生成AI（人工知能）のRAG（検索拡張生成）の導入など企業で使われ始めたベクトルデータベース。その特徴は検索にある。ベクトルデータベースとはどのようなデータベースで、なぜ「意味」で検索できるのか。ベクトルデータベースの基本技術についてデータベースの専門家が解説する。（編集部）ベクトルデータベースは自然言語処理などAI技術の発展の中で生まれたデータベースであり、ベクトルの概念を用いてデータを管理するデータベースです。生成AIの登場とともに注目を集め、いまや多くの既存のDBサービスやその応用サービスにベクトルデータベースの機能が組み込まれています。以下で検索を例にベクトルデータベースの特徴や動作の仕組みを解説します。ベクトルによる「類似度」の判断ベクトルデータベースがストアするのは数値の羅列です。単語や文章などの「意味」「文脈」を数値化したデータであり、個々の数値を取り出して意味や違い
- AI
- あとで読む
- 技術
- 検索
- データベース
- DB
- データ
- search
- tech
インターネット上の文章にわざと誤字脱字をまぎれこませることでAIを狂わせるサイバー攻撃の可能性
- 140 users
- gigazine.net
- テクノロジー
- 2022/10/20
画像や文章の自動生成、顔認識、ゲームのプレイなど、人間の行動を模倣するAIを開発するためには、膨大なデータセットで学習する必要があります。データセットの内容にはインターネットに存在する画像や文章が使われるケースが多くありますが、このインターネット上にある文章に含まれる誤字がAIの発達に大きな影響を及ぼすと、IBMリサーチ・Amazon・テキサス大学の研究者が発表しています。 [1812.00151] Discrete Adversarial Attacks and Submodular Optimization with Applications to Text Classification https://doi.org/10.48550/arXiv.1812.00151 If AI can read, then plain text can be weaponized – TechTa
友人の結婚を素直に祝えない｜ゎ｜note
- 139 users
- note.com
- 暮らし
- 2019/12/27
冷たい空気がストッキングを通過する灰色の空の下を歩き、少し早めに会場に着いた。ここは、友人と私の母校。いつもは学生食堂として使われているテーブルの数々に、白いクロスがかかり、銀色のカトラリーと花の装飾が並んでいる。席次を見る。同級生は一人もいない。一人だけ、知っている名前が私の名前の隣に並んでいた。彼は、以前盛大にキレて縁をぶち壊してしまった社長だ。友人は、きっとこのことを知らなかったのだろう。トイレに行ったり、荷物の整理をしたり、席次や食事のメニューを見たりしながら時間を潰す。会場には人が増えてきて、会話する声の総量が増大する。社交性のない私は、同じテーブルに座る知らない他人に会釈すらできなかった。披露宴が始まる。扉の向こうから、新郎新婦が入場する。花とレースに身を包まれた小さな体が近づいてくる。友人は、ウエディングドレスが誰よりも似合っていた。彼女は私と同じ、アダルトチルドレ
俺・・・感情がねえんだ・・・ ←色んな感情推定器で本当に感情が無いのか分析してみる - Qiita
- 138 users
- qiita.com/honehoney
- テクノロジー
- 2020/03/04
はじめに人間のコミュニケーションは言語だけではなく、表情・仕草など数多くの非言語情報が含まれています。機械的・プログラム的に人の行動を分析・解釈するときには、そのような非言語情報も加味し意味づけを行っていくことでより多くの情報を取得することができます。画像処理、自然言語処理、音声認識など各分野でこれらの技術は研究開発されていて、マーケティングやロボットとの交流システムなど数多くのフィールドで応用されることが期待されています。今後も大きく発展していくことでしょう。前回の記事(「たけのこの里」を「きのこの山」に『正しく』自動で修正して差し上げるプログラム) では、文章中の誤りを修正するためにテキストからの感情推定APIというものを使ってみました。このような自然言語処理技術を活用することで、話者の抱いている感情を推定し、その感情によって違った反応を返すことができるようになります。例えば、話者
“Pepper不要論”払拭なるか　Pepperが接客するカフェ、渋谷に誕生　開発元が自ら運営
- 137 users
- www.itmedia.co.jp
- テクノロジー
- 2019/12/03
“Pepper不要論”払拭なるか　Pepperが接客するカフェ、渋谷に誕生　開発元が自ら運営（1/2 ページ）「Pepperを派手に展開するフェーズは終わったと考えている。今後は地に足を付けて事業に取り組む」――。ソフトバンクロボティクスの蓮実一隆取締役は、12月3日に開いた「Pepper PALOR」の内覧会でこう語った。 Pepper PARLORは、商業施設「東急プラザ渋谷」（5日開業）に出店予定のカフェ。その名の通り、店内に多数の人型ロボット「Pepper」を配置し、Pepperが接客する。広さは420平方メートル、席数は162席と大規模だ。受付のPepperは顧客の表情を認識し、年齢・体調・表情に応じたメニューを提案する。ソファ席にPepperが同席し、話し相手になったり、タブレットのゲームアプリで一緒に遊んだりするコーナー「相席Pepper」も設ける。ソフトバンクロボティ
- ロボット
- pepper
- robot
- あとで読む
- カフェ
- SoftBank
- 開発
【厳選】機械学習の学習におすすめのTwitterアカウント40選 - Qiita
- 137 users
- qiita.com/goto_yuta_
- テクノロジー
- 2022/07/11
はじめに最近、翻訳サービスをリリースしたりしてから、機械学習の勉強をどこでしたらいいのか聞かれることが増えました。機械学習関連の知識は遷移が激しいので、書籍には限界があります。ですので、その度に「twitterが一番勉強になる」と答えていました。が、この回答は聞き手依存な無責任な回答な気もしたので、この際フォローすべき人をまとめておこうと思います。時折機械学習系でない人も紛れているかもしれません。とりあえず40アカウントおすすめするだけの記事なので、抜け漏れはあると思いますが、後日補完していこうと思います。登場するアカウントには何の許可も取っていませんが、独断と偏見でアカウントの特徴をメモしていきます。 (メモとはいえ失礼のないよう書いたつもりです) 0. goto_yuta_ 私です。機械翻訳や、論文のまとめなどの話が多いです。自作の機械翻訳サービスの中身に触れたりします。
- 機械学習
- あとで読む
- 勉強
- qiita
- 学習
- twitter
- AI
これから流行る言語 | 雑記帳
- 135 users
- blog.miz-ar.info
- テクノロジー
- 2023/05/07
新言語にできることはまだあるかいなんとかWIMPS 最近（1ヶ月くらい前）、こんな記事が出ました：新しいプログラミング言語が出てこない(新しく出てた言語を追記) – きしだのHatena Kotlin, TypeScript, Rust, Swift以降にみんなが話題にするような新しい言語が出てこない、それはなぜか、みたいな趣旨です。客観的に見れば「新しい言語は常に出続けている」わけですが、「みんなが話題にするような」というのが多分曲者なんでしょうね。例え話をすると、新しい若木は常に生えてきているんだけど、大木に成長するには時間がかかるので、大木にしか興味のない人には「この8年間で新しい大木は登場していない」と判断してしまうのかもしれません。まあ私としても、Web (HTTP) APIを書く言語とか、JSON色付け係が使う言語はもう出揃ってしまったのかもしれないという気はしなくもな
【2024年】ITエンジニア本大賞まとめ - Qiita
- 135 users
- qiita.com/qiita01f
- テクノロジー
- 2024/01/30
アジャイルプラクティスガイドブックチームで成果を出すための開発技術の実践知チーム・組織にプラクティスを導入し、根付かせるために！ 116の手法を一冊にまとめた“実践”の手引きチームでのアジャイル開発には、開発技術やツールなどの「技術プラクティス」の活用が重要です。プラクティスはそれぞれの目的や役割を意識することで効果を発揮します。しかし、目まぐるしく状況が変化する開発では、当初の目的を忘れて、プラクティスに取り組むこと自体が目的化してしまうチームも少なくありません。本書は、チーム・組織でアジャイル開発に取り組んできた著者が、プラクティスの効果的な選択・活用のしかたについて、自らの実践経験に基づいてまとめたガイドブックです。架空の開発現場を舞台にしたマンガとともに、チーム開発の様々なシーンで役立てられるプラクティスを、幅広くかつわかりやすく解説しています。開発現場に備えておけば、
- エンジニア
- あとで読む
- 本
- 書籍
- 開発
- IT
ChatGPTを使って爆速でプレゼン資料を作る - Qiita
- 133 users
- qiita.com/ydty
- テクノロジー
- 2023/03/30
ChatGPTを使ってプレゼン資料を作るエンジニアのみなさんはコードを書くことは得意でもLTなどで発表するプレゼン資料（スライド）を作成することが苦手の方もいらっしゃいますよね。そんな人（自分含む）にChatGPTを使ってスライドを作成する方法についてまとめましたので共有します。ちなみに、現状(2023/03/30時点)のChatGPTには直接スライドを出力できるような機能はないので、下記のような感じで工夫するとChatGPTを使って爆速でスライドが作れちゃいます。使用するツール ChatGPT Marp for VS Code Marpって何?という方は下記の記事をご参考ください。簡単に言うとMarkdownからスライドを作成できるものです。もちろん皆さん大好きなPowerPointやPDFにも出力可能です。作成フロー 1.ChatGPTでプレゼン資料にしたい内容をMarp形式で
- ChatGPT
- AI
- marp
- あとで読む
- プレゼンテーション
- プレゼン
- qiita
- 資料
［CEDEC 2023］メタスコア85点を獲得した国産インディーゲームは，いかにして作られたのか。セッション「『メグとばけもの』のつくりかた - 心を揺さぶるゲームの技術」をレポート
- 132 users
- www.4gamer.net
- アニメとゲーム
- 2023/08/26
［CEDEC 2023］メタスコア85点を獲得した国産インディーゲームは，いかにして作られたのか。セッション「『メグとばけもの』のつくりかた - 心を揺さぶるゲームの技術」をレポートライター：大陸新秩序 2023年8月25日，ゲーム開発者向けカンファレンス「CEDEC 2023」にて，セッション「『メグとばけもの』のつくりかた - 心を揺さぶるゲームの技術」が行われた。本セッションには，インディーゲームデベロッパ Odencatの代表取締役社長佐藤大悟氏（以下，Daigo氏）が登壇し，同社の「メグとばけもの」（PC / Mac / Xbox Series X|S / Nintendo Switch / Xbox One）の開発過程を披露した。「メグとばけもの」とは Daigo氏によると「メグとばけもの」は，HP99999の化け物が少女を守って戦うゲームで，内容は「ありきたりな設定で
- CEDEC
- あとで読む
- ゲーム
- game
- 仕事
- 創作
Rust言語でファームウェア、OS、言語処理系を実装して、CSS 2020で発表した - 未完成な論を綴るブログ
- 131 users
- ytakano.hatenablog.com
- テクノロジー
- 2020/11/20
先月、国内最大のセキュリティ研究会であるコンピュータセキュリティシンポジウム 2020（CSS 2020）が開催され、そこで、Rust言語を用いてファームウェア、OS、言語処理系を設計・実装した話を発表しました。本来、CSS 2020はリアルで開催されるはずでしたが、コロナ禍の影響でオンライン開催となり発表動画作成が求められました。せっかく作った動画をこのまま捨て置くのももったいないと思い、ここで供養したいと思います。 www.youtube.com 概要内容は、Rust言語を用いて、AArch64のセキュアワールド内で動作するファームウェア、OS、プログラミング言語処理系を実装した話となります。と言っても、まだまだ基本的な部分しか実装しておらず、実現目標に対して2〜3割と言ったところですが、どうぞご笑覧ください。ブート部分は多少アセンブリ言語を使っていますが、その他の部分はRustで
- rust
- あとで読む
- OS
自然な日本語ダミーテキストを生成するWebアプリを作りました
- 130 users
- zenn.dev/sabigara
- テクノロジー
- 2022/01/14
こんな感じの文章を自動生成できます。二人の男女を一様に観察していました。私は仕方なしに立って、再び封の中へ、自分の左右前後を見廻して母の頭は陛下の病と父の病と父の病とを結び付けて考えるのが変に気味が悪かったのです。固よりそこにはまるで解りませんけれど、おそらくそんな意味じゃないでしょう。私の考えは行き詰まればいつでも両方が同時に奥さんのいる事をとうから自覚していました。先生の附近で盗難に罹ったものが、僻んだ私の眼を擦りました。それでも鷹揚に育った私は、もっと海の中で遊んでいられるか、宅へ帰って食卓に向った時、両親の死に断えた私の卒業する前に、また一種の弛みができても、決して強い言葉で説明しました。モチベーション同じようなツール・サービスはいくつも公開されていますが、ほとんどが以下の 3 つの方式を採用しており、個人的にはあまり満足できていませんでした。短い定型文の繰り返し: 一種の
- python
- 日本語
- あとで読む
- web
- webサービス
- アプリ
- 文章
- 機械学習
- AI
ChatGPTをGTPと間違える人のために解説します
- 130 users
- www.gizmodo.jp
- テクノロジー
- 2023/04/21
頭がごっちゃになる人続出！世界的ブームのChatGPT。これだけ朝から晩までChatGPT一色なら、もはやChatGTPと言い間違える人もいないだろうと思っていましたら、GPTとGTPの混乱はまだまだ続いているようです。日本はレーシングカーのGT、ドラゴンボールのGTについ引っ張られちゃいますもんね。頭でわかっちゃいるんだけど、ついGTPと口走ってしまったりします。 GPTって何の略？ChatGPTの｢GPT｣は｢ Generative Pre-Trained Transformer （プレトレーニング済みテキスト生成型Transformer）｣の略。 Transformerというのは、Google（グーグル）が開発してオープンソースで公開した自然言語学習モデルをいいます。 2017年に論文｢Attention Is All You Need｣で発表され、ディープラーニングとディープニ
- AI
- あとで読む
- ChatGPT
- 言葉
- 人工知能
- 言語
- 文章
大規模言語モデル (LLM) の進化: GPT 以降の最新動向 / AWS Dev Day 2023 - Evolution of LLM since GPT
- 130 users
- speakerdeck.com/hariby
- テクノロジー
- 2023/06/23
このセッションでは、最新の大規模言語モデル (LLM) とその技術的進歩を紹介し、自然言語処理タスクやクリエイティブなテキスト生成、コード生成などの実践的なデモンストレーションを通じて、LLM の多様な応用例を探ります。また、スタートアップや大企業での活用事例や学術研究での成果を紹介し、LLM の未来に関するチャレンジや機会についても議論します。このセッションを通じて、開発者やアーキテクトは LLM の最新動向を理解し、その応用や技術的な発展に対する洞察を深めることができます。 https://aws.amazon.com/jp/events/devday/japan/
- LLM
- あとで読む
- aws
- GPT
- AI
- 技術
- 資料
- 機械学習
- dev
スクエニのAI検証実験プロジェクト『ポートピア連続殺人事件』Steam無料配信スタート。野心的実験ながら、苦渋の“雑談機能削除”が影響残す - AUTOMATON
- 129 users
- automaton-media.com
- アニメとゲーム
- 2023/04/24
スクウェア・エニックスは4月24日、『SQUARE ENIX AI Tech Preview: THE PORTOPIA SERIAL MURDER CASE』を無料配信開始した。Steamストアページより、プレイすることができる。本作は、『ポートピア連続殺人事件』をベースにした“自然言語理解の体験用ソフトウェア”だ。オリジナル版『ポートピア連続殺人事件』ではプレイヤーが文字列を入力してキャラの行動を決定し、物語を進めるコマンド入力式のシステムが採用されていた。同システムでは自由な文字列を入力してゲームを遊べるものの、すべき行動がわかっているのに適切な文字列がわからないといった事態も起こりえた（ファミリーコンピュータ移植版では、コマンド選択式が採用）。一方、本作では入力されたテキストの判別に自然言語処理（Natural Language Processing）を採用。大量のテキストデー
- AI
- ゲーム
- steam
- あとで読む
- game
- 文章
- 自然
- 人工知能
公開されている日本の企業名辞書の紹介 - MNTSQ Techブログ
- 128 users
- tech.mntsq.co.jp
- テクノロジー
- 2021/04/28
特許・契約書・有価証券報告書・企業関連ニュースなど、実応用上の自然言語処理では、会社名を認識したいという場面に非常に多く出くわす。会社名らしい文字列をテキストから抽出することは、形態素解析器の辞書を用いたり固有表現抽出モデルを学習することである程度実現される一方で、抽出した会社名をレコード化して分析などに用いる際には、いわゆる名寄せの問題が発生する。自然言語処理における名寄せに似た問題は、エンティティリンキングや共参照解析といったアプローチで探求されており、実応用上は前者のアプローチが採られることが多い印象がある。*1 名寄せタスクをエンティティリンキング的に解くためには、帰着先の知識ベース・辞書が予め存在していることが必要だが、研究の文脈では知識ベースとしてWikipediaが採用されることが多い。 Wikipediaを用いる利点は多くあり、様々なエンティティ種に対してそこそこのカバ
- database
- 企業
- あとで読む
- データ
- dictionary
- NLP
- 会社
- programming
- データベース
初心者が1からプログラミングを勉強し始めて2か月経った
- 128 users
- anond.hatelabo.jp
- 暮らし
- 2021/01/13
私は腐女子なので、二次元の推しとLINEしたくてLINE公式アカウントを作ってLINEしていた。でもすぐに公式の機能だけじゃ足らんなという欲が湧いてきてプログラミングに手を出した。と言ってもプログラミングなんか大学の授業でちょろっとやった程度で、端的に言って画面にhello World!と表示するより難しいことは何ひとつできない。 gitリモートとかデプロイとか言われても意味が分からないし、そもそもコマンドを打ち込むための真っ黒の画面ってどうやって起動するの？そのレベルのヤバい無知から始めたので、とりあえず月980円のプログラミング講座を申し込んで、webアプリ開発入門みたいなのを数日かけて受けた。絶対に翌月分を課金したくなかったので急ピッチで受けた。あまり人のいないサービスのようで、受講すると貰えるポイントのデイリーランキングで1位になったりして、まあデータベースの使い方とか、C
- プログラミング
- あとで読む
- 増田
- programming
- 学習
- 勉強
- 言葉
- 文化
2023年、読んで印象に残った本 - Don't Repeat Yourself
- 126 users
- blog-dry.com
- テクノロジー
- 2024/01/02
あけましておめでとうございます。年がもう明けてしまいましたが、2023年に読んでよかった本について簡単に書いていこうと思います。noteで書いていましたが、こちらのブログをしっかり使わないといろいろもったいなと思ったので、技術に関係ない話題ではありますがこちらに書いていきます。技術書単体テストの考え方/使い方フロントエンド開発のためのセキュリティ入門知らなかったでは済まされない脆弱性対策の必須知識プロを目指す人のためのTypeScript入門安全なコードの書き方から高度な型の使い方まで技術書でないものサピエンス減少縮減する未来の課題を探るネガティヴ・ケイパビリティで生きる 2050年の世界見えない未来の考え方訂正可能性の哲学 GitLabに学ぶ世界最先端のリモート組織のつくりかたドキュメントの活用でオフィスなしでも最大の成果を出すグローバル企業のしくみ 2024
ChatGPTは文字コードをどのように解釈しているか　Unicodeの「日本語認識」「括弧の抽出」「旧字体と新字体の変換」を実験してみた
- 126 users
- logmi.jp
- テクノロジー
- 2023/05/09
「YAPC（Yet Another Perl Conference）」は、Perlを軸としたITに関わるすべての人のためのカンファレンスです。ライトニングトークにはPR TIMES インターンのShun氏が登壇。ChatGPTと文字コードについて話します。 ChatGPTは文字コードをどのように解釈しているか土屋俊介氏：こんにちは。先ほど、発表が4分だと知った土屋です。PR TIMESというところで、機械学習のインターンをしています。（スライドを示して）昨今、ChatGPTというものがメチャメチャはやっていますよね。私は使っていく中で、（ChatGPTが）文字コードをどのように解釈しているかが気になりました。なぜそんなニッチな話が気になるのかというと、自然言語処理とWebに関わっている以上、文字コードに関するプログラムをよく書くんです。その関係で気になったので調べてみました。（スライ
自然言語処理の王様「BERT」の論文を徹底解説 - Qiita
- 126 users
- qiita.com/omiita
- テクノロジー
- 2020/05/04
オミータです。ツイッターで人工知能のことや他媒体で書いている記事などを紹介していますので、人工知能のことをもっと知りたい方などは気軽に@omiita_atiimoをフォローしてください！ 2018年10月に登場して、自然言語処理でもとうとう人間を超える精度を叩き出したことで大きな話題となったBERT。それ以降、XLNetやALBERT、DistillBERTなどBERTをベースにしたモデルが次々と登場してはSoTAを更新し続けています。その結果、GLUEベンチマークでは人間の能力が12位(2020年5月4日時点)に位置しています。BERTは登場してまだ1年半程度であるにもかかわらず、被引用数は2020年5月4日現在で4809 にも及びます。驚異的です。この記事ではそんなBERTの論文を徹底的に解説していきたいと思います。BERTの理解にはTransformer[Vaswani, A.
【保存版】オープンデータ・データセット100選 -膨大なデータを活用しよう！ | AI専門ニュースメディア AINOW
- 126 users
- ainow.ai
- テクノロジー
- 2020/03/02
最終更新日： 2020年3月4日 AIの高まりとともにデータの大切さが再認識される今、オープンにさまざまなデータが公開され、気軽に活用できるようになっています。オープンデータの存在は、膨大なデータから学習を行う機械学習にとって不可欠で、構築したいAIに合わせてオープンデータを選択し、活用することが必要です。一方、オープンデータのみでは競合優位性のあるAIは構築できません。マクロなオープンデータと、独自に収集したミクロなデータを組み合わせて、独自のAIを構築していくことが重要です。オープンデータを活用したサービスを構築する際には、サービスのUX（ユーザー体験）を高め、いかにユニークなデータを取得できるかが勝負なのでオープンデータに頼りすぎないようにしましょう。今回、オープンデータ・データセットを6カテゴリに分類し、100個選出しました。自身のサービスやAIの構築に活かせそうなデータを
市場価値の高いエンジニアとは？？はむかずさん、そのっつさんが語る「エンジニア転職の本音〜意外な転職先の真相に迫る～」 - Findy Engineer Lab
- 125 users
- findy-code.io
- テクノロジー
- 2019/12/11
2019年11月28日、エンジニアを対象としたイベント「エンジニア転職の本音〜はむかずさん（SoftBank）そのっつさん（ZOZO）が語る〜」が開催されました。エンジニアの求人倍率は7倍とも言われ、転職活動においては売り手市場になってきています。エンジニアの転職をサポートするFindyは、1,000名以上のユーザーにお会いし、多くの方のキャリア相談に向き合ってきました。その中で、最近ではエンジニアの転職先として、従来のメガベンチャーやスタートアップだけではなく、外資や大手企業も当たり前のように選択肢になってきていることがわかってきました。そこで今回は、シルバーエッグテクノロジー株式会社からソフトバンク株式会社へ転職をしたはむかずさん、株式会社ディー・エヌ・エーから株式会社ZOZOテクノロジーズへ転職をしたそのっつさんをお呼びして、パネルディスカッションを実施。「エンジニア転職の今
- 転職
- あとで読む
- エンジニア
- engineer
- キャリア
- 会社
- 労働
- 企業
Angularでの開発を快適に進めるために知っておきたいこと - Qiita
- 125 users
- qiita.com
- テクノロジー
- 2019/12/03
Help us understand the problem. What is going on with this article? この記事は Angular #2 Advent Calendar 2019 3日目の記事です。こんにちは、奥野賢太郎（ @okunokentaro ）です。今回は同日に公開された記事『フロントエンドフレームワーク選定前に知っておくべき Angular の 6 つの問題点と、それでも Angular を選ぶ理由』のアンサー記事として、筆者の考える問題点の克服方法、または誤解の解消、および自分がAngularを選ぶ理由を述べようかと思います。特定のAPIの便利な使い方…とかよりは、もうちょっと視座の高い話になっています。また本稿内にてReactの言及が多いことについては、アンサー元の記事がReactを推しておられることに由来しており、それらの節で言及してい
- angular
- あとで読む
- react
- 開発
- AngularJS
- ライブラリ
- qiita
- JavaScript
時系列データのための大規模言語モデル
- 125 users
- zenn.dev/tsurubee
- テクノロジー
- 2024/07/10
近年の大規模言語モデル（LLM）の出現は、自然言語処理（NLP）においてパラダイムシフトをもたらし、ChatGPTをはじめとする様々な革新的サービスを生み出している。LLMの急速な進化は、NLPの領域を超えて、より広範なデータモダリティへのLLMの適用可能性を探る研究への発展を促している。その中で今回注目したのが、時系列データへのLLMの適用である。例えば、[Gruver+, 2023] では、GPT-3やLLaMA-2などの既存のLLMが、ダウンストリームタスクで教師あり学習した時系列モデルの性能に匹敵するか上回るレベルで、zero-shotで時系列予測ができることを報告しており、大変興味深い。本ブログでは、2024年に公開されたサーベイ論文「Large Language Models for Time Series: A Survey」を参考にLLM for Time Seriesの全
- LLM
- あとで読む
- AI
- 機械学習
- 論文
- 研究
ChatGPTはプログラミング言語マスター（語弊ありまくり） - kmizuの日記
- 124 users
- kmizu.hatenablog.com
- テクノロジー
- 2022/12/03
皆さんおはようございます。見ている人は見ていたかもしれませんが、昨夜はかなり遅くまで巷で話題沸騰のChatGPTによくわからんクエリを投げて、その結果をみてげらげら笑っていました。特に存在しないプログラミング言語であり「ScalaにHaskellと同じ型推論を加えた」言語Scalayがあることにしたら、ChatGPTが本当にHaskellぽい（単なるHMでなく、Haskellぽいというのは型クラスまで推論される辺り）型推論を持つ架空のScalayコードを解釈実行してくれたりしたところは、控えめに言っても予想外の結果で深夜なのに部屋で忍び笑いをしていました。 Scalaに引数の型推論を追加したようなパチもんのプログラミング言語Scalay（仮）ができてしまった（ChatGPTと対話してる間だけの短い命）。一応、add: (Int, Int) => Int が推論されてるのすばらですね。 p
40歳エンジニア管理職が「Deep Learning for ENGINEER(E資格)」に合格した話 - Qiita
- 123 users
- qiita.com/takayukiblue
- テクノロジー
- 2020/02/01
Deep Learning for ENGINEER（E資格）とはこの記事は2020年1月時点の情報であることをご了承ください。現在、この日本においてAIのスキルを証明する公的資格として下記が挙げられます。 JDLA Deep Learning for GENERAL（G検定） JDLA Deep Learning for ENGINEER（E資格）です。位置付けとしては、G検定がAI関連技術に関する一般教養を問う試験。 E資格がAI関連技術に関する理論を理解し、AIを実装できるスキルを問う試験。という理解です。詳細というか、正確な定義については、日本ディープラーニング協会（JDLA）のサイトをご参照ください。 E資格の受験方法とJDLA認定プログラムとういうわけで、ここからはE資格のことを中心に話を進めていきたいと思います。 E資格を受験するチャンスは年に2回あり、2月と8
機械学習／統計学／データサイエンスの無償gacco動画、全まとめ【2021年秋版】：AI・機械学習の独学リソース（1/3 ページ） - ＠IT
- 123 users
- atmarkit.itmedia.co.jp
- テクノロジー
- 2019/11/07
機械学習／統計学／データサイエンスの無償gacco動画、全まとめ【2022年秋版】：AI・機械学習の独学リソース（1/3 ページ） 2022年3月末の最新状況に合わせて改訂。はじめてのAIから、機械学習、深層学習、自然言語処理、統計学、社会人のためのデータサイエンス（実用知識）、大学生のためのデータサイエンス（理論知識）まで、全28個の講義内容を紹介。本稿独自に考察した、学習者対象やお勧めの学習方法についても示す。
28歳、一念発起して未経験からデータサイエンティストを志した2年間の軌跡 - Qiita
- 123 users
- qiita.com/toshiyuki_tsutsui
- テクノロジー
- 2020/01/01
はじめに経済産業省の試算によるとAIやビッグデータといったデータサイエンティストが関わる分野では2020年に4.8万人が不足すると言われています。まだまだ、世の中的に需要があり、将来性のある職業ですので、これから目指そうと思われている方も少なくないのではないでしょうか。私も時代の流れに乗って、データサイエンティストを目指した人の一人です。「一念発揮して未経験からデータサイエンティストを目指した普通の社会人が、2年後どのような姿になったのか？」ということに、少しでも興味のある方に読んで頂けましたら幸いです。そもそもデータサイエンティストとはデータサイエンティストは大きく分けて2種類あると考えています。企業の課題解決のために大規模データを分析し、その結果をもとに状況の改善をすべく施策立案を行うデータアナリスト・コンサルタント寄りのDS サービスに機械学習を用いた機能を実装したり
完全自動運転にLLMは必要か？
- 123 users
- zenn.dev/turing_motors
- テクノロジー
- 2023/10/17
この記事を3行でまとめると.. Turingでは1年以上前から完全自動運転に自然言語処理が必要と考えてきた自動運転におけるロングテールなデータに対して、LLMの一般常識に基づく判断能力が必要 Chat-GPTをきっかけにLLMを自動運転に利用する研究が盛り上がってきている TuringのBrain Researchチームの棚橋です。Brain Researchチームでは、中長期的に自動運転においてキーとなるコア技術の開発を行っています。最近ではVision LanguageモデルのフレームワークとしてHeronをリリースしました。なぜ自動車を製造する会社が、LLMの開発を行っているのでしょうか。 Turingでは1年以上前から自動運転における複雑な文脈理解には自然言語が必要であると主張してきました。今年の7月にはLLMで実際の車を動かしてみるプロジェクトをデモとして公開しました。このデモ
- LLM
- あとで読む
- 人工知能
- 研究
- 科学
- language
- 自動運転
- AI
- 交通
今年の書初めコーディングはAITuberを創る！
- 123 users
- zenn.dev/koduki
- テクノロジー
- 2024/01/09
はじめにあけましておめでとうございます。去年は何といってもAIの年でした。ChatGPTやStableDiffusionが2022年末に登場してから、想像を超えてAI周りが進化しましたね。今回は年の初めという事もあり、前から興味のあったAITuberを作ってみる事にしました。「AITuberを作ってみたら生成AIプログラミングがよくわかった件」って本も買ったし。LLM部分だけでは無く、OBSやYouTubeのコメント取得などAITuberに必要な内容が一式揃っていて非常に参考になりました。また、私はプログラミングは多少できますが、イラストや音楽に関しては全くスキルの無い人間です。そのためそのあたりに関してはStable DiffusionやSunoAIの力を借りて作っているので、結果的にオール生成AIという感じですね。そのあたりも含めて記事にまとめたいと思います。 TL;DR 素の
- AI
- あとで読む
- LLM
- api
- technology
- プログラミング
MeCab互換な形態素解析器Vibratoの高速化技法 - LegalOn Technologies Engineering Blog
- 123 users
- tech.legalforce.co.jp
- テクノロジー
- 2022/09/20
こんにちは。LegalForce Researchで研究員をしている神田 (@kampersanda) です。 LegalForce Researchでは、MeCab互換の形態素解析器Vibrato（ヴィブラ〰ト）を開発しています。プログラミング言語Rustで実装しており、高速に動作することが主な利点です。Vibratoはオープンソースソフトウェアとして以下のレポジトリで公開しています。 github.com 本記事では、Vibratoの技術仕様を解説します。以下のような方を読者として想定します。自然言語処理の要素技術に興味のある方データ構造・アルゴリズムに興味のある方 Rustでの自然言語処理に興味がある方 Vibratoについて最小コスト法による形態素解析単語ラティスの構築最小コスト経路の計算高速化の取り組み辞書引きのキャッシュ効率化実装での注意点連接コスト参照のキャ
LLMを用いたLLMの自動評価について〜可能性と注意点〜 - NTT Communications Engineers' Blog
- 122 users
- engineers.ntt.com
- テクノロジー
- 2023/09/25
こんにちは、イノベーションセンターの杉本（GitHub：kaisugi）です。普段はノーコードAI開発ツール Node-AI の開発に取り組む傍ら、兼務1で大規模言語モデル（LLM:Large Language Model）について調査を行なっています。特に、日本語を中心に学習された LLM への関心があり、awesome-japanese-llm という日本語 LLM をまとめた Web サイトのメンテナンスにも取り組んでいます。今回は、LLM に LLM の評価そのものを行わせるという新たなアプローチ（LLM-as-a-judge）についてご紹介します。 ChatGPT の登場以降、国内外で LLM の開発競争が進行しており、モデルの重みが公開されたオープンなモデルも続々と現れています。そのような中で、新しいモデルの構築だけでなく、どのモデルが優れているかを比較検討することが今後ます
無料、独学で機械学習エンジニアになる！~機械学習が学べる無料サイト、書籍~ - Qiita
- 122 users
- qiita.com/KamikawaTakato
- テクノロジー
- 2021/03/05
こんにちはkamikawaです今回は無料で利用できる機械学習、データサイエンスに関するサイトや書籍をまとめました私自身も機械学習プロジェクトに関わった経験があるのですが、ここに載せたサイトや資料を勉強に使っていました機械学習エンジニアを目指す人必見です入門者レベル〜応用・発展レベルまで幅広く載せていますレベルは個人の見解です。(あくまでも参考程度に) 日本語のものと英語のものを紹介します海外の大学の講義もあるので英語の勉強にも使えます海外でのキャリアを考えている方も必見です対象読者機械学習を学びたいけどお金をかけたくない人独学で機械学習を身につけたい人機械学習エンジニアになりたい人発展的な機械学習を学びたい人日本語 Python 三重大学奥村教授のサイト機械学習、様々な分析、スクレイピング、データ可視化、地図データ、CV、統計など幅広い分野を扱っている R編もある