[B! ai][日本語] kyo_agoのブックマーク

kyo_ago id:kyo_ago

aiと日本語に関するkyo_agoのブックマーク (16)

生成AIは日本語の画像をどこまで理解できるのか？ - Qiita
はじめにこんにちは！AI エンジニアのヤマゾーです。ここ数年生成 AI の進化が目覚ましく、生成テキストの品質だけでなく画像の理解力も各段に向上しつつあります。例えば以下の記事を書いた時の ChatGPT は画像中に書かれた日本語を殆ど読めなかったのですが、現在は難しい漢字もスラスラ読めるようになっています。その他にも、X ではインフルエンサーの「〇〇を読めた！」「〇〇を扱えた！」という投稿を毎日のように見かけます。中には再現性や新規性が怪しい投稿も含まれるようですが、ここまで活発かつ継続的に多くの進展が報告されるのは異例の事態です。それでは、現時点における生成 AI は実際どこまで日本語の画像を理解できるのでしょうか？本記事ではこの疑問に答えるべく、三大生成 AI である ChatGPT、Gemini、Claude を対象にオリジナルのテストを行い、初学者向けに解説しようと思い
kyo_ago 2024/07/18
AI

日本語

OpenAI

画像

テスト

qiita

人工知能

google

Anthropic

claude
リンク
各種Prompt Engineeringの日本語実例集（Zero-CoT、mock、ReAct、ToT、Metacog、Step Back、IEPなど） - Qiita
各種Prompt Engineeringの日本語実例集（Zero-CoT、mock、ReAct、ToT、Metacog、Step Back、IEPなど）Python 機械学習入門ChatGPTLLM CoT、Zero-CoT、ToT、mock、ReAct、Step Back、Metacog、IEPなど、各種Prompt Engineering手法の概説と、日本語での実際のプロンプト例をまとめた記事です。各種Prompt Engineering手法を日本語で実装したい方向けの記事となります。本記事で取り扱う手法は以下の通りです。項目数が多いため、記事右下の目次リンクもご活用ください。本記事の内容 01: 通常のPrompt 02: Few-shot Learning 03: CoT（Chain of Thought） 04: 出力形式の指定方法 05: Zero-shot CoT（≒
kyo_ago 2024/06/28
react

日本語

qiita

本

TDD

AI

人工知能

ChatGPT
リンク
Sakana AI
概要 Sakana AIは進化や集合知などの自然界の原理を応用して基盤モデルを開発することを目指しています。私達の目標は、モデルを自ら訓練し開発することだけではありません。基盤モデルの開発を効率化、高度化、自動化するための新たな手法を生み出すことに挑戦しています。この目標に向けた第一歩として、私たちはプレプリント「Evolutionary Optimization of Model Merging Recipes （モデルマージの進化的最適化）」を公開しました。このリリースの要点は以下の通りです。進化的モデルマージという手法を提案します。これは、多様な能力を持つ幅広いオープンソースモデルを融合（マージ）して新たな基盤モデルを構築するための方法を、進化的アルゴリズムを用いて発見する手法です。私たちの手法は、ユーザーが指定した能力に長けた新しい基盤モデルを自動的に作成することができます。既
kyo_ago 2024/03/25
AI

日本語

technology

研究

開発

設計

アルゴリズム

人工知能

機械学習

deeplearning
リンク
ELYZA LLM for JP (デモ版)
2024年6月　基盤LLMを「ELYZA-japanese-Llama-2-70b」から「Llama-3-ELYZA-JP-70B」（Built with Meta Llama 3）に変更しました「ELYZA LLM for JP」はELYZAが開発する日本語の大規模言語モデル（LLM）シリーズの総称です。今回のデモは2024年6月時点で最高性能のモデル「Llama-3-ELYZA-JP-70B」を基盤としたもので、日本語による対話・タスクの実行においてグローバルプレイヤーが提供する海外製LLMに匹敵する性能（※）を実現しています。ELYZAでは本モデルシリーズを、グローバルモデル以外の新たな選択肢として、主にセキュリティやカスタマイズ性を重視する企業、自社サービスや事業にLLMを組み込みたい企業に向けて、安全なAPIサービスや共同開発プロジェクトなど様々な形態で提供してまいります。
kyo_ago 2024/03/15
GenerativeAI

サービス

企業

日本語

開発

AI

webサービス

webservice

service

LLM
リンク
画像生成AI「Bing Image Creator」が日本語対応--英語なしでOKに
マイクロソフトの画像生成AI「Bing Image Crator」が日本語に対応した。英語を使わずに、日本語テキストで画像を生成できるようになった。 Bing Image Creatorは、入力したテキストをもとに画像を生成するサービスだ。画像の生成には、「ChatGPT」を開発したOpenAIの別プロジェクトの1つである「DALL・E2」を利用している。Mirosoftは同モデルを開発したOpenAIに出資している。
kyo_ago 2023/04/29
AI

画像

image

日本語

英語
リンク
画像生成AI「Stable Diffusion」がLINEのチャットbotに　九工大の学生が作成　日本語にも対応
画像生成AI「Stable Diffusion」を使ったLINEのAIチャットbotサービス「お絵描きばりぐっどくん」が8月28日に公開された。LINE上で文章を送ることで、AIが画像を生成する。英語の他、日本語にも対応している。九州工業大学情報工学部の4年生の西野颯真さん（＠nishino_0719）が作成した。 LINEでbotを「友だち登録」することで利用可能。1日10枚まで画像を生成できる。生成した画像の著作権はStable Diffusionと同様、パブリックドメインとしている。西野さんは「Stable Diffusionを触る上で環境構築のハードルの高さへの課題を感じていて、そこを誰でも気軽に触れるLINEを使って解消できないかなと思った」と作成した経緯を話す。リクエスト通りに画像を生成するコツについては「明言はできないが、人物の生成は苦手だけど風景の生成は得意などの特徴を把
kyo_ago 2022/09/02
AI

画像

イラスト

開発

bot

LINE

twitter

日本語

機械学習

webサービス
リンク
文章執筆AI「ELYZA Pencil」
kyo_ago 2022/04/04
文章

webサービス

generator

writing

AI

人工知能

日本語

ツール

webservice

tool
リンク
Seeing AI - Talking Camera for the Blind
Seeing AI is a free app that narrates the world around you. Designed with and for the blind and low vision community, this ongoing research project harnesses the power of AI to open up the visual world. Seeing AI assists with daily tasks from reading, to describing photos, to identifying products, and more. The app continues to evolve as we hear from the community and AI research advances.
kyo_ago 2021/12/08
日本語

AI

tool

ツール

アプリ

accessibility

アクセシビリティ

カメラ

microsoft

ios
リンク
“説明可能なAI”の教科書、日本語訳を公開　「AIに何ができ、何ができないか」理解の手引きに
機械学習モデルによる判断を、人間が解釈・説明するための手法について俯瞰的に解説する名著「解釈可能な機械学習/Interpretable Machine Learning」日本語訳が、このほど公開された。翻訳プロジェクトを主催したAI企業のHACARUSは、「AIに何ができて何ができないかを正しく理解するために、非常に役に立つ」と紹介。「最初の数章に目を通すだけでも価値がある」という。 Interpretable Machine Learningの原著（英語版）は、データサイエンティストクリストフ・モルナル氏による著書で、書籍で発行されている他、Webで無料公開されている。また、PDF版を有料ダウンロードすることもできる。同書では、「コンピュータは通常、判断の説明をしない。それが機械学習を採用する障壁になっている」との前提に立ち、機械学習モデルや、その判断を解釈可能なものにするノウハウを
kyo_ago 2021/05/19
日本語

法律と倫理

学習

AI

ITmedia

news

勉強

人工知能

book
リンク
日本語で東大生超えの自然言語処理スコアを出すAI「ELYZA Brain」（アスキー） - Yahoo!ニュース
株式会社ELYZAは、人間を超える国内最大の日本語AIエンジン「ELYZA Brain」を開発。最先端技術を武器に、社会実装を経て、事業開発までを視野に入れて活動している。【もっと写真を見る】 AI、特に機械学習における画像認識や自然言語処理における進化は日々とめどなく続いている。たとえば、この夏に発表された、人間が書いたような文章を自動生成できる高性能言語モデル「GPT-3」は英語圏で非常に話題となっているが、日本語の壁ゆえに、日本ではまだ知名度が低い。 AIにおける自然言語処理の技術は進歩を続けており、2018年10月にGoogleが論文発表をしたBERTをきっかけに翌2019年には自然言語処理で人間超えのスコアを出す成果が出ている。いまやAIは人間よりも正確に文章を分類できるようになったのだ。しかし、これはあくまで英語圏に限った話。膨大な予算での研究が進められているが、日本は後れ
kyo_ago 2021/04/09
AI

日本語

学習

言語

日本

ニュース

開発

研究

社会

データ
リンク
TechCrunch
Kyle Kuzma is a lot of things. He’s a forward for the Washington Wizards NBA team and a 2020 NBA champion. He’s also a style icon — depending on who you ask — and an angel investor. No
kyo_ago 2020/09/02
日本語

サービス

言語

技術

AI

検索

開発

japan

データ

service
リンク
How Google does Machine Learning 日本語版
Vertex AI プラットフォームの概要を説明し、このプラットフォームを使用してコードを 1 行も記述せずに AutoML 機械学習モデルを迅速に構築、トレーニング、デプロイする方法を説明する
kyo_ago 2020/08/04
google

日本語

machinelearning

機械学習

techfeed

AI

勉強

study
リンク
Magic Pod: AI自動テストツール on Strikingly
AIエンジンが、アプリケーションの画面から項目を自動検出。あとは項目を選んでいくだけで、読みやすい日本語のスクリプトが作成できます。
kyo_ago 2020/06/23
ios

AI

ツール

テスト

アプリケーション

日本語

test

webservice

testing

tool
リンク
Amazon Transcribe：破壊的な文字起こしのスピードと価格。 60分の音声だと150円で、20分もあれば完了。日本語にも対応。｜Sangmin Ahn
【主要なアップデート】（2020.02.04）「7 関連ノート」のセクションを追加（2020. 01.30）図にImageの番号を追加こんにちは、Choimirai School のサンミンです。 0 はじめに機械学習を使って文字起こしを行なっているサービスはいくつかありますが、Amazon Transcribe もその一つです。11月21日から日本語も対象となりましたので、使い方を簡単に紹介します。文字起こしは、業者に頼むと１時間に１万円はすると思う。納期も最低２〜３日はかかる。ところが、Amazon Transcribe を使えば１時間で１５０円。そして、２０分もあれば終わる！会話の場合、１０人までだと参加者毎に文字起こしすることも可。言語に関する仕事をされてる方は技術の変化に注目すべき。 https://t.co/G7bJaMin6M — Sangmin @Choimir
kyo_ago 2020/01/22
amazon

使ってみたい

サービス

日本語

aws

テープ起こし

文字起こし

webサービス

AI
リンク
AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発 - PC Watch
kyo_ago 2019/07/12
日本

研究

開発

ツール

AI

google

PC

翻訳

日本語
リンク
認識率98.66％？！たった2ヶ月で手書き日本語のOCRを開発したノンジャパニーズに話を聞いてきた | Ledge.ai
記事ネタを集めていたところ、代官山で日本語の手書き認識ソフトウェアの開発に成功した外国人グループがいる。それもたった２か月で。という記事にあたりました。日本語の手書き文字のOCRを外国人が開発しているという驚き。気になりすぎたので、早速取材にいってみたところ、Reactive Inc.のデータサイエンティストのDavid MalkinさんとコアエンジニアのPhilip Irriさんにお話しを聞くことができたので、まとめてみました！非エンジニアにもわかるようにと噛み砕いて、システムの内容や今後の拡張計画ディープラーニングの可能性についてまでいろいろ話してくださいました。
kyo_ago 2016/08/02
ai

OCR

機械学習

deeplearning

日本語

開発

IT

システム

エンジニア
リンク
1