タグ

日本語と日本に関するkutakutatriangleのブックマーク (6)

  • 日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan

    Stability AIは日語向け画像言語モデル「Japanese InstructBLIP Alpha」を一般公開しました。入力した画像に対して文字で説明を生成できる画像キャプション機能に加え、画像についての質問を文字で入力することで回答することもできます。 Japanese InstructBLIP AlphaJapanese InstructBLIP Alpha」は、先日公開された日語向け指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を拡張した、画像を元にしたテキストが生成されるモデルです。 「Japanese InstructBLIP Alpha」は、高いパフォーマンスが報告されている画像言語モデルInstructBLIPのモデル構造を用いております。少ない日語データセットで高性能なモデルを構築するために、モデルの一部を大規模な

    日本語画像言語モデル「Japanese InstructBLIP Alpha」をリリースしました — Stability AI Japan
  • 英語圏の開発現場から語る「STEAMのインディーゲームに日本語対応を実現するための誰でもできる応援方法」 — Neon Noroshi

    今日はわりとシンプルかつ、日のゲーマーのみなさんが気になる話をしようと思います。 ズバリ、Steamで遊びたいゲームに日語対応してもらう方法とは!? 自分の遊びたいゲームが日語に対応していなくて、悔しい気持ちになったことはありませんか? そんなみなさまに朗報、以下の3つを心掛ければ日語に対応してくれる可能性は上がります。 遊びたいゲームがあったらウィッシュリスト登録をする Steamゲームのページを友達にシェアする 発売済のゲームなら購入する これだけです。この積み重ねがスタジオや開発者の日語への意識を変えます。私自身、マーケターとして多くのゲームに関わっていて実際に開発現場にもいますが、現場の感覚としてこれは間違いありません。 発売済みゲームの購入はハードルが高いかもしれませんが、ウィッシュリスト登録だけでも効果があります。 なぜなら、Steamに登録しているスタジオは、ダッ

    英語圏の開発現場から語る「STEAMのインディーゲームに日本語対応を実現するための誰でもできる応援方法」 — Neon Noroshi
  • 日本語指示データ・日本語擬似レビューの公開 - Megagon Labs | リクルート AI研究機関

    このたび以下の2種類のデータを公開しましたので,簡単にご紹介いたします. 日語指示データ 大規模言語モデル(LLM)の開発に必要なものの1つは高品質なデータです. 英語では様々なデータが公開されていますが,日語ではまだ少ないのが現状です. そこで,LLM研究の一助となるよう,小規模ではありますが,人力で作成した日語指示データmegagonlabs/instruction_jaを公開いたします. このデータは以下の特徴をもちます. オープンソースライセンス 社会や料理など様々な話題を含む対話 自然な日語表現からなる対話 この1と2を満たすデータとしてAnthropicが英語の指示データを公開しています.そしてそれを元に機械翻訳した日語の指示データが,有志によって公開されています.今回それをもとに,3を満たすために人手による補足や日語表現の変更といった改変を行いました. (改変の結

  • 日本語で初対面の人と仲良くなるのむずい問題

    ちょうど1年前、初めて国内の大きなテック・カンファレンスに行ったときの話。業界歴が浅いために知り合いがおらず、完全ぼっちで参加した。 セッションをやってる間はライブツイートしたりしながら自然に時間が過ぎる。しかしこれだけ大勢の参加者がいるのに、途中の休憩や隙間時間でびっくりするほど誰からも話しかけられることがなく、自分から軽く話しかけるのも非常に難しく感じる。話しかけるどころかお互いに必死で視線を避け合っている。 そんな孤立感が地味に積み重なるうちに懇親会の時間になった。ギリギリの気力で参加を試みたが、やはりまったく入り込める感じではなく、ものの数分で内心半泣きになりながら退散した。 心が折れて、カンファレンス2日目はもういいや、行くのをやめようと思った。が、私のちょっとした弱音ツイートを偶然見た優しいフォロワーのひとりがDMをくれて、その人に挨拶するためだけでも行ってみようと、2日目の夕

    日本語で初対面の人と仲良くなるのむずい問題
  • 妖怪ウォッチで思い出した、子ども騙しに子ども騙されてた甘苦い記憶 - ←ズイショ→

    じゃあちょっと、これ伝わるんかめっちゃ怪しい話しますね。 『セクシーコマンドー外伝 すごいよ!!マサルさん』って漫画の中で主人公のマサルが学校机の上でまんぐり返しのポーズで寝てたら突然「モンテスキュー!」って叫んで「夢か……」って残念がるシーンがありまして、当時小学生の僕は「なんだよそれ!意味わかんねぇ!(笑)」って大爆笑してたんですけど、これ僕は完全に語感と勢いだけで笑ってただけで中学生になってモンテスキューっていう三権分立の概念を考案したおっさんがどうも過去にいたらしいぞって話を初めて知りまして、初めてそれを知った時に何だか恥ずかしいというかもどかしいというか、なんか内心サーッと青ざめちゃいまして、モンテスキューっていうおっさんが実際に過去存在していたのなら夢の中にモンテスキューが出てきて二人でシーソーの両端に跨ってなんか三権分立の話なんかをしてたら「ありがとう」って寂しそうに笑ったモ

    妖怪ウォッチで思い出した、子ども騙しに子ども騙されてた甘苦い記憶 - ←ズイショ→
    kutakutatriangle
    kutakutatriangle 2014/08/19
    いきなりロックマンXの話が少しだけ挿入されてて笑った。
  • asahi.com(朝日新聞社):日本IT界の鬼っ子「外字問題」解消を 経産省が着手 - 社会

    「外字(がいじ)」。コンピューターで使う漢字として日工業規格(JIS)が定めた約1万字に含まれない、規格外の文字たち。文字化けや正常なデータ通信ができない原因になり、IT業界にとって悩ましい、この「外字問題」を一気に解消しようというプロジェクトが始まった。パソコンで文章を書くときの使い勝手は大きく変わるのか――。  例えば「渡辺」の「辺」。JIS規格には「邊」「邉」をあわせた3文字しか含まれないが、100字近い異体字があるとされる。  約58万人分の戸籍を扱う東京都足立区。区役所のパソコン画面には49もの「辺」の異体字が現れた。戸籍などを管理するコンピューターシステムに区が登録したものだ。名前に未登録の漢字がある住民が転入するたびに増え、今では外字全体で約5千もある。  外字を作るのは区職員。パソコンで、1文字に30分ほどかけて点描する。完成後は庁内や出先機関にある千数百台のパソコンに登

  • 1