タグ

技術と日本語に関するmohnoのブックマーク (19)

  • GPT-4に日本語特化モデル OpenAI Japan始動会見で発表

    OpenAIは4月15日、大規模言語モデル「GPT-4」について、日語に最適化したカスタムモデルを発表した。日語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。 関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや値下げを発表 OpenAIは、11月に発表した「GPT-4 Turbo」のプレビュー版をリリースすると発表した。「GPT-4」が怠け者になってきたという苦情を受け、怠けにくくしたという。公式版は数カ月中にリリースする計画だ。 マイクロソフト提供の“社内GPT基盤”もGPT-4 Turboなどに対応 米Microsoftが、大規模言語モデル「GPT-4」などのAPIをクラウドサービス「Microsoft Azure」経由で使える「Azure OpenA

    GPT-4に日本語特化モデル OpenAI Japan始動会見で発表
    mohno
    mohno 2024/04/16
    何を学習させたんだろうねぇ。
  • 中国の人型ロボ、バク宙にするたび成功に震える

    中国の人型ロボ、バク宙にするたび成功に震える2024.03.23 11:0078,281 岡玄介 ロボット(機械人形)だけに器械体操ってね。 ここ数年は2足歩行をするヒューマノイド開発が流行しており、各社が運動性能の良さや器用さ、AIを使った賢さなど独自の路線で新作が生まれています。 さすが雑技団の国ボストン・ダイナミクスの「Spot」にソックリな、4足歩行の犬型ロボを作っていた中国Unitree社もそのひとつ。 人型ロボ「Unitree H1」は身軽さと運動能力に特化しているようで、器械体操の後方宙返りが出来るようになりました。 Video: Unitree Robotics/YouTube妙な違和感クルっと回って着地するのはスゴい性能ですが、何かおかしくないですか? そう、人間みたいに膝を抱えていないんです。下半身をピンと伸ばした「スワン宙」でもなく、足の裏が背中にくっつくくらい脱力

    中国の人型ロボ、バク宙にするたび成功に震える
    mohno
    mohno 2024/03/24
    「バク宙にするたび」って何?「ボストン・ダイナミクスの「アトラス」が油圧式の駆動系なのに対して、こちらはモーター式」←そういう違いがあるんだな。アトラスも“使い道”が分からんけどな。
  • Setting「設定です」 Configuration「設定です」 Preference「設定です」/Options、Flags、Properties「俺が、俺達が設定だっ!」【やじうまの杜】

    Setting「設定です」 Configuration「設定です」 Preference「設定です」/Options、Flags、Properties「俺が、俺達が設定だっ!」【やじうまの杜】
    mohno
    mohno 2023/02/21
    「設定です」「環境です」「構成です」「詳細設定です」「選択画面です」/こういうのはカタカナさまさま。すっかり定着した「プロパティ」も、Quattroのときは何て訳すか迷走して「デマンドメニュー」になったりした。
  • 住民票を貰いに役所に行ったら「住民票の写しの原本」という謎ワードの餌食になった話→こうやって理解しよう

    よく「住民票の原を用意してください」と言われるが... 東京都北区のHPより「住民票の写しとは」 ❝住民票に記載されている事項の写しのことです。一般に「住民票を取る」と言いますが、住民票の原は請求できません❞

    住民票を貰いに役所に行ったら「住民票の写しの原本」という謎ワードの餌食になった話→こうやって理解しよう
    mohno
    mohno 2022/11/05
    なるほど「写し」は"print"か。でも、普通の日本語だと「写し」は "copy" だよね。/コピー機で「複製」の透かしが印刷できるのはすごいと思ったな。
  • グーグルさん、なかなか確認できないんですけど――検索エンジン比較

    「独立」の検索結果に仰天 日が第二次世界大戦で戦った連合国との間で結んだサンフランシスコ講和条約。これが発効した日は日が占領下からの独立を回復した日でもあります。この日付を調べようとして、たまげました。グーグルで「日 独立 いつ」と検索すると、大きな文字でドーンとこの結果が表示されたのです(上の画像)。 これは伝説上の神武天皇の即位とされる日です。「建国記念の日」のもとにもなっています。一瞬「皇国史観」の設定かとも思いましたが、よく見ると小さく「日/設立」とも出てきます。つまりグーグルは「独立」と「設立」「建国」を同義語と認識してこの結果になったのでしょう。 このようにパソコンに画面で一番目立つように“誤答”が表示されるのは困ったものです。“正解”を表示させるためには、検索語の入力にちょっとした手間をかければいいことをご存じでしょうか。それは、“ ”という引用符を検索語につける

    グーグルさん、なかなか確認できないんですけど――検索エンジン比較
    mohno
    mohno 2022/04/17
    「私はマイクロソフトの回し者ではありませんよ」←マイクロソフトは言わないだろうな。AppleがMacOSがマイナーなせいで攻撃されにくいのを「Windowsより安全」って言っちゃうようなもんだよ(Appleは言ってたが)
  • 大卒外国人の採用、「高い日本語力」要求が壁に - 日本経済新聞

    大卒程度の学歴で専門的な技術や知識を持つ外国人の採用に当たり、高い日語での会話力を求める企業の姿勢が就労の壁になっている。求人の7割超が最高水準の日語力を要求するのに対し、レベルを満たす求職者は4割弱にとどまることが26日、民間データの集計で分かった。国は「高度外国人材」として海外から研究者やエンジニアらの呼び込みを図るが、日語での意思疎通を前提にした採用方針が活躍の機会を失わせている現状

    大卒外国人の採用、「高い日本語力」要求が壁に - 日本経済新聞
    mohno
    mohno 2021/12/27
    「高い日本語での会話力を求める企業の姿勢」「レベルを満たす求職者は4割弱」←外国人で日本語が堪能で技術的スキルもある人に見合う給与を支払うつもりがあるのかどうか。でなきゃ他の国に行っちゃうのでは?
  • 「という」と「こと」を削って文章のもたつきをとる【WEB文章術】 | センスも文才もなくていい 発信力を上げる「WEB文章術」 | mi-mollet(ミモレ) | 明日の私へ、小さな一歩!(1/2)

    ミモレで2021年に公開された記事のうち、特に人気があったものをご紹介します。よろしければぜひご一読ください。 無意識に使ってしまいがちで、“文章のもたつき”を生む言葉に「という」と「こと」があります。「という」と「こと」を減らし、言い換えるコツをご紹介します。 「という」はなくても成立することが多い 話し言葉に近い文体で書くブログやWEB記事は、普段の口グセ・言い回しのクセがそのまま文章に出やすいですよね。前回ご紹介した「のですが」同様、「という」も、無意識にクッション言葉として使いがちです。私自身もインタビューの録音をテープ起こしのために聞くと、「〜なんですが」と「〜という」「〜っていう」を多用していることに気づいて反省します。 「〜のですが」や「という」「ということ」など、話し言葉では語気をやわらげるクッション言葉も、文字として連続するとより目障りでまどろっこしい印象に。私はこれを「

    「という」と「こと」を削って文章のもたつきをとる【WEB文章術】 | センスも文才もなくていい 発信力を上げる「WEB文章術」 | mi-mollet(ミモレ) | 明日の私へ、小さな一歩!(1/2)
    mohno
    mohno 2021/12/01
    「こと」は便利だけど抽象的、ということかな(←おっと)。とはいうものの、文字数調整を優先してしまう。
  • 学生がGoogle翻訳して持ってきた英文がちゃんとした英語になっていた話。Google翻訳の精度が最近急激に向上してるらしい

    内藤健 @drk0311 最近学生が、英語で登録しないといけない学会要旨を日語で書いて、それをGoogle翻訳に掛けたのを見せてきて、「これでいいですか」と訊いてきた。反射的に「ダメに決まってんだろ」と言ったんだが読んでみると「ほぼOKなのではないか」と思えるほどちゃんと英語になってて驚いた。 内藤健 @drk0311 今後は日語で書いた論文をGoogole翻訳して、それを自分で添削すればいいという時代になるんだろうか。なるんだろうなー。圧倒的に効率がいいもの。

    学生がGoogle翻訳して持ってきた英文がちゃんとした英語になっていた話。Google翻訳の精度が最近急激に向上してるらしい
    mohno
    mohno 2019/12/26
    Webページの翻訳はだいぶ読めるようになったし、とくに英語以外は助かってる。技術文書の自動翻訳は、翻訳量が増えて人手に頼れなくなった早い時期から使われていたけど、原文から翻訳されやすい文章にするんだよね。
  • 日本語できぬ親への対応は? 就労拡大…教育現場、追い付かず|【西日本新聞ニュース】

    拡大 外国人の母親と女性のLINEのやりとり。プリントの文面をスマホの翻訳ソフトで英訳して送っている(写真の一部を加工しています) 「子どもの同級生の親は日語ができない。学校が配布するプリントは読めず、配慮が足りないのでは」。福岡県久留米市の女性(53)から、特命取材班にそんな声が寄せられた。改正入管難民法が4月に施行され、外国人の就労拡大が見込まれる。家族を呼び寄せたり、日で子どもをもうけたりするケースは今後さらに増える見通しだが、教育現場の環境整備は進んでいるのか。 女性には小学3年の子どもがおり、昨秋、クラスにフィリピンから男児が転校してきた。今春、クラスのPTA役員決めの際、男児の母親が何も話せず困っているのに気付いた。「大事なことはきちんと伝えないと」と思い、母親と無料通信アプリLINE(ライン)の連絡先を交換した。 5月の金曜日。母親からLINEを通じて「子どもが明日学校が

    日本語できぬ親への対応は? 就労拡大…教育現場、追い付かず|【西日本新聞ニュース】
    mohno
    mohno 2019/08/21
    「国策」って別に移民じゃないし、よほど政策的な事情でもない限り、公立学校で公用語以外の言語でお知らせしてくれる国なんて、そうそうないんじゃないだろうか。今どきなら翻訳ツールが使えるかもしれないが。
  • 「楽しいです」をどう回避するか? 〔日本語を編集する悩ましさ〕 - in between days

    語の欠点のひとつとされるものとして「形容詞+です」の問題があります。 これは標準語の敬体表現において、名詞であれば「犬です」のように「です」があり、動詞には「遊びます」にように「ます」があるのに対して、形容詞に付く適切な助動詞がないことに起因しています。一種の仕様バグかもしれません。 とても丁寧に言えば「楽しうございます」となるけれど、この「ございます」ほど丁寧でなく、もっと日常的で使いやすい語尾がほしい。京都には「楽し(う)おす」という表現があり、これが入って標準語にも「です」「ます」「おす」が揃っていればキレイだったんですが、残念ながら含まれていない。 それで仕方なく使われてるのが、来なら名詞に付く「です」を形容詞に付けた「楽しい+です」という表現で、これがどうしても木に竹を接いだような印象になってしまう。とはいえ、いかんともしがたいので、最近では「い+です」も正しい日語でいい

    「楽しいです」をどう回避するか? 〔日本語を編集する悩ましさ〕 - in between days
    mohno
    mohno 2019/08/20
    「書き言葉として「形容詞+です」は稚拙な印象を与えてしまいがち」←説明文なら「形容詞+名詞+です」だなあ。最悪でも「楽しいことです」とか。
  • さよならGoogle日本語入力、ただいまATOK - 35歳からの中二病エンジニア

    僕は1年ちょっと前に、長らく使っていたATOKを離れて、Google日本語入力に乗り換えた。 ありがとうATOK。30年間お世話になりました。— aikawame (@aikawame) 2017年10月25日 そしてこの度、めでたく出戻りを果たすこととなった。 我慢の限界に達したのでATOKに出戻り。今回はプレミアムにしてみた。— aikawame (@aikawame) 2019年1月12日 出戻りの背景 ツイートにもあるように、僕は30年来のATOKユーザーだ。一太郎Ver.3(昭和62年発売)の頃から使っていて、人生で一番長く使ってきたソフトウェアなのは間違いない。 ただ、最近ではGoogle日本語入力のユーザーが増えていて、ATOKと比べても遜色ないという話もちらほらある。僕自身はATOKの変換精度に満足していたし、毎月300円払う価値は十分にあると思っていたけれども、他のIME

    さよならGoogle日本語入力、ただいまATOK - 35歳からの中二病エンジニア
    mohno
    mohno 2019/01/13
    Google IMEが使いたいときって、Chromeのアドレスバーを使えばいいというか、むしろ一太郎ってよく続けてるよなぁ、と。ネット印刷とか、ちゃんとできてるんだろうか。
  • ゲーム翻訳の現状

    https://anond.hatelabo.jp/20180329160035 この投稿について書いてみたいと思う。 注意:ゲーム翻訳に関わった経験はあるが、ここに書くことがすべての場合には当たらない。あくまで経験上の話。 ちなみに翻訳で嫌いな単語は「availability」です。とにかくめんどくさい。 はてな記法わからないのでベタ打ちなのは申し訳ない。 あの投稿にコメントなどで「意訳」という言葉が出てきたが、実際のところ翻訳者がそうしたいと思ってもできないのが現状です。 これは翻訳者やゲーム翻訳業界の問題というよりも、発注元のゲーム業界に端を発した問題だというのが個人的見解。 流れとしては開発と並行してある程度のテキストができたら翻訳を外注する。 基的に自社で翻訳をやることはほとんどない。特に多言語に展開する場合は無理で、日語から英語(その逆も)というメジャーな組み合わせでも同じ

    ゲーム翻訳の現状
    mohno
    mohno 2018/03/31
    技術文書と違って“説明のために原文を翻訳しやすい文章にする”という配慮もないだろうしねぇ。「翻訳する方としては後で難癖付けられるのは困るので、少なくとも「間違いではない翻訳」を提出する」
  • Budou: 日本語のための自動折り返し制御ツール

    .app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads

    Budou: 日本語のための自動折り返し制御ツール
    mohno
    mohno 2016/10/20
    「Cloud Natural Language API を使って単語の境界判別と構文解析を行い、その出力結果をもとに文節を特定します」←どれくらいの“構文解析”をするんだろう。
  • HTTP/2でも初めてみます?

    12. HTTP/2フレーム Length : ペイロードのオクテット数 Type : フレームの種類、データフレームやヘッダーフレームなどを指す Flags : ストリームの終了やらのフラグ Stream Identifier : 31bitのストリームのID R : 未定義 Frame Payload : タイプによって決められたデータ形式のデータの領域 13. フレームタイプ Type Name Summary Binary DATA ストリームに関連する任意の可変長オクテット列。 0x0 HEADERS 名前-値のペアを転送する。ストリームの開始に仕様される。 0x1 PRIORITY 送信者からストリームの優先度を指定する。 0x2 RST_STREAM ストリームの即時終了を表す 0x3 SETTINGS エンドポイントの通信方式に影響を与える設定など。 0x4 PUSH_PR

    HTTP/2でも初めてみます?
    mohno
    mohno 2015/08/19
    誰も書いてないから不安になるが「始めてみます?」(「始めてみませんか?」の意)のtypoじゃないの?
  • 「シドニアの騎士」モデル販売のデータを見てみました - HIROSHI MIYAMOTO BLOG

    3DCGアニメシリーズ「シドニアの騎士」に使われたモデルが、有料、無料でダウンロードが可能と話題に。 シドニア堂 遅ればせながら、自分もダウンロードしてみました。 ■はじめに このモデルデータについて、SNS界隈で色々な意見が飛び交っているのを見ました。 このモデルを見ることで、学生さんやこれからトゥーン系アニメCGをやろうと思っている人がどのような視点で受け取ればいいのか。 一応、実写からトゥーンまで色々な仕事をしてきた自分としての意見も述べておこうかなと思いこの記事を投稿しました。 (※あくまでアニメ会社勤務サラリーマンの個人的感想です) ■会社によって、千差万別なモデリングの考え方 まず、フリーで落とせた3体を読み込んでみました。 造形等については、キャラクタデザイナーの意図、視聴者の好みがありますので私見は述べない事とします。 自分はゲーム会社やアニメ会社、フリーランスとして受注し

    「シドニアの騎士」モデル販売のデータを見てみました - HIROSHI MIYAMOTO BLOG
    mohno
    mohno 2014/11/10
    もう何が何やら、さっぱりだが、読むぶんには面白い。なので、「うるおぼえ」とか「教授」とか、なんか残念。
  • パーソナルデータ活用「セーフとアウトの明暗がはっきり」、産総研の高木氏

    産業技術総合研究所の高木浩光主任研究員は2013年11月8日、「関西オープンフォーラム2013」で基調講演し、2013年7月以降にパーソナルデータの活用を巡ってインターネットで議論となったJR東日NTTドコモ、KDDIなどの4件について、それぞれの違いを指摘し、現行の個人情報保護法で「セーフとアウトの明暗がはっきりした」と述べた(写真1)。 高木氏は、JR東日が交通系ICカード「Suica」の乗降履歴を第三者に譲渡しようとした事例について、個人情報保護法23条の委託であれば、第三者提供に当たらず適法だったと指摘。政府の「パーソナルデータに関する検討会」(座長=堀部政男・一橋大学名誉教授)でFTC3要件が議論されていることは「現行法でもできる委託方式だと、全体を統括する技術力と管理力が必要になる。IT会社に全部分析をやってほしいので売ってしまいたい事業者もいるので、ある程度は規制緩和し

    パーソナルデータ活用「セーフとアウトの明暗がはっきり」、産総研の高木氏
    mohno
    mohno 2013/11/09
    「セーフとアウトの明暗」とは言わないと思う。
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
    mohno
    mohno 2012/09/08
    古い記事なんだ。“主語の省略”など、文脈への依存度が高いからだと思うけど。
  • 日本語文字列照合順番 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "日語文字列照合順番" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2016年7月) 日語文字列照合順番(にほんごもじれつしょうごうじゅんばん)は、日語の文字列のソート順を示し、日のJIS規格のJIS X 4061で定められている。一般には辞書順(じしょじゅん)、五十音順(ごじゅうおんじゅん)やあいうえお順と呼ばれることが多い。 概要[編集] 日語の国語辞典などの多くの辞書類や各種書物の索引において、この規格で決められた順序で並べ替えが行われる。一般には日語での読みについて濁点や半濁点を無視し、小書き仮名を清音文字(濁点などが

  • よみやすさって、なんだろう - hituziのブログじゃがー

    漢字の すくない日語の文章を かいていると、すぐに よみにくいという反応が かえってきます。はたして、よみやすいって どういうことだろう。きょうのテーマは、「よみやすさ」です。 日語学/日教育の研究者であるシュテファン・カイザーさんの「日語と漢字・日人と漢字 : 日語の表記と国内外における捉え方について」という講演が あります。これが、とても よく まとまっています。まず、これを よんでみてください。PDFで公開されています。 あるいは、つぎの文章が とても参考になります。 山口 光(やまぐち・ひかる)1987 「表意文字と表音文字」『日語学』8月号 山田尚勇(やまだ・ひさお) 1987 「文字体系と思考形態」『日語学』8月号、43-64 山田尚勇 1990 「文字の型と読みの速さ」『日語学』11月号、4-29 マーシャル・アンガー「漢字とアルファベットの読み書き能力」

    よみやすさって、なんだろう - hituziのブログじゃがー
    mohno
    mohno 2008/07/09
    普通に漢字が混じった文章を機械的に指定したレベルでひらがなに置き換えるプログラムはできないものかなあ。20年くらい前に、ひらがな化プログラムに挑戦したことはあるんだが。
  • 1