並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 43件

新着順 人気順

feature 英語 名詞の検索結果1 - 40 件 / 43件

  • 三上章とその著書、あるいは三上文法に関する読書案内(おまけ付き) - 誰がログ

    はじめに 読書案内 庵功雄 (2003)『『象は鼻が長い』入門』 益岡隆志 (2003)『三上文法から寺村文法へ』 金水敏 (1997)「4 国文法」『岩波講座 言語の科学 5 文法』 そのほか 寺村秀夫はどのように三上章の後継者か 「主語」の議論にフォーカスし過ぎるのは三上文法の過小評価では 「主語」に関する辞書の記述 日本語文法事典 日本語学大辞典 中間まとめ:三上の扱い おまけ1:「は」とか「主題」とか 「は」と主題の話なら山田孝雄も 「主題」を表す手段は様々な言語に様々な形である この辺りの読書案内 おまけ2:三上文法に関連するあれこれへの私見 主語廃止論と学校文法 ピリオド超え 三上の「土着文法」は日本語特殊論の対極にある 生成文法は主語を絶対視しているか 「「は」は主題」で本当に分かりやすいか おわりに 書いてみて 研究者・専門家のみなさま 引用文献(三上の著書を除く) 長いで

      三上章とその著書、あるいは三上文法に関する読書案内(おまけ付き) - 誰がログ
    • 『シン・エヴァンゲリオン劇場版』冒頭映像0706版を徹底分析!エヴァはどう完結へ向かうのか?

      7月6日、アニメ映画『シン・エヴァンゲリオン劇場版』の冒頭10分40秒の映像を上映するイベント「『シン・エヴァンゲリオン劇場版』0706作戦」が世界各地で行われた。2020年公開予定の『シン・エヴァンゲリオン劇場版』は2007年の新劇場版『序』の公開から数えて14年目の完結作とうたわれており、現在も鋭意制作中の作品の冒頭部分の公開にファンは沸き立った。今回の記事ではレビューや評価というよりは、約10分の映像から順を追ってできる限りの情報を拾い、解析していきたい。固有名詞や設定は公式未発表のものが大多数なので、正式版と異なる可能性も大きいことをお断りしておく。映像については期間限定で公開されている「LINE LIVE」のイベント映像などを参照していただければありがたい。 まずは東宝に続いて東映、カラーのロゴ。今回『シン・エヴァンゲリオン劇場版』の配給は東宝、東映、カラーの3社となった(『序』

        『シン・エヴァンゲリオン劇場版』冒頭映像0706版を徹底分析!エヴァはどう完結へ向かうのか?
      • Pythonのライブラリで小説全文をテキストマイニングしよう

        テキストマイニングとは? テキストマイニングとは、テキストをプログラムに分析してもらい、文章の特徴を図や色などで表現することを指します。 SNSで注目されている単語やGoogle検索トレンドなども瞬時で分析でき、データサイエンティストやマーケターなども活用できます。 今回行うテキストマイニングで特に重要な処理が「形態素解析」と呼ばれるもので、繋がっている文章の中から単語を抜き出して意味を割り出す分析方法です。 例えば、私たち人間が「このサイトは非プログラマーが日常業務で使えるシンプルなPythonを紹介するメディアです。」 をという文章を読む時には 「この/サイト/は/非/プログラマー/が/日常/業務/で/使える/シンプル/な/Python/を/紹介/す/る/メディア/です。/」 と区切ることができます。しかし(英語は単語ごとにスペースを開けるのでプログラムで処理をしなくても問題はありませ

          Pythonのライブラリで小説全文をテキストマイニングしよう
        • 外交支える“最強集団” 外務省 通訳の世界に迫る | NHK政治マガジン

          「通訳担当官」という肩書きを聞いたことはあるだろうか。 実は、各国の首脳や外相との会談の通訳は、基本的に「通訳担当官」に任命された外交官が担っている。 外務省が認める「語学のスペシャリスト」であり、国益をかけた外交の最前線に立ち会う厳しい職責を負う者たちでもある。 驚くことに、まったくの語学初心者が訓練を経て「通訳担当官」に選ばれることも多いという。 彼らはどのように養成されているのか、日本外交を支える“最強集団”に迫った。 (馬場勇人) 初心者から「通訳担当官」に 「ポーランド語は入省後初めて勉強しました。ゼロからのスタートです」 こう話すのは、外務省19年目の課長補佐、山下大輔さん(45歳)だ。 2017年にポーランド語の通訳担当官に登用されたが、外務省に入るまでまったくポーランド語とは縁がなかったという。 大学は外国語大学だが専門は国際関係。卒業後イギリスに留学したが、音楽を学ぶため

            外交支える“最強集団” 外務省 通訳の世界に迫る | NHK政治マガジン
          • 訳文;「"好奇心駆動型の冒険"とでも言うべき特殊なタイプの冒険に報酬を与えるゲームをつくりたい、それが『Outer Wilds』の主目的です」A・ビーチャム氏の論文より - すやすや眠るみたくすらすら書けたら

            翻訳の秋が今年もきました。また去年みたく面白い記事をいくつか見つけて勝手に紹介したいところです! {また翌年も、これに関連する論考を勝手に紹介しました。(訳文;「そこにはなんの報酬もありません。このゲームが何を為していてどう機能しているのか、ただただ見ていたかったのです」ジェンキンズ、カーソン、ホッキング、『Outer Wilds』へつづく2,3の論考) 訳文2万1000字+感想1万6千字くらい。 ※言及したトピックについてネタバレした文章がつづきます。ご注意ください※ 訳した人・なぜ訳した? 内容ざっと説明 ('23追記)ネタバレをある程度避けて論文のエッセンスを味わえる、オフィシャルな記事がオフィシャルな人々から出たよ 論文訳文 アレックス・ビーチャム著『Outer Wilds: a game of curiosity-driven space exploration :: Unive

              訳文;「"好奇心駆動型の冒険"とでも言うべき特殊なタイプの冒険に報酬を与えるゲームをつくりたい、それが『Outer Wilds』の主目的です」A・ビーチャム氏の論文より - すやすや眠るみたくすらすら書けたら
            • 形態素解析の精度向上を頑張った話 - Leverages データ戦略ブログ

              はじめに こんにちは。データ戦略室データエンジニアリンググループの森下です。 普段はデータエンジニアとして、主にデータ活用基盤の保守運用や機能追加、ツール開発やデータ抽出・可視化といった業務を行っています。もともと機械学習への興味はありましたが、本記事の内容以前では、業務で使用したことはありませんでした。今回、初めて機械学習の業務を経験する事ができ、非常に多くのことを学ぶことができました。本記事は未経験者の奮闘記となりますので、これから機械学習を学ぶ方・業務に活かす方にとって参考になれば幸いです。 経緯について データエンジニアとしてデータ活用基盤の構築や保守運用をしていく中で、機械学習へのデータ活用は自然と考える部分です。しかし、書籍やチームの勉強会で機械学習について少しずつ学んではいるものの、業務で機械学習を使用したことはありませんでした。 そのような状況の中で、機械学習の業務に携わり

                形態素解析の精度向上を頑張った話 - Leverages データ戦略ブログ
              • Angular と Firebase で月間PV1億超えの PWA を作った話 - Qiita

                はじめに これは Angular Advent Calendar 2019 10日目の記事です。 こんにちは (。・ω・。) Angular と Firebase で CGM サービス(一般ユーザー投稿型サービス)を開発している者です。 早いもので、Angular Advent Calendar も 3 回目の参加となります。 例年ではなんとなく不吉な 4 日目をいただいていたのですが、今年も募集当日にエントリーしに行くと既に 9 割ほどの枠で参加表明があり、狙っていた? 4 日目も埋まっていました。 (どこでも良いので他の人が嫌がる確率が高そうなところに入ったろの精神 今まで #1 しかなかったカレンダーが今年は勢いそのまま #2 まで誕生し、ここ 1 年での Angular コミュニティの成長を実感しています (ノ゚∀゚)ノ 小話はこの辺で... この記事では、約 2 年間 Angul

                  Angular と Firebase で月間PV1億超えの PWA を作った話 - Qiita
                • wav2vec 2.0 を使って 手軽に音声認識モデルを触れるようになろう - NTT Communications Engineers' Blog

                  この記事は NTTコミュニケーションズ Advent Calendar 2021 の20日目の記事です。 はじめに こんにちは。プラットフォームサービス本部アプリケーションサービス部の是松です。 NTTコミュニケーションズでは自然言語処理、機械翻訳、音声認識・合成、要約、映像解析などのAI関連技術を活用した法人向けサービスを提供しています。(COTOHA シリーズ) NTTコミュニケーションズがこのようなAI関連技術を活用したサービスを展開する強みとして、 NTT研究所の研究成果が利用可能であること 自社の他サービスを利用しているお客様に対してシナジーのあるサービスを提案できること この2点が挙げられると思います。 実際に、私が担当している COTOHA Voice Insight は 通話音声テキスト化によってコンタクトセンターの業務効率化・高度化を実現するサービスなのですが、 NTT研

                    wav2vec 2.0 を使って 手軽に音声認識モデルを触れるようになろう - NTT Communications Engineers' Blog
                  • セキュリティ英単語帳

                    2022年6⽉ 独⽴⾏政法⼈ 情報処理推進機構 産業サイバーセキュリティセンター 第5期中核⼈材育成プログラム 「セキュリティエンジニアのための English Reading」プロジェクト 動詞 単語 意味 関連語 使用例 include ~を含む 【名】inclusion: 包含、含まれるもの 【形】inclusive: すべてを含んだ the email including a malicious macro 悪意のあるマクロを含むメール steal ~を盗む steal sensitive information 機微な情報を盗む exploit (脆弱性) を突いて攻撃する 【名】エクスプロイト (コード) 【名】exploitation: (脆弱性を突く) 攻撃 【形】exploitable: 悪用可能な actively exploited vulnerability よく攻

                    • ローンチ前の Tag Suggestion 機能を機械学習で作る - Beatrust techBlog

                      Beatrust の ML Lead の Tatsuya(白川 達也)です。 機械学習はデータからの学習プロセスを経てデータに最適化した機能を提供する技術ですが、新しい機能の導入前の段階ではユーザーの行動ログデータなどが蓄積されていないため、機械学習ベースの機能を新規提供することには本質的な困難さがあります。 本記事は、Beatrust People における Tag Suggestion 機能を例に、そのような状況においてどのように機械学習ベースの機能を構築していったのかを記したものです。 本記事で書いたこと Beatrust における Tag Suggestion 機能の紹介 データがない状況でどうあがいたか 機能改善ポイント(Relevance、Importance、Diversity) 仲間を募集しています! なお、今回の記事は私のほかにもいつも Beatrust を手伝ってくれて

                        ローンチ前の Tag Suggestion 機能を機械学習で作る - Beatrust techBlog
                      • AWS 認定 機械学習 – 専門知識(Machine Learning – Specialty)合格に向けたオレオレ学習ガイドライン - Qiita

                        分野 1: データエンジニアリング 1.1 機械学習のデータリポジトリの作成。 1.2 データ収集ソリューションの特定と実装。 1.3 データ変換ソリューションの特定と実装。 分野 2: 探索的データ解析 2.1 モデリングのためのデータのサニタイズと準備。 2.2 特徴エンジニアリングの実施。 2.3 機械学習用データの分析と視覚化。 分野 3: モデリング 3.1 ビジネス上の課題を機械学習の課題として捉え直す。 3.2 特定の機械学習の課題に対する適切なモデルの選択。 3.3 機械学習モデルのトレーニング。 3.4 ハイパーパラメータの最適化の実施。 3.5 機械学習モデルの評価。 分野 4: 機械学習の実装と運用 4.1 パフォーマンス、可用性、拡張性、回復性、フォールトトレランスを備えた機械学習ソリューションの構築。 4.2 特定の課題に対応する適切な機械学習サービスおよび機能の

                          AWS 認定 機械学習 – 専門知識(Machine Learning – Specialty)合格に向けたオレオレ学習ガイドライン - Qiita
                        • 【2020年・メタル周辺ベストアルバム】後編 日本のメタルシーンと「音楽批評」 - Closed Eye Visuals

                          【2020年・メタル周辺ベストアルバム】後編 日本のメタルシーンと「音楽批評」 closedeyevisuals.hatenablog.com closedeyevisuals.hatenablog.com 【一覧】 Boris with Merzbow DIMLIM 妖精帝國 Damian Hamada`s Creatures 五人一首 Arise in Stability KRUELTY 明日の叙景 君島大空 【日本】 Boris with Merzbow:2R0I2P0(2020.12.11) 日本の音楽を考えるにあたって避けて通れない問題のひとつに「洋楽至上主義」というものがある。ポップミュージック周辺の音楽はどのジャンルも基本的には外来文化であり、国外で形成された様式や価値観を下敷きにするところから始まった(その上で自在に改変してきた)経緯があるため、意識的に語ろうとするのであれ

                            【2020年・メタル周辺ベストアルバム】後編 日本のメタルシーンと「音楽批評」 - Closed Eye Visuals
                          • プログラミングにおける精神的摩擦(Mental friction)と向き合い方

                            はじめに これは Qiita Advent Calendar 2021 D言語カレンダー の 8日目 の記事です。 近年プログラミング言語の1つであるD言語のコミュニティフォーラムで言及されるようになった「精神的摩擦(Mental friction)」という概念について、個人的な考えも交えつつ整理したもの公開しておこうと思います。 ある程度読んでいただくと、以下のような課題に対して改善が図れたり理解が進むのではないかと思います。 プログラミング等で自分の怒りや不満を抑えるポイント、改善に向けた方法論 稀に見るヘイトにあふれた技術記事や日ごろ発生する不満への対処法 プロダクトの価値としてぼやけがちな「心地よさ」の明確化 もちろん話を単純化したうえで予想を多く含むので、怒りや不満の心理を理解したとか言うつもりはまったくありません。全然違うこともあると思います。以下実際のやり取りをまとめたものな

                              プログラミングにおける精神的摩擦(Mental friction)と向き合い方
                            • 論文を書く上での規則 - Qiita

                              スライドの作り方 → イショティハドゥス的スライドの作り方 やりがちだけど、やらないべきだよねって思っていること。 論文を書く上でどちらにするか迷うところ。 この記事さえ読めば体裁はまずまともになると思います。 日本語・英語両方について書きます。英語は適当なので雰囲気だと思ってください。 ここで出している例はほとんどすべて実在する論文から引用しています。 面倒くさいので引用元は書いてありませんが、Google Scholar などで検索すればすぐ出てくると思います。 Disclaimer あくまで僕の考えなので、参考にするかしないかはおまかせします。 おすすめの文献 科学英文のチェックマニュアル 英語論文におけるポイントはかなりまとまっている上、かなり信頼できます。 英語論文を読む前に一通り目を通しておくとよさそうです。 日本語論文を書く上でも参考にになる場所があります。 科学論文に役立つ

                                論文を書く上での規則 - Qiita
                              • リテリングとは?やり方・効果を解説 アウトプット重視英語学習法・3STEPの効果的インプット法とは!? - ポリグロットライフ | 言語まなび∞ラボ

                                はじめに 今回はリテリング(retelling)を活かしたアウトプット重視英語学習方を紹介していきます。やり方や効果を解説していきます。言語習得にはインプットがもちろん大切ですが、アウトプット仮説によれば、構文への意識など様々な効果が期待されると言われています。その中でもリテリングは要約やパラフレーズを必要とするため、日頃からリテリングを意識する事で、インプット環境も劇的に変化させることが可能で、ぜひ、今後の英語学習の参考にしてみてください。 ↓↓Youtubeチャンネルも随時英語学習の動画を追記しています www.youtube.com リテリング リテリングとは リテリングの手順 英語学習への効果・最新の研究 リテリングを取り入れた指導モデル 英語アウトプットの役割とは アウトプット仮説 統語処理・文法意識化 統語処理とは 文法への意識 構文プライミング効果と研究 プロダクションモデル

                                  リテリングとは?やり方・効果を解説 アウトプット重視英語学習法・3STEPの効果的インプット法とは!? - ポリグロットライフ | 言語まなび∞ラボ
                                • EMNLP2019の気になった論文を紹介 - 株式会社ホクソエムのブログ

                                  ホクソエムサポーターの白井です。 EMNLP-IJCNLP 2019 (以降 EMNLP) が先日、香港で開催されました。 EMNLPは Empirical Methods in Natural Language Processing の略称で、ACLやNAACLと並ぶ、計算機科学のTop conferenceと言われてます*1。 今年採択されたEMNLPの論文は682本 (+システム/デモ論文45本) です。 (年々増えています。) 今回は、EMNLP2019の論文から、いくつか気になったものを紹介します。 前回に引き続き、検証系の論文とデータ構築についての論文をメインに扱います。 以降、記載する図表は、明記しない限り、論文から引用しています。 1. ner and pos when nothing is capitalized 2. A Little Annotation does a

                                    EMNLP2019の気になった論文を紹介 - 株式会社ホクソエムのブログ
                                  • えぬえるぴーや 1ねんせい

                                    Event: みんなのPython勉強会#82 Presented: 2022/06/09 nikkie BERT以後の自然言語処理入門を話します いい感じのタイトルは「えぬえるぴーや 1ねんせい」となりました 元ネタは こちら (香川照之さん) BERTを ばーっと理解 しましょう 皆さんの自然言語処理経験 お前、誰よ にっきー / Twitter @ftnext / GitHub @ftnext えぬえるぴーや 4年生(株式会社ユーザベースのデータサイエンティスト) Python大好き 6年生(みんなのPython勉強会のスタッフ) えぬえるぴーやの提唱者 電波受信! 自然言語処理(NLP)に従事する者の呼称、 NLPer(えぬえるぴーや) SIerと同じ読み方なら、えぬえるぴあー、でも「ぴーや」もそんなに変わらないのでは? 試しに今後のLTなどで名乗って見よう — nikkie にっ

                                      えぬえるぴーや 1ねんせい
                                    • 週刊Railsウォッチ: Evil Martiansが使っているgem、JavaScriptガイドが更新ほか(20230131前編)|TechRacho by BPS株式会社

                                      こんにちは、hachi8833です。RubyKaigi 2023のCFPは今夜1/31いっぱいが締め切りです。 “about 15 hours left to submit your proposal” 🏯🏔️📝👀💨 #rubykaigi https://t.co/n4CUDDLf6X pic.twitter.com/klXhtyZqpY — Kakutani Shintaro (@kakutani) January 31, 2023 週刊Railsウォッチについて 各記事冒頭には🔗でパーマリンクを置いてあります: 社内やTwitterでの議論などにどうぞ 「つっつきボイス」はRailsウォッチ公開前ドラフトを(鍋のように)社内有志でつっついたときの会話の再構成です👄 お気づきの点がありましたら@hachi8833までメンションをいただければ確認・対応いたします🙏 Tech

                                        週刊Railsウォッチ: Evil Martiansが使っているgem、JavaScriptガイドが更新ほか(20230131前編)|TechRacho by BPS株式会社
                                      • WebXR の現状確認 2020 Winter

                                        これは ZOZOテクノロジーズ #3 Advent Calendar 2020 23 日目の記事です。 昨日の記事は @hrsma2i さんによる『metric learning のファッション分野における活躍』でした。 whoami 🍿🐏 が好きな雛乃木神社氏子でめぐるーまーの観測者こと @ikkou です。 VR とか AR とか MR とか、いわゆる xR あるいは XR 領域が大好物で特に WebXR を推しています。 はじめに 1 年前の 2019/12/20 JST に『WebAR の現状確認 2019 Winter』という WebAR に関するまとめエントリを投稿しました。投稿時点から 1 年が経ち、様々なアップデートがありました。 今年は WebAR だけではなく、WebVR も含む WebXR 全般を対象として 2020/12/23 JST 現在の情報をもとにアップデ

                                          WebXR の現状確認 2020 Winter
                                        • プログラミング必須英単語600+

                                          1 A accept【動詞】受諾する access【動詞/名詞】アクセスする /アクセス account【名詞】アカウント、口座 algorithm【名詞】アルゴリズム allow【動詞】可能にする、許可する alternative【形容詞】代替の application【名詞】アプリケーショ ン apply【動詞】適用する argument【名詞】引数 array【名詞】配列 attribute【名詞】属性 audio【名詞】オーディオ、音声 author【名詞】作成者 available【形容詞】利用可能な、入 手可能な avoid【動詞】回避する B backup【名詞】バックアップ base【形容詞/動詞】ベースの、基 底の/〜に基づく(based on で) bit【名詞】ビット blank【形容詞】空白の block【名詞/動詞】ブロック/ブ ロックする boolean【形容詞

                                          • 自然言語処理の基礎である形態素解析からbowによるベクトル化、TF-IDFによる重み付けまで解説|shimakaze_soft

                                            Pythonをそれなりに書いており、専門的にやっているわけではありませんが、自分も業務などで機械学習を行った経験が少しあり、Pythonをやっていれば機械学習や自然言語処理などに触れる機会があります。。 今回は自然言語処理系の機械学習では、ほぼ必ず行う「形態素解析」から文字列の「ベクトル化」までの流れを初心者向けに解説します。 使用環境としてはPython3.5以上を想定しています。 自然言語処理の前処理の基本の流れ機械学習でいう文字列の学習を行うには、前処理と呼ばれる工程で機械学習の形式に扱えるような文字列の処理をする必要があります。基本的な流れは以下のようになります。 - 1. 形態素解析(品詞の分解を行う) - 2. Bag of words(bow)による文字のベクトル化 - 3. TF-IDFによる文字の重み付けベクトル化とは機械学習を行うには、データーである文字列を機械学習で扱

                                              自然言語処理の基礎である形態素解析からbowによるベクトル化、TF-IDFによる重み付けまで解説|shimakaze_soft
                                            • 形態素解析の結果を利用してTF法により特徴抽出をする - Qiita

                                              はじめに 本記事では、文書分類器を実装するための特徴抽出方法としてのTF(Term Frequency method)法について解説する。 1. 形態素解析 文書分類では、文書内の単語の情報を利用する。日本語は英語のように単語の区切りが明示された分かち書き言語ではなく、非分かち書き言語であり、そのため、文書内の各文を単語に分割する必要がある。文を単語に分割し、各単語の品詞を推定することを形態素解析という。 ここでは、オープンソース形態素解析ソフトウェア MeCab(めかぶ)を使う. • http://taku910.github.io/mecab/ 2. 特徴抽出 分類問題を扱う際、一般に、データ中の、分類に利用する情報のことを特徴量と呼び、この特徴量をデータから抽出する作業を特徴抽出と呼ぶ。 文書の分類では、文書中の単語が特徴量として利用される。 文書内の各単語の出現頻度は、しばしば、単

                                                形態素解析の結果を利用してTF法により特徴抽出をする - Qiita
                                              • #WebXR ( WebVR/WebAR ) の現状確認 2021 Winter

                                                🎄本エントリは『WebXR』をテーマにしたアドベントカレンダー『WebXR ( WebVR/WebAR ) Advent Calendar 2021』の初日 Day 1 を飾るエントリです。 whoami @ikkou a.k.a HEAVEN chan です。長らく WebXR 周辺の動向を追っていて、定期的に WebXR に関する『現状確認』エントリを投下しています。 本エントリでは『現状確認 2021 Summer』から少しだけ経過した『現状確認 2021 Winter』として 2021-12-01 JST 現在 の WebXR 全般に触れていきますが「個々の詳細」には触れません。また、具体的なコンテンツの動向にも触れません。それらは Day 2 以降で触れられていくことでしょう。本エントリを読めば WebXR の現状が概ね理解できることを目的としています。 Update 2021

                                                  #WebXR ( WebVR/WebAR ) の現状確認 2021 Winter
                                                • [自然言語処理/NLP] pyvisライブラリを使って共起ネットワークを簡単に描画してみる(SageMaker使用) | DevelopersIO

                                                  こんにちは、Mr.Moです。 共起ネットワークを描画するのにpyvisライブラリを使うと簡単にできたので下記にまとめていきます。 共起ネットワークについて 共起とは? > 共起(きょうき,英:Co-occurrence)は、ある単語がある文章(または文)中に出たとき、その文章(文)中に別の限られた単語が頻繁に出現すること。 https://ja.wikipedia.org/wiki/%E5%85%B1%E8%B5%B7 共起ネットワークは共起する単語の関係をネットワーク図で表したものです。 https://en.wikipedia.org/wiki/Co-occurrence_network pyvisライブラリについて ネットワーク図の視覚化に特化したライブラリのようです。 https://pyvis.readthedocs.io チュートリアル がありデータも用意されているのですがそち

                                                    [自然言語処理/NLP] pyvisライブラリを使って共起ネットワークを簡単に描画してみる(SageMaker使用) | DevelopersIO
                                                  • 「E2E音声認識」と「話者分離」のためのラベルなしデータ学習 「CLOVA Note」で認識性能向上するための技術

                                                    2021年11月10日と11日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2021」がオンラインで開催されました。そこでEnd-to-End音声認識技術の実用化とAI音声記録サービス「CLOVA Note」について紹介されました。まずはNAVERのリュー ヒョクス氏から、サービスの紹介とそれに使われている技術について。 CLOVA Speechチーム リューヒョクス氏:End-to-End音声認識と「CLOVA Note」というサービスについて、LINEの木田とNAVERのリューヒョクスが発表します。この音声認識は、NAVER CLOVA、LINEのSpeechチーム共同での研究開発の成果です。よろしくお願いします。 本日は2部構成で発表いたします。最初にNAVER CLOVAのリューヒョクスがEnd-to-End音声認識とは

                                                      「E2E音声認識」と「話者分離」のためのラベルなしデータ学習 「CLOVA Note」で認識性能向上するための技術
                                                    • 海外ではメルセデスが普通? なぜ日本人だけ「ベンツ」と呼ぶのか - 自動車情報誌「ベストカー」

                                                      輸入車の代名詞のひとつであるメルセデス・ベンツ。日本では、古くから親しみを込めて「ベンツ」と呼んできたが、世界的には「メルセデス」と呼ぶことが一般的といわれる。いったいどう呼ぶのが、正しいのか!? 本稿では、メルセデス・ベンツジャパンに尋ねてみた。以下、その回答も含め、日本で最もポピュラーな輸入車ブランド、メルセデス・ベンツ呼び方について掘り下げていきたい。 文:大音安弘 写真:Daimler AG.、編集部 【画像ギャラリー】日本でも18車種を展開!! メルセデス・ベンツ 現行全ラインナップを見る! 「全世界で“メルセデス”を推奨しています」 「MBUX」を搭載し、日本では2018年に発売されたAクラス 2019年の輸入新車登録台数ナンバー1に輝くなど、今も絶大な人気を誇るメルセデスベンツ。日本では「ベンツ」と呼ぶのが一般的。バブル期に大人気となった190Eは、「小ベンツ」の愛称で親しま

                                                        海外ではメルセデスが普通? なぜ日本人だけ「ベンツ」と呼ぶのか - 自動車情報誌「ベストカー」
                                                      • 中華娯楽週報 第62回:中国産映画は全滅!香港人の大陸への拒否感と大規模デモの背景(前編)

                                                        こんにちは!「香港ガリ勉眼鏡っ娘ゲーマー」こと歐陽です。中国・香港・台湾を含む中華圏のゲームや映画、アニメなどの情報を発信し、社会事情を分析するコラム「中華娯楽週報」。第60回と第61回は2週連続で中国本土の愛国・愛党エンタメを紹介し、現代の若者の政治意識を検証した。日常的に愛国・愛党の娯楽作品に接触している中国の若年層は、全面的な対米貿易戦争による21世紀以降最大の「国難」に際して、驚くほどの一致団結を見せ、普段は日本のアニメや米国のドラマを愛好する彼らは余すことなく愛国心と中国政府・中国共産党への熱烈な支持を表現している。 今回と次回は、状況が180度異なる香港の状況にフォーカスする。まず結論をひと言にしてしまえば、1997年の中国返還後、香港人は中国に親しさを感じたり、愛国心に目覚めたりするどころか、むしろ返還前よりも反中国ムードが盛り上がっている。香港人の反中情緒は、民間における文

                                                          中華娯楽週報 第62回:中国産映画は全滅!香港人の大陸への拒否感と大規模デモの背景(前編)
                                                        • 週刊Railsウォッチ(20200609後編)Rubyにカスタマイズ可能な軽量fiberスケジューラを実験導入、RailsとGraphQL、DBについて知って欲しいことほか|TechRacho by BPS株式会社

                                                          2020.06.09 週刊Railsウォッチ(20200609後編)Rubyにカスタマイズ可能な軽量fiberスケジューラを実験導入、RailsとGraphQL、DBについて知って欲しいことほか こんにちは、hachi8833です。 追記(20200612): 冒頭セクションにおけるツイートの引用方法がツイートの意図と異なるというご指摘をいただきました。大変申し訳ございません🙇‍♂️。 該当セクションを削除いたしました。削除前のスクショ: 1、2 各記事冒頭には⚓でパーマリンクを置いてあります: 社内やTwitterでの議論などにどうぞ 「つっつきボイス」はRailsウォッチ公開前ドラフトを(鍋のように)社内有志でつっついたときの会話の再構成です👄 ⚓Ruby ⚓Rubyに軽量なfiberスケジューラを実験的に導入(Ruby Weeklyより) issue: Feature #1678

                                                            週刊Railsウォッチ(20200609後編)Rubyにカスタマイズ可能な軽量fiberスケジューラを実験導入、RailsとGraphQL、DBについて知って欲しいことほか|TechRacho by BPS株式会社
                                                          • 日本語書記技術WG報告書(2019年3月31日付)

                                                            慶應義塾大学SFC研究所 Advanced Publishing Laboratory 日本語書記技術WG報告書 2019年3月31日 目 次 日本語書記技術 WG の議論の概要… …………………………… 小林龍生…   5 EPUB は Web ではない…………………………………………… 村 田   真… 19 Is EPUB part of the web?… ………………………………… Florian Rivoal… 23 リフロー可能なドキュメント環境とは………………………… 木田泰夫… 29 簡便な行組版ルール(案) … ……………………………………… 小 林   敏… 35 読み効率を高める日本語電子リーダー設計の試み…………… 小林潤平… 49 組版についてのアクセシビリティ要件………………………… 村 田   真… 57 ルビの簡便な配置ルール(案) … ………………………

                                                            • pythonで日本語文の感情分析(+言語処理の基礎) - Qiita

                                                              この投稿は、python Advent Calendarの9日目として記述しています。 下記のノウハウは、基礎的な言語処理にも使えます。 pythonで言語処理するためのライブラリインストール方法(Mecab/Cabocha) pythonでデータ処理(ファイルから読み込んだり、mongoDBに保存したり) この記事の成果物として、pythonで日本語を解析するライブラリ(jpParser)は、こちらからご覧ください(あんまり整理しきれてないですが) 目的 日本語の感情分析システムを作ります! 用途としては、例えば、twitterで特定アカウントのつぶやきからそのユーザーが怒ってるか喜んでいるかを判定したり、今後主流になるであろうチャット対話や音声対話の機能のうちの一つとしても利用したいところです。 とある理由で調べたのですが、日本語言語処理に関する手法があまりなかったのでまとめてみました

                                                                pythonで日本語文の感情分析(+言語処理の基礎) - Qiita
                                                              • Outcomes over Output: Productivityの高い組織への変革|Yoichi Tagaya

                                                                Outcomes over Outputとは「Output (つくったもの) よりもOutcome (成果) に目を向ける」というシンプルで本質を表した概念です。 最近邦訳版が出版されたMelissa Perri著「プロダクトマネジメント - ビルドトラップを避け顧客に価値を届ける」では、Output志向の問題をビルドトラップという言葉で表現しています。Silicon Valley Product Groupの記事 "Product vs. Feature Teams" では、Product TeamはOutcome志向でFeature TeamはOutput志向のように対比しています。そのままのタイトルの本 "Outcomes Over Output: Why customer behavior is the key metric for business success" (Joshu

                                                                  Outcomes over Output: Productivityの高い組織への変革|Yoichi Tagaya
                                                                • 『欧米圏デジタル・ヒューマニティーズの基礎知識』特設サイト

                                                                  [1] http://www.europeana.eu/portal/, accessed July 19, 2020. [2] http://discovery.dho.ie/, accessed July 19, 2020. [3] http://www.omnia.ie/, accessed July 19, 2020. [4] http://nialloleary.eu/, accessed July 19, 2020. [5] http://www.digitalnz.org/, accessed July 19, 2020. 1-8 [1] 例えば、岡崎敦「西欧中世における「書簡」資料をめぐる諸問題」新井由 紀夫(編)『「中・近世西欧における書簡とコミュニケーション」キックオフ・ シンポジウム報告書』(2018), 5-22 など。 [2] 基本的に本節の内容は、Peter S

                                                                    『欧米圏デジタル・ヒューマニティーズの基礎知識』特設サイト
                                                                  • ワードクラウド

                                                                    はじめに ワードクラウド(word cloud)とは頻出語を頻度に比例する大きさで雲のように並べたものです。 英語のワードクラウドは wordcloud ライブラリで簡単に描けます。あらかじめ pip install wordcloud などとしてインストールしておきます。テキストとしては何でもいいのですが、ここでは WordCloud() の説明文(docstring)を用いてみます: from wordcloud import WordCloud text = WordCloud.__doc__ wc = WordCloud(width=480, height=320) wc.generate(text) wc.to_file('wc1.png') 日本語はこのように簡単にはいきません。まずは単語に分解しなければなりません(形態素解析)。そのためのツールとして、昔から有名なMeCab(

                                                                    • AI(Artificial Intelligence)が英語執筆を支援する性 能は,劇的に向上している。DeepL などの機械翻訳 AI が出力する英語は,スペリングや文法のミスが事実上皆無 である。ChatGPT などの多目的の生成系 AI (Generative AI)は英語の文体改善もしてくれる。こういった技術的 進展は,英語を母語としない研究者にとって朗報である。 Nature1) を始めとした国際的学術誌の多くは,投稿者が その利用を言及すれば,AI を文章の校正や改訂のために 使用することを是認している。研究者の母語が,研究能力 の評価の大きな要因とならない時代が近づいているのかも しれない。 本稿は,大学で AI を活用した学術英語ライティングを 教える英語教師の筆者 2) が,英語論文執筆を常習化して いない日本人研究者のために, DeepL や ChatGPT といっ た

                                                                      • テキストの感情分析|Whale1107|note

                                                                        この記事を書いた目的noteに上げることで、なんとかモチベーションを保っているグータラな僕の、完全に個人的な忘備録。 文字列の分類様々な文字列は以下の4種類に分類する事ができる。 カテゴリデータ ・固定されたリストから得られるデータ。ドロップダウンメニューから選択された値など、あらかじめ任意の値を設定してある文字列。 意味的にはカテゴリ分類できる自由に書かれた文字列 ・テキストエリアなどで取得されるデータ。同じ意味を指す異なる語句をユーザが使うことができる。例えば「あなたの性別は?」という問いに対し「男」や「男性」など。 構造化された文字列 ・住所や地名、日付や電話番号などといった何らかの構造を持つデータ。これらは、それ単体で意味を持つ。 テキストデータ ・文章からなる自由に書かれたデータ。記事や論文、メールやチャットの内容などがこれにあたる。 テキスト解析においては、データセットは「コー

                                                                          テキストの感情分析|Whale1107|note
                                                                        • TF-IDFとコサイン類似度により文書の類似度を判定する - Pythonでいろいろやってみる

                                                                          文書の類似度を調べます。関連文献の調査などで「自動で似ている文書を探してくれれば楽なのに」と思うことがありますが、類似度が求められれば自動化の可能性が出てきます。 TF-IDFは文書中に含まれる単語の重要度を評価する手法の1つであり、情報検索などに利用されています。TF(Term Frequency、単語の出現頻度)はそのまま出現頻度を示し、IDF(Inverse Document Frequency、逆文書頻度)は、単語がある文書だけでに現れるのか、多くの文書に現れるのかといった希少度を現します。 TF-IDFはTFとIDFの積であり、出現頻度が大きく(TF大)、特定の文書において現れる(IDF大)場合に大きくなります。例えば「こと」、「ため」といった様々な文書でよく現れる単語についてはTFは大きいですがIDFは小さくなるためTF-IDFが小さくなります。 また、コサイン類似度はベクトル

                                                                          • 初めて公開Webサービス作ってみた奮闘の記録 - Qiita

                                                                            はじめに 先日、初めて公開Webサービスを作ってみた。 【個人ブログのためのSEOツール】キーワードの重要度比較 ブログのSEO対策ツールで、自分のURLと競合ページのURLを入力するとそれぞれのページに含まれるキーワード別の重要度がわかる、というものだ。 これ、このページの下の方に書いた通り、いろんなライブラリの寄せ集めで、ぼくは何も難しいことをしていないんだけど、何しろ初めて公開Webサービスを作ったので、色々試行錯誤があった。 だれもがはじめて作るときは初心者だ。 初心者には初心者なりの悩みがある。 これからWebサービスを作りたいと思っている人に、少しでも参考になればと思って筆をとってみた(キーボードを叩いてみた)。Qiitaにも初投稿だ。 このサービスを作った目的 ぼくはこのサービスのトップドメインでしょうもないブログを書いていた。 コロナになるくらいから始めてはみたものの、ご多

                                                                              初めて公開Webサービス作ってみた奮闘の記録 - Qiita
                                                                            • はじめての自然言語解析(全文公開)|Seiya Kitazume

                                                                              技術書店5にて出品したはじめての自然言語解析を全文公開します! 1.1 自然言語解析のステップ自然言語解析を行う際は基本的な流れとして、下記3ステップを踏むことになります。 形態素解析・分かち書き→数値ベクトルへ変換→機械学習アルゴリズム適用 形態素解析とは、品詞等の情報に基づいて、意味のわかる最小単位に文章を区切ることを言います。 例えば、「今日は学校に行って、その後塾に行って、数学を勉強した。」という文章があったとします。 これを形態素解析すると下記のようになります。(MeCabというツールを使用しています。後ほど詳しくご説明します。) 分かち書きとは、文章において形態素解析に従って語の区切りに空白を挟んで記述することです。英語では単語と単語の間には空白が存在していますが、日本語にはないため、空白を付け足す必要があります。自然言語処理のアルゴリズムは基本的に英語をベースに作成されたもの

                                                                                はじめての自然言語解析(全文公開)|Seiya Kitazume
                                                                              • バッチ処理のbatchって何 - nakaoka3のなんでもブログ

                                                                                batch バッチ処理とは、複数の処理をまとめて一括で処理する方法のことだ。複数の処理をバラバラで実行するよりも、まとめて実行した方が効率的ということがよくあるので、そういう時に使われる。 ところでバッチというのは聞き慣れない言葉だ。バッチの英語での綴りは batch である。バッジ badge ではない。 Batch processing が日本語でいうところのバッチ処理だ。 Computerized batch processing is the running of "jobs that can run without end user interaction, or can be scheduled to run as resources permit." (https://en.wikipedia.org/wiki/Batch_processing) 動詞 batch や動名詞

                                                                                  バッチ処理のbatchって何 - nakaoka3のなんでもブログ
                                                                                • ChatGPTに英語のお知らせタイトルを書いてもらったら一瞬でネイティブっぽいのができた | DevelopersIO

                                                                                  はじめに みなさん、新機能のリリースや仕様・規約改定のお知らせをウェブサイトに出す際に、英語のお知らせタイトルを考えるのに困ってませんか? わたしは、日本語のタイトルを機械翻訳するだけではタイトルに適した英文にならないため、ルールや表現方法を調べながら英文を考えていました。 ChatGPTさんにお願いしたら、一瞬でそんなの欲しかった!という複数のタイトル候補を書いてくれたので、これからめちゃくちゃ効率化されそうです。 今まで困っていたこと DeepLなどの機械翻訳を用いると、精度の高い翻訳をしてくれます。しかし、タイトルという文脈においては適切な表現にはならないため、手直しが必要でした。 例:〇〇の機能が利用できるようになりました。 機械翻訳:You can now use 〇〇. "You can ~" という表現は、本文中や会話形式での内容であればよく使う表現です。しかし、お知らせのタ

                                                                                    ChatGPTに英語のお知らせタイトルを書いてもらったら一瞬でネイティブっぽいのができた | DevelopersIO