並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 257件

新着順 人気順

共起の検索結果1 - 40 件 / 257件

  • 【英会話独学】英語学習ロードマップ 第二言語習得研究と行動科学に基づく英語を話す方法 - ポリグロットライフ | 言語まなび∞ラボ

    はじめに 今回は英語を話す方法の完全英語学習ロードマップを丁寧に解説していきます。私の第二言語習得研究の知見と行動科学(私自身の語学学習の経験を観察して得られた実証結果・多言語話者に取材をして気づいた彼らに共通した行動の特徴)に基づく学習マップを始めから丁寧に解説していきます。英会話の完全独学ができますので、今回のブログをしっかり理解して英語を話せるようになりましょう。 「ポリィの英語講義」というYoutubeチャンネルも開設致しましたので、ぜひこちらもチェックしみてください。こちらのチャンネルでは、今後英語学習ロードマップの実践動画をアップしていきたいと思います。 www.youtube.com 英語学習ロードマップ Phase1 学習方略に基づく学習計画(公開済み) Phase2 発音と単語で気づきを促す(公開済み) Phase3 浅い理解を深い理解に転換(公開済み) Phase4 英

      【英会話独学】英語学習ロードマップ 第二言語習得研究と行動科学に基づく英語を話す方法 - ポリグロットライフ | 言語まなび∞ラボ
    • 認知科学の観点からいえる、最強の英語学習法──『英語独習法』 - 基本読書

      英語独習法 (岩波新書 新赤版 1860) 作者:今井 むつみ発売日: 2020/12/19メディア: 新書この『英語独習法』は、認知科学や発達心理学を専門とする今井むつみによる、認知科学の観点から考えた最強の英語学習について書かれた一冊である。『「わかりやすく教えれば、教えた内容が学び手の脳に移植されて定着する」という考えは幻想であることは認知心理学の常識なのである。』といったり、多読がそこまで良くはない理由を解説したり、一般的に良しとされる学習法から離れたやり方を語っている。 特徴としては、「何が合理的な学習方法なのか」を披露するだけではなく、「なぜそれが合理的なのか」という根拠を説明しているところにある。だから、これを読んだらなぜ一般的な英単語の学習法(たとえば、英単語と日本語の意味を両方セットで暗記していく)が成果を上げないのか、その理屈がわかるはずだ。認知科学のバックボーンから出

        認知科学の観点からいえる、最強の英語学習法──『英語独習法』 - 基本読書
      • 日本から野党が消える日

        消えるというのは大袈裟だけど、衆参両院から50議席を超える野党がなくなって自民党単独で2/3を越えて占める日は遠くないなと確信してる。 日本は最も平和的に一党独裁を100年以上に渡って続ける国になるだろうし、今のままならそうなるしかない。 良い事ではないとは感じるが、とは言え「では、どこか野党に投票するのか?」と聞かれたら「それは無理です。すみませんでした」とならざるを得ない。 ウクライナ戦争において、何が戦争を踏み切らせる理由になってしまったかを考えると、これまで野党が行ってきた主張を許しがたくなるのは、人としては当然の考えと思う。 ウクライナは何故、戦争をしかけられたか? -NATO(集団安全保障)に未加盟であるため、NATOからの反撃を考えなくてよかったからなのは明らかだウクライナへの侵攻を決定づけたのは、バイデンによる「ウクライナには部隊派遣しない」だった可能性があるけれど、日本に

          日本から野党が消える日
        • オタクと気持ち悪いという言葉 - データをいろいろ見てみる

          概要 Twitter上で「気持ち悪い」、「キモイ」という言葉が、どのように使われてるかと調査した。 調査対象は、キモイ、気持ち悪いという言葉を含むtweet、約28万件 時系列の変化を見るため、2018年と2019年で調査を行った 気持ち悪いと言う言葉は、オタクへの言及とともに使われている オタクを含んだtweetは、28万件中、14431件あった 調査結果 2018年調査 2018年に投稿されたツイート調査 調査期間 2018/01/09 - 2018/12/31 tweetソース元 Sample realtime Tweets API 2019年調査 2019年に投稿されたツィート調査 調査期間 2019/01/01- 2019/10/20 tweetソース元 Sample realtime Tweets API 気持ち悪いという言葉の特徴 気持ち悪いという単語は、他者を侮蔑する意味と

            オタクと気持ち悪いという言葉 - データをいろいろ見てみる
          • 自然言語を簡単に可視化・分析できるライブラリ「nlplot」を公開しました - ギークなエンジニアを目指す男

            こんにちは。たかぱい(@takapy0210)です。 本日は自然言語の可視化を手軽にできるようにしたパッケージnlplotをPyPIに公開したので、これのご紹介です。 nlplotとは? nlplotで何ができるか 使い方 使用データ 事前準備 ストップワードの計算 N-gram bar chart N-gram tree Map Histogram of the word count wordcloud co-occurrence networks sunburst chart まとめ nlplotとは? 自然言語の基本的な可視化を手軽にできるようにしたパッケージです。 現在は日本語と英語で動作確認済みです。 基本的な描画はplotlyを用いているため、notebook上からインタラクティブにグラフを操作することができます。 github.com (スター★お待ちしております🙇‍♂️)

              自然言語を簡単に可視化・分析できるライブラリ「nlplot」を公開しました - ギークなエンジニアを目指す男
            • Qiitaのランキングの最初の設計者としての「いいね」の設計と、「LGTM」は下においてほしいという話 - mizchi's blog

              https://blog.qiita.com/like-to-lgtm/ Qiitaさんの変更。思想はまぁわかるものの、「全部読んでから押してほしい」といいながら、開いた直後に押せるところに配置するのは意味がわからないかなあ。https://t.co/HEtwKg0txr— chokudai(高橋 直大)🌸🍆🍡 (@chokudai) 2020年3月12日 これについては chokudai さんに完全に同意なのですが、その理由として、自分の在職時に企画したサービス設計意図が強くあって、退職者がそれについて今更どうこういうのはどうか思うところもあるのですが、当時の同僚がほぼ全員退職してしまっているため、ここでその意図を伝えます。 お前は誰 & 何 当時の Qiita の開発で、ストックといいねを分離して、いいねをベースにしたランキングの実装のを提案したのが自分です。社内の Qiita:

                Qiitaのランキングの最初の設計者としての「いいね」の設計と、「LGTM」は下においてほしいという話 - mizchi's blog
              • 「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ

                ※ この記事は、AWS (Amazon Web Services) の技術支援を受けて執筆しています。 はじめに この記事はコネヒトアドベントカレンダー 8日目の記事です。 コネヒト Advent Calendar 2023って? コネヒトのエンジニアやデザイナーやPdMがお送りするアドベント カレンダーです。 コネヒトは「家族像」というテーマを取りまく様々な課題の解決を 目指す会社で、 ママの一歩を支えるアプリ「ママリ」などを 運営しています。 adventar.org こんにちは!コネヒトの機械学習エンジニア y.ikenoueです。 突然ですがみなさん、Amazon Bedrockをご存知でしょうか。 aws.amazon.com Amazon Bedrock(以下、Bedrock)は、テキスト生成AIをはじめとする基盤モデル (Foundation Model)*1を提供するAWS

                  「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ
                • Elasticsearchで関連キーワード機能がどれだけ低コストで実装できるかの旅路 - エムスリーテックブログ

                  クエリに対する関連キーワード機能 エムスリーエンジニアリンググループ AI・機械学習チームの中村(@po3rin) です。 好きな言語はGo。仕事では主に検索周りを担当しています。 Overview 最近の仕事で医師に質問ができるサービスで「Elasticsearchを使ってなるべく低コストで関連キーワード機能を実装する」という案件に携わっていました。本記事では関連キーワード機能を低コストで実装するための技術調査の結果と、実際に採用した方法をご紹介します。 今回紹介する方法は機械学習などは使わず、なるべく低コストである程度の品質を目指すものです。この記事を読むことで検索アプリケーションにサクッと関連キーワード機能を実装できるようになるでしょう。 Overview 検索における関連キーワード機能とは 実装の前提条件 実装パターンの紹介 (1) ログで出現した単語を数えあげる (2) ログに対

                    Elasticsearchで関連キーワード機能がどれだけ低コストで実装できるかの旅路 - エムスリーテックブログ
                  • ネットワーク分析から直感的に理解するTransformerの仕組みと処理の流れ - あつまれ統計の森

                    グラフ理論と隣接行列 グラフ理論は点と線で物事を表す理論です。たとえば駅の路線図では下記のように駅を点、路線を線で表します。 東京メトロホームページより 上記の路線図では「駅と駅が隣接するかどうか」を中心に取り扱う一方で、それぞれの位置や方角などは厳密に再現はされません。このように、「隣接するかどうか」のみに着目して物事を表す際の理論を「グラフ理論」といいます。 グラフ理論では点をノード(node)、線をエッジ(edge)、全体をグラフ(graph)と定義します。数式で表すと$G = (V,E)$のように表しますが、$V$が頂点のVertice、$E$がEdge、$G$がGraphであるとそれぞれ解釈すると良いです。 グラフの表記法に関しては主に$2$通りあり、「①図を用いる」と「②隣接行列を用いる」をそれぞれ抑えておくと良いです。例があるとわかりやすいので下記のWikipediaの例を元

                      ネットワーク分析から直感的に理解するTransformerの仕組みと処理の流れ - あつまれ統計の森
                    • 推薦システムにおいて線形モデルがまだまだ有用な話 | CyberAgent Developers Blog

                      本記事は、CyberAgent Advent Calendar 2022 19日目の記事です。 目次 はじめに 問題設定 協調フィルタリングのための線形モデル iALS EASE 関連する非線形モデル 実務活用 おわりに はじめに メディア DSC所属の機械学習エンジニアで、タップルの推薦システムを担当している橋爪 (@runnlp)です。 最近、推薦システムを触り始めました。推薦手法は、協調フィルタリング、コンテンツベース、ハイブリッドなど様々ですが、今回は昔から今に至るまで長く使われている協調フィルタリングについてです。 協調フィルタリングではDeep系のモデルがたくさん出る中で、RecSys2022で発表された論文では10年以上前から使用されている線形モデル(iALS)がDeep系のモデルに匹敵する結果であると報告されており興味深いです。また、推薦システムを開発するにあたって、問題設

                        推薦システムにおいて線形モデルがまだまだ有用な話 | CyberAgent Developers Blog
                      • Google Analytics 4 以外でウェブサイトを分析・改善するための無料ツール群とオウンドメディアでの活用法(寄稿:小川卓) - はてなビジネスブログ

                        株式会社HAPPY ANALYTICSの小川卓(id:ryuka01)です。 Google Analytics 4はアクセス解析ツールのスタンダードとして、多くの企業やサイトに導入されています。しかし利用ハードルが高いのもまた事実です。数多くあるレポートや、自由度が高すぎて迷ってしまう探索レポート、独自の用語なども沢山あり、利用に苦労されている方も多いのではないでしょうか。 そこで、GA4以外でウェブサイトのユーザー行動を理解し、サイト改善するためのツールを厳選して紹介します。今回紹介するツールは無料で利用できるものをピックアップしています。無料プランと有料プランの両方があるサービスの場合は、その旨を記載しています。また、無料でも期間限定のサービスは追加していません。 数多く紹介することを目的とせず、全て筆者が利用している(あるいは利用経験があるもの)に絞り込み、その中で良かったと思うツー

                          Google Analytics 4 以外でウェブサイトを分析・改善するための無料ツール群とオウンドメディアでの活用法(寄稿:小川卓) - はてなビジネスブログ
                        • メンタルレキシコンとは?わかりやすく解説・心理学との関係 英語学習への効果とは? - ポリグロットライフ | 言語まなび∞ラボ

                          はじめに 今回はメンタルレキシコンについてわかりやすく解説していきます。メンタルレキシコンとは、どのような意味や性質を持ち、学ぶ意義は何なのかを考えていきます。心理学との関係や英語学習及び語彙学習への効果についても考えていきます。メンタルレキシコンを正しく理解して、正しい効率的な語彙学習をぜひ取り入れてみてください。 ↓↓第二言語習得研究に基づく英語学習動画をアップしていきます。 www.youtube.com メンタルレキシコンとは? メンタルレキシコンの意味 メンタルレキシコンの性質 メンタルレキシコンを学ぶ意義 メンタルレキシコン内の語彙知識モデル 階層的ネットワークモデル 活性化拡散モデル 母国語のメンタルレキシコン 子供の語彙の増加 即時マッピング 第二言語学習への示唆 バイリンガルの語彙発達 バイリンガルの言語的特徴 バイリンガルレキシコン メンタルレキシコンと心理学 二重符号

                            メンタルレキシコンとは?わかりやすく解説・心理学との関係 英語学習への効果とは? - ポリグロットライフ | 言語まなび∞ラボ
                          • 英単語の覚え方・コツ 第二言語習得研究・最新の脳科学研究に基づく学習方法 - ポリグロットライフ | 言語まなび∞ラボ

                            はじめに 今回は英単語の覚え方・コツを考えていきます。第二言語習得研究・最新の脳科学研究に基づいて効果的な英単語学習方法を紹介していきます。どれぐれいの語彙が必要なのか、どれぐらい深く学習するべきかという基礎知識を確認した後で、第二言語習得研究・脳科学研究に基づく学習のヒントの事例や研究を紹介していきます。最後に学習スタイル診断を紹介するので、自分に合った学習戦略み基づいて英単語学習をぜひはじめてみてください。 第二言語習得研究から考える英語学習方法はこちら↓↓ www.sunafuki.com 英語が話せるようになる実践トレーニングはこちら↓↓ www.sunafuki.com シャドーイングの実践方法はこちら↓↓ www.sunafuki.com パターンプラクティスの正しいやり方はこちら↓↓ www.sunafuki.com 参考文献 「脳科学的に正しい英語学習法」 「英語の学び方入

                              英単語の覚え方・コツ 第二言語習得研究・最新の脳科学研究に基づく学習方法 - ポリグロットライフ | 言語まなび∞ラボ
                            • kaggle本で参考になった点のなぐり書き - ML_BearのKaggleな日常

                              これはなに? kaggle本を読んで血肉になった/したい点をなぐり書きにしたただの個人用メモです。ちゃんとした書評を書こうと思い続けてはや半月以上経過したので一旦書きました。 この箇条書きの記事だけ読んでも多分内容わからないと思うので、気になった点があればぜひ購入しましょう!読後すぐに書いた推薦ツイートは以下のとおりです。 kaggle本読み終わりました。初心者にも良い本だと思いますが、ExpertやMasterなりたての人が最も恩恵を得られそうだなと感じました。自分の今までのコンペ経験を思い返しつつ、その中では経験できなかった内容を学ぶことができ「賢者は歴史に学ぶ」が可能になった感があります。著者の方々に感謝です!— ML_Bear (@MLBear2) October 23, 2019 リンク Chap. 2 - タスクと評価指標 「しきい値の最適化」という概念 正例か負例のラベルを提

                                kaggle本で参考になった点のなぐり書き - ML_BearのKaggleな日常
                              • 2023年 研究開発部 新卒技術研修 ~ 実践編 ~ - Sansan Tech Blog

                                こんにちは、研究開発部 Architectグループの藤岡です。 4/26(水)〜 4/28(金)で研究開発部内の技術研修を行ったので、その内容を公開します。 目次 目次 研修の目的 研修の概要 実践編の概要 アプリケーションを作成 バッチを作成 gokartとは パイプラインを実装 APIを作成 FastAPI とは APIを実装 ディレクトリ構成 実行 Webアプリを作成 Streamlitとは Webアプリを実装 Docker化 デプロイ ECRにイメージをプッシュ アプリケーション基盤 Circuitについて アプリのマニフェストを作成 研修終了後 終わりに 研修の目的 この研修の主な目的は、新卒社員がスムーズに業務に入れるようにすることです。 研究開発部にはさまざまなバックグラウンドを持つ研究員が入社するため、チーム開発の経験がない方もいます。 そのため、Gitの操作やプルリクエス

                                  2023年 研究開発部 新卒技術研修 ~ 実践編 ~ - Sansan Tech Blog
                                • 【自然言語処理】【Python】共起ネットワークの作り方を理解する

                                  はじめに 自然言語処理をはじめたら、一度は作ってみたいのが共起ネットワークではないかと思います。 私自身、共起ネットワークについては、書籍やネット記事を参考にしながら、これまで何度も作ってきました。 しかしながら、文章→共起行列→共起ネットワークとなる一連の過程において、特に共起行列を作成するコードの理解が十分ではないと思い至り、今回、勉強もかねて、共起行列の作成過程を残すことにしました。 共起ネットワークに興味を持たれている方の参考になればと思います。 共起ネットワーク 単語どおしのつながりを可視化してくれる手法で、文章の構造的な特徴を直感的に理解するのによく利用されます。 文書(text)を文章(sentence)に分割したのち、同一文章中に同時に出現する単語(word)の組みを数えあげることで共起行列を作成し、これをネットワークで可視化します。 ネットワークはノード(丸) と、ノード

                                    【自然言語処理】【Python】共起ネットワークの作り方を理解する
                                  • 外部データをRetrievalしてLLM活用する上での課題と対策案 - ABEJA Tech Blog

                                    はじめに ABEJAでデータサイエンティストをしている服部です。 今回はLLMで外部データを使うケースについてのお話をしたいと思います。 はじめに LLMと外部データの利用 RetrievalとLLM 0. (事前準備)参照したいテキストデータをDBに格納 1. ユーザの入力文とのテキスト類似度を計算して、関連テキストを抽出する(Retrieval) 2. 関連テキストをLLMのプロンプトに入れ込み、ユーザの入力文に回答する。 Retrieval時の課題 LangChainでの用意 Case1: それぞれの文章がRetrievalしにくい形で保存されている 対策案: ページ構造を意識した形で各文章を格納する 他の対策案 聞き方を明確にする 類似度を測るクエリ文章を置き換える 不要そうな文章をデータから削除する データ自体をLLMで整形し直す Case2: 未知の単語を含む 仮説: ニャオハ

                                      外部データをRetrievalしてLLM活用する上での課題と対策案 - ABEJA Tech Blog
                                    • コーパスとは? 使い方をわかりやすく解説 無料英語学習最ツール coca corpus・SKELLも紹介 - ポリグロットライフ | 言語まなび∞ラボ

                                      はじめに コーパスとは?今回は英語学習無料ツールであるコーパスの使い方をわかりやすく解説します。コーパスとは膨大の言語データベースで言語学の研究のために使用されています。まず始めに、コーパスの意味や活用方法、無料で利用できるcoca corpusを紹介します。英語学習への効果やコロケーションについても解説します。実際にSKELLというサービスを使って、頻出動詞のコロケーションも完全整理したので、ぜひチェックしてみてください。コーパスを活用すれば、頻出の動詞やコロケーションを知ることができます。英語話者が実際に使用している語句を網羅すれば、効率よく英語学習を進めることができます。 ↓↓こちらの動画でも解説してます www.youtube.com 英単語の覚え方はこちら↓↓ www.sunafuki.com 英語脳についてはこちらで解説↓↓ www.sunafuki.com 主な参考文献 「英

                                        コーパスとは? 使い方をわかりやすく解説 無料英語学習最ツール coca corpus・SKELLも紹介 - ポリグロットライフ | 言語まなび∞ラボ
                                      • ダジャレを判定する - Stimulator

                                        - はじめに - 近年、IT業界のダジャレは熾烈の一途を辿っている(ITだけに) 。 類義語を巧みに取り入れたダジャレ、難読化されたダジャレなどが増加し、一体どれで「初笑い」すれば良いのか悩む若者も少なくない。 そのような背景があり、ダジャレを判定するアルゴリズムの開発も盛んである。 ルールベースによる判定では、@kurehajimeが提案、開発したdajarep *1 や、@fujit33によるShareka *2が存在する。特にSharekaは、ルールベースのロジックにも関わらず、反復型とされる種類のダジャレに対して高い精度での判定を可能にしている。また、機械学習モデルを用いた判定手法として、谷津(@tuu_yaa)らが開発したDajaRecognizer *3がある。DajaRecognizerは、多くのルールベースによって子音音韻類似度をPMIとして定義、Bag-of-Words、

                                          ダジャレを判定する - Stimulator
                                        • Qiita投稿記事から作る「日本のIT技術マップ」 - VDSLab Magazine vol.1|likr

                                          はじめにIT分野では日々新しい技術が登場しています。技術者の肌感覚として新しい技術・枯れた技術の区別は付くでしょうが、それらを俯瞰して視ることはできるのでしょうか?昨今のIT分野では、Qiita等のプラットフォームを通じてコミュニティベースでの技術情報の発信が活発に行われています。本稿では、Qiitaの投稿記事に付けられたタグの情報を利用して、過去約10年間の国内のIT技術動向を可視化した「日本のIT技術マップ」を紹介します。 「日本のIT技術マップ」「日本のIT技術マップ」は、Qiitaの投稿記事から得たタグの関係を地図テイストに可視化したものです。投稿記事は、Qiitaのサービス開始時である2011年9月から2022年12月までのものをQiita APIから取得しました。可視化方法の主要な部分は以下の論文を参考にしています。 Gansner, E. R., Hu, Y., & Kobo

                                            Qiita投稿記事から作る「日本のIT技術マップ」 - VDSLab Magazine vol.1|likr
                                          • Google、検索アルゴリズムの更新「Helpful Content Update」を実施 検索エンジンファーストで作成されたコンテンツを標的 - SEMリサーチ

                                            人間ではなく検索エンジンのために作成された、役に立たないコンテンツや満足度が低いコンテンツの評価を調整することを目的とした検索アルゴリズム更新「Helpful Content Update」(HCU)の情報について随時更新していきます。 一般的な情報は本ページに、詳細解説は SEMリサーチ+(プラス、有料版)に掲載します。 目次 Helpful Content Update 概要 アルゴリズム更新の実施時期 対象検索エンジンと言語 HCU 対象範囲 HCUが標的とするコンテンツの種類 HCU 検出の仕組み 「低品質」と判定されたときの影響範囲と期間 HCU に備えたウェブマスターの対応 ユーザーファーストのコンテンツ作成に注力する 以下の質問にすべて「はい」と自信を持って答えられるか HCU に関する注意事項 (2022.08.20更新) テクニカルな”抜け道”を探そうという発想が生まれた

                                              Google、検索アルゴリズムの更新「Helpful Content Update」を実施 検索エンジンファーストで作成されたコンテンツを標的 - SEMリサーチ
                                            • 自然言語処理におけるEmbeddingの方法一覧とサンプルコード - 機械学習 Memo φ(・ω・ )

                                              概要 自然言語処理における単語や文章のEmbeddingの方法を勉強したので概要を記載しました。 また、学習済みモデルからEmbeddingベクトルを取得するサンプルソースコードも一部記載しました。 概要 Word2vec fastText GloVe Skip-thought SCDV USE ELMo BERT おわり 宣伝 Word2vec 似た意味の単語の周りには同じような単語が出現するとして、ある単語の周辺に出現する単語を予測するNNの隠れ層の重みを、ある単語のベクトルとしたもの。Doc2vecはWord2vecを文章に拡張したもの。 NNには以下のようなSkip-Gramのモデルが使われる。 Word2vecの元論文 : [1310.4546] Distributed Representations of Words and Phrases and their Composit

                                                自然言語処理におけるEmbeddingの方法一覧とサンプルコード - 機械学習 Memo φ(・ω・ )
                                              • プログラミング学習においての写経の必要性について

                                                これは YouTube Live で写経の必要性についてディスカッションするために、自分が用意した資料。 急いで書いたので色々雑。 議論が終わったら追記する、かも。 争点 プログラミングの写経に意味があるのか。ないのか。 あるとしたら、その意味は。 ないとしたら、なぜ無意味なのか。 また、少し違った視点として、とくに学校教育の現場で、モチベーションが低い対象を前提として、写経を行わせる意味などもあるかもしれない。 語らない点 個別の言語ごとの写経の向き不向き 特定ツールの良し悪し 個々のライブラリでは云々 一般化できなさそうな N=1 事例 プログラミングの写経の定義 (同意できそうなところ) 完全に思考を停止した状態で、意味を理解せずに上からタイプする作業を写経と呼んではいない。なので、仏教的な意味においての写経・読経や、ヨーロッパの修道院で行われた聖書の写本的な意味合いからは(完全に無

                                                  プログラミング学習においての写経の必要性について
                                                • 自由記述のアンケートデータがあったときに実施すべき4つの分析手法 - Qiita

                                                  アンケートには、数値で回答をする設問があったり、自由記述の回答をする設問があったりすることが一般的です。 そして、数値の回答に関しては、集計して性別や年代など回答者の属性ごとにスコアを比べたり、質問間の相関を調べて、分析を進めることが可能です。 一方で、自由記述の回答の場合、膨大なテキストデータを眺めるだけで終わってしまったり、アンケートを見た人の主観的な気付きをまとめただけで分析が終わってしまい、「データに基づいた気付き」を得るまでには至らないことも少なくありません。 そこで、今回は自由記述のアンケートデータがあったときに、有用な情報や気付きを得るために実施すべき4つの分析手法を紹介いたします。 1. 頻出単語のカウント 自由記述のテキストデータがあったときに、データ(文章)は「単語」に分け、それぞれの単語の出現回数を集計(定量化)することで、データの中にあるパターンや特徴を掴めるように

                                                    自由記述のアンケートデータがあったときに実施すべき4つの分析手法 - Qiita
                                                  • 画像認識の定番データセットImageNetはもう終わりか - Qiita

                                                    オミータです。ツイッターで人工知能のことや他媒体で書いている記事など を紹介していますので、人工知能のことをもっと知りたい方などは気軽に@omiita_atiimoをフォローしてください! 2012年にAlexNet[Krizhevsky, A.(2012)]が登場してから、画像認識分野での発展は著しい。その発展を支えてきたものこそ大規模データセットImageNet[Deng, J.(2009)]である。ImageNetでSoTAを達成すると、そのモデルには最強モデルの称号が与えられると言っても過言ではない。2020年6月にGoogle Brainによって出されたこの論文は、そんな当たり前に使われてきたImageNetデータセットに対して疑問符を叩きつけるものとなっている。現存のImageNetでの性能評価が必ずしも正しいのだろうか。この論文を通してその答えを探しにいく。 本論文で使われて

                                                      画像認識の定番データセットImageNetはもう終わりか - Qiita
                                                    • 自然言語処理の最先端Transformerを集合生成に応用する【逆転オセロニア】 | BLOG - DeNA Engineering

                                                      はじめまして。9月初旬より約半月にわたり、AIエンジニアコースのインターンに参加させていただいた清水と申します。大学院は情報系の専攻で、最近は幾何学的な深層学習に関する研究に取り組んでいます。その過程で言語的なタスクを出口に用いることも多く、副次的に深層学習を利用した自然言語処理にも多少明るかったりします。 題目にあるTransformerとは、そうした分野にてここ数年にわかに注目を集めている仕組みの名です。自然言語処理の最先端研究ではまず流用されないことなどない、いわば伝家の宝刀レベルのモデルといってよいでしょう。 本記事ではこれを『逆転オセロニア』というゲームのデッキ編成に特化させ、現行手法よりも表現力に富んだ編成システムを実現した経緯についてお話しできればと思います。『日進月歩で強力になっていく機械学習手法の恩恵に与りたいけれど、所望の問題設定にドンピシャな手法なんてそうそうなくて思

                                                        自然言語処理の最先端Transformerを集合生成に応用する【逆転オセロニア】 | BLOG - DeNA Engineering
                                                      • 【決定版】SEOコピーライティングガイド - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ

                                                        Aと同様、BもSEOのキーワードに最適化されている。 さらに、内容が非常に優れているのだ。 Bは優れた内容とSEOが組み合わさっているため、下記のようなSEOのランキング要素の多くを高いレベルで獲得している。 より多くの被リンク 低い直帰率 高い滞在時間 平均以上のクリック率 多くのソーシャルシェア コメントやコミュニティ つまり、最終的にBはAを凌駕することになるのだ。 SEOコピーライティングがいかにしてBacklinkoの成長を促したか SEOについて知ることは素晴らしい。 コピーライティングについて知ることも素晴らしい。 それら2つをなし得た場合、どうなるだろうか? 非常に優れた2つの武器を手に入れることになるのだ。 実際、SEOコピーライティングは、Backlinkoが競合性の高い領域において急成長を遂げた主要因の1つであるのだ。 例えば、Backlinkoをローンチした当初、S

                                                          【決定版】SEOコピーライティングガイド - SEO Japan|アイオイクスのSEO・CV改善・Webサイト集客情報ブログ
                                                        • I play {∅︎/a/the} guitar. - 空論上の砂、楼閣上の机。

                                                          米語母語話者のニック・ノートン氏による非常に興味深いコメントを発見しました。 youtu.be 要約すると次の通りです。 微妙な差ではあるものの、I play guitar. は習慣的に、I play {the/a} guitar. は初めて、ギターを弾くことを意味するように感じられる。piano や harmonica や trumpet もこの類に属する。 しかし I play saxophone. は言えず I play the saxophone と言う。accordion もこの類に属する。 ここで The Beatles の挨拶を聞いてみましょう。 I’m Ringo, and I play the drums. I’m Paul, and I play the bass. I’m George, and I play a guitar. I’m John, and I too

                                                            I play {∅︎/a/the} guitar. - 空論上の砂、楼閣上の机。
                                                          • 【実践編】はてなブログの記事をリライトしてみた!~個人事業主162日目~ - かえるの雑記~好きなことつぶやくブログ~

                                                            スポンサーリンク ~目次~ 第13回目は『実際にはてなブログ記事をリライトしてみた』です リライトする記事を選択 リライトする記事のキーワードを選択 キーワードが決まったらラッコキーワードで情報取得 競合サイトの見出しを確認 競合サイトの文字数を確認 競合サイトの構成を確認 共起語を確認 リライト開始 はてなブログの記事のリライトのまとめ こんばんは。 かえるです。 無職から個人事業主となって162日が経ちました。 かえるのブログについての独り言 第13回目は『実際にはてなブログ記事をリライトしてみた』です 1月23日は少し時間が取れることもあり、はてなブログの記事のリライトをおこなってみます。 リライトをする手順などを書いていきますので、参考にしていただければ幸いです。 それでは、はてなブログの記事のリライト開始!! スポンサーリンク リライトする記事を選択 今回は以前上げた「伊勢志摩旅

                                                              【実践編】はてなブログの記事をリライトしてみた!~個人事業主162日目~ - かえるの雑記~好きなことつぶやくブログ~
                                                            • Pythonでテキストアナリティクス  〜『テキストアナリティクス入門』に沿い共起ネットワークなど描いてみた〜 Part3:辞書登録編 - Qiita

                                                              Pythonでテキストアナリティクス  〜『テキストアナリティクス入門』に沿い共起ネットワークなど描いてみた〜 Part3:辞書登録編Pythonwordcloud共起ネットワークGiNZApyvis 2022/08/15 紹介いただいた「国語研長単位」モデルで実行した番外編の記事もアップしました。 はじめに テキストアナリティクス入門 この書籍は、テキストアナリティクス初学者向けの入門書です。 テキストアナリティクスとは何だということのみならず、頻出語やこれを表現したWordCloud、共起ネットワークをどのように活用すべきかが、実例に沿ってわかりやすく解説されていて、とても参考になりました。 紹介されているテキストアナリティクスを実行したい!ということで、 1回目は、テキストの頻出語確認→WordCloud→共起ネットワークの作成および原文検察を、形態素解析した単語で実行。 2回目は、

                                                                Pythonでテキストアナリティクス  〜『テキストアナリティクス入門』に沿い共起ネットワークなど描いてみた〜 Part3:辞書登録編 - Qiita
                                                              • プリキュアは16年間、何を歌ってきたのか 413曲の分析から見えたもの

                                                                プリキュアは16年間、何を歌ってきたのでしょうか? プリキキュアソング413曲の「歌詞の計量テキスト分析」により調べてみました。 画像はAmazon.co.jpから kasumi プロフィール プリキュア好きの会社員。2児の父。視聴率などさまざまなデータからプリキュアを考察する「プリキュアの数字ブログ」を執筆中。2016年4月1日に公開した記事「娘が、プリキュアに追いついた日」は、プリキュアを通じた父娘のやりとりが多くの人の感動を呼び、多数のネットメディアに取り上げられた。 これまでのプリキュア連載一覧 2020年5月はコロナ禍の影響により放送中の「ヒーリングっど プリキュア」も「おさらいセレクション」と称する再放送となりました。 2019年は5月31日に追加プリキュア「キュアコスモ」が発表されるなど本来であれば5月、6月は新しいプリキュアやそれに伴うエンディング曲の変更などプリキュア界隈

                                                                  プリキュアは16年間、何を歌ってきたのか 413曲の分析から見えたもの
                                                                • LLMにデータ分析をさせてみる:テーブルデータの概要解釈 - 渋谷駅前で働くデータサイエンティストのブログ

                                                                  先日こんな記事を書いたのでした。はてブも400近くに達しており、良くも悪くもバズったようです。 で、この記事の中で言いたかったことは幾つかあるのですが、その一つに「文書・テキスト要約など『そもそもLLMというかLM自体が得意な仕事』をさせると便利なはず」というのがありました。そして実際に現職の日常業務の中でも時々使っているのですが、確かに便利だなぁと思うことが多いです(もっとも時々凄まじいhallucinationを炸裂させてくることもありますが)。 そこでちょっと考えたのが「データ分析の諸作業のうち何をLLMにやらせると効率的か」というお題です。これはちょっと調べれば既に試している人が結構いて、例えば以下のような事例があったりします。 ただ、例えば "Titanic" のような有名過ぎるデータセットだとそこらじゅうにこれを対象として分析してみましたという記事やドキュメントが沢山転がってお

                                                                    LLMにデータ分析をさせてみる:テーブルデータの概要解釈 - 渋谷駅前で働くデータサイエンティストのブログ
                                                                  • 【非エンジニア向け】PythonとExcelをSEO施策に活用するための分析例をわかりやすく解説 | Web担当者Forum

                                                                    SEO施策においては、データを確認したうえで施策の内容や方向性を決めることは非常に重要です。しかし、データで何かを判断できるようになるには、いくつかのステップがあると思います。 それは「データを集める」ということです。 本記事を読んでいる方の中には、その「データ集め」をパワープレイ(手作業で集める)で行っている方も多いと思います。結論から述べると、今話題のプログラミング言語である「Python(パイソン)」と「Excel(エクセル)」を活用すれば、データ集めが自動化でき、分析まで可能です。 この流れができれば、あなたの隣にいるマーケターよりもワンランク上の分析業務ができること間違いありません。今回はSEO施策に従事している人向けに、PythonとExcelを組み合わせたSEO施策用の分析例をわかりやすく紹介していきます。 Pythonってよく聞くけど、SEO施策にどう使えるの?Python

                                                                      【非エンジニア向け】PythonとExcelをSEO施策に活用するための分析例をわかりやすく解説 | Web担当者Forum
                                                                    • テラスハウスで最も誹謗中傷されたのは誰だったのか? - データをいろいろ見てみる

                                                                      概要 フジテレビのリアリティショー形式の番組テラスハウスに出演していた木村花さんが亡くなるという事件があった。花さんの死を受けて、政府がSNS上の誹謗中傷に関する取り組みを行う用になった。 女性のみがSNS上で誹謗中傷を受けているのか? 花さんの死を受けて、SNS上で女性が主に誹謗中傷にさらされるといった言説が見られるようになった。「ネット上で女性が攻撃されている実態は広く知られていない」1といった記事はよく目にする。しかし実際にSNSを調査するとテラスハウスの男性出演者の方がより多くの誹謗中傷を受けていた。我々は男性が攻撃的で女性は攻撃的ではないと思い込みがちだ。しかしそれはバイアスである。テラスハウスに言及したtweetを取得しテラスハウスの出演者がどの様に誹謗中傷を受けたかを調査する。 調査概要 概要 値 取得ツイート 97584 取得期間 2020-03-20 00:00:00-2

                                                                        テラスハウスで最も誹謗中傷されたのは誰だったのか? - データをいろいろ見てみる
                                                                      • 聞こえると震えてしまうSEOに関わる10の死語【2024】 - ブログ - 株式会社JADE

                                                                        こんにちは、JADEブログ編集部です。 ある日、こんな投稿を拝見しました。 聞こえると震えてしまうSEOに関わる10の死語【2024】 ってコンテンツをJADEはんに書いてもらいたい。 — 寺倉タイシ|THE MOLTS (@taishi_molts) 2024年7月19日 JADEはんに書いてもらいたい、と言われたら書かないわけにはいきません。て言うか書きたい。 社内チャットで「SEOの死語募集。集まれば記事化します。」と依頼したところ、瞬時に集まりました。どこか鼻の奥がツーンとなるワードから、記事化できそうにない香ばしいワードまでその数30強。定員オーバー。 世界は常に変化し、かつては絶対的だと信じられていた手法や概念でも、懐かしい思い出となるものもあります。インターネットを良くするために、知識は正しい方向にアップデートしていかねばなりません。 歴代のSEO戦士たちの苦労と工夫、そして

                                                                          聞こえると震えてしまうSEOに関わる10の死語【2024】 - ブログ - 株式会社JADE
                                                                        • Googleサジェストを調べる、ラッコキーワードの使い方

                                                                          Googleサジェストとは? Google、サジェストキーワード Googleで検索するときに、たとえば、 「ラッコキーワード」と入力すると、 ラッコキーワード 使い方 ラッコキーワードとは ラッコキーワード 検索ボリューム みたいなものが勝手に表示されます。 これらの関連語を勝手に表示する機能が、「Googleサジェスト」です。 「Googleサジェスト」によって表示されるキーワードのことを 「Googleサジェストキーワード」と呼びます。 「Googleサジェストキーワード」は、「他の人はこういう単語で検索を行っていますよ」というGoogleからの提案です。 ラッコキーワードとは? 「Googleサジェスト」では、10個くらいのキーワードを表示してくれます。 しかし、「ラッコキーワード ○○」みたいな組み合わせのキーワードは10個以上あり、他の人はもっといろんな組み合わせで検索をしてい

                                                                            Googleサジェストを調べる、ラッコキーワードの使い方
                                                                          • 【リライト経験者が語る】ブログ記事のリライトをする方法~個人事業主152日目~ - かえるの雑記~好きなことつぶやくブログ~

                                                                            スポンサーリンク ~目次~ 第12回目は『ブログのリライトの方法』です リライトとは ブログをリライトをするときの手順 リライトをするブログ記事の選択 リライトするブログのタイトルや見出しを変更 リライトするメタディスクリプションの変更 リライトするブログに共起語を入れる リライトするブログの状況を確認 ブログをリライトするときの注意点 ブログをリライトする方法まとめ こんばんは。 かえるです。 無職から個人事業主となって152日が経ちました。 かえるのブログについての独り言 第12回目は『ブログのリライトの方法』です 私は今年の目標として、1ヶ月に1記事ブログのリライトをすることにしました。 1ヶ月に1記事しかリライトをしないの?と思われた方もいらっしゃるかもしれませんが、リライトは結構な時間と労力を要します。 そのため、あまり多くのリライトをすると仕事に差し障るので1ヶ月に1記事としま

                                                                              【リライト経験者が語る】ブログ記事のリライトをする方法~個人事業主152日目~ - かえるの雑記~好きなことつぶやくブログ~
                                                                            • 認知科学の観点から考えた最適の英語学習法──『英語独習法』 - HONZ

                                                                              この『英語独習法』は、認知科学や発達心理学を専門とする今井むつみによる、認知科学の観点から考えた最強の英語学習について書かれた一冊である。『「わかりやすく教えれば、教えた内容が学び手の脳に移植されて定着する」という考えは幻想であることは認知心理学の常識なのである。』といったり、多読がそこまで良くはない理由を解説したり、一般的に良しとされる学習法から離れたやり方を語っている。 特徴としては、「何が合理的な学習方法なのか」を披露するだけではなく、「なぜそれが合理的なのか」という根拠を説明しているところにある。だから、これを読んだらなぜ一般的な英単語の学習法(たとえば、英単語と日本語の意味を両方セットで暗記していく)が成果を上げないのか、その理屈がわかるはずだ。認知科学のバックボーンから出てくる独習法も納得のいくものばかりである。僕も様々な理由(英語圏Vなどの英語が聞き取れるようになりたい、洋書

                                                                                認知科学の観点から考えた最適の英語学習法──『英語独習法』 - HONZ
                                                                              • 「言語処理100本ノック 2020」をPythonで解く - u++の備忘録

                                                                                「言語処理100本ノック 2020」が4月6日に公開されました。2015年以来、5年ぶりの改訂です。昨今の自然言語処理の研究動向を鑑み、深層ニューラルネットワークに関する問題追加などの変更があります。 nlp100.github.io 実装のためのプログラミング言語としては、Python3系を利用します。バージョンは初公開時は3.6.8で、2023年11月に3.11.3に更新しました。ソースコードは、GitHubで公開しています。 github.com 第1章: 準備運動 00. 文字列の逆順 01. 「パタトクカシーー」 02. 「パトカー」+「タクシー」=「パタトクカシーー」 03. 円周率 04. 元素記号 05. n-gram 06. 集合 07. テンプレートによる文生成 08. 暗号文 09. Typoglycemia 第2章: UNIXコマンド 10. 行数のカウント 11.

                                                                                  「言語処理100本ノック 2020」をPythonで解く - u++の備忘録
                                                                                • 【久々の誰も知りたくないシリーズ!】かえるのやることリストの中身を公開!~個人事業主150日目~ - かえるの雑記~好きなことつぶやくブログ~

                                                                                  スポンサーリンク ~目次~ 第85回目は『やることリストの中身公開』です 毎日やること 毎日30分のウォーキング 毎日タイ語と英語の勉強 毎朝6時に起きる 毎週やること 毎月やること やることリスト公開まとめ こんばんは。 かえるです。 無職から個人事業主となって150日が経ちました。 かえるの自分のことについての独り言 第85回目は『やることリストの中身公開』です 4日前から毎日やることリストを作成して、今年やり続けたいことを明確化して日々取り組んでおります。 なぜ、いちいちやることリストを作成してやっているかというと… かえるはかなりのサボり性だからです。 一部の方へはコメントで「かえるはサボりの天才と評される」ことが多いことは書きました。 私自身もまさにその通りだな、と思っております(笑) そのため、わざわざ自分を締め付けるようなことをしているわけです。 やることリストを作成してから

                                                                                    【久々の誰も知りたくないシリーズ!】かえるのやることリストの中身を公開!~個人事業主150日目~ - かえるの雑記~好きなことつぶやくブログ~