はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    参議院選挙2025

『zenn.dev』

  • 人気
  • 新着
  • すべて
  • VS-CODEでDocker環境を簡単に構築する方法

    6 users

    zenn.dev/robes

    VS-CODEの拡張機能Dev Containersを使って、Docker環境を簡単に構築する方法についてご紹介します。 こちらのudemyの講座を参考しています。 自分が忘れないように記事にしました。 自作シェルで学ぶLinuxシステムプログラミング ―Pythonで150行の「シェル」を実装してLinuxのしくみを学ぼう Dev Containersとは Dockerコンテナを使った環境構築を非常に簡単に構築できるVS-CODEの拡張機能です Dev Containersのインストール VS-CODEの拡張機能の検索欄からdev containersを検索します インストールします 構成ファイルの作成 開発コンテナーのための構成ファイル(JSON)を作成していきます コマンドパレットから、Dev Contaniners: Add Dev Contaniner Configuration

    • テクノロジー
    • 2024/01/03 10:39
    • プログラミング
    • 【1ヶ月半で合格】統計検定2級の勉強方法

      4 users

      zenn.dev/robes

      1.はじめに 統計検定2級に合格しました。勉強期間は1ヶ月半程度。 ちなみに成績優秀賞もいただきました。 これから統計検定2級を勉強してみようと考えている方に向けて、勉強方法やオススメの教材をお伝えできればなと考え、記事にしました。 2.スペック(試験前) ゴリゴリ文系人間(法学部卒) 。数学は高校まで。 仕事でデータを扱う機会が多く、平均・標準偏差・正規分布など基本的な統計用語は知っている。 ただし、信頼推定・仮設検定はさっぱり分かっていませんでした。正規分布以外の二項分布やt分布、カイ二乗分布、F分布も理解できていませんでした。 3.勉強方法 過去問中心に勉強する 「長時間勉強しているのに、なかなか勉強内容が理解できない」 ということはないでしょうか。 それは勉強方法が適切でないからです。 例えば、資格試験の勉強として、テキストを一通り理解してから、過去問を解くやり方が一般的だと思いま

      • 学び
      • 2023/07/21 17:43
      • 【機械学習】Optunaを使って効率よくハイパーパラメータを調整しよう

        6 users

        zenn.dev/robes

        機械学習において、モデルのハイパーパラメータの調整は非常に大事です。 大事なんですが、手動で行うと、時間も手間もすごくかかりますよね。 ここでは、ハイパーパラメータを効率的に調整するOptunaについてご紹介するとともに、Pythonでの具体的な実装方法をご説明します。 Optunaとは 日本のPrefferdNetworks社が開発した、ハイパーパラメータの自動最適化フレームワークです。 Optunaは、ベイズ最適化を実装することで、パラメータの探索を効率的に行うことができます。 ベイズ最適化は、確率統計の理論の一つです。 具体的には、目的関数の値を評価するために、パラメータの値をサンプリングして目的関数の値を取得し、その値を元にパラメータの推定値を更新するというプロセスを繰り返します。このプロセスによって、より良いパラメータの候補が見つけていきます。 簡単に言うと、試行錯誤をしながら、

        • テクノロジー
        • 2023/05/04 16:36
        • 数学
        • あとで読む
        • 【自然言語処理】日本語GPT-2モデルをファインチューニングして文章生成をやってみる

          6 users

          zenn.dev/robes

          はじめに 2022年11月にOpenAIが公開したchatGPTの反響が凄いですね。 公開6日目にして100万人がユーザー登録したとか。 今のところは、無料で使うことができますが、いずれは利用が制限されるかもしれませんね。 ここでは、chatGPTよりは精度が落ちますが、無料で使うことができて、日本語に特化した事前学習済みモデルもあるGPT-2を採り上げ、文章生成にチャレンジしたいと思います。 具体的にはrinna社が開発したGPT-2モデルを使用します。 事前学習済みモデルだけでもそれなりの文章を生成できますが、せっかくなので、特定のドメインでファインチューニングさせてみて、文章生成をしていきたいと思います。 rinna社の日本語GPT-2の特徴 言語モデルは、会話や文章の「人間が使う言葉」を確率としてモデル化したものです。優れた言語モデルとは、確率を正確に推定できるものを指します。例え

          • テクノロジー
          • 2023/01/23 17:20
          • language
          • 文章
          • 学習
          • 日本
          • 【Python】Word2Vecで単語の分散表現を体感する

            4 users

            zenn.dev/robes

            Word2Vecとは Word2Vecは2013年にトマス・ミコロフにより提案された自然言語の数値化の手法です。 トマス・ミコロフはGoogle在籍のエンジニアで、Word2Vecの発明により、Google翻訳の性能が著しく向上したと言われています。 Word2Vecの何がすごいか Word2Vecは単語の分散表現を取り入れたモデルです。 単語の分散表現とは、単語を固定長のベクトルで表すことです。 単語の一つ一つを、ベクトル空間における点として表現することで、単語同士の距離(類似度)を測ったり、演算(足し算・引き算)したりすることが可能なモデルになっています。 Word2Vecは、文章を学習用テキストデータとしてあたえ、周辺にある単語からから中心にある単語を予測することでベクトル化していきます。 このように、ある単語の意味は周辺の単語によって形成されるという考え方を分布仮説と呼びます。Wo

            • テクノロジー
            • 2022/11/03 10:59
            • python
            • 【簡単かつ高精度】音声認識AIのWhisperを実装してみた

              3 users

              zenn.dev/robes

              はじめに 画像生成AIのDALL・E2や文章生成AIのGPT-3で何かと話題のOpenAIですが、今度は、音声認識の世界でもやってくれました。 2022年9月22日に高性能な音声認識AIのWhisperを発表したのです。日本語にも対応していたので、早速、GoogleColaboratoryで実装してみました。 驚くほど簡単に実装でき、かつ、驚くほど精度が高くて、びっくりしました。 ここでは、Whisperの概要について簡単に触れた上で、GoogleColaboratoryでの実装方法、精度をお示ししたいと思います。 Whisperについて OpenAIの公式サイトから、概要をご紹介します。 Whisperは、ウェブから収集した68万時間に及ぶ多言語・マルチタスク教師付きデータで学習させた自動音声認識(ASR)システムです。 大規模で多様なデータセットを使用したことで、アクセント、背景雑音、

              • テクノロジー
              • 2022/10/18 01:24
              • モデル
              • 学習
              • 勉強
              • ai
              • 英語
              • python
              • あとで読む
              • 【自然言語処理】【Python】TF-IDFを使って文書の特徴をつかもう

                3 users

                zenn.dev/robes

                はじめに 古くから、自然言語処理の世界では、単語をスコアリングする手法として、TF-IDFというのがあります。 古くからあるにもかかわらず、普通に暮らしていると馴染みのない概念だと思います。かく言う私も、Pythonで自然言語処理を学ぶまでは名前すら聞いたことがありませんでした。 ここでは、そんなTF-IDFについて、はじめて触れる方にも分かるように概念を丁寧に説明するとともに、Pythonを使った実装方法についてご紹介していきたいと思います。 🐱TF-IDFとは 一言でいうと、ある文書の含まれる単語の重要度を示す指標です。文書の中で重要な単語をとらえることで、その文書の特徴を知ることができます。 具体的には以下の式で計算します。 単語の重要度というと、パッと思いつくのが、単語の出現頻度ではないでしょうか。それはある意味で正しいのですが、単語の出現頻度だけでみてしまうと、極端にいうと、「

                • テクノロジー
                • 2022/09/19 21:16
                • 【画像生成】Python初心者でも話題のStableDiffusionを爆速で実装できた

                  5 users

                  zenn.dev/robes

                  はじめに 話題の画像生成AIStableDiffusionを、GoogleColaboratoryを使って爆速で実装することができました。(正味30分程度で実装できました) ここでは、実装方法などについて、余計な説明なしに爆速でご紹介したいと思います。 StableDiffusionとは テキストから画像を生成してくれるオープンソースのAIです。 いわゆるText to Imageというやつです。 2022年8月に英Stability AIが、HuggingFaceで無償公開しました。 それでは実装方法を見ていきましょう HuggingFaceでのアクセストークンの取得 StableDiffusionを利用するには、HuggingFaceでアクセストークンを取得する必要があります。 以下の手順で、アクセストークンを取得していきましょう。 HuggingFaceでアカウントを作成する こちら

                  • テクノロジー
                  • 2022/09/14 09:28
                  • python
                  • 画像
                  • あとで読む
                  • 【自然言語処理】【Python】共起ネットワークの作り方を理解する

                    80 users

                    zenn.dev/robes

                    はじめに 自然言語処理をはじめたら、一度は作ってみたいのが共起ネットワークではないかと思います。 私自身、共起ネットワークについては、書籍やネット記事を参考にしながら、これまで何度も作ってきました。 しかしながら、文章→共起行列→共起ネットワークとなる一連の過程において、特に共起行列を作成するコードの理解が十分ではないと思い至り、今回、勉強もかねて、共起行列の作成過程を残すことにしました。 共起ネットワークに興味を持たれている方の参考になればと思います。 共起ネットワーク 単語どおしのつながりを可視化してくれる手法で、文章の構造的な特徴を直感的に理解するのによく利用されます。 文書(text)を文章(sentence)に分割したのち、同一文章中に同時に出現する単語(word)の組みを数えあげることで共起行列を作成し、これをネットワークで可視化します。 ネットワークはノード(丸) と、ノード

                    • テクノロジー
                    • 2022/09/11 18:29
                    • python
                    • 自然言語処理
                    • 言語
                    • あとで読む
                    • 文章
                    • 自然
                    • AI
                    • NLP
                    • language
                    • *まとめ
                    • 【自然言語処理】Doc2Vecで文章ベクトルを算出し、類似文書検索をやってみた

                      30 users

                      zenn.dev/robes

                      はじめに 以前、BERTを使って歌詞の文章ベクトルを算出し可視化する試みを行いました。BERTは優秀なんですが、入力できるトークン数が512に限られるため、長い文章のベクトル算出には向いていないんですよね。 今回は、上場企業約2,500社が有価証券報告書で書いている割と長文の文章について、Doc2Vecを使って文章ベクトルを算出し、あわせて、文章ベクトルから類似文書を検索してみました。 個人的には、BERTよりもDoc2Vecの方が納得感のいく結果を出している気がしています。 ここでは、文章ベクトルの算出方法・類似文書検索方法について、お伝えしていきたいと思います。 文章ベクトルのイメージ ①野球を観戦した ②サッカーの試合を見た ③犬の散歩にでかけた の3つの文章を2次元のベクトルに変換することを考えてみましょう。 文章の内容を考えると①と②が近く、③が少し離れているイメージですね。 こ

                      • テクノロジー
                      • 2022/09/04 17:21
                      • 自然言語処理
                      • python
                      • language
                      • 言語
                      • 検索
                      • プログラミング
                      • あとで読む
                      • 【自然言語処理】【Python】有価証券報告書の非財務情報(テキストデータ)を取得する

                        29 users

                        zenn.dev/robes

                        0. はじめに 上場企業が作成する有価証券報告書には、企業の経営成績がどうなっているのか?といった財務情報に加え、企業として何を課題と捉えどう取り組んでいくのか?といった非財務情報の記載があります。 最近は、気候変動リスクや人権問題への対応など企業の社会的責任の遂行に注目が集まる中、機関投資家が企業を評価する目線も、短期的な視点である財務情報から、中長期的な視点である非財務情報にうつりつつあります。 これからの時代、財務情報(数値データ)ではなく、非財務情報(テキストデータ)の分析ニーズが高まることが予想されます。こうした点も踏まえ、まことに僭越ながら、Pythonを使って有価証券報告書の非財務情報を取得する方法について、記載したいと思います。 具体的には、上場企業約2,500社分の有価証券報告書の 【経営方針、経営環境および対処すべき課題等】と【事業等のリスク】 を取得していきたいと思い

                        • テクノロジー
                        • 2022/09/03 17:13
                        • python
                        • text
                        • report
                        • finance
                        • 【自然言語処理】Python初心者でも文章要約タスクが実装できた

                          55 users

                          zenn.dev/robes

                          はじめに わたくし、Python歴1年の初心者ですが、このたび、苦労に苦労を重ねて、自然言語処理タスクの文章要約を実装できました。 自然言語処理に興味のあるPython初心者のお役に立てればと、記事に残したいと思います。 実装にあたっては、ネットの記事も手あたり次第調べましたが、最終的には、以下の本が大変参考になりました。 ただし、バージョンの変更により、この本の通りに実装しても、2022年8月時点ではエラーになる箇所があります。出版社経由で著者の方にお聞きして一部コードを修正したほか、自分なりに工夫をして実装しました。 モデルについて Huggingface社が提供している深層学習フレームワークのTransformersを使います。 transformersにはBERTをはじめとするさまざまな言語モデルが実装されていますが、今回のタスクでは、T5というモデルをファインチューニングして使い

                          • テクノロジー
                          • 2022/08/25 16:54
                          • python
                          • 自然言語処理
                          • 文章
                          • プログラミング
                          • 言語
                          • あとで読む
                          • 【自然言語処理】BERTを使って歌詞をベクトルに変換し可視化する

                            7 users

                            zenn.dev/robes

                            自然言語処理モデルの王様と言われるBERTを使って、文章をベクトルに変換し可視化しましたので、それらのタスクについて示したいと思います。 これは 「BERTによる自然言語処理入門」 を参考にしたものですが、本では、livedoorのニュースコーパスが用いられていました。 ここでは、文章コーパスとして、女性シンガー(後述)の歌詞を使ってみたいと思います。 ライブラリーのインストール BERTが格納されているtransformersのほか、matplotlibで日本語を可視化するためにjapanize_matplotlibもインストールしておきます !pip install transformers==4.18.0 fugashi==1.1.0 ipadic==1.0.0 !pip install japanize_matplotlib import pandas as pd import n

                            • テクノロジー
                            • 2022/08/14 17:14

                            このページはまだ
                            ブックマークされていません

                            このページを最初にブックマークしてみませんか?

                            『zenn.dev』の新着エントリーを見る

                            キーボードショートカット一覧

                            j次のブックマーク

                            k前のブックマーク

                            lあとで読む

                            eコメント一覧を開く

                            oページを開く

                            はてなブックマーク

                            • 総合
                            • 一般
                            • 世の中
                            • 政治と経済
                            • 暮らし
                            • 学び
                            • テクノロジー
                            • エンタメ
                            • アニメとゲーム
                            • おもしろ
                            • アプリ・拡張機能
                            • 開発ブログ
                            • ヘルプ
                            • お問い合わせ
                            • ガイドライン
                            • 利用規約
                            • プライバシーポリシー
                            • 利用者情報の外部送信について
                            • ガイドライン
                            • 利用規約
                            • プライバシーポリシー
                            • 利用者情報の外部送信について

                            公式Twitter

                            • 公式アカウント
                            • ホットエントリー

                            はてなのサービス

                            • はてなブログ
                            • はてなブログPro
                            • 人力検索はてな
                            • はてなブログ タグ
                            • はてなニュース
                            • ソレドコ
                            • App Storeからダウンロード
                            • Google Playで手に入れよう
                            Copyright © 2005-2025 Hatena. All Rights Reserved.
                            設定を変更しましたx