並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 33 件 / 33件

新着順 人気順

ipadicの検索結果1 - 33 件 / 33件

  • Ubuntu 20.04 LTSにMeCab(mecab-ipadic-neologd)/CaboChaのインストール - Qiita

    前提 この記事は、Ubuntu 20.04LTSにMeCab(mecab-ipadic-neologd)とCaboChaをインストールし、pythonで使用できるようにするまでをまとめた記事です。 ※本記事は以下の記事を大いに参考にさせて頂き、インストール場所など補足で記述しております。 ubuntu 18.10 に mecab をインストール CabochaのUbuntuへのインストール(Pythonでテスト) curlやwgetで公開済みGoogle Driveデータをダウンロードする MeCab(mecab-ipadic-neologd)のインストール MeCabのインストール まずMeCabをインストールします

      Ubuntu 20.04 LTSにMeCab(mecab-ipadic-neologd)/CaboChaのインストール - Qiita
    • 【自然言語処理】科研費データベースからMeCab-ipadic-neologdとtermextractでキーワードを抽出する - Qiita

      【自然言語処理】科研費データベースからMeCab-ipadic-neologdとtermextractでキーワードを抽出するPythonmecab自然言語処理 科研費申請書を書いている研究者のみなさま、お疲れ様です。 ご存知の通り、過去に採択された研究は科研費データベースに載っています。が、全部見るのはなかなか大変です。 過去の傾向をざっくり把握してみよう! ということで、今回は科研費データベースの研究の概要から自然言語処理でキーワードを抽出してみました。形態素解析パッケージMeCabと専門用語抽出ツールのtermextractを使っています。 環境構築 PythonとJupyter Notebookを使います。 OSなど MacOS Mojave 10.14.5 Anaconda 2020.02 Python 3.7.6 Jupyter Notebook 6.0.3

        【自然言語処理】科研費データベースからMeCab-ipadic-neologdとtermextractでキーワードを抽出する - Qiita
      • 【Node.js】kuromoji.js + mecab-ipadic-neologdで形態素解析して遊ぶ - Qiita

        スクレイピングした文章を形態素解析したい! nodeではjava用に書かれたkuromojiを移植したkuromoji.jsを使用するのが簡単っぽい。(自分調べ) しかしWeb上の文字は日々変化し、思ったように解析できない場合も多い。 そこでWeb上の資源を解析して作られている新語・固有表現に強いmecab-ipadic-NEologdという辞書も導入する。 (+ベースはipadic辞書) MeCab: Yet Another Part-of-Speech and Morphological Analyzer kuromoji - japanese morphological analyzer mecab-ipadic-neologd/README.ja.md at master · neologd/mecab-ipadic-neologd 日本語形態素解析エンジンKuromojiについて

          【Node.js】kuromoji.js + mecab-ipadic-neologdで形態素解析して遊ぶ - Qiita
        • Google ColabにMeCabとipadic-NEologdをインストールする - Qiita

          1.はじめに Google Colab に MeCab と ipadic-NEologd をインストールしようと思ったら意外に手間取ったので備忘録として残します。 2.コード 色々なWeb情報を漁った結果、インストールには下記のコードがベストではないかと思います。 # 形態素分析ライブラリーMeCab と 辞書(mecab-ipadic-NEologd)のインストール !apt-get -q -y install sudo file mecab libmecab-dev mecab-ipadic-utf8 git curl python-mecab > /dev/null !git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git > /dev/null !echo yes | mecab-ipadic-

            Google ColabにMeCabとipadic-NEologdをインストールする - Qiita
          • Mecab + mecab-ipadic-NEologd な形態素解析 API サーバーを作った - Qiita

            Mecab を触っていたらいい感じに汎用的な形態素解析 API サーバーができたので GitHub に公開しました。 動機 品詞・形態素解析エンジンである Mecab と固有表現に強い辞書 mecab-ipadic-NEologd を、チャットボットを動かしているコンテナにインストールして使っていましたが、辞書のサイズが大きくて取り回しが悪いので、マイクロサービス的に分離してみることにしました。 概要 文章を投げると単語ごとに品詞・形態素解析をしてくれます コンテナで動きます AMD64 / ARM64 対応 Mecab の出力結果を key: value の形式に直して返すのでわかりやすい 使ってみる docker run します。

              Mecab + mecab-ipadic-NEologd な形態素解析 API サーバーを作った - Qiita
            • Elasticsearch7.2でkuromoji_ipadic_neologd_tokenizerのsearchモードとsynonym_token_filterを一緒に使うとエラーが出る - 焼肉が食べたい

              TL;DR Elasticsearch7.2でKuromoji IPADic Neologd TokenizerのsearchモードとSynonym Token Filterを使うとエラーが出る。 エラーを回避するには、Synonym Token Filterを利用するanalyzerではkuromoji_tokenizerのnormalモードを使う 発生した問題 ElasticsearchでKuromoji IPADic Neologd TokenizerのsearchモードとSynonym Token Filterを一緒に使ったところ、インデックス作成時にエラーが出た。 /var/log/elasticsearch/[cluster name].logのエラー エラーメッセージ(クリックして表示) [2019-09-19T05:57:48,919][DEBUG][o.e.a.a.i.t

                Elasticsearch7.2でkuromoji_ipadic_neologd_tokenizerのsearchモードとsynonym_token_filterを一緒に使うとエラーが出る - 焼肉が食べたい
              • 3. Pythonによる自然言語処理 2-2. 共起ネットワーク[mecab-ipadic-NEologd] - Qiita

                3. Pythonによる自然言語処理 2-2. 共起ネットワーク[mecab-ipadic-NEologd]Pythonmecab自然言語処理networkxmecab-ipadic-neologd mecab-ipadic-NEologdは、MeCab標準の辞書を補完するかたちでカスタマイズされた辞書です。 Web 上の多数の言語資源から語句が追加されたもので、新語や複合語、慣用的な表現などに対応しています。 上記のとおり、MeCab標準では「個人」と「主義」に分割されてしまいますが、mecab-ipadic-NEologdでは「個人主義」という一語として扱われています。 課題 mecab-ipadic-NEologdを使って、併せてストップワードの除去を行い、共起ネットワークに表現するという一連の作業を行ないます。 1. テキストデータの準備 ⑴ テキストデータの読み込み コーパスには

                  3. Pythonによる自然言語処理 2-2. 共起ネットワーク[mecab-ipadic-NEologd] - Qiita
                • mecab ipadic-NEologd を Google Colaboratory で使う - Qiita

                  これはなに? 形態素解析のデファクトスタンダードであるMeCabと、その追加辞書mecab-ipadic-NEologdをGoogle Colaboratoryで動かすためのコードです。 かつてはmecabとipadic-NEologdを直接インストールしていましたが、いまはGinza経由で呼び出すほうが便利です。 Ginzaのインストール !pip install ginza==4.0.5 ja-ginza !pip install sortedcontainers~=2.1.0 import pkg_resources, imp imp.reload(pkg_resources) pipを使ってginzaをインストールします。 sortedcontainersというライブラリがColabのデフォルトとGinzaの要求バージョンが違うせいでエラーが発生するので、Ginzaの指定するバージ

                    mecab ipadic-NEologd を Google Colaboratory で使う - Qiita
                  • [Python]Mecabのipadic辞書が超簡単に使えるようになっていた

                    import MeCab import ipadic tagger = MeCab.Tagger(ipadic.MECAB_ARGS) print(tagger.parse("今日はいい天気です")) #=> # 今日 名詞,副詞可能,*,*,*,*,今日,キョウ,キョー # は 助詞,係助詞,*,*,*,*,は,ハ,ワ # いい 形容詞,自立,*,*,形容詞・イイ,基本形,いい,イイ,イイ # 天気 名詞,一般,*,*,*,*,天気,テンキ,テンキ # です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス # EOS

                      [Python]Mecabのipadic辞書が超簡単に使えるようになっていた
                    • mecab-ipadic-neologdが見つからないと怒られる - Qiita

                      つくりながら学ぶ! PyTorchによる発展ディープラーニングの第7章を実行中にmecab-ipadic-neologdが見つからないというエラーに遭遇したので,その解決法です. 本はこれです. エラー 発展Pytorchディープラーニングの実行に際して,mecab-ipadic-neologdが見つからないというエラーに遭遇. 解決の道のりを備忘録的に残します. Traceback (most recent call last): File "/home/user_hoge/pytorch_advance/7_nlp_sentiment_transformer/7-1_Tokenizer.py", line 126, in <module> m_t = MeCab.Tagger('-Ochasen -d /usr/lib/mecab/dic/mecab-ipadic-neologd')

                        mecab-ipadic-neologdが見つからないと怒られる - Qiita
                      • IPADIC(IPA辞書)とはなにものか?

                        ※私は言語処理に関する知識は無いので、あくまで「IPADICとは何ものなのか?」という点に絞ってのみ記述しています。まあ、ここまで突っ込んだのは戯れですが、一応の目的として現在から未来にわたって無料で入手できる形態素解析を使うに当たり、「メンテナンスが継続されている辞書」が入手できるかを調べたかったという意図もあります。 日本語を処理する上で形態素解析というのはわりと欠かせないものです。 Webのサービスでよく用いられている形態素解析器にはChaSenとmecabがありますが、これらのエンジンは何らかの辞書を利用して日本語を解析します。 ちなみに形態素解析器と言うのはChaSenの表現を帰りれば「形態素解析器とは、入力文を単語単位に分割し品詞を付与するツールである。」ということです。形態素解析器の開発の歴史はMeCab の開発経緯をご覧ください。 ここでChaSenにもMeCabにも、標準

                          IPADIC(IPA辞書)とはなにものか?
                        • kuromoji.js + SudachiDict で形態素解析(辞書のビルド、IPADic・UniDic との比較) - Qiita

                          kuromoji.js + SudachiDict で形態素解析(辞書のビルド、IPADic・UniDic との比較)JavaScript形態素解析SudachiDict UniDic の matrix.def のサイズが間違っていたので修正しました: 59GB → 5.9GB kuromoji.js (日本語形態素解析器 Kuromoji の JavaScript実装)と React を組み合わせて、クライアントサイドで完結するブラウザアプリを開発しています。kuromoji.js は IPADic (mecab-ipadic-20070801) をデフォルト辞書として使用していますが、収録語彙が私のアプリケーションの目的には最適ではないと感じていました。また、UniDic は機能面で魅力的ですが、ビルドして使ってみた結果、データサイズが大きすぎてスマートフォンでは動作しないという課題に

                            kuromoji.js + SudachiDict で形態素解析(辞書のビルド、IPADic・UniDic との比較) - Qiita
                          • mecab-ipadic-neologdで知っておきたい単語のコスト変更方法 - Qiita

                            前提条件 筆者はWindows内にWSLを利用しています。Linux系統を仮定して書いてます。 前条件は以下になります: - mecab - mecab-ipadic-neologd(以下、NEologd) 問題について NEologdを使っていると、多くの単語を認識してくれて便利なのだが、たまに「余計なお世話」な単語の解析も出てくる。 あり[動詞/連用形]+ませ[助動詞/未然形]+ん[助動詞] と普通に解析されて欲しい時に、固有名詞が出現してしまう。 その他、単体では普通に解析されるが、前後の文章の影響で解析結果が変わってしまうこともある。 接続詞の「では」が文章だと分割されているのがお分かりいただけるだろうか。 この記事ではこの二つの問題に対処していく。 固有名詞 まず、固有名詞がNEologdで追加されたものなのかどうかを確認する。 通常のIPAdicの場合、 「有馬線」とは解析され

                              mecab-ipadic-neologdで知っておきたい単語のコスト変更方法 - Qiita
                            • Mecab辞書、ipadicとneologdについてのメモ - エイエイレトリック

                              主にMecabを使う時によくみるリンクとメモ。 ほぼ自分用のメモです。よって、Mac OSのことしか考慮していません。 パス 品詞 品詞ID 品詞体系についてまとめたページ ipadic / IPA辞書 マニュアル 品詞体系 辞書引き mecab-ipadic-NEologd 品詞体系 辞書引き neologdn 数字の扱い おわりに ⭐️⭐️⭐️⭐️⭐️ ※Mecabのインストール方法や使い方は全く説明していません。 各所に記事があるので、そちらを参考にしてください。 以降、ですます調ではなくなります。 パス 辞書の格納先は mecab-config --dicdir でみることができる 参考: mecab-ipadic-NEologdのREADME Mac OSの場合は /usr/local/lib/mecab/dic 品詞 IPA辞書 (以降ipadic) やUnidicは、品詞体系

                                Mecab辞書、ipadicとneologdについてのメモ - エイエイレトリック
                              • Ubuntu18.04に mecab+mecab-ipadic-NEeologd をインストールし、pythonスクリプトでWERを算出するまで - Qiita

                                Ubuntu18.04に mecab+mecab-ipadic-NEeologd をインストールし、pythonスクリプトでWERを算出するまでUbuntumecab音声認識wer まとまっていないタイトルで申し訳ございません。同じことをしようとしている方の助けになれば幸いです。基本的に以下の記事をつぎはぎさせていただいております。個人のメモ程度という認識で見てもらえればと思います。 (参考記事) - Ubuntu 18.04 LTSのPythonでMeCabを動かす方法 - ubuntu 18.10 に mecab をインストール - Custom Speech の精度の評価と向上 MeCab & mecab-ipadic-NEeologd のインストール まずはMeCab本体のインストールです。pipをインストールしている前提です。

                                  Ubuntu18.04に mecab+mecab-ipadic-NEeologd をインストールし、pythonスクリプトでWERを算出するまで - Qiita
                                • 【自然言語処理】科研費データベースからMeCab-ipadic-neologdとtermextractでキーワードを抽出する - Qiita

                                  【自然言語処理】科研費データベースからMeCab-ipadic-neologdとtermextractでキーワードを抽出するPythonmecab自然言語処理 科研費申請書を書いている研究者のみなさま、お疲れ様です。 ご存知の通り、過去に採択された研究は科研費データベースに載っています。が、全部見るのはなかなか大変です。 過去の傾向をざっくり把握してみよう! ということで、今回は科研費データベースの研究の概要から自然言語処理でキーワードを抽出してみました。形態素解析パッケージMeCabと専門用語抽出ツールのtermextractを使っています。 環境構築 PythonとJupyter Notebookを使います。 OSなど MacOS Mojave 10.14.5 Anaconda 2020.02 Python 3.7.6 Jupyter Notebook 6.0.3

                                    【自然言語処理】科研費データベースからMeCab-ipadic-neologdとtermextractでキーワードを抽出する - Qiita
                                  • windows Mecabの辞書「mecab-ipadic-NEologd」を使用する

                                    windows環境で、Mecabの辞書である「mecab-ipadic-NEologd」を使用するまでの手順を記述してます。 環境 OS windows10 pro 64bitmecab 0.996 mecab-ipadic-NEologd使用 ここでは「WSL」で「Ubuntu」を使用します。 windowsでubuntuの使用方法はこちら 次に「mecab」と必要パッケージをインストールします。

                                      windows Mecabの辞書「mecab-ipadic-NEologd」を使用する
                                    • 3. Pythonによる自然言語処理 2-2. 共起ネットワーク[mecab-ipadic-NEologd] - Qiita

                                      3. Pythonによる自然言語処理 2-2. 共起ネットワーク[mecab-ipadic-NEologd]Pythonmecab自然言語処理networkxmecab-ipadic-neologd mecab-ipadic-NEologdは、MeCab標準の辞書を補完するかたちでカスタマイズされた辞書です。 Web 上の多数の言語資源から語句が追加されたもので、新語や複合語、慣用的な表現などに対応しています。 上記のとおり、MeCab標準では「個人」と「主義」に分割されてしまいますが、mecab-ipadic-NEologdでは「個人主義」という一語として扱われています。 課題 mecab-ipadic-NEologdを使って、併せてストップワードの除去を行い、共起ネットワークに表現するという一連の作業を行ないます。 1. テキストデータの準備 ⑴ テキストデータの読み込み コーパスには

                                        3. Pythonによる自然言語処理 2-2. 共起ネットワーク[mecab-ipadic-NEologd] - Qiita
                                      • NMeCabで、新語に強いmecab-ipadic-neologd(UTF-8)を簡単に使って、形態素解析を行う。 | つーる屋 【IKIS】 あいきす

                                        NMeCab0.07を使って、mecab-ipadic-neologd(UTF-8)を使う C#でツールを開発している割には、C#の事を初めて書くかもしれません。 色々なことをやっているのにここに投稿するのが面倒で、いざ書こうとしたときには何をやったか詳細を覚えていない(^^; と言うことで、詳細を覚えているうちに今後は・・・ NuGetで取得できるNMeCabは、0.06.4で、Shift-JISの辞書にしか対応していません。 UTF-8の辞書であるmecab-ipadic-neologdを使うためには、NMeCab0.06.4をNuGetで取得して使用するのではなく、NMeCab0.07をダウンロードして使えば良いだけです。 NMeCab0.07は、NuGetでは取得できないので、以下のページからダウンロードしてプロジェクトで参照すれば使用できます。 なぜ、NMeCab0.07がNuG

                                        • kuromoji.jsでmecab-ipadic-NEologdを使う - Qiita

                                          JavaScriptだけで形態素解析ができるkuromoji.jsで、mecab-ipadic-NEologdを使いたいなーと思って、試してみました。 結論 辞書生成はできた 辞書サイズが大きすぎてメモリ馬鹿食いする 読み込みに時間がかかる サーバサイドでの使用ならいいかもしれませんが、クライアントサイドでの利用は難しいかなと思いました。 サーバサイドなら素直にmecab使うほうが楽な気はしますね。 辞書生成方法 追加辞書の用意 ここから追加辞書をダウンロードして解凍します。 ここではmecab-user-dict-seedを追加しようと思います。

                                            kuromoji.jsでmecab-ipadic-NEologdを使う - Qiita
                                          • [Docker]Ubuntu20.04でのmecab及びmecab-ipadic-neologdの利用 - Qiita

                                            shellで、あるリストを単語ごとに分割しようとした矢先、mecabというライブラリを発見。 そのライブラリ及び専用の辞書ツールを試しにGoogle Colabで利用して便利であったため、Linux環境にも導入したい。 そこで今回はDockerのUbuntu20.04内に導入する方法を記録する。 環境 Mac OS 11.2.3 Docker version 20.10.8 手順 任意のディレクトリに以下でDockerfileを作成する。 # workディレクトリ内にmecab-conディレクトリを作成 mkdir ~/work/mecab-con; cd $_ # mecab-con内にDockerfileを作成 touch Dockerfile FROM ubuntu:20.04 # 日本設定 ENV TZ Asia/Tokyo RUN ln -snf /usr/share/zonei

                                              [Docker]Ubuntu20.04でのmecab及びmecab-ipadic-neologdの利用 - Qiita
                                            • [形態素解析] 「仮定縮約1」とは?MeCab・IPADICの品詞分類を理解しよう - Qiita

                                              MeCabで多くの人が用いるIPADICでは総勢1316の分類(ID)が定義されています1。その中には「動詞,自立,*,*,五段・ラ行特殊,仮定縮約1,*」のように、パッと見ただけではどんな単語が該当するのかわからないような物も多いです。 そこで「ipadic version 2.7.0 ユーザーズマニュアル」という品詞体系の解説を参考に、実際の解析結果などと付き合わせつつ、品詞の分類全体を眺めていきます。 なお、記事内で示す解析結果はNEologdを用いています。これはpythonで次のようなコードで出力しています。 node = mecab.parseToNode(text).next while node: print(node.surface, node.lcAttr, node.rcAttr, node.feature) node = node.next BOS/EOS: 0 文

                                                [形態素解析] 「仮定縮約1」とは?MeCab・IPADICの品詞分類を理解しよう - Qiita
                                              • mecab, neologd-ipadicのcolab上での使用方法 - Qiita

                                                はじめに ipadic-neologdとは、 mecab用の辞書の一つ。週2回以上更新してくださるので、新語や固有表現に対応ができる。 例 #ipadic-neologd未使用 m=MeCab.Tagger() print(m.parse("COVID-19によりオーバーシュートが起こった。")) >COVID COVID COVID 名詞-固有名詞-組織 - - - 名詞-サ変接続 19 19 19 名詞-数 により ニヨリ により 助詞-格助詞-連語 オーバー オーバー オーバー 名詞-サ変接続 シュート シュート シュート 名詞-サ変接続 が ガ が 助詞-格助詞-一般 起こっ オコッ 起こる 動詞-自立 五段・ラ行 連用タ接続 た タ た 助動詞 特殊・タ 基本形 。 。 。 記号-句点 EOS #ipadic-neologd使用 m=MeCab.Tagger("-d {辞書のパス

                                                  mecab, neologd-ipadicのcolab上での使用方法 - Qiita
                                                • dockerでubuntu16+python3.6+mecab(neolog-ipadic)を構築する - メモ帳

                                                  ubuntu上にpython3.6をいれて、mecab-python3でmecabが使えるような構成が以下のDockerfileで実現できる。 # base image FROM ubuntu:16.04 # language conf ENV LANG C.UTF-8 ENV TZ Asia/Tokyo ENV PYTHONIOENCODING "utf-8" ENV PYTHONUNBUFFERED 1 # update ubuntu RUN apt-get update -y && \ apt-get upgrade -y && \ apt-get dist-upgrade -y # install python3.6 RUN apt-get install -y software-properties-common RUN add-apt-repository ppa:jonath

                                                    dockerでubuntu16+python3.6+mecab(neolog-ipadic)を構築する - メモ帳
                                                  • Pythonで Igo + mecab-ipadic-neologd を用いた形態素解析 (Rubyのおまけ付き) - Qiita

                                                    はじめに Pythonで形態素解析をしたいと思います。 今回は 形態素解析器として 「Igo」を、辞書として 「mecab-ipadic-neologd」 を使います。 形態素解析とは 「単語分割」と「品詞付与」 を行うものです。 まずは、Igo、mecab-ipadic-neologd について説明した後、実際にPythonで使えるようにセットアップしていきます。 Igo とは? 形態素解析エンジンとしては「Mecab」が有名なので聞いたことがある方が多いかもしれません。今回使うのは「Igo」です。 「Mecab」はC言語で書かれていて、「Igo」はjavaで出来てるようです。「Igo」はMecabと同じ解析結果を返すように作られているようです。速度で比較してみ同速程度で動くようです。 「Mecab」バイナリをビルドしなければならなかったりして使いづらい場合があるようで「Igo」を使って

                                                      Pythonで Igo + mecab-ipadic-neologd を用いた形態素解析 (Rubyのおまけ付き) - Qiita
                                                    • MeCabとmecab-ipadic-NEologdをWindowsのPythonで使用するときに注意すること - Qiita

                                                      こんにちは 2回目の投稿です。今回はWindowsでMeCabとmecab-ipadic-NEologdを、Pythonから使おうと思ったらめちゃくちゃ手こずったので、その備忘録的なものを書きます。 インストール 情報が少なく、READMEなどを読んでも「???」だったので色々探したところ、これで行けました。 WindowsでPythonでMeCab(mecab-ipadic-NEologd) gccが必要らしいです。私の場合、もう既に入っていたので大丈夫でした。 macやlinux系のOSでの解説はまあまあありましたが、Windowsは少なかったですね……WSLを推奨しているので仕方がないとは思いますが…… 記述方法 【Python】WindowsのMeCabでNEologdをユーザー辞書に使う この記事が参考になりました。 ただし、インストールの際に64bit版ではなく32bit版のM

                                                        MeCabとmecab-ipadic-NEologdをWindowsのPythonで使用するときに注意すること - Qiita
                                                      • Python:3.xコンテナでMeCab + IPADIC + NEologdをシステム辞書として使用するためのDockerfile

                                                        Python:3.xコンテナでMeCab + IPADIC + NEologdをシステム辞書として使用するためのDockerfile python - Docker Hubで公開されているコンテナイメージをベースとして、MeCab + IPADIC + NEologdを使用するためのDockerfileを公開します。NEologdは、IPAが公開する辞書であるIPADICとの併用が推奨されています。今回は、IPADIC + NEologdを、MeCabのシステム辞書として使用します。 詳細 MeCab + IPADIC + NEologdを使用するための流れをご紹介します。

                                                        • [Docker]Ubuntu20.04でのmecab及びmecab-ipadic-neologdの利用

                                                          shellで、あるリストを単語ごとに分割しようとした矢先、mecabというライブラリを発見。 そのライブラリ及び専用の辞書ツールを試しにGoogle Colabで利用して便利であったため、Linux環境にも導入したい。 そこで今回はDockerのUbuntu20.04内に導入する方法を記録する。 環境 Mac OS 11.2.3 Docker version 20.10.8 手順 任意のディレクトリに以下でDockerfileを作成する。 # workディレクトリ内にmecab-conディレクトリを作成 mkdir ~/work/mecab-con; cd $_ # mecab-con内にDockerfileを作成 touch Dockerfile FROM ubuntu:20.04 # 日本設定 ENV TZ Asia/Tokyo RUN ln -snf /usr/share/zonei

                                                            [Docker]Ubuntu20.04でのmecab及びmecab-ipadic-neologdの利用
                                                          • CentOS/UbuntuにMeCab(とipadicとneologdとpythonのmecabモジュール)を丁寧にインストールする。 - Qiita

                                                            CentOS/UbuntuにMeCab(とipadicとneologdとpythonのmecabモジュール)を丁寧にインストールする。PythonLinuxCentOSmecab自然言語処理 はじめに MeCabは各種パッケージマネージャでも提供されていますが、PythonやGoなど各言語のバインディング利用時にライブラリのリンクエラーなど発生しがちです。 Mecab本体や関連辞書をソースコードから適宜オプションを指定してインストールすることにより、どんなファイルを何処にインストールしたかが明確になり、リンクライブラリの指定エラーなどに対して適切に対応できるようになります。 作業方針 ・UTF-8対応として本体、辞書共にソースコードから設定(configure)およびビルドします。 ・MeCab本体は「/opt/mecab」以下にインストールします。 ・標準辞書のipadicは「/opt/

                                                              CentOS/UbuntuにMeCab(とipadicとneologdとpythonのmecabモジュール)を丁寧にインストールする。 - Qiita
                                                            • Ubuntu 22.04にmecab-ipadic-neologdをインストール - Qiita

                                                              sudo apt update \ && sudo apt install -y mecab libmecab-dev mecab-ipadic-utf8 git make curl xz-utils file python3-pip \ && pip install mecab-python3 \ && git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git \ && cd mecab-ipadic-neologd \ && ./bin/install-mecab-ipadic-neologd -n -y echo "import MeCab tagger = MeCab.Tagger('-Ochasen -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipa

                                                                Ubuntu 22.04にmecab-ipadic-neologdをインストール - Qiita
                                                              • GitHub Actionsで最新のmecab-ipadic-neologd辞書を持つdocker imageをDocker Hubにpushする - May the Neural Networks be with you

                                                                こんにちは@shunk031です。草津温泉からこの記事を書いています。温泉は良いぞ。 この記事は彌冨研 Advent Calendar 2019 17日目の記事です。 クジラ(docker)の上に乗るタコ(Octcat)とめかぶ(MeCab) 私のレポジトリshunk031/mecab-neologd-py3では、最新のmecab-ipadic-neologdを持つpython3用のdocker imageをTravisCIを使って定期的にビルドし、Docker Hubにpushしています。 今回はGitHub Actions公開に伴い、TravisCIからの乗り換えを行います。 github.com 以下、2019年12月現在の情報です。 GitHub Actionsを有効にする GitHub Actionsでdocker imageをビルドする Docker Hubへのログイン Doc

                                                                  GitHub Actionsで最新のmecab-ipadic-neologd辞書を持つdocker imageをDocker Hubにpushする - May the Neural Networks be with you
                                                                • GoogleColaboratoryでMeCabとmecab-ipadic-NEologdを使う - Qiita

                                                                  この記事の内容 GoogleColaboratoryのnotebookで以下を行う ・MeCabをインストールして使う(No module named 'MeCab'への対応) ・mecab-ipadic-NEologd をインストールして使う MeCabをインストールして使う MeCabとは オープンソースの日本語形態素解析エンジン。 http://taku910.github.io/mecab/ GoogleColaboratoryでMeCab(テキストの形態素解析をするライブラリ)をインストールして いざMeCabを使おう(import MeCabしよう)とすると、 ない(No module named 'MeCab')となる。 これは、ライブラリがインストールされた場所が、pythonがライブラリを探しにいく先に含まれていないことから起きている。 この場合は、ライブラリをインストー

                                                                    GoogleColaboratoryでMeCabとmecab-ipadic-NEologdを使う - Qiita
                                                                  • WindowsでPythonでMeCab(mecab-ipadic-NEologd) - Qiita

                                                                    前提 Windows10 Python3.9 1. MeCabのインストール Binary package for MS-WindowsをDL・インストール 文字コードはUTF-8にしておく 2. mecab-ipadic-NEologdをインストール 最新の辞書とかもあって便利なのでいれる →WindowsはWSLに入れろって感じだけど普通にインストールできる NEologd辞書のダウンロードとコンパイル git clone --depth 1 https://github.com/neologd/mecab-ipadic-neologd.git cd mecab-ipadic-neologd\seed 7z X *.xz mecab-dict-index -d "c:\Program Files (x86)\MeCab\dic\ipadic" -u NEologd.20200910-u

                                                                      WindowsでPythonでMeCab(mecab-ipadic-NEologd) - Qiita
                                                                    1