MeCabとPythonを使用した日本語テキスト分析入門 MeCabは、自然言語処理タスクに広く使用されているオープンソースの日本語テキスト分割ライブラリです。このブログ記事では、PythonでMeCabを使用して日本語テキストを分析する方法を、初心者にもわかりやすく段階的に説明します。 第1章:環境のセットアップ MeCabを使用する前に、環境をセットアップしましょう: Python をインストールする(まだの場合) MeCab とその Python ラッパーをインストールする:

はじめに この記事はNuco Advent Calendar 2024の23日目の記事です。 Pythonの標準ライブラリについて全てまとめた記事になります! 標準ライブラリでちゃんとサポートされているのに、サードパーティのものを利用してしまっていたり、自分で車輪の再発明をしてしまったという経験をお持ちの方もいると思います。 Pythonも幾度のバージョンアップによって、標準に組み込まれた機能も増えてもきました。 全てを暗記する必要も全くありませんが、どんなことができるのかを頭の中に入れておくだけで、来年からのPython生活の選択肢が広がることと思います! 1つ1つ解説したことで、相当なボリュームになってしましたので、いいねやストックをして何回かに分けてお楽しみください。 本記事が少しでも皆様のお役に立てば幸いです! 弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら
print("Hello World") // 半角スペース区切り print("Hello", "World", "paiza")
はじめに 今回の記事では、学習・開発でPythonを使うプログラマーが必ず確認するべきGitHubリポジトリを10個紹介する。本記事の対象は主に以下の通り。 実務でPythonを使っているプログラマー Pythonの情報収集に困っている人 Pythonの学習・開発の効率をアップさせたい人 Pythonのフレームワーク・ライブラリを確認しておきたい初心者 Pythonは1991年にリリースされてから今年で30年以上も経過している歴史のあるプログラミング言語なので、情報量が非常に多くどのように開発を進めればよいかわからない人も少なくないだろう。 そこで、本記事では個人の独断と偏見で学習・開発でPythonを使うなら必ず確認するべきGitHubリポジトリを紹介する。Pythonで実装できるプロダクトは多岐に渡るので、本記事では分野ごとに確認するべきGitHubリポジトリを紹介する。 必見 awe
2.学習済みモデルの利用今回は、日本語の学習済みモデルを提供してくれているgpt2-japaneseを使います。ありがたい。小説を学習させたモデルも用意されているので、ちょうどいいですね。 本章ではローカルにクローンして、試しに動かしてみます。README.mdを読んでできる方は、この章は読まなくて大丈夫です。 2-1. モデルはv1の小説モデルを使います。新しいv2もありますが、短い入力にはv1が良いらしいので、何も考えずにv1を選択。 2-2. ダウンロードしたら解凍しておきます。Windowsなので、解凍用のフリーソフト(7-Zipなど)を使います。 2-3. GitHubからgpt2-japaneseをcloneします。 PyCharmの場合は、VCS>Checkout from Version Control>Gitを選択。 URLには、GitHubのページの「Code」をクリッ
※サンプル・コード掲載 1. あらすじ 人工知能という言葉が、昨今、ますます身近になってきており、Siriなどの対話システムも日々発達してきています。 また、人間の言語を人工知能に解釈させる対話システムの需要が増えると共に、NLP(自然言語処理)のニーズも日に日に高くなって来ています。 NLP分野では、画像処理系や、音声処理系と比較すると、まだ技術的なブレークスルーが起こっているという状況では無く、他の分野に比べて人工知能関連の技術適用は、限定的と言えるかもしれません。 しかしながら、NLPの分野でも、当然、機械学習は使用されますし、ディープラーニングをNLP分野に使おうとする動きも多く見られています。 今回は、その中で対話システムの制御等に使われる、入力文章の意図、主に対話カテゴリーの分類を、NLP、及び、機械学習を用いて、なるべくシンプルな手法で実装してみます。 文章のカテゴリー分類と
Python3でTwitterAPIを使う方法をどのサイトよりも丁寧に解説する 最近Python3を使って日々の作業を便利なスクリプトにまとめたり自動化しているのですが、 ターミナル(シェル)からTwitter触れたら便利じゃね?っと思ったのでまとめてみました。 めちゃくちゃ丁寧に解説しましたのでこれさえ読めば、 今日からPython3 DE Twitteのタイムラインを表示することができます。 TwitterクライアントをPythonで作ってみたい方はぜひ参考にしてください。 TwitterAPIへつなぐための認証情報(トークン)を用意 TwitterAPIを使用するには認証情報(トークン)が必要です。 ですが、このトークン情報を取得するのが思ったより敷居が高いので、 トークンを取得する方法を順をおって解説します。 すでにトークンを取得済みの方はこの手順を飛ばしてコードを組んでいきましょ
Mar 2, 2020/mod: May 4,2020 - 4 min read - プログラミング 【Twitter API】Twitter 情報取得・返信・リツイート【Python】 前回の記事「Twitterで予約投稿」で使ったPythonのTwitter向けライブラリTweepyには投稿以外にもいろいろな機能があります。 使いそうなところをざっくりみて組み合わせるとどんなことができるか見てみましょう。 プログラミングしないで予約投稿をしたい場合はSocialDog使いましょう。 紹介記事: 【フォロワー数向上】Twitter便利アプリSocialDogを参照してください。 Tweepyで扱うオブジェクト Tweepyでは2つの情報が主に使われます。 Statusオブジェクト: メッセージを表すオブジェクト Userオブジェクト: ユーザを表すオブジェクト どのような情報が含まれてい
エンジニアの鈴木(泰)です。 今回は、multiprocessingとthreadingとasyncioの違いとはなんだろう?という問に挑戦してみたいと思います。 この問の答えをグーグル先生に聞いてみると、非常にたくさんの情報がヒットします。しかしながら、どの情報も断片的なものばかりで(本記事もそうなのかもしれません)、色々と本を読んだりネットを漁ったりして、情報を補完しなければなりませんでした。 本記事は、僕が調べた限りの情報を集約し、この問に対する結論を1つの記事にまとめたものとなっています。 前提 マルチプロセスとは マルチスレッドとは Pythonにおけるマルチスレッド 本題 マルチプロセス(multiprocessingライブラリ)を利用したほうが良い場合 cpu_sec.py cpu_multiprocessing.py cpu_threading.py cpu_asyncio
はじめに 本記事は爆速(1日)でHerokuに幼稚園児並みのアプリをデプロイしていくまでの軌跡である。 Herokuへのデプロイの仕方が主で、Flaskについては幼稚園児並みにしか触れないので注意されたい。 環境 動作OS:Windows10 home ターミナル:Powershell 言語:Python 3 実施手順 venvでの環境構築 Herokuへのデプロイ パイプラインの実装 venvでの環境構築 任意のディレクトリに任意名のフォルダを作成する。 kindergartenというのは幼稚園という意味である。 幼稚園児でも理解できる記事にしていきたいと思う。 pythonでvenvを実行しアクティベートしていく。 WindowsやMac、Linuxでコマンドに差分があるので注意。 ターミナルがPowershellかCOMかでも差分があるので注意。 今回はWindows-Powersh
個人出版した本の表紙をどう作るか問題 先日KDP(Kindle Direct Publishing)で「ゼロから始める情報発信」という書籍を個人出版しました。 ゼロから始める情報発信: No Output, No Value 作者:からあげAmazon 書籍を個人出版したとき、何に一番悩んだかというと装丁ですね。電子書籍の場合は、ずばり「表紙画像」そのものです。書籍の表紙は、顔のようなものですからね。いくつかKindle個人出版関係の書籍も読みましたが、読まれる数に直結するのが表紙のようです。 表紙の重要性は、出版社から出る商業誌でも同じです。出版社から出す場合は、出版社が、それはもう力を入れて表紙を作ってくれるので、作者は悩む必要はありません(作者が表紙まで意図的にコントロールしたい場合は別)。前に、出版社から出した書籍「AI自作教室」の装丁に関しては、詳しくは以下ブログ記事参照ください
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 0.この記事について この記事ではテンプレートを使ったWebアプリの簡易開発法を紹介します。 データ定義ファイルの修正といくつかの作業だけでアプリが完成します。 使用するプログラム言語はPython、フレームワークはDjango(2.1)です。 チュートリアル形式なのでPythonの知識は必要ありません。 Webアプリケーションの開発経験がある方なら短時間で習得可能です。 1.概要 はじめに 「Webアプリの作成に挑戦したけど、勉強することが多すぎて挫折した…」 という経験を持つ方は多いのではないでしょうか。そんな方々のためにWebアプ
リスト内包表記を使って、リストを作成する基本と、enumerate関数やzip関数と組み合わせる例、for句をネストしたり内包表記をネストしたりする例を紹介。 # リスト内包表記 squares = [n ** 2 for n in range(5)] print(squares) # [0, 1, 4, 9, 16] # 反復可能オブジェクトから渡される値を使用しない例 from random import randint random_nums = [randint(1, 5) for _ in range(5)] print(random_nums) # [1, 5, 2, 1, 5]など # 'a'~'z'を要素とするリストの作成 chars = [chr(n + ord('a')) for n in range(26)] print(chars) # ['a', 'b',
初めに 株式会社デジサク がお送りするプログラミング記事、 今回はPythonでサービス開発できるまでのロードマップを扱っていこうと思います。 この記事は 『プログラミング未経験からPythonでサービス開発できる』 ことを目標に、習得すべきスキルを学習ロードマップとして整理しました。 毎日2~3時間(土日は+2時間) 続ければ最短3ヵ月で完了できる内容に絞りました。 すでに習得済みのスキルは飛ばしつつ進めて大丈夫です。 Rubyなど他の言語でも大筋は同じ流れなので、 Pythonと書いてある部分を、そのままRubyと読み替えれば大丈夫です。 ※なお、Twitter でもプログラミングに関する情報を発信しています。 もし良ければ Twitterアカウント「Saku731」 もフォロー頂けると嬉しいです。 学習ロードマップの全体像 まず、サービス開発に必要なスキルは大きく分けて10種類ありま
Twitter APIの基本的な使い方を記事にしてまとめてみました。 この記事ではpythonのTwitter APIのライブラリtweepyを使って、いろいろやっていきます。 関連リンク 前準備 REST APIを使ってみる。 タイムラインの取得 ツイートの検索 ツイートの投稿と指定したユーザーへのリプライ リツイートする 自分or指定したユーザのフォロワーの情報を見る フォローしたと見せかけて速攻フォロー解除する あるユーザー同士がお互いにフォローし合っているか確認する トレンドを取得する Twitter APIを使うとこんなことができます。 ①現在地球上(宇宙ステーションを含める)で投稿されているツイートを手に入れる ①のソースコード 会話データを手に入れる おまけ スクリーンネームって何? 手に入れたツイートがリツイートかどうか調べる方法 ツイートの中身の情報について 関連リンク
# Import borscht. import borscht as bor # Text used for chain generation of Markov chain text = """ 親譲りの無鉄砲で小供の時から損ばかりしている。小学校に居る時分学校の二階から飛び降りて一週間ほど腰を抜かした事がある。 なぜそんな無闇をしたと聞く人があるかも知れぬ。別段深い理由でもない。 新築の二階から首を出していたら、同級生の一人が冗談に、いくら威張っても、そこから飛び降りる事は出来まい。弱虫やーい。と囃したからである。 小使に負ぶさって帰って来た時、おやじが大きな眼をして二階ぐらいから飛び降りて腰を抜かす奴があるかと云ったから、この次は抜かさずに飛んで見せますと答えた。 親類のものから西洋製のナイフを貰って奇麗な刃を日に翳して、友達に見せていたら、一人が光る事は光るが切れそうもないと云っ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く