# CSV -> DataFrame df = pd.read_csv('/path/to/file.csv') # DataFrame -> Arrow Table table = pa.Table.from_pandas(df) # Arrow Table -> Parquet pq.write_table(table, '/path/to/file.pq')
![Parquet, CSV, Pandas DataFrameをPyArrow経由で相互変換する - Qiita](https://cdn-ak-scissors.b.st-hatena.com/image/square/7035636cf1d708dc7e8f5ec041662989a9aabda0/height=288;version=1;width=512/https%3A%2F%2Fqiita-user-contents.imgix.net%2Fhttps%253A%252F%252Fcdn.qiita.com%252Fassets%252Fpublic%252Farticle-ogp-background-412672c5f0600ab9a64263b751f1bc81.png%3Fixlib%3Drb-4.0.0%26w%3D1200%26mark64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZ3PTk3MiZoPTM3OCZ0eHQ9UGFycXVldCUyQyUyMENTViUyQyUyMFBhbmRhcyUyMERhdGFGcmFtZSVFMyU4MiU5MlB5QXJyb3clRTclQjUlOEMlRTclOTQlQjElRTMlODElQTclRTclOUIlQjglRTQlQkElOTIlRTUlQTQlODklRTYlOEYlOUIlRTMlODElOTklRTMlODIlOEImdHh0LWFsaWduPWxlZnQlMkN0b3AmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT01NiZzPWNhZjQ3OWM4NzMyMzU3MWY5YWRkNTk1OWE2Y2E0MTE1%26mark-x%3D142%26mark-y%3D57%26blend64%3DaHR0cHM6Ly9xaWl0YS11c2VyLWNvbnRlbnRzLmltZ2l4Lm5ldC9-dGV4dD9peGxpYj1yYi00LjAuMCZoPTc2Jnc9NzcwJnR4dD0lNDBzaGl1bWFjaGkmdHh0LWNvbG9yPSUyMzIxMjEyMSZ0eHQtZm9udD1IaXJhZ2lubyUyMFNhbnMlMjBXNiZ0eHQtc2l6ZT0zNiZ0eHQtYWxpZ249bGVmdCUyQ3RvcCZzPWJiNDVkYWQ4MjgxNzdjZTdjNmYwZDQ1NmRkMDE0YzM2%26blend-x%3D142%26blend-y%3D486%26blend-mode%3Dnormal%26s%3D27e911306e7f623d872350f325727b28)
Sphinxを、MercurialとPandocを組み合わせて Markdown記法で運用できるようにしたお話。
この記事は Sphinx アドベントカレンダーの 19日目です。 markdown と Sphinx (reST) Sphinx では文書を書く際の記述フォーマットに reStructured Text を利用していますが、 世を広く見回すと、github 然り、bitbucket 然り、様々な場所で markdown フォーマットが利用されています。 markdown フォーマットは reST と比べると表現力が低い上、表現を拡張することができないという点が指摘されています。 表現を拡張することができないため、いくつかの方言が存在するという問題もあります。 ですが、reST と比べてシンプルで、なおかつポピュラーに利用されているフォーマットであるため、 新しく Sphinx に触り始める人の取っ掛かりとしては、markdown はうってつけのフォーマットと言えます。 sphinxcont
WP2TXT: Wikipedia to Text Converter 本ソフトウェアは無保証です。ライセンスを確認の上、自己責任で使用してください。 本ドキュメントは書きかけです。以下の仕様は今後変更する可能性があります。 1. はじめに WP2TXT は BZ2 圧縮された Wikipedia データダンプ XML ファイルからテキストデータを抽出し、コーパス言語学の研究などに 適した形式に整形します。通常のテキストフィルタと異なり、言語研究に主眼を置いて いるため「センテンス」の形式を備えた文字列のみを取り出します。 現在はWikipedia 日本語版にのみ対応しています。 WP2TXT は Ruby 言語によって作成されており、 wxRuby ライブラリによる Windows 用 GUI インタフェイスを備えています。また Linux などではコマンドラインプログラム とし
MagickWand for PHPと、Imagick 2.0系はもともと同じ、ImageMagickののAPI群を利用しているため、片方でできることとは基本的にもう片方でもできるようになっています。 たとえば、PECL/Imagickのメンテナである、Mikko氏のblogのMikko's blogのCreating a PDF previewという記事の内容で、pdfの画像にしてプレビューするというのがありますが、これも、あっさり以下のような感じで移植ができます。 ※ 多少コードを変えて、複数ファイルがあるときのために、ファイルに保存するようにしてみました。 $image = NewMagickWand(); MagickReadImage($image, 'test.pdf'); MagickSetFormat($image, 'png'); MagickWriteImages
Use the magick program to convert between image formats as well as resize an image, blur, crop, despeckle, dither, draw on, flip, join, re-sample, and much more. See Command Line Processing for advice on how to structure your magick command or see below for example usages of the command. We list a few examples of the magick command here to illustrate its usefulness and ease of use. To get started,
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く