はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    WWDC25

『qiita.com』

  • 人気
  • 新着
  • すべて
  • Jupyter Notebook ファイルのままdiffをとったり、マージしたり出来るツール nbdime - Qiita

    41 users

    qiita.com/nannoki

    Jupyter Notebook の問題点 Jupyter Notebook は、ソースコードとアウトプットが一つの ノートブックファイル.ipynb で管理・実行することができるので、非常に便利です。しかし、その代償として、.ipynb ファイルにはソースコード以外のメタデータやアウトプットデータが含まれる為に、ソースコード部分の差分が非常に分かりにくくなってしまいます。 jupytext等で、.pyファイルにエクスポートして diffを取ることも考えられますが、.pyファイルが増えてしまい、本来の .pyファイルと混じって、これはこれで管理しづらい。 結構困った問題です。 ノートブックdiffツール nbdime ノートブックのままdiffをとったりマージしたり出来ないかと思っていたところ、nbdime というツールでばっちりそれができるらしい。 Github リポジトリ https:

    • テクノロジー
    • 2019/04/11 15:58
    • Jupyter
    • diff
    • python
    • git
    • あとで読む
    • ツール
    • *あとで読む
    • 自然言語処理用にYahooショッピングのレビューを大量に取得する - Qiita

      6 users

      qiita.com/nannoki

      はじめに 機械学習でテキスト分類や感情分析をしようと思って、オープンデータのコーパスを探したのですが、自分のやりたいことに合うものがなかったので、YahooショッピングのレビューからAPIでデータを取得することにしました。 コーパスとは、機械学習などの自然言語処理の素材データとして、文章やそれに対する付加情報を大量に集めたものです。 コードはこちら。(Python) https://github.com/nannoki/yahoo_reviews 取得できるデータ 全部で100万レビューくらい取得できます。 階層構造のカテゴリ分類。大分類(22種類)>中分類(約330種類)>小分類(約3,700種類) 分類タスクの教師ラベルとして使えます。 商品に対する評価点。1.00(悪い)から5.00(良い) 感情分析の教師ラベルとして使えます。 上記カテゴリと評価点以外にも分析しがいのある項目があり

      • テクノロジー
      • 2017/11/04 20:55
      • Pandas.DataFrameのメモリサイズを削減する(最大で8分の1) [Python] - Qiita

        4 users

        qiita.com/nannoki

        はじめに Pandasで巨大なデータを扱うと、貧弱なPCではすぐメモリエラーになるのではないでしょうか。 これまで結構苦労したので、Pandasでメモリ消費を抑えるコツを挙げておきます。 DataFrameについて書きますが、Seriesも同様です。Panelは触ったことないですが、きっと同様でしょう。多分。 使用した環境 Python 3.6 Pandas 0.20.3 メモリが必要以上に増大してしまうケース いろんな場合がありますが、以下のケースは、よくあるかつコードで対処可能なものだと思います。 【ケース1】 DataFrame構築時にカラムの型(dtype)を指定していない 【ケース2】 カラムを追加する・カラム全体へ値を代入する 【ケース3】 DataFrameに対する処理の戻り値を、他の変数で受け取る 詳しく見ていきます。 【ケース1】 DataFrame構築時にカラムの型(d

        • テクノロジー
        • 2017/11/01 02:11
        • [Python] assert文で超お手軽テスト - Qiita

          13 users

          qiita.com/nannoki

          assert文とは 条件式がTrueではない時に、例外を投げます。 これを仕込んでおくと、それまでちゃんと動いていたコードが、いじっているうちにいつの間にか想定と異なる振る舞いをするようになった時に、いち早く気づくことが出来ます。「とにかく想定と違ったら止める」というだけで良いなら、別途テストを書かなくていいので便利です。 機械学習やデータ分析 では、仕様が決まっておらず試行錯誤しなければいけない部分が多くあるし、アドホックな対応も結構あり、テストを書くことが必ずしもなじまない場合が多いと思います。このような領域では、特におすすめしたいです。 pytestなどのちゃんとしたテスト用途以外では、asset文はJupyter Notebookで使うのが一番効果的だと個人的には思います。関数のセルの下に、assert文でちょっとしたテストを書いておくと便利です。また、データを読み込んだ直後にデー

          • テクノロジー
          • 2017/08/29 12:12
          • python
          • Windowsに、オフラインでディープラーニング環境をインストールする(Tensorflow, Keras) ・・・「オフライン環境でのpipインストール方法」と言ってもいいかも・・・ - Qiita

            4 users

            qiita.com/nannoki

            なぜWindows? なぜオフライン? 機械学習・ディープラーニングの環境は、インターネットに接続できるMacやLunuxで構築するのが一般的だと思います。しかし、事情により「オフライン(インターネット非接続)」の「Windows7マシン」に環境構築しなければならなくなりました。 Windowsとういだけで警戒しますが、さらにオフライン。 なぜこんなしばりかというと、データ分析案件でかなり機密度の高いデータを扱う必要があり、自社にデータを持ってくることも、クラウドにアップすることも許されないため、すべてお客様先で完結させる必要があるためです。ディープラーニングをデータ分析用途に使おうとする場合には、考えられる状況ではないでしょうか。 ちょっと調べてみると、結構面倒そうな情報ばかりで、はまりそうな予感がします。 結論を先に書いておくと、あっさり簡単にできました。 TensorflowのWin

            • テクノロジー
            • 2017/02/20 18:31

            このページはまだ
            ブックマークされていません

            このページを最初にブックマークしてみませんか?

            『qiita.com』の新着エントリーを見る

            キーボードショートカット一覧

            j次のブックマーク

            k前のブックマーク

            lあとで読む

            eコメント一覧を開く

            oページを開く

            はてなブックマーク

            • 総合
            • 一般
            • 世の中
            • 政治と経済
            • 暮らし
            • 学び
            • テクノロジー
            • エンタメ
            • アニメとゲーム
            • おもしろ
            • アプリ・拡張機能
            • 開発ブログ
            • ヘルプ
            • お問い合わせ
            • ガイドライン
            • 利用規約
            • プライバシーポリシー
            • 利用者情報の外部送信について
            • ガイドライン
            • 利用規約
            • プライバシーポリシー
            • 利用者情報の外部送信について

            公式Twitter

            • 公式アカウント
            • ホットエントリー

            はてなのサービス

            • はてなブログ
            • はてなブログPro
            • 人力検索はてな
            • はてなブログ タグ
            • はてなニュース
            • ソレドコ
            • App Storeからダウンロード
            • Google Playで手に入れよう
            Copyright © 2005-2025 Hatena. All Rights Reserved.
            設定を変更しましたx