タグ

MachineLearningとProgrammingに関するflatbirdのブックマーク (8)

  • Intel、コードの異常パターンを自動検出する「ControlFlag」をオープンソース化

    ControlFlagはGitHubのようなバージョン管理システム上のオープンソースリポジトリをマイニングする。それにより、C/C++のような高級プログラミング言語の制御構造における一般的なパターンを学習し、新たに与えられたコードの異常を検出する。 ControlFlagは単純な誤植(タイポエラー)の検出はもちろん、NULLチェック漏れに対するフラグ付けなど、さまざまな問題検出に利用できる。 開発時間と開発コストの50%を占めるデバッグを改善 ソフトウェア開発者は開発時間の50%以上をデバッグに費やしていると推定されている。ControlFlagは、コードの異常パターンの自動検出機能により、デバッグを改善することを目指したツールだ。 Intelは、開発者がControlFlagを使ってデバッグ作業を効率化し、創造的な作業により多くの時間をかけられるようになることを期待している。 デバッグが

    Intel、コードの異常パターンを自動検出する「ControlFlag」をオープンソース化
  • 話し言葉でプログラミング Microsoft、ノーコード進化 - 日本経済新聞

    【シリコンバレー=佐藤浩実】米マイクロソフトは25日、人が話す言葉でプログラミングをできるようにすると発表した。AI人工知能)で機械がわかる言語に「翻訳」し、コーディングの知識が乏しくてもアプリケーションソフトを作れるようにする。IT(情報技術)人材の拡大につながり、企業のデジタル活用にも弾みがつく。「Power Apps(パワーアップス)」と呼ぶ業務用アプリの開発ソフトに、文章を判断してプ

    話し言葉でプログラミング Microsoft、ノーコード進化 - 日本経済新聞
  • 機械学習ゴリゴリ派のための数学とPython

    NLP コロキウム https://nlp-colloquium-jp.github.io/ で発表した際のスライドです。 論文: https://arxiv.org/abs/2205.01954 GitHub: https://github.com/joisino/wordtour 概要 単語埋め込みは現代の自然言語処理の中核技術のひとつで、文書分類や類似度測定をはじめとして、さまざまな場面で使用されていることは知っての通りです。しかし、ふつう埋め込み先は何百という高次元であり、使用する時には多くの時間やメモリを消費するうえに、高次元埋め込みを視覚的に表現できないため解釈が難しいことが問題です。そこで研究では、【一次元】の単語埋め込みを教師なしで得る方法を提案します。とはいえ、単語のあらゆる側面を一次元で捉えるのは不可能であるので、研究ではまず単語埋め込みが満たすべき性質を健全性と完

    機械学習ゴリゴリ派のための数学とPython
  • なぜ機械学習にPythonが選ばれるのか - Qiita

    教育言語として Pythonは「同じインデントレベルの文は同じ塊」というルールを採用しており、見掛け上のPythonプログラムの最大の特徴となっています。 Python作者のGuido van Rossum氏(オランダ人でアムステルダム大学卒)はPythonを開発する以前に、オランダで教育向けの「ABC言語」の開発に関わっており、Python自体はRAD(迅速なアプリケーション開発)がメインで教育用を念頭に開発してはいなかったものの、ルーツとなったABC言語では文法に関してさまざまな研究が行われ、インデントを使うのが初心者にとってもっとも間違いにくいブロックの表現として採用していたのです。(Donald Knuth氏が推進していた。) Rubyist のための他言語探訪 【第 1 回】 Python Pythonがプログラミングの学習に向いているたった一つの理由 From ABC to P

    なぜ機械学習にPythonが選ばれるのか - Qiita
  • Machine Learning for Programming

    Clojure 2024 Jordan Miller discusses the evolution of the Clojure ecosystem, from Rich Hickey's initial vision tackling complexity to its current status as a mature enterprise solution. He explains key philosophies, highlights pivotal moments like the "Simple Made Easy" talk, and showcases the vibrant Clojure community and its innovative tools.

    Machine Learning for Programming
  • 機械学習で2年分の積雪量の変化を予測してみた - Qiita

    このエントリーは以前書いた機械学習で積雪の有無を予測してみたの続編です。この時は積雪の有無(1か0か)だけを予測したのですが、もうちょっと頑張って積雪量の変化を予測してみました。 先に結果を記しとくと、こんな感じになりました。横軸が日数、縦軸が積雪量(cm)です。 結果その1(青が実際の積雪量、赤線が予測した積雪量) 結果その2(青が実際の積雪量、赤線が予測した積雪量) 「結果その1」と「結果その2」がそれぞれ何なのかは以下を読んでみてください。 やりたかったこと 以前、機械学習で積雪の有無を予測してみた で scikit-learn を使って積雪の有無を予測してみたのですが、ちょっと欲が出てきて、有無じゃなくてまとまった期間の実際の積雪量(cm)を予測してみたい、と思ってやってみました。 具体的には、気象庁から提供される 積雪量 風速 温度 などの気象データを取得して、そのうち最初の約7

    機械学習で2年分の積雪量の変化を予測してみた - Qiita
  • 精度95%以上! ソースコードは指紋、作者はほぼ特定できる

    精度95%以上! ソースコードは指紋、作者はほぼ特定できる2015.02.11 19:0010,967 ほぼドンピシャでバレバレです。 スペースやタブ、大文字やアンダーバーを組み合わせた命名規則、コメント…コードの書き方には、人によってスタイルがありますよね。それはもう指紋のようなもので、それさえ見えれば、誰がコードを書いたかほとんどわかってしまう…そんな驚きの研究結果が発表されました。 米ドレクセル大学、メリーランド大学、プリンストン大学、独ゲッティンゲン大学の共同チームの研究によると、自然言語処理と機械学習によるコード分析により、95%の精度で作者は特定できるそうです。 解析されるのは、レイアウトや語彙の特性と、「抽象構文木(AST)」です。ASTとは、「コードの書き方からまったく影響を受けずに、コードの型の特性をとらえる」もので、つまり、関数の名前、コメント、スペース入れ方などのクセ

    精度95%以上! ソースコードは指紋、作者はほぼ特定できる
  • ソースコードを分析してその著者を特定するシステムが開発される | スラド デベロッパー

    ストーリー by hylom 2015年01月30日 14時32分 コード品質判定システムなんかも作れるかも? 部門より Drexel Universityとthe University of Maryland、the University of Goettingen、Princetoの研究者らが、ソースコードを分析し、その記述スタイルからその著者を検出する「code stylometry」なるシステムを開発したそうだ(Slashdot)。 実験では著者が明らかになっているソースコードを自然言語処理や機械学習といった技術を使って分析・学習するシステムを開発。250人の著者、1人の著者当たり平均630行のコードを学習させたところ、95%の成功率で「匿名のコード」の著者を見つけられたという。 また、学習に使用したソースコードの著者数を30人に減らし、また1人あたりのソースコード量を1900行に

  • 1