タグ

2019年12月18日のブックマーク (6件)

  • 日立グループ OSS - Qiita Advent Calendar 2019 - Qiita

    The Qiita Advent Calendar 2019 is supported by the following companies, organizations, and services.

    日立グループ OSS - Qiita Advent Calendar 2019 - Qiita
    dominion525
    dominion525 2019/12/18
    これらが"ハンコ.PNG"の賜物だと思うとぐっと来るな…。
  • Sentencepiece : ニューラル言語処理向けトークナイザ - Qiita

    少し時間が経ってしまいましたが、Sentencepiceというニューラル言語処理向けのトークナイザ・脱トークナイザを公開しました。MeCabやKyTeaといった単語分割ソフトウエアとは趣旨や目的が異なるソフトウェアですので、少し丁寧にSentencepieceの背景、応用、実験結果等をお話したいと思います。 サブワード ニューラル言語処理の中心となる要素技術にLSTM (RNN)があります。テキスト(トークン列)を低次元のベクトルに符号化したり、ベクトルからテキストを復号化したり、その応用範囲は多岐にわたります。ニューラル機械翻訳 (NMT) は、LSTMによる符号化・復号化を組み合わせて翻訳を行います。 ↓↓↓↓↓↓↓ あなたの記事の内容 NMTのアーキテクチャは従来法と大きく異なりますが、入出力はこれまでと同様、なにかしらのトークン列です。どのような列でもよいのですが、慣習的に単語列が

    Sentencepiece : ニューラル言語処理向けトークナイザ - Qiita
    dominion525
    dominion525 2019/12/18
    sentencepiece知らなかったので。あとこういう使い分けも> “意味処理ならJUMAN, 音声がからむと unidic, 情報抽出だと neologd といった塩梅です。”
  • 2019年末版 形態素解析器の比較 - Qiita

    形態素解析は日語処理の初歩であり、文を単語に分割したり、品詞や活用形、基形を分析するために行います。記事では形態素解析のツールをいくつかの出力例を交えて比較していきます。 (SentencePieceでいいじゃん、という人はお呼びでないですが、そういう方には、Twitterのトレンドが変な分割になってたら嫌では?と申し上げておきたいです) MeCab 言わずと知れた形態素解析器。とりあえずMeCabを使うという人は今なお多いことでしょう。とにかく高速であるということと、システムと辞書が分離されているのが特徴です。またPythonから使うのも簡単になりました(Janomeというものがありましたがmecab-python3の方が高速です)。Javaから使いたい人はKuromojiを使えばmecab(+ipadic)相当の結果が得られるはずです。 辞書はIPA辞書が推奨されていますが、Un

    2019年末版 形態素解析器の比較 - Qiita
    dominion525
    dominion525 2019/12/18
    近頃の状況がざっくりわかるので便利ぽい。人参政権!
  • 日立社員「社内からQiitaに投稿?できるのそれ」 - Qiita

    (2019-12-18 表現を一部訂正しました。) メタ記事。投稿するのにかかる手間に関する投稿です。 1 どうしてこんな記事を書こうと思ったか 日立製作所もガンガンOSS活動をしていることを知ってほしい。日立に興味があるが、OSSコントリビューションは社外発信にどれくらい熱心なのか気になる人向けに、とある一部署の情報をシェアしたい。 タイトルのような感想を持つ弊社内の人に情報発信してもらいたい。 (残念なことに、) 社内の情報共有サイトに書くよりQiitaに書いたほうが読まれそう。 後輩がAdvent Calendarの記事集めに苦労していたので気の毒になったため 注: 全社的な審査プロセスではなく、(株)日立製作所 ITプロダクツ統括部のやりかたです。 では全社的なプロセスは?他の部署は? → 詳しい方、(申請の上)コメントください。 ITプロダクツ統括部って何? Google i

    日立社員「社内からQiitaに投稿?できるのそれ」 - Qiita
    dominion525
    dominion525 2019/12/18
    こんな体制下で自社アドベントカレンダーやろうと思う人とその牽引力はすごいな。別のところならもっと力を発揮できそうなのに。
  • ソフトバンクG孫社長、大学入試「AIを試験科目に」-日本後れ危惧

    ソフトバンクG孫社長、大学入試「AIを試験科目に」-日後れ危惧 日向貴彦、Pavel Alpeyev ソフトバンクグループの孫正義社長は17日、東京都内で開かれた国際シンポジウムで講演し、日の大学入試で人工知能(AI)を試験科目に取り入れるべきだとの考えを披露した。 孫社長は、日が抱える最大の問題は高齢化であり、交通事故と医療費が劇的に増加していると指摘。問題解決のためにはAIを使い、自動運転やがんの早期発見を推進することが国力の増強につながるとの認識を示した。その上で、「試験科目になければ日人は勉強しない」とし、有能なAI人材の輩出に向け、大学入試で「義務化すべきだ」と話した。 また孫社長は、AIの特許数では中国が米国を追い越す中、日は後れを取っており、国内総生産(GDP)が低調な一因になっていると分析。一方、国の数や人口面からアジアは世界トップのAIプラットフォームになる可能

    ソフトバンクG孫社長、大学入試「AIを試験科目に」-日本後れ危惧
    dominion525
    dominion525 2019/12/18
    ちょっと意味がわかんないんですけど、具体的には何を指してるの? 統計と行列、あと情報科学を強化すればよいですか?
  • ’89 牧瀬里穂のJR東海クリスマスエクスプレスのCMが良すぎて書き殴ってしまった|pato|note

    ここにあった文章はすったもんだの末、https://sakumaga.sakura.ad.jp/entry/2020/10/07/120000 に移動しました

    ’89 牧瀬里穂のJR東海クリスマスエクスプレスのCMが良すぎて書き殴ってしまった|pato|note
    dominion525
    dominion525 2019/12/18
    券売機前の丸い柱とか名駅感ある。平成最初の年のCMを令和の最初の年に見るとか、流石に差分を感じてエモみ高まるわ…。