2023年12月19日のブックマーク (5件)

  • 法律のデータ構造と検索

    デジタル庁は、法令標準 XML スキーマに準拠した、現行の法令データをe-Gov法令検索というサイト上で公開しています[1]。今回、この法令XMLをパースするPythonライブラリ ja-law-parser をつくり、法令データの全文検索をしてみました。 この記事では、日の法令とそのデータ構造、法令XMLパーサについて解説し、最後に、それらを使った法令データの全文検索システムを実装する方法をご紹介します。法令検索の実装についても、GitHubリポジトリで公開しています。 この記事は、情報検索・検索技術 Advent Calendar 2023の16日目の記事です。 法律と法令 法律とは 法律の制定と公布 法律と法令の違い 法律の改正 法令のデータ構造 e-Govの法令データ 法令標準XMLスキーマ 法令番号と法令ID 題名 則と附則 条・項・号 編・章・節・款・目 法令XMLパーサ:

    法律のデータ構造と検索
    yag_ays
    yag_ays 2023/12/19
  • Swallow: LLaMA-2 日本語継続事前学習モデル

    はじめに 東京工業大学 横田研究室の藤井です。 日(2023/12/19)Llama 2から日語継続事前学習を行ったSwallow-7B, Swallow-13B, Swallow-70Bをリリースさせて頂きました。 モデルの開発は、産総研、東京工業大学 岡崎研究室、横田研究室の合同プロジェクトにて行われました。公式プロジェクトページはこちらです。 Swallow-70Bはオープンな日語モデルにおいて最高の日語性能を記録しました。 (後述のモデル評価セクションを参照のこと) リリースモデル 日語継続事前学習済みモデル Swallow-7B Swallow-13B Swallow-70B 上記モデルに指示チューニングを施したモデル Swallow-7B-instruct Swallow-13B-instruct Swallow-70B-instruct 記事では、Swallow

    Swallow: LLaMA-2 日本語継続事前学習モデル
    yag_ays
    yag_ays 2023/12/19
  • Swallow – TokyoTech-LLM

    Swallow Llama 2の日語能力を強化した大規模言語モデル (7B, 13B, 70B) です。モデルのパラメータ(重み)が公開されていますので、LLAMA 2 Community Licenseに従う限り、研究や商業利用など自由に利用できます。 View on HuggingFace 大規模言語モデルSwallowは東京工業大学情報理工学院の岡崎研究室と横田研究室、国立研究開発法人産業技術総合研究所の研究チームで開発された大規模言語モデルです。英語の言語理解や対話で高い能力を持つ大規模言語モデルLlama 2 7B, 13B, 70Bの日語能力を拡張するため、研究チームは言語モデルに日語の文字や単語などの語彙を追加したうえで、新たに開発した日語データを用いてモデルの構築を継続的に行う継続事前学習を行いました。研究チームで実施した性能評価では、2023年12月現在オープンな

    Swallow – TokyoTech-LLM
    yag_ays
    yag_ays 2023/12/19
  • IT系コミュニティをタダ飯狙いの不審者からどう守るべきか。あるイベントで発生した深刻な事案と提言

    タダ飯狙いでIT系コミュニティのイベントなどに入り込む人たちがいる、ということが少し前から話題になっている中で、実際に不審者がイベントに入り込もうとした事案がまた明らかになりました。 12月11日と12日の2日間、都内で開催されたコミュニティ主催の技術系カンファレンスで、おそらくは無料の事を目当てにした不審な人物らが侵入しようとした出来事が発生していたことがイベントの当事者の発言で示されています。 スタッフとして不審者に対応した一人である鍋島理人氏は、「勉強会参加者や運営に危害が及ぶほどの脅威であり、必要なのは不審者対策そのものだと認識を改めた。というか僕はそれぐらい怖かった」とポストし、今回の事態の大きさを吐露しました(鍋島氏は以前、翔泳社でDevelopers Summit(通称デブサミ)のオーガナイザーを勤めたこともある、イベントやコミュニティの運営に関して十分な知見を備えた人物で

    IT系コミュニティをタダ飯狙いの不審者からどう守るべきか。あるイベントで発生した深刻な事案と提言
    yag_ays
    yag_ays 2023/12/19
  • SBI証券、金融庁から業務停止命令の可能性…株価操作で顧客が損失、重大な罪

    SBI証券のHPより インターネット証券・SBI証券が、引受業務を手がける企業の新規株式公開において初値を人為的に操作しているとして、証券取引等監視委員会は15日、同社に行政処分を行うよう金融庁に勧告した。これを受け金融庁は同社に対し行政処分を行う見通し。過去に金融商品取引法が禁じる「作為的相場形成」が認定された事案では業務停止命令が出されたこともあり、同社にも同様の処分が出される可能性も指摘されている。また、SMBC日興証券による株価操縦事件では元執行役員に金融商品取引法違反罪で懲役1年6月、執行猶予3年の判決(今年2月に確定)が出されており、SBI証券をめぐる今後の動向が注目されている。 同社は引受業務を担当する新規上場案件において、初値が公開価格を上回るよう、傘下の金融商品仲介業者などを使って顧客に買い注文をさせていた疑いが持たれている。15日付日経済新聞記事によれば、SBI証券

    SBI証券、金融庁から業務停止命令の可能性…株価操作で顧客が損失、重大な罪
    yag_ays
    yag_ays 2023/12/19