タグ

ikutani41のブックマーク (496)

  • B2Bスタートアップの印象に残った採用スライド7選+1|Anno Takahiro

    採用のために、スタートアップが自社について説明する「採用スライド」を公開する流れは、かなり一般的になってきた感覚があります。 とくにB2Bのスタートアップでは、どういう業務をしているのかB2Cの事業と比べるとどうしても想像がしにくいところがあります。なので、こういった採用スライドのようなメディアとは、特に相性が良いと言えます。 最近、私の会社でも採用スライドを作る機会があり、さまざまなB2B企業の採用スライドをみていたのですが、新しく作る時の参考になりそうなスライドがたくさんあったので、この機会に紹介してみたいと思います。 1) 10x 小売・流通事業者向けにネットスーパーを立ち上げられるサービス「Stailer(ステイラー)」を提供している10Xさん。 印象に残ったスライド 今の組織図だけではなく、「3年後」の組織図を記載しているのは非常に珍しいなと思います。確かにこの図は「入社後にどう

    B2Bスタートアップの印象に残った採用スライド7選+1|Anno Takahiro
  • Transformersを用いた固有表現抽出のtips - MNTSQ Techブログ

    TL;DR TransformersのNERではFast Tokenizerを使うことで、サブトークン ↔ ラベルのアラインメントが実装できる。 長いテキスト入力については、無駄なpaddingを最小限にとどめて高速処理するために、入力を固定長分割するのが良い。 検出漏れが問題になるようであれば、ストライド付きのwindow処理を追加するのが良い。 サンプル実装: github.com 背景 この記事を目に留めていただいた方にはおそらくおなじみであろう Hugging Face の Transformers *1。 BERT等のTransformer素子ベース事前学習モデルを用いた転移学習が容易に実験できるライブラリである。 最新モデルのモジュールがすごいスピードで実装されることに加えて、事前学習モデルおよび依存するトークナイザが一緒に管理・ダウンロードできる点がご利益として特に大きい。

    Transformersを用いた固有表現抽出のtips - MNTSQ Techブログ
  • 2030年の新人法務パーソンL子(仮)の一日 | MNTSQ, Ltd.

    リーガルテック業界の中にいる人が妄想している実現したい未来のおはなしです 全ての法務パーソンに希望を!9:00 木曜日はリモートDAYだ 法務は秘匿性の高いデータを扱うため、他の部署のようにカフェ等で仕事をすることは許可されていない よって一日自宅勤務なのだが、Web会議が続くので戦闘準備をする 具体的には、きっちりメイクして髪も整える PCモニター越しにしか会ったことがない人も多いので、見た目の印象は大事だと思っている 通常業務に加えて来月末の株主総会の準備もあるので今の時期は何かと忙しい でも夜に久々にロースクールの同期と会うので絶対遅れたくない タスクを整理して巻きで片付けていく まずは契約データベースを立ち上げる ドラフト依頼が2件たまっているので、自動ドラフティング機能でポチポチしてプレーンなファーストドラフトを作成する。案件に応じた個別修正が必要な条項は、データベースの過去事

    2030年の新人法務パーソンL子(仮)の一日 | MNTSQ, Ltd.
  • JuliaとPythonを併用したデータ処理のススメ - MNTSQ Techブログ

    Pythonでデータ処理をしている際、numpyにはまらないごちゃごちゃした前処理があり、ちょっと遅いんだよなぁ。。。となること、ないでしょうか。 ルーチンになっている解析であれば高速化を頑張る意味がありそうですが、新しい解析を試行錯誤している最中など、わざわざ高速化のためのコードをガリガリ書いていくのは辛いぐらいのフェーズ、ないでしょうか。 こんなとき、私はJuliaを使っています。Juliaは特別な書き方をしなくても高速になる場合が多く、並列処理も簡単にできます。 julialang.org Julia、いいらしいが名前は聞いたことがあるけど使うまでには至ってない、という方がと思います。今まで使っているコードの資産を書き直すのは嫌ですよね。 しかし、JuliaにはPythonの資産を活かしつつ高速にデータ処理がするための道具がそろっています。 今回の記事はPythonJuliaをいっ

    JuliaとPythonを併用したデータ処理のススメ - MNTSQ Techブログ
    ikutani41
    ikutani41 2020/12/07
  • 安定を求めてなぜかリーガルテックベンチャーへ | MNTSQ, Ltd.

    MNTSQ転職して2か月が経過しました。 冒険より安定を求める性質であり、キーボードで打った文字からは感情が伝わらないからと言って手書きで手紙を書いていた自分が、IT企業、それもリーガルテックという最先端かつ未成熟な分野に身を置くとは自分でも驚きです。 そういえばなんでこんなことになっているのか、振り返ってみます。 順を追って思えば10代から安定志向だった私は、手堅い法学部を卒業して、法律事務所に就職しました。 仕事は充実していたし人間関係にも恵まれ、このまま法律業界で生きていくつもりでしたが、 結婚相手は転勤族。結婚式の2か月後に東北への転勤辞令があり、仕事を辞めて帯同しました。 このとき専業主婦になって夫を支える覚悟を確かにしていたのですが、 自分でお金が稼げない=自分の価値に自信がなくなる残りの人生を今までのインプットの貯金で生きていくのかと思ったら、足りなさ過ぎてぞっとした何の縁

    安定を求めてなぜかリーガルテックベンチャーへ | MNTSQ, Ltd.
  • リーガルテックベンチャーと企業法務での働き方|mizukim

    リーガルテック企業のMNTSQに入社してもうすぐ9カ月。 最初の3~4カ月で東京都の緊急事態宣言の発動があったり、それに伴い子供の保育園が休園したりで、なんかもうあんまり記憶がないですけどバッタバタでした。。 3月にエントリー記事を書いたときには、想像もつかなかった未来が来て、人生はほんとに何が起こるかわからんなーと感慨深くなりますが、今日は少し前を思い出して、MNTSQに入社してからわたしが感じた法務部で働いていた時とのギャップをご紹介してみようと思います。 中間管理職がいないある程度大規模の上場企業などの法務部では、中間管理職がいて、その人が個々のタスクを振り分けて管理監督するのが普通ではないかと思います。なので、その下で働く平法務部員の私は、あなたはこれをやってねと言われてそれを期日までにやるという働き方でした。 入社エントリー記事でも少し触れましたが、「会社としての方針はこうだから

    リーガルテックベンチャーと企業法務での働き方|mizukim
  • GPT-3の学習データはどのように作られたか - moriyamaのエンジニアリング備忘録

    OpenAIが発表した言語モデルGPT-3はパフォーマンスの高さから各方面で注目されており、ついにはMicrosoftが学習済みモデルの利用を独占化しました。 私個人の所感としてこれまで学習済みモデルは無料公開するという流れを無視し、(アーキテクチャではなく)学習済みモデルが商品化するのはAIビジネスの一つの転換期と感じています。 深層学習による自然言語処理分野で巨大化していくモデルを十分に学習させるためにはWebデータの活用が大きな役割を果たしています。一方、その量に関する話題はあるものの、利用にあたっての細かな前処理に関する議論はあまりなされていない印象です。 そこで記事は学習データの構築にフォーカスします。 GPT-3の論文でも言及されている通り、学習データはGoogle Researchが発表したT5のデータを踏襲したと書かれていますので、まずはT5のデータから見て行きましょう。

    GPT-3の学習データはどのように作られたか - moriyamaのエンジニアリング備忘録
  • 固有表現抽出のアノテーションデータについて - NLP太郎のブログ

    自然言語処理技術のなかでも固有表現抽出(Named Entity Recognition; NER)は情報抽出の処理をやろうとするときにとても役立つ。 応用は幅広く、会社名や個人名などの情報抽出処理、個人情報除去などのような抽出した情報に対する処理、代名詞の解析(照応解析・共参照解析)のような文脈解析処理などに用いられる。 最も簡単なNERの方法としては、辞書や形態素解析結果や正規表現などに基づくルールを用いて、単語列にラベリングする方法があるが、会社名など判断が難しいケースについては機械学習によってNERを行うことが有効なことが多い。機械学習ベースの既存の固有表現抽出器を使ってみたい場合には、GiNZAやKNPのようなNERモデルが同梱されているツールを使用してみるのがよい。 しかし公開モデルの性能では満足いかない場合に自分でモデルを構築しようとしても、公開データセットが見つけにくかった

    固有表現抽出のアノテーションデータについて - NLP太郎のブログ
    ikutani41
    ikutani41 2020/10/06
    [りーがるてっく
  • 代表取締役の肩書きを置いてでも「変化を選択する」という価値観とキャリア | MNTSQ, Ltd.

    この投稿は、これからのキャリアを考えている方に向けてひとつの選択肢を示せればと思い、現職を選択するに至るまでの思考プロセスを備忘録として書き残したものである(3分でひとりの人生の一部を追体験できるお得な読み物です) 「長谷川さんはなんでMNTSQ(モンテスキュー)に入ったんですか?」採用面談の場で私がとにかくよく尋ねられる質問がこちらで、いつもこの質問をさせてしまってごめんなさいと思いながら、そもそも自分の自己紹介が悪いのだということを、最近ようやく自認しはじめるようになった。 いわゆる定型文的な「自己紹介しますね」のあとの、このあたりのくだりがが良くないらしい。 - 大企業向けのコンサル的なキャリアからスタートして(わかる) - 創業メンバーとして参画したスタートアップで売上10億・メンバー70名までの成長を3年で経験したあと(わかる) - 自分でも会社つくって(わかる) - なぜかMN

    代表取締役の肩書きを置いてでも「変化を選択する」という価値観とキャリア | MNTSQ, Ltd.
  • 英文法律関連テキストを対象とした文境界推定の論文を読む - ヤドカリラボ

    はじめに 法律ドメインに特化した自然言語処理は、ビジネス上重要な位置を占めるにもかかわらず、金融や医療等の他の分野と比べいままであまり重きをおかれることがなかった分野でした。 法律関連のタスクに電子機器が使われる機会は徐々に高まっており、自然言語処理を応用し、法律の実務家や法律関連SaaSのユーザに価値を提供する機会もまた増えてきています。 このような状況の中で、自然言語処理の研究者と法律の実務家が一堂に会する機会を設けるためにNLLP (Natural Legal Language Processing)ワークショップが設立されました。 今年はCovid19の影響でバーチャル開催され、KDD(Knowledge Discovery and Data Mining)と同時期に行われています。 sites.google.com 記事ではNLLP 2019で発表された論文:Sentence

    英文法律関連テキストを対象とした文境界推定の論文を読む - ヤドカリラボ
    ikutani41
    ikutani41 2020/09/11
  • “依存ライブラリ更新めんどい問題”を解決するRenovateを試してみた|Anno Takahiro

    依存ライブラリのバージョン管理は既に人間には無理ゲーになっている リポジトリが依存しているライブラリのバージョン管理は大変である。比較的シンプルなプロジェクトであっても、pipやらgemやらDockerfileのベースイメージのバージョンやらnpmやらMavenやらGradleやらで複雑な依存関係を整理することになる。当然、多種多様なライブラリはそれぞれのペースでこちらの事情などお構いなしに開発を進めていく。関係する全てのupdateをきちんと見極めて、タイムリーに自分のリポジトリに取り込んでいくのはもはや無理ゲーだ。 ということで、気づいたベースで対応する、必要になった段階で対応する、やる気が出た瞬間に気合でアップデートする、という運用になりがちだ。だがこれでは継続的に高品質な運用をすることは難しい。 依存関係自動更新ツールのRenovateを使ってみたけどすごくよかった 最近、Reno

    “依存ライブラリ更新めんどい問題”を解決するRenovateを試してみた|Anno Takahiro
  • MNTSQプロダクト開発チームのカンバン運営を紹介します!|ikutani41

    リーガルテック・カンパニーMNTSQ(モンテスキュー)を創業して1年と9ヶ月が経ちました。 今日はMNTSQ(モンテスキュー)のプロダクト開発チームでは日々どんな流れで仕事が行われているのか、特にカンバン運営に焦点を当てて紹介しようと思います。 MNTSQのプロダクト開発の全体像としては、OCRやアルゴリズム開発やリーガルナレッジの再定義など様々なことをやっていますが、今回は特にユーザが触るソフトウェア面の開発(Rails + Vue.js + Elasticsearch)での運営を紹介します。 開発チーム構成 # こんな感じ ・PM & Designer & フロントエンドエンジニア: 1人(私) ・遊撃隊: 1人 ・バックエンドエンジニア: 2名 ・検索エンジニア: 1名 ・週2~3業務委託エンジニアチーム: 4名見ての通りまだまだ小さいチームです。 特に業務委託チームはフルリモートで

    MNTSQプロダクト開発チームのカンバン運営を紹介します!|ikutani41
  • Wantedly(ウォンテッドリー)はたらくを面白くするビジネスSNS

    Wantedlyは、運命のチームや仕事に出会えたり、人脈を広げ、ビジネスの情報収集に使えるビジネスSNSです。

    Wantedly(ウォンテッドリー)はたらくを面白くするビジネスSNS
  • リーガルテックのパラリーガルの一日|うどっぴ

    長島・大野・常松法律事務所から8億円の出資を受け、今夏の一般販売に向けて小松製作所様および福岡銀行様と実証実験を行っているリーガルテックベンチャーであるMNTSQ株式会社でパラリーガルとして勤務している者です。正社員として入社してから1年が経過しました。 コロナ禍で電子締結が話題になり、リーガルテックが注目を集めている状況は内部にいる私も認識しているのですが、「リーガルテックの中の人が具体的に何をやっているのか?」についてはこれまでほとんど発信されてきませんでした。おかげさまで弊社に応募してくれる方もいらっしゃるのですが、毎回説明に苦慮しているという状況です。そこで、イメージをつかんでいただくため、お話しできる範囲で弊社の業務内容をご紹介します。 法律と機械学習に関する大量の専門用語が登場するため「読者0人では?」という不安がありますが、雰囲気が伝われば十分だと思っているので各自ググってい

    リーガルテックのパラリーガルの一日|うどっぴ
  • flairを使って最速でNLPのベースラインモデルを作る - moriyamaのエンジニアリング備忘録

    自然言語処理に限らず、機械学習関連のプロジェクトではスタート時は、なるべく複雑なコーディングをせずにシンプルなベースラインモデルを低コストで作成し、そこからデータの傾向やタスクの複雑さを把握することが重要です。 ところが自然言語処理では前処理のコストが高く、最低限でも単語分割、ベクトル化、深層学習を用いる場合は事前学習された埋め込みベクトルを準備する必要があります。その後は他のタスクと同様にモデルの保存方法や、予測のパイプラインで悩みポイントを抱えることが多いと思います。 最近はAutoMLを始めとした機械学習の自動化が進歩し、初手から高性能なモデルをブラウザ上で数クリックで作成できますが、中身がブラックボックスである故に前述のデータの傾向やタスクの複雑さを把握することを目的とした場合には適切とは言えない側面があります。 記事では自然言語処理を対象にモデルの中身が参照可能でかつ少ないコー

    flairを使って最速でNLPのベースラインモデルを作る - moriyamaのエンジニアリング備忘録
  • Feature Importanceって結局何なの?|Yotaro Katayama

    この記事の目的GBDT(Gradient Boosting Decesion Tree)のような、決定木をアンサンブルする手法において、特徴量の重要性を定量化し、特徴量選択などに用いられる”Feature Importance”という値があります。 記事では、この値が実際にはどういう計算で出力されているのかについて、コードと手計算を通じて納得することを目指します。 なお、この記事は3回シリーズの第2回で、最終的にcatboostのfeature importanceの算出方法を理解するのが目的です。ここでは、用意されているfeature importanceの計算方法がわかりやすいxgboostを使います 第1回: Catboostの推論の仕組みを理解する 第2回: Feature Importanceの計算を理解する (イマココ) 第3回: CatboostのFeature Impor

    Feature Importanceって結局何なの?|Yotaro Katayama
  • MNTSQ社の開発環境のご紹介|yuki_nishimura

    MNTSQ社でソフトウェアエンジニアをやっております西村と申します。 弊noteへのご来訪まことにありがとうございます。 日は弊社の開発環境をご紹介いたします。 開発言語弊社では基盤部分をRuby on Railsで開発しております。一部、OCR処理は都合でJavaを利用したり、機械学習Pythonが得意ですのでPythonを利用しております。 レビュー環境 リリースブランチや開発ブランチへの直接プッシュは禁止しております。GitHubでブランチを保護する方法につきましては、以下の記事などをご参考ください。 [GitHub] ブランチの保護設定を活用しよう 【レビューが通るまでマージさせんぞ】 | Developers.IO リリースブランチや開発ブランチに変更を加えるには、Pull Requestを介して行います。Pull Requestのレビューは必須となっており、少なくとも一名が

    MNTSQ社の開発環境のご紹介|yuki_nishimura
  • ポストコロナ時代を支えるリーガルテックは?|mizukim

    私は、MNTSQというリーガルテックベンチャーで、パラリーガルをやっています。すでに多くのメディアで話題になっていることですが、ポストコロナ時代の働き方は、リーガルテックにとって追い風だなということを私も感じます。 そこで、ポストコロナ時代の企業活動にとって特に重要となるリーガルテックサービスについて、リーガルテック企業に身を置くいちパラリーガルとして少し考えてみました(私が所属する会社としての意見ではありません)。 電子契約システム人との接触、移動が制限されるポストコロナ時代では、もはや必須といえるのが電子契約、電子署名です。法律上、契約とは当事者間の意思表示の合致によって成立し、必ずしも書面の作成を必要とするものではありませんが、後に文書の真正が争われた場合に備え、契約締結の際には、契約書を作成し、署名押印するのが慣行となっています。 しかし、緊急事態宣言下でも契約書に判を押すためだけ

    ポストコロナ時代を支えるリーガルテックは?|mizukim
  • 良い"空気"のスタートアップを作る技術|Anno Takahiro

    手前味噌だが、弊社のオフィスではそれなりに良い”空気”が漂っているのではないかと自負している。やはり働くにあたってどういう”空気”で働くかは重要だと考えている。”空気”といっても、「人々の気持ちを支配するようなその場の雰囲気」のことではない。文字通り「オフィスに充填された気体」のことを指して言っている。 なぜか弊社のCareers Deck(採用候補者向けのプレゼン資料)にも、空気に関する記載が多い。「採用候補者向けの資料に占める空気関連の記述領域の割合」は数あるスタートアップの中でも上位にい込むのではないだろうか。 働く場所における気体の”空気”を大事にする風潮は、COVID-19で「密を防ごう」という文脈から一気に加速した感じはあるものの、実はその前から割と言われるようになってきていたように思う。 リアルかオンラインかの議論以前に、CO2満載の会議室だけは撲滅したい。。あれは明確にハ

    良い"空気"のスタートアップを作る技術|Anno Takahiro
  • 専門知で深まる自然言語処理を求めて | MNTSQ, Ltd.

    これまでの経歴5月からMNTSQにジョインしました、自然言語処理エンジニアの稲村と申します。自然言語処理自体には昔から関心があり、大学院では日語データセットの自動作成をテーマに比較的基礎寄りの研究をしていました。研究の道には進みませんでしたが、自然言語処理技術を深く理解して使えるようになりたいという想いがあったため、学生時代に十分に取り組めなかった自然言語処理の応用に関われそうな会社にこれまでお世話になってきました。働き始めてから3年目になりますが、振り返ってみると、新卒当初に意識していた機械学習エンジニアやデータエンジニアと呼ばれるシステム開発寄りのキャリアというよりも、自然言語処理に軸足を置いて、最新の研究で得られた成果の検証・導入や、古典的な手法も視野に入れた技術応用の探索がやってきたことの中心となっています。 前職はMNTSQの関連会社である、株式会社PKSHA Technolo

    専門知で深まる自然言語処理を求めて | MNTSQ, Ltd.