ayaniimi213のブックマーク - はてなブックマーク

LINE LLMをMacで動かす - きしだのHatena

先日、LINE(現LINEヤフー)のNLP Foundation Devチームから日本語言語モデルが公開されました。(以降LINE LLMと表記します) 36億パラメータの日本語言語モデルを公開しました Instruction Tuningにより対話性能を向上させた3.6B日本語言語モデルを公開しますでも「NVIDIAのGPUがないと動かないんでしょ」と、試していない人も多いんではないでしょうか。そこでこのブログでは、MacでLINE LLMを動かす手順をまとめたいと思います。 Windowsや他のLLMでもほぼ同じ手順で動かせるはずです。次のような手順で進めます。 pythonインストールライブラリインストール 1.7Bのサンプルコードを動かすチャットインタフェースで1.7Bを動かす CTranslateによる3.6B llama.cppによる3.6B Pythonインストール

ayaniimi213 2023/10/28

リンク

CyberAgentの日本語言語モデルを試してみる - きしだのHatena

CyberAgentが日本語LLMを公開していたので、とりあえず動かしてみました。サイバーエージェント、最大68億パラメータの日本語LLM（大規模言語モデル）を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供― | 株式会社サイバーエージェントモデルは次のように6サイズ提供されています。 ※ Rinna社も同時に新しいモデルを出したので試しています。 Rinnaの新しい3Bモデルを試してみる - きしだのHatena open-calm-small(160M) まずはopen-calm-small。160Mパラメータです。このあたりは動作確認用なので、内容は気にしない。 GPUメモリは1.3GBくらいの消費です。 open-calm-medium(400M) 次にopen-calm-medium。400Mパラメータです。このへんも細かいことは気にしないけど、なんかま

ayaniimi213 2023/05/18

リンク

「オブジェクト指向神話からの脱却」という特集をWEB+DB PRESSで書きました - きしだのHatena

「オブジェクト指向神話からの脱却」というあおり気味タイトルの特集をWEB+DB PRESS vol.132で書きました。 12/24発売！クリスマスプレゼントです WEB+DB PRESS Vol.132 作者:きしだなおき,加藤尋樹,斉藤洸紀,牟田裕太郎,吉澤政洋,朝日リナ,鈴木僚太（うひょ）,川島義隆,五十嵐進士,末永恭正,佐藤雄太,吉井健文,牧大輔,西山和広,吉田花春,古川雅大,岡林大,池澤春菜,和田卓人,日高正博,はまちや2,竹原技術評論社Amazon 大まかには、「オブジェクト」でソフトウェアをぜんぶ考えるということに無理があったので、パーツそれぞれ適したやりかたでやっていこうぜ！という内容です。ソフトウェアを切り出したときのパーツとしてのオブジェクトの特性が同質であるという暗黙の前提があって、だから「オブジェクトの話をすればソフトウェア開

ayaniimi213 2022/12/09

リンク

プログラミング言語の入門が終わったら何の勉強をすればいいの？ - きしだのHatena

JJUG CCC 2022 Fallで「Javaの入門が終わったら何の勉強をすればいいの？」という内容で発表を行いました。基本的なものが作れるようになったけども、イマイチプログラムが組めないというときに、何を勉強すればいいかをまとめました。入門が終わって作りたいものがあれば作っていきましょう、業務で言われたものが作って行こう、でもなんだかちゃんとしたものが作れないな、もっとちゃんとしたものを作りたい、次のステップに進みたいというときに勉強していく感じです。資料はこちらですとりあげた本についてまとめておきます。開発作業について概要プログラミング言語アーキテクチャミドルウェアネットワークデプロイ理論開発手法開発プロセスまとめフレームワークは入門でやってる前提です。Java入門書「プロになるJava」ではJavaの基本から簡単なDB操作、Spring Bootまで

ayaniimi213 2022/11/28

リンク

「写経」の原典 - きしだのHatena

書籍とかのサンプルコードをそのまま入力して勉強することを「写経」というけども、それを言い出したのは角谷さん、というメモ。写経は言葉ではなく心で理解するのが大事。 2004-2005頃に @t_wada と働いていた頃、サンプルコードをコピペでなく手打ちすることを「写経」と呼んでました。和田さんが以前の現場に通いながら"TDD by Example"のサンプルコードを「祈るような気持ち」で手打ちしていたというエピソードを形容して「写経ですね」と呼んだのが始まりだったような…— Kakutani Shintaro (@kakutani) 2021年9月18日恐らく2005年7月ごろではないかと思われる。この夏は写経が来るね, 地震が来た - 角谷HTML化計画(2005-07-23) 角谷さんのブログでの初出も7/15だけど、babieさんのコメントを見るとこの時期にまわりで語ってたこと

ayaniimi213 2021/09/21

リンク

Database Management Systems 8章読み終わった - きしだのHatena

一日1ページとか2ページとかいうペースで、Database Management Systemsを読んでるのだけど、やっと8章「Overview of storage and indexing」が読み終わった。 Database Management Systems 作者: Raghu Ramakrishnan,Johannes Gehrke出版社/メーカー: McG raw Hill Higher Education発売日: 2002/09/01メディア: ペーパーバック購入: 1人クリック: 9回この商品を含むブログ (2件) を見るついでに言うと、8章から読み始めたので、最初の章がやっと終わった感じ。さらについでに言うと、7章までは普通にリレーショナルモデルとかSQLの説明とか、日本語でも読めるような内容なので、読み飛ばしてる。JDBCのAPIの説明とかJSPとか、どうでもいいし

ayaniimi213 2017/07/12

リンク

乱数のたのしい話と遺伝アルゴリズム - きしだのHatena

金曜日の「プログラマのための数学勉強会＠福岡」で乱数の話をしてきました。プログラマのための数学勉強会@福岡 #3 - connpass で、乱数の生成だとか、クイックソートや素数判定などの乱択アルゴリズムの話とかをしました。乱数タノシイヨ乱数のたのしい話 from なおききしだその中で、遺伝アルゴリズムで巡回セールスマン問題(TSP)を解くというのをやってみました。遺伝アルゴリズム、すいぶん昔から名前は知ってて、どういうアルゴリズムかも知ってて、実装もそんな難しくないと知りつつ、書く機会がありませんでした。なので、この機会に書いてみようと。とりあえず最初に完全にランダムでTSPを解いてみます。 TSP with random ぐちゃぐちゃですね。下部のグラフはその時点での最短距離。最初に距離が短いものをみつけていくけどだんだんみつかりにくくなる、という感じになっています。 1

ayaniimi213 2016/02/08

リンク

ぼくの実装した最弱のディープラーニング - きしだのHatena

8月の頭からディープラーニングを実装していたのを、先日、プレゼンしてきました。プログラマのための数学勉強会@福岡 - connpass ぼくの実装した最弱のディープラーニング from なおききしだ ※追記 2023/4/12 SpeakerDeckにも置いてます https://speakerdeck.com/kishida/weakest-deep-learning-i-implemented GPU対応したり、ドロップアウトとかミニバッチとかいろいろ実装して、結構つよくなってます。ちゃんと学習してくれないこと以外は。ソースはこんな感じになってきています。 https://github.com/kishida/neuralnet/tree/CorrectOperationAsCCN GPU対応にはaparapiを使っています。JavaでGPUコードが書けるスグレモノです。 ap

ayaniimi213 2015/09/08

リンク

パーセプトロンからSVMでの画像認識まで、機械学習エントリのまとめ - きしだのHatena

なんかJJUGナイトセミナーで機械学習をやるっぽくて、定員100人が40人キャンセル待ちとかになってますね。【東京】JJUG ナイト・セミナー「機械学習・自然言語処理特集！」12/17（水）開催 - 日本 Javaユーザーグループ | Doorkeeper ということで、予習用だか復習(になるかわかんないけど)用に、2008年になんか機械学習をやってたときのエントリをまとめてみます。今でこそ機械学習はなんかもりあがってるけど、2008年にぼくがやってたとき「ところで機械学習やってなんになるの？」ってよく言われてました。ぼくも「いや、なんかそこに機械学習ってものがあるから実装してる」みたいな答えをしてた気がします。特に目的はありませんでした。たまたまサポートベクターマシン入門という本を見かけて、なんか実装してみたくなっただけです。変な力がありあまってたっぽい。機械学習ことはじめ

ayaniimi213 2014/12/08

リンク

ソニーデジタルペーパーを買った。これはいいものだー - きしだのHatena

発表されたときから興味があって、その値段のせいで買うのを躊躇していたソニーデジタルペーパー、なんかレビューみてたら一瞬気を失っていて、その間に注文してしまっていたようです。ひとこと。これはいいものだー。ソニーデジタルペーパー DPT-S1 出版社/メーカー: ソニー発売日: 2013/12/03メディア: エレクトロニクスこの商品を含むブログ (1件) を見る表示大きいことはいいことだ。パタヘネやWEB+DB PRESSが実物以上の大きさで表示できるのは、とてもいいです。これで、アルゴリズムデザインみたいなでかい本を裁断する気になります。ブラウザ機能もあって、文字の多いサイトを読むのにもいい感じ。通常の大きさの本だと見開きで表示できるサイズなのですが、見開き表示のモードがないのが本当に残念。４枚表示でも読めるのですけど、横向きで２枚表示が欲しい。ただ、電子書籍を読んだり

ayaniimi213 2014/12/04

リンク

プログラムの難しさの階層 - きしだのHatena

プログラムを理解するのは、まあ難しいです。でも、その難しさには階層があります。よく、変数は箱だとか箱じゃないとか議論になりますが、何人か初心者に教えた感じでは、変数自体でつまづくことはあまりないので、実際はそんな例えをしなくても「変数は変数だ」で充分だったりします。デバッガでステップ実行しながら変数の内容を見ればいい。で、条件分岐くらいは結構つまづくことはなくて、単純な演算と条件分岐だけが必要なプログラムであればまあそれなりに書けるようです。ぼくも、一番最初に自分の意図で作ったプログラムは input "ワカレミチガアル。ドウスル？ 1:ミギ 2:ヒダリ"; a if a = 1 then print "ガケニオチテシニマシタ" else print "ライオンニカマレテシニマシタ" みたいなものでした。こういった条件分岐をたくさん並べてアドベンチャーゲームっぽいものを作った人は

ayaniimi213 2014/04/28

リンク

アルゴリズムの勉強のしかた - きしだのHatena

この記事で、アルゴリズムの勉強はアルゴリズムカタログを覚えることじゃないよということを書きました。プログラムの理論とはなにかアルゴリズムの勉強というのは、スポーツで言えば腕立て伏せや走り込みみたいな基礎体力を養うようなもので、「ソートなんか実際に自分で書くことないだろう」とかいうのは「サッカーは腕つかわないのに腕立ていらないだろう」とか「野球で1kmも走ることなんかないのに長距離の走り込みいらないだろう」とか言うようなものです。 Twitterでアルゴリズムの勉強とはなにかと尋ねられて、「アルゴリズムの基本的なパターンを知って、それらの性質の分析のしかたをしって、いろいろなアルゴリズムでどのように応用されているか知って、自分が組むアルゴリズムの性質を判断できるようになることだと思います。」と答えたのですが、じゃあ実際どういう本で勉強すればいいか、ぼくの知ってる本からまとめてみました。

ayaniimi213 2014/04/25

リンク

Java8時代の文字列連結変態さんまとめ - きしだのHatena

いろいろな文字列連結のコードを書いた人がいたのでまとめておきますね。主に変態さん。とりあえず、基準として、メモリ確保したStringBuilder版 public static String stringBuilderJoinMem(){ StringBuilder s = new StringBuilder(9100).append("["); for(int i = 0; i < strarray.length; ++i){ if(i != 0){ s.append("],["); } s.append(strarray[i]); } s.append("]"); return s.toString(); } 1037ms ということで、まずはbackpaper0さん。比較的常人のコード。 https://gist.github.com/backpaper0/10273558 pu

ayaniimi213 2014/04/14

リンク

StringBuilderを使ったクソコードはどこまで遅いか - きしだのHatena

※ 4/9 11:25 いろいろ計測しなおしてます。こちらも参照 Javaで文字列連結する場合には+演算子よりもStringBuilderを使うべき、という話があるのですが、よく sb.append("[" + data + "]"); みたいなコードをみかけて、あんまり意味ないなーと思ったりします。あと、 sb.append("title:"); sb.append("[" + data + "]"); みたいに、+演算子を使った一行の式にして sb = "title:" + "[" + data + "]"; としておけば「title:」と「[」はコンパイル時点で最適化されたのに、ってコードもあります。ということでTwitterで Javaでの文字列連結は+を使うべき、ってやったほうが、StringBuilder使ったsb.append("[" + data + "]")みたいなク

ayaniimi213 2014/04/09

リンク

Java8時代の文字列連結まとめ - きしだのHatena

文字列の配列やリストを[〜]で囲ってカンマで区切って連結するという話、String.joinだとどう？とwatermintさんから指摘があったので、試してみました。シンプル！ public static String stringJoin(){ return "[" + String.join("],[", strarray) + "]"; } でも、1847msでした。改めて前後の文字を文字列連結してるところで時間かかってる感じ。で、昨日のStringBuilder版はもう少し最適化できるので書き直します。 public static String stringBuilderJoin(){ StringBuilder s = new StringBuilder("["); for(int i = 0; i < strarray.length; ++i){ if(i != 0){ s.

ayaniimi213 2014/04/09

リンク

プログラマでメシを食う話 - きしだのHatena

今日やってきた話職業人講和20140403 from なおききしだあらすじ・技術力の格差がでかくなってる・会社は教育してくれない・勉強するとちょっと自由になる・勉強することはたくさんある・10年とか20年とか勉強する必要がある・モチベーションが必要・Twitterに情報もモチベーションもある・Facebookにローカルな情報がある・勉強会とかでモチベーションをたもつのがいいコミュニティ福岡IT関連勉強会福岡の水曜飲み会コミュニティ「水どう」の代表になりました - きしだのはてな本ソフトウェア工学論理学作者: 野矢茂樹出版社/メーカー: 東京大学出版会発売日: 1994/02/18メディア: 単行本購入: 24人クリック: 175回この商品を含むブログ (80件) を見る統計学が最強の学問である作者: 西内啓出版社/メーカー: ダイヤモンド社発売日:

ayaniimi213 2014/04/03

リンク

ひどい記事のリンクを貼らないほうがいい３つの理由 - きしだのHatena

よくありますよね。「93%の人が間違える計算問題」みたいなタイトルで、開いてみたらこの計算問題解けますか？ 27+83=? 簡単に見えるこの問題、なんと93%の人が間違えるのです！みたいな。ここで「バカにすんな！」みたいなコメントと一緒にTwitterに投稿しそうになりますが、ここでぐっとこらえるほうが良いという理由を３つあげてみます。ひどい記事のリンクをガマンすればインターネッツから消えてくれるひどい記事、この世から、インターネッツから消えてほしかったりしますよね。もう見たくない。でも、「こんな記事載せるなや！ http://example.com/easy_probl em」みたいにリンク貼っちゃうと、その記事の生存どころか増殖に加担してしまいます。コンテンツにとって、インターネッツ上に存在するというのは、リンクがどこかから貼られていることと等価です。そして、リンクが多

ayaniimi213 2014/03/19

リンク

プログラムの生産性を高めるためになにを勉強するか - きしだのHatena

用語は形式的なものではなく感覚的なものであることをお断りしておきます。言語・フレームワーク・プラットフォームまず最初に触れるものでとっつきやすい。何か使えないことには話になりません。多くの人が、勉強というとまずここ。何かすでにつかえる人が新しく勉強することは、生産性をあげない。そのプラットフォームを初めて採用するときの準備が減らせる。どちらかというと仕事の選択肢を増やす感じですね。深く知ることは、最適なコードを書きトラブルを減らしトラブルが起こったときの対策も早くなるので、生産性があがります。ただ、ある程度の深さ以降は生産性への寄与度がさがるので、その点では深くまで勉強する必要はありません。プロダクトの使い方なので、プロダクトの寿命が勉強成果の寿命です。実際に使わないものの勉強は無駄になるし、使われなくなったら無駄になる。寿命もそう長くないです。「プログラマは勉強してもすぐ使わ

ayaniimi213 2014/03/14

リンク

プログラマ業界の二分化 - きしだのHatena

プログラマの業界は、同じソフトウェアを作るという作業でありながら、大きく２つの形態にわかれています。小売業界が、コンビニやデパートなど、同じモノを売るという作業でありながら全く違う形態があるのに近いです。この分化は、2010年ごろのGREE/DeNAの人材獲得合戦で明確に形ができたように思います。なので、もう5年たって、定着しつつある感じでしょうか。その２つの形態というのは、労働集約型の業界と、知識集約型の業界です。労働集約型はSIで多い多人数開発の業界で、知識集約型がサービスで多い少数精鋭型の開発です。知識集約型の業界は、最初こそちょっとお花畑すぎる感じもありましたが、最近は落ち着いてきており、徐々に経済的に均衡するところに収束していくと思います。それでも比較的めぐまれた労働環境ではあり続けると思います。ただし、常に勉強が求められる業界ではあります。問題は労働集約型の業界で

ayaniimi213 2014/03/13

リンク

プログラムの生産性をあげるためには - きしだのHatena

前回のエントリで、プログラマの業界が労働集約的なものと知識集約的なものにわかれてきているという話を書きました。プログラマ業界の二分化 - きしだのはてな前のエントリでは労働集約的なものと知識集約的なものに完全にわかれているように書きましたが、もちろん完全に労働集約的であったり完全に知識集約的であったりすることは少なく、どのような組織でもある程度は両方の性質をもっています。知識集約的な性質の強いSI会社というのもあります。ただ、SIに労働集約的な、サービスに知識集約的な性質が強くなる傾向はあると思います。また、知識集約的であればよくて労働集約的であればダメということもありません。労働集約的なSIでありながら良い会社というのもあります。という断りをいれておかないと、SIで労働集約だからといって全部ひとからげにするなという、労働集約的なSIでありながら良い会社方面から鋭利なマサカリが飛

ayaniimi213 2014/03/13

“プログラマ業界の二分化 - きしだのはてな”

リンク

はてなブックマーク

タグ

ブックマーク / nowokay.hatenablog.com (28)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第2週）

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス