
エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
bfloat16 (brain float16) のCPUによる対応とC言語からの利用
binary32との変換 指数部の幅が同じなので、binary32からbfloat16に変換するのは上位16ビットを取り出す... binary32との変換 指数部の幅が同じなので、binary32からbfloat16に変換するのは上位16ビットを取り出すだけで可能となります。ただ、この方法だと端数が単なる切り捨てになってしまいます。 上位16ビットを取り出す前にbinary32のビット列表現に 0x8000 を加えておけば、四捨五入の二進法版、零捨一入(IEEE 754用語で言えばroundTiesToAway)ができそうです(できるよね?)。元の浮動小数点数がNaNの場合はこれだとまずいかもしれませんが、入力がx86やArmなどの標準的なNaNであると仮定できるならチェックを省いても問題ないでしょう。 もうちょっとビット演算をガチャガチャやれば偶数丸め(roundTiesToEven)もできるでしょう。 bfloat16からbinary32への変換は、単に上位16ビットに設定すれば大丈夫です。このやり方だと入力がs
2025/07/03 リンク