自作CPUにおいて、ある程度ベクトル移動命令が動作するようになってきた。 次はマスク命令の動作について考えてみる。マスク命令は、通常の算術演算命令と動作が違うのでちょっと厄介。 実装の方針をちょっとまとめる。 ベクトル演算におけるレーンとデータパス ベクトル演算命令パイプラインでは、演算器はレーンと呼ばれるグループを複数並べることで構成する。 1レーンはXLENの大きさに相当するデータ幅を管理している。 例えばXLEN=64の場合、SEW=8の場合は8要素の演算を実行し、SEW=32の場合は2要素の演算を並列に実行する。 このレーンを複数並べることによりベクトルデータパスを構成することになる。 Single-width 演算命令 ベクトル演算パイプラインはレーンを複数並べて構成する。 1サイクルで実行することのできるデータパス幅はパラメータDLENで決定されるので、パイプライン上にはDLE
