lavu/floatdsp: RISC-V V vector_fmul_add

author: Rémi Denis-Courmont <remi@remlab.net> 2022-09-26 17:52:34 +0300
committer: Lynne <dev@lynne.ee> 2022-09-27 13:19:52 +0200
commit: f4ea45040f4c0d896fce66a6f52deb53249ed77f (patch)
tree: 6dafa2f16edb77b5aaf954f701d83f39a789fcff
parent: d120ab5b915fb422247f9e4dd5b823d1b47d6adf (diff)
download: ffmpeg-f4ea45040f4c0d896fce66a6f52deb53249ed77f.tar.gz
2 files changed, 22 insertions, 0 deletions
diff --git a/libavutil/riscv/float_dsp_init.c b/libavutil/riscv/float_dsp_init.c
index a559bbb32b..8982436647 100644
--- a/libavutil/riscv/float_dsp_init.c
+++ b/libavutil/riscv/float_dsp_init.c
@@ -31,6 +31,8 @@ void ff_vector_fmac_scalar_rvv(float *dst, const float *src, float mul,
                                 int len);
 void ff_vector_fmul_scalar_rvv(float *dst, const float *src, float mul,
                                 int len);
+void ff_vector_fmul_add_rvv(float *dst, const float *src0, const float *src1,
+                             const float *src2, int len);
 
 void ff_vector_dmul_rvv(double *dst, const double *src0, const double *src1,
                          int len);
@@ -48,6 +50,7 @@ av_cold void ff_float_dsp_init_riscv(AVFloatDSPContext *fdsp)
         fdsp->vector_fmul = ff_vector_fmul_rvv;
         fdsp->vector_fmac_scalar = ff_vector_fmac_scalar_rvv;
         fdsp->vector_fmul_scalar = ff_vector_fmul_scalar_rvv;
+        fdsp->vector_fmul_add = ff_vector_fmul_add_rvv;
     }
 
     if (flags & AV_CPU_FLAG_RVV_F64) {
diff --git a/libavutil/riscv/float_dsp_rvv.S b/libavutil/riscv/float_dsp_rvv.S
index 048ec0bc40..db62402878 100644
--- a/libavutil/riscv/float_dsp_rvv.S
+++ b/libavutil/riscv/float_dsp_rvv.S
@@ -74,6 +74,25 @@ NOHWF   mv       a2, a3
         ret
 endfunc
 
+// (a0) = (a1) * (a2) + (a3) [0..a4-1]
+func ff_vector_fmul_add_rvv, zve32f
+1:
+        vsetvli   t0, a4, e32, m1, ta, ma
+        vle32.v   v8, (a1)
+        sub       a4, a4, t0
+        vle32.v   v16, (a2)
+        sh2add    a1, t0, a1
+        vle32.v   v24, (a3)
+        sh2add    a2, t0, a2
+        vfmadd.vv v8, v16, v24
+        sh2add    a3, t0, a3
+        vse32.v   v8, (a0)
+        sh2add    a0, t0, a0
+        bnez      a4, 1b
+
+        ret
+endfunc
+
 // (a0) = (a1) * (a2) [0..a3-1]
 func ff_vector_dmul_rvv, zve64d
 1:
author	Rémi Denis-Courmont <remi@remlab.net>	2022-09-26 17:52:34 +0300
committer	Lynne <dev@lynne.ee>	2022-09-27 13:19:52 +0200
commit	f4ea45040f4c0d896fce66a6f52deb53249ed77f (patch)
tree	6dafa2f16edb77b5aaf954f701d83f39a789fcff
parent	d120ab5b915fb422247f9e4dd5b823d1b47d6adf (diff)
download	ffmpeg-f4ea45040f4c0d896fce66a6f52deb53249ed77f.tar.gz