nmpp/group__vec___clip_mul_n_d_n_w2___add_vr.html

ar2=ar0;


gr2=[ar1++];

ar0=ar2+gr2;

rep 2 wfifo=[ar4++],ftw,wtw;

rep N data =[ar0++gr0] with vsum ,activate data,vr;


.repeat K-1;

gr2=[ar1++];

ar0=ar2+gr2;

rep 2 wfifo=[ar4++],ftw,wtw;

rep N data =[ar0++gr0] with vsum ,activate data,afifo;

.endrepeat;

rep N [ar6++gr6]=afifo;
Функции
void	vec_ClipMulNDNW2_AddVr (nmreg nb1, nmreg sb, nmreg f1cr, nmreg vr, nmreg ar0, nmreg gr0, nmreg ar1, nmreg gr1, nmreg ar4, nmreg gr4, nmreg gr5, nmreg ar6, nmreg gr6)
nb1	задает разбиение на колонки
sb	задает разбиение на 2 строки (sb=2)
f1cr	задает функцию активации
vr	константа для суммирования
ar0	задает базовый адрес для входных массивов (как правило адрес первого массива)
gr0	шаг чтения входного масиива stride for input arrays
ar1	массив адресных смещений входных массивов относительно ar0
gr1	количество массив - K
ar4	массив из K матриц весовых коэффициентов по 2 64р. слов
gr4	дублирует nb1
gr5	Высота матриц N = [0,1,2...31,32,33,...]
ar6	указатель на результирующий столбец
gr6	межстрочный шаг для ar6