nmpp
Функции

Функции

void vec_ClipMulNDNW2_AddVr (nmreg nb1, nmreg sb, nmreg f1cr, nmreg vr, nmreg ar0, nmreg gr0, nmreg ar1, nmreg gr1, nmreg ar4, nmreg gr4, nmreg gr5, nmreg ar6, nmreg gr6)
 

Подробное описание

\~
 \~russian Взвешенное умножение нескольких массивов с накоплением и активацей 
 \~english Weighted multiplication of several arrays with accumulation and activation 

\~
 \~russian Ядро функции SIG_Filter(). 
 \~english nmppsFilter_() function core. 
\~

Действие функции эквивалентно следующим псевдоинструкциям:

ar2=ar0;
gr2=[ar1++];
ar0=ar2+gr2;
rep 2 wfifo=[ar4++],ftw,wtw;
rep N data =[ar0++gr0] with vsum ,activate data,vr;
.repeat K-1;
gr2=[ar1++];
ar0=ar2+gr2;
rep 2 wfifo=[ar4++],ftw,wtw;
rep N data =[ar0++gr0] with vsum ,activate data,afifo;
.endrepeat;
rep N [ar6++gr6]=afifo;
Аргументы
nb1
задает разбиение на колонки
sb
задает разбиение на 2 строки (sb=2)
f1crзадает функцию активации
vrконстанта для суммирования
ar0задает базовый адрес для входных массивов (как правило адрес первого массива)
gr0шаг чтения входного масиива stride for input arrays
ar1
массив адресных смещений входных массивов относительно ar0
gr1количество массив - K
ar4
массив из K матриц весовых коэффициентов по 2 64р. слов
gr4
дублирует nb1
gr5
Высота матриц N = [0,1,2...31,32,33,...]
ar6
указатель на результирующий столбец
gr6межстрочный шаг для ar6


Restrictions: <br>
При выходе из функции изменяется содержимое регистров: ar0,ar1,gr1,ar2,gr2,ar3,gr3,ar4,ar6,gr7.