Signed-off-by: James Almer <jamrial@gmail.com>tags/n2.4
@@ -69,10 +69,8 @@ cglobal idet_filter_line, 4, 5, 0, a, b, c, width, index | |||||
CMP widthd, indexd | CMP widthd, indexd | ||||
jg .loop | jg .loop | ||||
mova m0, m_sum | |||||
psrlq m_sum, 0x20 | |||||
paddd m0, m_sum | |||||
movd eax, m0 | |||||
HADDD m_sum, m0 | |||||
movd eax, m_sum | |||||
RET | RET | ||||
%endmacro | %endmacro | ||||
@@ -123,18 +121,7 @@ cglobal idet_filter_line_16bit, 4, 5, 8, a, b, c, width, index | |||||
paddd m_sum, m5 | paddd m_sum, m5 | ||||
jl .loop_16bit | jl .loop_16bit | ||||
mova m2, m_sum | |||||
%if mmsize == 16 | |||||
psrldq m2, 4 | |||||
paddd m_sum, m2 | |||||
psrldq m2, 4 | |||||
paddd m_sum, m2 | |||||
psrldq m2, 4 | |||||
paddd m_sum, m2 | |||||
%else | |||||
psrlq m2, 32 | |||||
paddd m_sum, m2 | |||||
%endif | |||||
HADDD m_sum, m2 | |||||
movd eax, m_sum | movd eax, m_sum | ||||
RET | RET | ||||
%endmacro | %endmacro | ||||