本文介绍: 本文介绍了Depthwise Convolution 的Int8算子移动端CPU上的性能优化方案。ARM架构升级和相应指令集的更新不断提高移动端各算子性能上限,结合数据重排和Sdot指令能给DepthwiseConv量化算子性能带来较大提升。背景MNN对ConvolutionDepthwise Int8量化算子在ARM V8(64位)和ARM V8.2上的性能做了较大的优化,主要优化方法包…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注