YouTube视频 我们在训练数据之前,需要先对输入数据进行预处理,其中数据增强就是预处理过程中的一个手段,即通过这样的方式能够使得输入数据成倍的增长。 为什么要做数据增强 因为在深度学习领域,更多的数据能够使得我们的模型更稳健,不太容易发生过拟合的现象,而有些时候我们并不能收集到足够多的原始数据。 什么是数据增强 对于图片来说,数据增强的本质是要对输入图像的像素点的分布、值的大小做一些根本性的变化,但是在变换的同时,需要保证图像的label值是不变的。 数据增强的方式 1、水平翻转 是数据增强过程中的最常用的手段,因为对计算机来说,图片的像素值发生了根本性的变化; 2、随机裁剪/缩放 crops的作用:一张图片被裁剪成很多部分之后放进模型进行训练,可以很好地训练模型,增加模型的稳健性,因为我们在测试的时候会有光照、遮挡等问题的出现,如果没有这些数据的训练,可能模型无法对物体进行正确分类和识别等。 scale:将图片进行放大和缩小。 3、translation:将某个物体进行平移; 4、rotation:进行角度变换; 5、stretch:拉伸; 6、shear:修剪 综上,在实际应用中,这以上部分是一起进行的,让计算机自己去进行一些随机的操作。比如,给定translation的变换幅度在[-10,10],rotation的变换幅度在[-15°,15°]等,让计算机自己在这些范围内随机组合。