3. 自监督学习增强方法
- SimCLR 风格的增强:包括一系列的随机裁剪、翻转、颜色抖动和模糊等操作,用于自监督学习。
- BYOL 和 MoCo 等方法的增强:这些方法通过多视角增强生成不同的图像视图,以进行对比学习。
文章作者: Hongwei Zhao
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Hongwei Zhao's Blog!
相关推荐

2025-11-16
高级数据增强
高级数据增强方法 Cutout:在图像上随机遮挡一个矩形区域。 Mixup:将两张图像按照一定比例进行线性混合,同时混合对应的标签。 CutMix:将一张图像的矩形区域剪切并粘贴到另一张图像上,同时混合标签。 Random Erasing:在图像中随机擦除一个区域。 TransMix: TransMix 是一种用于增强 Vision Transformer (ViT) 模型的高级数据增强方法。它结合了 Mixup 和 CutMix 的思想,并应用于 Transformer 的 attention 机制上。 Mixup 和 CutMix12345678910111213141516171...

2025-11-16
imgaug
imgaug 简介和安装imgaug 简介imgaug是计算机视觉任务中常用的一个数据增强的包,相比于torchvision.transforms,它提供了更多的数据增强方法,因此在各种竞赛中,人们广泛使用imgaug来对数据进行增强操作。 Github 地址:imgaug Readthedocs:imgaug 官方提供 notebook 例程:notebook imgaug 的安装imgaug 的安装方法和其他的 Python 包类似,我们可以通过以下两种方式进行安装 conda12conda config --add channels conda-forgeconda insta...

2025-11-16
基础数据增强
-使用 PyTorch 和 Albumentations 进行数据增强与损失函数 1. 基础数据增强方法 随机裁剪(Random Crop):从图像中随机裁剪一个子区域并调整大小。 随机水平翻转(Random Horizontal Flip):以一定的概率水平翻转图像。 随机旋转(Random Rotation):以一定的角度范围随机旋转图像。 颜色抖动(Color Jitter):随机改变图像的亮度、对比度、饱和度和色调。 归一化(Normalization):将图像像素值归一化到一定范围内。 基础数据增强12345678910import torchvision.transfo...

2025-11-16
数据增强概述
数据增强(Data augmentation)大部分的计算机视觉任务使用很多的数据,所以数据扩充是经常使用的一种技巧来提高计算机视觉系统的表现。我认为计算机视觉是一个相当复杂的工作,你需要输入图像的像素值,然后弄清楚图片中有什么,似乎你需要学习一个复杂方程来做这件事。在实践中,更多的数据对大多数计算机视觉任务都有所帮助,不像其他领域,有时候得到充足的数据,但是效果并不怎么样。但是,当下在计算机视觉方面,计算机视觉的主要问题是没有办法得到充足的数据。对大多数机器学习应用,这不是问题,但是对计算机视觉,数据就远远不够。所以这就意味着当你训练计算机视觉模型的时候,数据扩充会有所帮助,这是可行的...

2025-11-16
model
model.eval()pytorch中model.eval()会对哪些函数有影响? pytorch中model.eval()会对哪些函数有影响? 答:将BN和dropout这些训练和测试时行为不同的层切换到test mode。 Dropout训练和推理时的差异众所周知,dropout是训练的时候将某层的神经元输出以 $p$(如10%)的概率随机置为零,以减缓过拟合。那么测试时呢? 为了保证测试时每次推理的一致性,肯定是不能再随机让神经失活了,那什么都不做,让所有神经元都按正常输出值原样输出可以嘛? 从训练和测试时的输出值尺度一致性来看,答案显然是否定的。设每个神经元原始输出的绝对值均...

2025-11-16
timm概述
概述PyTorchImageModels,简称 timm,是一个巨大的 PyTorch 代码集合,包括了一系列: image models layers utilities optimizers schedulers data-loaders / augmentations training / validation scripts 旨在将各种 SOTA 模型整合在一起,并具有复现 ImageNet 训练结果的能力。虽然模型架构是 timm 的重点,但它还包括许多数据增强 (data augmentations)、正则化技术 (regularization tec...
公告
欢迎来到我的博客!这里分享 AI、机器学习和数学。