超腾开源博客 - 第14页 | 了解网站最新动态,分享最新技术

这篇文章全面介绍了PyTorch中torchvision库内置的数据集,涵盖了图像分类(如MNIST、CIFAR、ImageNet)、检测与分割(如COCO、Cityscapes)、光流、立体匹配、视频分类等多个计算机视觉任务领域。文章通过表格详细列出了各数据集的规模、用途和特点,并提供了简单加载示例。核心观点是,torchvision内置的丰富数据集为研究人员和开发者提供了极大便利,支持从入门实验到工业级应用的快速原型验证和算法对比。
277
0
创建于2025年5月1日
PyTorch拥有庞大活跃的开源生态系统,覆盖从计算机视觉、自然语言处理到强化学习、医学影像等多个AI领域。文章整理了PyTorch Landscape中收录的优秀项目,包括三维视觉(PyTorch3D)、CV(torchvision、Detectron2)、NLP(Transformers、Flair)、强化学习(torchrl)、多模态(NeMo、Diffusers)等模型相关项目,以及编译器(ONNX Runtime)、分布式训练(DeepSpeed)、通用工具(einops)、训练框架(PyTorch Lightning)、超参数优化(Optuna)、隐私安全(Opacus)、图神经网络(PyTorch Geometric)等优化与训练工具。生态丰富多元,用户可根据需求找到合适的开源工具。
285
0
创建于2025年4月28日
XMind是一款功能全面的思维导图软件,最新版本限制了只能创建3个画布,而提供无限画布功能的最后一个版本是2024年6月发布的24.04.10311。用户可通过下载该历史版本,登录后在首选项中关闭自动更新来保持无限画布功能。文章还列出了几个历史版本,如23.11.04336和24.04.10291,均不限制画布数量,而24.09.13001及之后版本则受限。
551
0
创建于2025年4月26日
这篇文章详细讲解了使用PyTorch实现四种GAN模型生成MNIST手写数字的完整过程,从最基础的全连接GAN入手,逐步深入到DCGAN、条件GAN和WGAN-GP。文章分别介绍了每种GAN的原理、网络结构、代码实现和结果分析。全连接GAN能生成基本数字轮廓但细节模糊;DCGAN通过卷积层提升图像清晰度;条件GAN加入标签信息实现可控生成;WGAN-GP采用Wasserstein距离和梯度惩罚,训练最稳定。最后总结了技术演进路线,强调数据预处理、标签平滑、卷积架构和WGAN-GP的实用性。
372
0
创建于2025年4月24日
本文介绍了PyTorch中常用的深度学习优化器,包括Adadelta、Adafactor、Adagrad、Adam、AdamW、SGD等。文章分析了每种优化器的特点、优缺点和适用场景。核心观点是:快速试验推荐Adam,追求泛化性能首选带动量的SGD,需要更好正则化效果可选用AdamW。对于稀疏特征任务,Adagrad和SparseAdam更合适;大模型训练中Adafactor可节省内存。文章强调,实际应用中大多数任务从Adam或SGD开始尝试即可,理解各优化器原理有助于高效训练模型。
233
0
创建于2025年3月12日