超腾开源博客 - 第15页 | 了解网站最新动态,分享最新技术

本文介绍了PyTorch中常用的损失函数,按任务类型分类讲解。回归任务包括MSELoss(均方误差)、L1Loss(平均绝对误差)、SmoothL1Loss和HuberLoss;分类任务涵盖CrossEntropyLoss(交叉熵)、BCEWithLogitsLoss(推荐用于二分类)、NLLLoss及KLDivLoss等;特殊任务如CTCLoss用于序列对齐,TripletMarginLoss用于度量学习。文章还给出了任务与损失函数的匹配建议,并提醒注意输入张量形状、是否内置softmax以及正负样本平衡问题。
265
0
创建于2025年3月12日
本文介绍了PyTorch中常用的激活函数及其功能,强调激活函数为神经网络引入非线性,使其能学习复杂模式。文章详细说明了ReLU、Sigmoid、Tanh、LeakyReLU、PReLU、ELU、GELU、SiLU、Mish等函数的公式、特点与使用示例,并介绍了概率激活函数如Softmax和其余辅助函数。最后提供了场景选择建议,如隐藏层通用推荐ReLU,分类输出用Sigmoid或Softmax,并建议从ReLU开始尝试,遇到问题再转向LeakyReLU或ELU。
210
0
创建于2025年3月12日
本文系统介绍了PyTorch中torch.nn模块的常用层类型及其功能,包括容器(Sequential等)、线性层、卷积层、池化层、正则化层、Dropout层、循环层(LSTM等)、Transformer层、稀疏层(Embedding)和视觉层,并通过代码示例展示了各层的使用方法。文章强调,理解这些层是构建神经网络的基础,最后通过一个完整的CNN分类网络示例综合演示了多种层的配合使用,并建议查阅官方文档获取更详细的信息。
247
0
创建于2025年3月12日
本文介绍了生成对抗网络(GAN)的基本原理,并使用PyTorch实现了一个用于生成动漫人物头像的完整模型。文章详细讲解了GAN的生成器和判别器结构,通过两者相互博弈的训练方式,生成器能生成逼真的图像。作者提供了数据集准备、模型定义、训练代码及图像生成代码,并使用了标签平滑、训练技巧等优化方法。训练100个epoch后,模型可生成发色、表情多样的动漫头像。文章还给出了提升生成质量的优化建议,适合初学者实践GAN项目。
295
0
创建于2025年3月10日
本文使用PyTorch实现IMDB电影评论情感分析二分类任务,比较了LSTM、CNN和Transformer三种神经网络模型。介绍了数据加载、构建词表、Dataset类和批处理填充的完整流程。实验结果表明,双向LSTM表现最佳,10个epoch时测试准确率达88.93%;CNN训练速度快且不易过拟合,5个epoch达86.68%准确率;Transformer因数据集规模有限表现中等。使用GloVe预训练词向量可提升LSTM性能至88.76%。文章还提供了模型代码实现、训练流程和优化建议,完整代码可在GPU环境下10-20分钟完成训练。
236
0
创建于2025年2月9日