超腾开源博客 - 第15页 | 了解网站最新动态，分享最新技术

PyTorch损失函数全解析：从回归到分类，选对Loss让模型训练事半功倍人工智能

本文介绍了PyTorch中常用的损失函数，按任务类型分类讲解。回归任务包括MSELoss（均方误差）、L1Loss（平均绝对误差）、SmoothL1Loss和HuberLoss；分类任务涵盖CrossEntropyLoss（交叉熵）、BCEWithLogitsLoss（推荐用于二分类）、NLLLoss及KLDivLoss等；特殊任务如CTCLoss用于序列对齐，TripletMarginLoss用于度量学习。文章还给出了任务与损失函数的匹配建议，并提醒注意输入张量形状、是否内置softmax以及正负样本平衡问题。

265

创建于2025年3月12日

PyTorch激活函数全攻略：从ReLU到GELU，一文看懂如何选型与使用人工智能

本文介绍了PyTorch中常用的激活函数及其功能，强调激活函数为神经网络引入非线性，使其能学习复杂模式。文章详细说明了ReLU、Sigmoid、Tanh、LeakyReLU、PReLU、ELU、GELU、SiLU、Mish等函数的公式、特点与使用示例，并介绍了概率激活函数如Softmax和其余辅助函数。最后提供了场景选择建议，如隐藏层通用推荐ReLU，分类输出用Sigmoid或Softmax，并建议从ReLU开始尝试，遇到问题再转向LeakyReLU或ELU。

210

创建于2025年3月12日

PyTorch神经网络层全攻略：从线性层到Transformer，一文掌握torch.nn核心组件人工智能

本文系统介绍了PyTorch中torch.nn模块的常用层类型及其功能，包括容器（Sequential等）、线性层、卷积层、池化层、正则化层、Dropout层、循环层（LSTM等）、Transformer层、稀疏层（Embedding）和视觉层，并通过代码示例展示了各层的使用方法。文章强调，理解这些层是构建神经网络的基础，最后通过一个完整的CNN分类网络示例综合演示了多种层的配合使用，并建议查阅官方文档获取更详细的信息。

247

创建于2025年3月12日

手把手教你用PyTorch实现GAN：从零生成动漫人物头像的完整教程人工智能

本文介绍了生成对抗网络（GAN）的基本原理，并使用PyTorch实现了一个用于生成动漫人物头像的完整模型。文章详细讲解了GAN的生成器和判别器结构，通过两者相互博弈的训练方式，生成器能生成逼真的图像。作者提供了数据集准备、模型定义、训练代码及图像生成代码，并使用了标签平滑、训练技巧等优化方法。训练100个epoch后，模型可生成发色、表情多样的动漫头像。文章还给出了提升生成质量的优化建议，适合初学者实践GAN项目。

295

创建于2025年3月10日

PyTorch实战：三种神经网络模型对决IMDB电影评论情感分类，LSTM以88.76%准确率夺冠人工智能

本文使用PyTorch实现IMDB电影评论情感分析二分类任务，比较了LSTM、CNN和Transformer三种神经网络模型。介绍了数据加载、构建词表、Dataset类和批处理填充的完整流程。实验结果表明，双向LSTM表现最佳，10个epoch时测试准确率达88.93%；CNN训练速度快且不易过拟合，5个epoch达86.68%准确率；Transformer因数据集规模有限表现中等。使用GloVe预训练词向量可提升LSTM性能至88.76%。文章还提供了模型代码实现、训练流程和优化建议，完整代码可在GPU环境下10-20分钟完成训练。

236

创建于2025年2月9日

XMind用户必看！这个无限画布的最后一个版本你还留着吗？

GeoScene Portal 4.1 Guava安全漏洞修复指南-CVE-2023-2976竞争条件漏洞解决方案

百度地图开发指南：WebGL三维地图与API使用教程

国产麒麟V10上从零编译PostgreSQL 16.6：ARM架构信创环境实战指南

GeoScene安全漏洞修复指南：SnakeYAML、Guava、Netty漏洞解决方案

ArcGIS Server 10.x出现498 Invalid token错误解决方法

超图iServer WMTS服务突破18级限制：自定义接口实现高精度瓦片加载

ArcGIS转GDB导入超图后空间查询失效？一个复制操作轻松修复

XWiki只允许本机访问：Jetty绑定127.0.0.1配置方法

Claude Mythos Preview称霸AI编程榜：16项全冠，昂贵且危险的性能怪兽

Nuxt 4中html lang死活改不成zh-CN？两个坑不要踩，正确解法在这里

手握9折优惠码！ToDesk专业版最新折扣攻略，解锁极致远程办公体验

10万级管线数据卡顿？这份ArcGIS Server性能优化全攻略必须收藏

Three.js卷积法大显身手！告别断裂，轻松实现平滑3D物体描边效果

告别卡顿！Three.js百万面模型用GPU秒速拾取物体并计算交点