超腾开源博客 - 第13页 | 了解网站最新动态,分享最新技术

本文介绍了使用Ollama实现工具调用的原理,并以qwen3模型为例,用Python进行了最简单的实现演示。文章首先说明了如何安装Ollama并启动qwen3模型,然后详细展示了工具调用的完整流程:发送包含工具定义的对话请求、模型返回tool_calls要求调用工具、将工具返回结果与聊天历史再次发送给模型,最终获得自然语言回答。通过一个查询北京天气的实例,Python源码清晰展示了两次API调用的交互过程,帮助读者理解MCP工具调用的基本原理。
620
0
创建于2025年5月4日
在Windows上使用PyTorch训练模型时,任务管理器显示的GPU占用率较低是正常现象,因为PyTorch主要使用CUDA核心,而未调用3D、视频解码等功能。建议使用nvidia-smi dmon命令查看真实的GPU利用率,重点观察sm(流处理器利用率)和mem(显存带宽利用率)两项指标。若GPU占用率确实偏低,可通过在DataLoader中设置num_workers和pin_memory参数来提升。注意Windows下需将训练函数放在if __name__ == "__main__"中,且num_workers不宜过大,建议从2开始逐步增加,确保nvidia-smi中GPU利用率达到90%以上,同时调整batch_size使显存占用率也在90%左右。
341
0
创建于2025年5月2日
本文介绍了生成对抗网络(GAN)的核心原理及其两种主流变体DCGAN和WGAN-GP,并展示了如何使用CelebA数据集生成逼真人脸图像。DCGAN通过卷积层替代全连接层提升了训练稳定性与生成质量,但存在振荡和模式崩溃风险;WGAN-GP采用Wasserstein损失与梯度惩罚,训练更稳定、生成图像更清晰自然。文章提供了完整的PyTorch代码实现、损失曲线分析和实践建议,强调WGAN-GP在图像质量和稳定性上优于DCGAN,适合用于图像生成、风格迁移等任务。
290
0
创建于2025年5月2日
本文介绍了PyTorch torchaudio库内置的多种音频数据集及其应用场景。文章详细列举了语音识别与合成(如LIBRISPEECH、COMMONVOICE、LJSPEECH)、语音命令与理解(如SPEECHCOMMANDS)、说话人与情感识别(如VoxCeleb1、IEMOCAP)、语音分离与增强(如LibriMix、MUSDB_HQ)、发音与语音障碍、音乐信息检索等领域的常用数据集。作者指出,这些数据集覆盖了语音处理的主要方向,从基础任务到高级研究均有涉及,方便研究人员和开发者根据具体需求选择使用。文章还提供了LJSPEECH的加载示例,强调通过torchaudio可轻松下载和调用这些数据集。
262
0
创建于2025年5月1日
torchtext 0.18.0 内置了丰富的数据集,覆盖文本分类、语言建模、机器翻译、序列标注、问答系统和无监督学习等NLP主要任务。文章分类介绍了AG_NEWS、IMDb、SQuAD、WikiText等常用数据集及其用途,并展示了使用Python加载IMDb数据的简单示例。这些数据集接口标准化,用户无需手动下载预处理,极大降低了NLP研究入门门槛并确保实验可复现性。
228
0
创建于2025年5月1日