-
#5182 TaskCfgVTT(uuid='d954dca1ec', name='C:/Users/Administrator/Downloads/Stop Procrastinating & Study with me - 30-minute Data Collection - April 19, 2026 - Joseph Imbornone - Joseph I...
💬 1[Last reply:7 minutes ago] 核心原因:你在“阿里百炼 Qwen3-ASR”语音识别渠道下,错误地选择了 tiny 模型(这是 faster-whisper 的模型,不适用于 Qwen3-ASR),同时视频文件名含大量特殊符号(&、,、( 等)和超长路径,导致音频切片生成失败,出现 list index out of range。解决方案:修改 ASR 模型选择:如果坚持使用 阿里百炼 Qwen3-ASR,请将模型下拉...103.151* Posted at: 7 minutes ago -
#5181 TaskCfgVTT(uuid='8703532931', name='C:/Users/Administrator/Desktop/Stop.mp4', dirname='C:/Users/Administrator/Desktop', noextname='Stop', basename='Stop.mp4', ext='mp4', target_dir...
💬 1[Last reply:11 minutes ago] ffprobe 无法读取视频文件 Stop.mp4,导致准备阶段失败。原因是该文件可能损坏、编码格式不兼容,或软件自带的 ffprobe 组件出现问题。解决步骤:检查视频文件:用其他播放器(如 PotPlayer、VLC)尝试播放 Stop.mp4。如果无法播放,说明文件已损坏,需重新获取或转换。切换视频格式:使用格式工厂或 FFmpeg 将视频转码为标准 h.264 编码的 mp4(如 ffmp...103.151* Posted at: 11 minutes ago -
#5180 TaskCfgVTT(uuid='00beedbd80', name='C:/Users/Administrator/Desktop/Stop Procrastinating & Study with me - 30-minute Data Collection - April 19, 2026 - Joseph Imbornone.mp4', dirnam...
💬 1[Last reply:13 minutes ago] ffprobe 返回非零退出码(exit status 1),说明它无法解析该视频文件。直接原因是视频文件名过长且包含过多特殊字符(空格、逗号、句点、连字符等),导致 Windows CMD 路径解析失败或 ffprobe 内部逻辑出错。解决办法:重命名视频文件 将文件名改为简短的全英文字母+数字组合,例如 study.mp4,并确保路径不含中文字符。移动视频到浅层目录 把视频放在盘符根目录下...103.151* Posted at: 13 minutes ago -
#5179 TaskCfgVTT(is_cuda=False, uuid='d13dd46301', cache_folder='/Users/xiaohuo/pyvideotrans-main/tmp/8951/d13dd46301', target_dir='/Users/xiaohuo/Downloads/_video_out/yesujiaochangge-m4...
💬 1[Last reply:3 hours ago] 语音识别阶段报 RuntimeError: Unknow error,通常是由于 faster-whisper 模型加载或运行时环境依赖缺失导致。macOS 源码部署需确保以下依赖完整:缺失系统库:安装 libsndfile(macOS 通过 brew install libsndfile)。Python 包不完整:在项目目录下重新执行 uv sync(如果安装了可选本地渠道,建议 uv sync...219.255* Posted at: 3 hours ago -
#5178 AI语音识别卡在了最后...
💬 1[Last reply:3 hours ago] 语音识别卡在最后阶段,通常是以下几种情况导致进程静默挂起或未能正常结束:显存不足(最常见):Whisper大模型推理时显存耗尽,子进程崩溃但主进程未收到信号,导致永久等待。CUDA 环境配置问题:虽勾选了CUDA加速,实际驱动/库版本不匹配,导致GPU任务启动失败却未正确报错。VAD 参数不合理:最长语音持续秒数 过大或 静音分割持续毫秒 过小,导致某段音频在VAD处死循环。音频文件异常:原始音频...240e:3a3* Posted at: 3 hours ago -
#5177 TaskCfgSTT(is_cuda=False, uuid='db3cb3cd9b', cache_folder='/Users/xiaohuo/pyvideotrans-main/tmp/8951/db3cb3cd9b', target_dir='/Users/xiaohuo/Downloads/pyvideotrans-main/output/reco...
💬 1[Last reply:3 hours ago] 语音识别阶段报 Unknow error,通常由以下三种原因之一导致,按可能性排列:模型下载不完整或路径错误:faster-whisper 的 medium 模型需事先下载到 models/ 目录。请检查 /Users/xiaohuo/pyvideotrans-main/models/ 下是否存在 models--Systran--faster-whisper-medium 文件夹且包含 .bin...219.255* Posted at: 3 hours ago -
#5176 2个问题,1,勾选了分离人声和重新嵌入背景音,但处理完的视频还是只有单独的纯配音,背景音依旧没有,2提取字幕和配音的问题,处理完的视频总是偶尔有几秒是没有声音的,原视频在这是有声音的,不知道是字幕提取有问题,还是配音没配上,这两个问题都让人很头疼,还请问有什么办法解决吗...
💬 1[Last reply:3 hours ago] 问题 1:背景音未嵌入原因:勾选了“分离人声背景声”但未同时勾选“嵌入背景”,或背景音分离/嵌入过程失败。解决步骤:在主界面点击 “设置更多参数”,确认 “嵌入背景” 已勾选,并检查 “背景音量”(建议 0.8-1.0)。如果仍无效,建议使用专业工具(如 UVR5)在 GPU 下分离人声和伴奏,然后手动放入输出目录:将分离出的伴奏文件重命名为 instrument.wav,人声重命名为 vocal...112.49* Posted at: 3 hours ago -
#5175 videotrans.configure.excepts.DubbingSrtError: None...
💬 1[Last reply:4 hours ago] The error DubbingSrtError: None indicates the TTS engine failed without returning a specific error message. This typically happens when a required API key is missing, network request times out, or the...2001:ee0* Posted at: 4 hours ago -
#5174 faster-whisper语音识别时卡住...
💬 1[Last reply:6 hours ago] faster-whisper 卡住通常由模型首次下载阻塞、显存不足或 CUDA 环境未正确配置导致进程挂起。解决方法:首次运行模型下载:首次使用会自动下载模型(约 2~3GB),若网络不稳定或无法连通 Hugging Face 会导致长时间无响应。建议手动下载模型并放置到 models/ 目录,具体方法见下方文档。显存不足:large-v3 模型需至少 8GB 显存。请尝试:切换为 small 或...240e:3a3* Posted at: 6 hours ago -
#5173 语音识别时卡住????...
💬 1[Last reply:7 hours ago] 语音识别卡住通常是由于以下原因之一:首次使用本地模型正在下载:若选择 faster-whisper(本地) 或 openai-whisper(本地),第一次运行需要在线下载模型(如 large-v3 大小约 3 GB),下载过程可能因网络慢而长时间无响应。请打开 logs/ 目录下的最新日志文件,检查是否包含 Downloading model 字样。若确为下载中,请保持网络畅通等待完成,或手动下...240e:3a3* Posted at: 7 hours ago -
#5172 HTTPSConnectionPool(host='edge.microsoft.com', port=443): Max retries exceeded with url: /translate/auth (Caused by ProxyError('Unable to connect to proxy', NewConnectionError('<ur...
💬 1[Last reply:10 hours ago] 这是由于需要访问国际网络(edge.microsoft.com)但未正确配置网络代理所致。解决方法:关闭加密代理格式:检查你使用的VPN或代理工具,确保其工作在HTTP/Socks5混合模式且关闭了PAC脚本或全局加密,让系统/软件能够识别普通HTTP代理。在软件中填写代理地址:在主界面第5行(同步对齐和字幕那一行)的网络代理输入框中,填写你的代理地址,格式如 http://127.0.0.1:7...117.30* Posted at: 10 hours ago -
#5171 HTTPSConnectionPool(host='translate.google.com', port=443): Max retries exceeded with url: /m?sl=zh-cn&tl=en&hl=en&q=%E6%95%8F%E6%84%9F%E6%80%A7,%E5%B0%B1%E8%BF%99%E4%B8%80%E4%B8%A...
💬 1[Last reply:10 hours ago] 原因:大陆网络无法直连 translate.google.com,且当前设置的代理(Proxy)未生效或代理服务未运行,导致连接被拒绝。解决方法:配置代理:在主界面第 5 行“网络代理”输入框中填写有效的代理地址,格式如 http://127.0.0.1:7890(端口号以你实际 VPN/代理软件为准)。切换翻译渠道:若不想使用代理,可将翻译渠道改为无需梯子的 Microsoft 翻译(免费且国内...117.30* Posted at: 10 hours ago -
#5170 No CUDA detected. Check NVIDIA GPU/Drivers. See Help -> CUDA....
💬 1[Last reply:13 hours ago] The error "No CUDA detected" indicates pyVideoTrans cannot find a compatible NVIDIA GPU or CUDA environment. This can occur for three main reasons: no NVIDIA GPU present, outdated or missing NVIDIA dr...24.133* Posted at: 13 hours ago -
#5169 Exception: 字幕中不存在 time/startraw/start_time 任何有效时间戳形式...
💬 1[Last reply:17 hours ago] 该错误出现在使用“自定义语音识别API”渠道时,原因是您的API返回的字幕结果中缺少必要的时间戳字段(如 time、startraw 或 start_time)。解决办法:检查自定义API返回的JSON数据结构,确保每条字幕包含符合SRT格式的time字段(如 "00:00:01,000 --> 00:00:03,000"),或包含startraw/start_time(...2401:e180* Posted at: 17 hours ago -
#5168 AttributeError: 'list' object has no attribute 'strip'...
💬 1[Last reply:17 hours ago] 这是一个明确的 list object has no attribute 'strip' 错误,发生在 自定义语音识别 API(_recognapi.py) 渠道的响应处理过程中。 原因:您的自定义 ASR API 返回的数据格式并不是预期的 SRT 字符串,而是被解析成了 Python list 列表,导致后续处理时无法调用 .strip()。解决方案:检查自定义 API ...2401:e180* Posted at: 17 hours ago -
#5167 TypeError: Session.request() got an unexpected keyword argument 'data_item'...
💬 1[Last reply:17 hours ago] 该错误是由于 _ai302tts.py 文件中调用 requests.post 时错误地传入了不被 requests 库识别的参数 data_item,属于软件内部的代码 bug 或文件不匹配。解决方案确保使用的是 完整版 v4.02(约 2.6GB),而非仅升级补丁包。请从官网重新下载完整压缩包,解压后覆盖原目录。若已使用完整版,请检查 videotrans/tts/_ai302tts.py 第...240e:34c* Posted at: 17 hours ago -
#5166 TaskCfgVTT(uuid='747cad535e', name='E:/AV_restored/AV/YFF/DJE-036.restored.mp4', dirname='E:/AV_restored/AV/YFF', noextname='DJE-036.restored', basename='DJE-036.restored.mp4', ext...
💬 1[Last reply:18 hours ago] 这是一个典型的自定义识别API返回数据格式错误问题。您的API响应缺少必需的 end_time 字段,导致软件无法解析时间轴。解决方案检查API返回的Json格式 请确认您的自定义API对每一条字幕都返回以下结构(必须包含 text、start_time、end_time):[ { "text": "字幕文本", "start...2401:e180* Posted at: 18 hours ago -
#5165 AI硅基流动翻译为什么那么慢?...
💬 1[Last reply:19 hours ago] 硅基流动翻译速度慢通常由以下原因导致:每批字幕行数过大:在 菜单 -> 工具/选项 -> 高级选项 -> 字幕翻译调整 中,将 AI翻译渠道每批字幕行数 调小(例如从 20 改为 5~10),减少单次请求的文本量,可大幅降低响应时间。网络延迟:硅基流动 API 位于中国大陆,如果未配置代理或使用了高延迟代理,会影响请求速度。确保主界面 网络代理 为空(国内直连)或填写正确的代理地...240e:3a3* Posted at: 19 hours ago -
#5164 TaskCfgVTT(uuid='25c753db82', name='D:/aaa/Documents/13425831819605875.mp4', dirname='D:/aaa/Documents', noextname='13425831819605875', basename='13425831819605875.mp4', ext='mp4',...
💬 1[Last reply:19 hours ago] 这是由硬件编码器 h264_nvenc 在合成视频时显存耗尽导致的错误。最后一步使用 NVIDIA NVENC 硬件编码,但编码过程中系统或显存不足,触发了 Cannot allocate memory 错误。解决方案:强制切换为软编码(使用 libx264 软件编码器)打开软件主界面,进入 菜单 -> 工具/选项 -> 高级选项。找到 【视频输出控制】 区域。勾选 强制软编码视频?(...2409:8a70* Posted at: 19 hours ago -
#5163 TaskCfgVTT(uuid='25c753db82', name='D:/aaa/Documents/13425831819605875.mp4', dirname='D:/aaa/Documents', noextname='13425831819605875', basename='13425831819605875.mp4', ext='mp4',...
💬 1[Last reply:19 hours ago] 这是由于微软翻译(Microsoft)API 拒绝了连接,通常是网络不稳定或短时间请求过于频繁导致服务器限流。解决方案:检查网络:确认当前网络可以正常访问微软服务(如 www.bing.com)。降低请求频率:进入 菜单 -> 工具 -> 高级选项 -> 字幕翻译调整,将 传统翻译渠道每批字幕行数 设为 1,并设置 翻译后暂停秒 为 5~10。更换翻译渠道:暂时改用其他免费渠道,...2409:8a70* Posted at: 19 hours ago
Open source and free maintenance is not easy. If this project is helpful to you, please consider making a small donation to help the project continue to maintain and update.
Dondate: ko-fi.com/jianchang512