├── README.md # 说明文档
├── benchmark.yaml # 配置文件,设置测试模型及模型参数
├── run_all.sh # 执行入口,测试并获取所有生成对抗模型的训练性能
└── run_benchmark.sh # 执行实体,测试单个分割模型的训练性能
- 单机(单卡、8卡)
- 系统:CentOS release 7.5 (Final)
- GPU:Tesla V100-SXM2-32GB * 8
- CPU:Intel(R) Xeon(R) Gold 6271C CPU @ 2.60GHz * 80
- CUDA、cudnn Version: cuda10.2-cudnn7
BasicVSR模型因竞品torch模型只能测4卡,故这里也测4卡。
因REDS数据集较大,避免每次下载时间较长,需要在Docker建立好后,将REDS数据集放到/workspace/data/目录一下。
- 镜像版本:
registry.baidubce.com/paddlepaddle/paddle:2.1.2-gpu-cuda10.2-cudnn7
- paddle 版本:
2.1.2
- CUDA 版本:
10.2
- cuDnn 版本:
7
ImageName="registry.baidubce.com/paddlepaddle/paddle:2.1.2-gpu-cuda10.2-cudnn7"
docker pull ${ImageName}
run_cmd="set -xe;
cd /workspace ;
bash -x benchmark/run_all.sh"
nvidia-docker run --name test_paddlegan -i \
--net=host \
--shm-size=128g \
-v $PWD:/workspace \
${ImageName} /bin/bash -c "${run_cmd}"
如果需要打开profile选项,可以直接替换run_cmd
为:
run_cmd="set -xe;
cd /workspace ;
bash -x benchmark/run_all.sh on"
执行完成后,在PaddleGAN目录会产出模型训练性能数据的文件,比如esrgan_mp_bs32_fp32_8
等文件。