VHDL_CNN🚀

Update

本项目的扩展基于HLS实现的代码
已经开源在cnn_hls文件夹下

Introduction

1、本项目是基于VHDL的卷积神经网络的RTL设计，所有的模块实现均采用手工设计
2、我们验证了设计的时序的准确性，包括使用软件仿真与硬件仿真的方法
3、我们加上了摄像头捕获数据与屏幕显示的数据流
4、我们仿真的前向传播延时约为100000，具体可参考我们的报告：report.docx

Requirements

1、simulation requirements

Quartus (Quartus Prime 18.0) Standard Edition + ModelSim - Intel FPGA Starter Edition 10.5b (Quartus Prime 18.0)

2、hardware requirements

ov7725 + EP4CE10F17C8 + Seven-inch RGB display

Usage

1、BNN模型的训练

如果BNN模型的训练出现问题，请参考：https://github.com/itayhubara/BinaryNet.pytorch

cd Pytorch_Bnn
python main_binary.py --model alexnet_binary --epochs 150

2、硬件文件配置

(1) 开发环境为：Quartus (Quartus Prime 18.0) Standard Edition + ModelSim - Intel FPGA Starter Edition 10.5b (Quartus Prime 18.0)
(2) 硬件配置为：ov7725 + EP4CE10F17C8 + Seven-inch RGB display
(3) 顶层文件的设置在：./top/top.vhd
(4) 仿真文件的设置在: ./simulation/modelsim 其中两个work分别代表时序仿真和逻辑仿真
(5) CNN模块的设置在: ./rtl_cnn/
其中

cnn.vhd:整体模块的设置
top_control.chd:控制器部分
conv_maxpooling.vhd:卷积与池化部分的计算单元  
full_connect.vhd:全连接层部分
ram_piexl.vhd:像素读取部分
rom_weight.vhd:权重读取部分

(6) 摄像头与屏幕的数据流在./cmos_lcd_pll_sdram
(7) 所定义的RAM与ROM在./a

3、代码使用

使用Quartus Prime 18.0打开项目，将./top/top.vhd设置为顶层文件，编译，然后烧录即可

4、硬件资源耗用

如图所示：

使用的LUT为6670，9bit专用乘法器为4个。

效果示意图

FAQ

项目扩展

上面的项目是基于纯手写的VHDL完成对CNN的设计，实际上基于HLS的高层次设计能在开发过程中实现更快的速度
将上面的网络用HLS进行实现，高层次综合的结果如下：

使用的LUT为8707，DSP为8个

1、整体设计

设计环境

Vitis HLS 2023

整体上的设计采用了乒乓buffer的形式，以粗粒度流水线的方式进行加速
在卷积层、池化层、权重读取、输入读取、输出写入等模块采用了部分展开进行流水线加速
卷积加速器：采用的是input_channel=4,output_channel=4,kernel_size=3,input_feature_size=36的加速模块并进行复用(乒乓buffer)

2、文件说明

cnn.cpp:整体模型的调用，配置层之间的数据流
conv2d.cpp:可复用的Conv2D的配置
AvgPooling2d.cpp:可复用的平均池化层的配置
GlobalAvgPooling2d.cpp:可复用的全局平均池化层的配置
Linear.cpp:可复用的全连接层的配置
layer_super_parm.h:层参数的定义

3、使用方法

(1)Conv2D

void Conv2d(ap_uint<8>*In_ddr,ap_uint<8>*W_ddr,ap_uint<8>* Out_ddr,
		int Chin,int Chou,int Insize,int Outsize,ap_uint<8> In_0[4][36][36],ap_uint<8> W_0[4][4][K][K],
		ap_uint<8> In_1[4][36][36],ap_uint<8> W_1[4][4][K][K],
		ap_uint<8> Out[4][34][34]);

参数说明：
In_ddr:ap_uint<8>* 输入地址，读入8bit输入
W_ddr:ap_uint<8>* 权重地址，读入8bit权重
Out_ddr:ap_uint<8>* 输出地址，写入8bit输出
Chin:int 输入通道数
Chou:int 输出通道数
Insize:int 输入特征大小
Outsize:int 输出特征大小
In_0,In_1:ap_uint<8>[4][36][36] 输入特征数组，静态变量
W_0,W_1:ap_uint<8>[4][4][K][K] 输入权重数组，静态变量
Out:ap_uint<8>[4][34][34] 输出数组，静态变量
(2)AvgPooling2d

void AvgPooling2d(ap_uint<8>*In_ddr,ap_uint<8>* Out_ddr,
		int Chin,int Chou,int Insize,int Outsize,ap_uint<8> In_0[4][36][36],
		ap_uint<8> In_1[4][36][36],ap_uint<8> Out[4][34][34]);

(3)GlobalAvgPooling2d

void GlobalAvgPooling2d(ap_uint<8>*In_ddr,ap_uint<8>* Out_ddr,
		int Chin,int Chou,int Insize,int Outsize,ap_uint<8> In_0[4][36][36],
		ap_uint<8> In_1[4][36][36],ap_uint<8> Out[4][34][34]);

(4)Linear

void Linear(ap_uint<8>*In_ddr,ap_uint<8>*W_ddr,ap_uint<8>* Out_ddr );

延时测试

由于还未进行仿真，因此使用HLS设计得到的各层延时的和作为总的延时，各层延时的测试如下
(1)Conv2d(1,4,kernelsize=3) cycles=4636
(2)Conv2d(4,4,kernelsize=3) cycles=8902
(3)AvgPooling2d(kernelsize=2) cycles=5145
(4)Conv2d(4,8,kernelsize=3) cycles=3985
(5)Conv2d(8,8,kernelsize=3) cycles=1917
(6)AvgPooling2d(kernelsize=2) cycles=1185
(7)Conv2d(8,16,kernelsize=3) cycles=637
(8)GlobalAvgPooling2d+Linear cycles=319

整体上的延时比纯RTL设计的要少，主要得益于乒乓buffer和部分展开的高效并行计算

代码位置

开源代码在点击跳往HLS代码

Contact us

kangliwang@stu.pku.edu.cn

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
Pytorch_Bnn		Pytorch_Bnn
a		a
cmos_lcd_pll_sdram		cmos_lcd_pll_sdram
cnn_hls		cnn_hls
db		db
greybox_tmp		greybox_tmp
incremental_db		incremental_db
output_files		output_files
rtl_cnn		rtl_cnn
simulation/modelsim		simulation/modelsim
top		top
LICENSE		LICENSE
README.md		README.md
report.docx		report.docx

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VHDL_CNN🚀

Update

Introduction

Requirements

Usage

1、BNN模型的训练

2、硬件文件配置

3、代码使用

4、硬件资源耗用

效果示意图

FAQ

项目扩展

1、整体设计

2、文件说明

3、使用方法

延时测试

代码位置

Contact us

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

VHDL_CNN🚀

Update

Introduction

Requirements

Usage

1、BNN模型的训练

2、硬件文件配置

3、代码使用

4、硬件资源耗用

效果示意图

FAQ

项目扩展

1、整体设计

2、文件说明

3、使用方法

延时测试

代码位置

Contact us

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages