0% found this document useful (0 votes)

6 views4 pages

Cuda4 1

The document contains a CUDA C program that performs vector addition of two arrays A and B, storing the result in array C. It allocates memory on the GPU, copies the input arrays to the device, executes the vector addition kernel, and retrieves the result back to the host. Finally, it prints the resulting vector and frees the allocated GPU memory.

Uploaded by

tryhackkme123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

6 views4 pages

Cuda4 1

Uploaded by

tryhackkme123

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

// vector_add.

#include <stdio.h>

global void vecAdd(float A, float B, float *C, int N) {

int i = blockIdx.x * blockDim.x + threadIdx.x;

if (i < N)

C[i] = A[i] + B[i];

int main() {

int N = 5;
size_t size = N * sizeof(float);

float A[] = {1, 2, 3, 4, 5};

float B[] = {10, 20, 30, 40, 50};

float C[5];

float d_A, d_B, *d_C;

cudaMalloc(&d_A, size);

cudaMalloc(&d_B, size);

cudaMalloc(&d_C, size);

cudaMemcpy(d_A, A, size, cudaMemcpyHostToDevice);

cudaMemcpy(d_B, B, size, cudaMemcpyHostToDevice);

vecAdd<<<1, N>>>(d_A, d_B, d_C, N);

cudaMemcpy(C, d_C, size, cudaMemcpyDeviceToHost);

printf("Result Vector C:\n");

for (int i = 0; i < N; i++)

printf("%f ", C[i]);

printf("\n");
cudaFree(d_A);

cudaFree(d_B);

cudaFree(d_C);

return 0;

CUDA Additionof2Vector
No ratings yet
CUDA Additionof2Vector
2 pages
Cuda 4.1
No ratings yet
Cuda 4.1
2 pages
Google Colab Solution Activity
No ratings yet
Google Colab Solution Activity
5 pages
Cuda Add Mult
No ratings yet
Cuda Add Mult
3 pages
Cuda
No ratings yet
Cuda
4 pages
Addition Cuda
No ratings yet
Addition Cuda
2 pages
TP1: Converting Vector Addition To CUDA.: Listing 1 An Example of Vector Addition Implemented in C
No ratings yet
TP1: Converting Vector Addition To CUDA.: Listing 1 An Example of Vector Addition Implemented in C
1 page
Vector Addition
No ratings yet
Vector Addition
3 pages
Cuda Firstprograms PDF
No ratings yet
Cuda Firstprograms PDF
6 pages
Rishi
No ratings yet
Rishi
30 pages
Group A Assignment 4 (A) : Two Large Vectors
No ratings yet
Group A Assignment 4 (A) : Two Large Vectors
5 pages
CUDA
No ratings yet
CUDA
3 pages
Moving To Parallel - Addition of 2 Matrices
No ratings yet
Moving To Parallel - Addition of 2 Matrices
14 pages
Input: Output: 1. Sub String Program
No ratings yet
Input: Output: 1. Sub String Program
8 pages
Cuda4 2
No ratings yet
Cuda4 2
4 pages
LP 1,,1
No ratings yet
LP 1,,1
5 pages
p4 Multiply
No ratings yet
p4 Multiply
2 pages
周03
No ratings yet
周03
65 pages
Parallel Scan in C CUda
No ratings yet
Parallel Scan in C CUda
3 pages
Department of Computer Engineering BE Laboratory Practice-I A.Y 2021-22 SEM1
No ratings yet
Department of Computer Engineering BE Laboratory Practice-I A.Y 2021-22 SEM1
45 pages
Mulmatrix Cu
No ratings yet
Mulmatrix Cu
3 pages
217 Lec2
No ratings yet
217 Lec2
24 pages
5 Computation
No ratings yet
5 Computation
13 pages
CUDA Programming for Developers
No ratings yet
CUDA Programming for Developers
42 pages
3 Cuda
No ratings yet
3 Cuda
5 pages
2023 CSC14120 Lecture01 CUDAIntroduction
No ratings yet
2023 CSC14120 Lecture01 CUDAIntroduction
32 pages
What Is The Output of This Program
No ratings yet
What Is The Output of This Program
2 pages
PDC Assignment
No ratings yet
PDC Assignment
9 pages
BECOA157 Parallel Matrix Multiplication
No ratings yet
BECOA157 Parallel Matrix Multiplication
3 pages
CUDA Practical's
No ratings yet
CUDA Practical's
38 pages
CUDA Class Lecture03
No ratings yet
CUDA Class Lecture03
18 pages
Source Code
No ratings yet
Source Code
7 pages
CUDA Programming Invert
No ratings yet
CUDA Programming Invert
36 pages
CUDA - Part 1 LMS
No ratings yet
CUDA - Part 1 LMS
51 pages
GPU Series III CUDA Compilation Host Side 1721302802
No ratings yet
GPU Series III CUDA Compilation Host Side 1721302802
8 pages
HPC Int2 Key
No ratings yet
HPC Int2 Key
10 pages
01 Cuda C Basics
No ratings yet
01 Cuda C Basics
32 pages
Cuda C/C++ Basics: NVIDIA Corporation
No ratings yet
Cuda C/C++ Basics: NVIDIA Corporation
67 pages
CUDA Exercises
No ratings yet
CUDA Exercises
185 pages
L06 GPGPU CUDA Programming 1
No ratings yet
L06 GPGPU CUDA Programming 1
23 pages
Hetero Lecture Slides 002 Lecture 1 Lecture-1-5-Cuda-API
No ratings yet
Hetero Lecture Slides 002 Lecture 1 Lecture-1-5-Cuda-API
11 pages
Introduction To CUDA: CAP 4730 Spring 2012
No ratings yet
Introduction To CUDA: CAP 4730 Spring 2012
35 pages
CUDA Matrix Multiplication Quiz
No ratings yet
CUDA Matrix Multiplication Quiz
12 pages
Lab7 GPU
No ratings yet
Lab7 GPU
10 pages
Vulkan Shader Conversion Guide
No ratings yet
Vulkan Shader Conversion Guide
30 pages
Vulkan and OpenGL Shader Code
No ratings yet
Vulkan and OpenGL Shader Code
7 pages
2023 CSC14120 Lecture05 CUDAMemories
No ratings yet
2023 CSC14120 Lecture05 CUDAMemories
48 pages
Advanced Vector Algorithms
No ratings yet
Advanced Vector Algorithms
1 page
Writing Parallel Algorithms For Parallel Vector Addition
No ratings yet
Writing Parallel Algorithms For Parallel Vector Addition
1 page
CUDA Lab Guide for Students
No ratings yet
CUDA Lab Guide for Students
19 pages
PC Cuda Assignment-2
No ratings yet
PC Cuda Assignment-2
29 pages
CUDA Part-1
No ratings yet
CUDA Part-1
52 pages
Introduccion CUDA C
No ratings yet
Introduccion CUDA C
51 pages
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
No ratings yet
3 Some Commonly Used CUDA API: 3.1 Function Type Qualifiers
7 pages
Intro To CUDA
No ratings yet
Intro To CUDA
76 pages
BCS3413 Principle & Applications of Parallel Programming Quiz 2: Gpgpu Cuda
No ratings yet
BCS3413 Principle & Applications of Parallel Programming Quiz 2: Gpgpu Cuda
3 pages
OpenAcc Assignment Questions
No ratings yet
OpenAcc Assignment Questions
11 pages
Allocate The Device Memory Where We Will Copy M
No ratings yet
Allocate The Device Memory Where We Will Copy M
2 pages

Cuda4 1

Uploaded by

Cuda4 1

Uploaded by

// vector_add.

__global__ void vecAdd(float *A, float *B, float *C, int N) {

int i = blockIdx.x * blockDim.x + threadIdx.x;

C[i] = A[i] + B[i];

float A[] = {1, 2, 3, 4, 5};

float B[] = {10, 20, 30, 40, 50};

float *d_A, *d_B, *d_C;

cudaMemcpy(d_A, A, size, cudaMemcpyHostToDevice);

vecAdd<<<1, N>>>(d_A, d_B, d_C, N);

cudaMemcpy(C, d_C, size, cudaMemcpyDeviceToHost);

printf("Result Vector C:\n");

for (int i = 0; i < N; i++)

printf("%f ", C[i]);

You might also like

global void vecAdd(float A, float B, float *C, int N) {

float d_A, d_B, *d_C;