Addition Cuda

This document provides a CUDA program for adding two large vectors. It includes the kernel function for vector addition and the main function that initializes the vectors, allocates memory on both the host and device, and manages data transfer between them. The program also prints the first 10 results of the addition before freeing allocated memory.

Uploaded by

Vedant Rewagad

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

24 views2 pages

Addition Cuda

Uploaded by

Vedant Rewagad

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 2

Cuda

Write a CUDA Program for :

1. Addition of two large vectors

#####################################################Addition of two large

vectors#############################

#include <iostream>
#include <cuda_runtime.h>

global void addVectors(int* A, int* B, int* C, int n)

{
int i = blockIdx.x * blockDim.x + threadIdx.x;
if (i < n)
{
C[i] = A[i] + B[i];
}
}

int main()
{
int n = 1000000;
int* A, * B, * C;
int size = n * sizeof(int);

// Allocate pinned memory on the host

cudaMallocHost(&A, size);
cudaMallocHost(&B, size);
cudaMallocHost(&C, size);

// Initialize input vectors

for (int i = 0; i < n; i++)
{
A[i] = i;
B[i] = i * 2;
}

// Allocate memory on the device

int* dev_A, * dev_B, * dev_C;
cudaMalloc(&dev_A, size);
cudaMalloc(&dev_B, size);
cudaMalloc(&dev_C, size);

// Copy data from host to device

cudaMemcpy(dev_A, A, size, cudaMemcpyHostToDevice);
cudaMemcpy(dev_B, B, size, cudaMemcpyHostToDevice);

// Launch kernel
int blockSize = 256;
int numBlocks = (n + blockSize - 1) / blockSize;
addVectors<<<numBlocks, blockSize>>>(dev_A, dev_B, dev_C, n);
cudaDeviceSynchronize();

// Copy result from device to host

cudaMemcpy(C, dev_C, size, cudaMemcpyDeviceToHost);
// Print first 10 results
for (int i = 0; i < 10; i++)
{
std::cout << C[i] << " ";
}
std::cout << std::endl;

// Free memory
cudaFree(dev_A);
cudaFree(dev_B);
cudaFree(dev_C);
cudaFreeHost(A);
cudaFreeHost(B);
cudaFreeHost(C);

return 0;
}

CUDA Additionof2Vector
No ratings yet
CUDA Additionof2Vector
2 pages
Group A Assignment 4 (A) : Two Large Vectors
No ratings yet
Group A Assignment 4 (A) : Two Large Vectors
5 pages
Vector Addition
No ratings yet
Vector Addition
3 pages
Cuda
No ratings yet
Cuda
4 pages
2023 CSC14120 Lecture01 CUDAIntroduction
No ratings yet
2023 CSC14120 Lecture01 CUDAIntroduction
32 pages
Cuda Add Mult
No ratings yet
Cuda Add Mult
3 pages
CUDA Programming for Developers
No ratings yet
CUDA Programming for Developers
42 pages
LP 1,,1
No ratings yet
LP 1,,1
5 pages
p4 Multiply
No ratings yet
p4 Multiply
2 pages
Google Colab Solution Activity
No ratings yet
Google Colab Solution Activity
5 pages
Moving To Parallel - Addition of 2 Matrices
No ratings yet
Moving To Parallel - Addition of 2 Matrices
14 pages
CUDA Programming Invert
No ratings yet
CUDA Programming Invert
36 pages
CUDA Practical's
No ratings yet
CUDA Practical's
38 pages
217 Lec2
No ratings yet
217 Lec2
24 pages
Cuda C/C++ Basics: NVIDIA Corporation
No ratings yet
Cuda C/C++ Basics: NVIDIA Corporation
67 pages
Rishi
No ratings yet
Rishi
30 pages
PDC Assignment
No ratings yet
PDC Assignment
9 pages
PC Cuda Assignment-2
No ratings yet
PC Cuda Assignment-2
29 pages
Introduction To CUDA C 3
No ratings yet
Introduction To CUDA C 3
67 pages
Source Code
No ratings yet
Source Code
7 pages
Introduccion CUDA C
No ratings yet
Introduccion CUDA C
51 pages
CUDA Exercises
No ratings yet
CUDA Exercises
185 pages
3 Cuda
No ratings yet
3 Cuda
5 pages
GPU History & CUDA Programming Basics
No ratings yet
GPU History & CUDA Programming Basics
44 pages
Cuda 4.1
No ratings yet
Cuda 4.1
2 pages
Introduction To CUDA C
No ratings yet
Introduction To CUDA C
67 pages
01 Cuda C Basics
No ratings yet
01 Cuda C Basics
32 pages
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
No ratings yet
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
121 pages
GPU Series III CUDA Compilation Host Side 1721302802
No ratings yet
GPU Series III CUDA Compilation Host Side 1721302802
8 pages
CUDAProg Model
No ratings yet
CUDAProg Model
24 pages
BECOA157 Parallel Matrix Multiplication
No ratings yet
BECOA157 Parallel Matrix Multiplication
3 pages
2023 CSC14120 Lecture05 CUDAMemories
No ratings yet
2023 CSC14120 Lecture05 CUDAMemories
48 pages
Lab 1 Parallel
No ratings yet
Lab 1 Parallel
4 pages
Intro To CUDA
No ratings yet
Intro To CUDA
76 pages
Cuda Firstprograms PDF
No ratings yet
Cuda Firstprograms PDF
6 pages
Cuda4 1
No ratings yet
Cuda4 1
4 pages
Introduction To CUDA: CAP 4730 Spring 2012
No ratings yet
Introduction To CUDA: CAP 4730 Spring 2012
35 pages
Lab7 GPU
No ratings yet
Lab7 GPU
10 pages
Lecture2 Cuda Basic 2010
No ratings yet
Lecture2 Cuda Basic 2010
44 pages
L06 GPGPU CUDA Programming 1
No ratings yet
L06 GPGPU CUDA Programming 1
23 pages
Cuda Review 1
No ratings yet
Cuda Review 1
13 pages
CUDA MatrixMultiplication
No ratings yet
CUDA MatrixMultiplication
2 pages
TP1: Converting Vector Addition To CUDA.: Listing 1 An Example of Vector Addition Implemented in C
No ratings yet
TP1: Converting Vector Addition To CUDA.: Listing 1 An Example of Vector Addition Implemented in C
1 page
CUDA Part-1
No ratings yet
CUDA Part-1
52 pages
CUDA Class Lecture03
No ratings yet
CUDA Class Lecture03
18 pages
CUDA - Part 1 LMS
No ratings yet
CUDA - Part 1 LMS
51 pages
Hetero Lecture Slides 002 Lecture 1 Lecture-1-5-Cuda-API
No ratings yet
Hetero Lecture Slides 002 Lecture 1 Lecture-1-5-Cuda-API
11 pages
CUDA Lab Guide for Students
No ratings yet
CUDA Lab Guide for Students
19 pages
GPU Programming Course Overview
No ratings yet
GPU Programming Course Overview
49 pages
G80 Cuda
No ratings yet
G80 Cuda
25 pages
GPUs and GPGPU
No ratings yet
GPUs and GPGPU
15 pages
Combinepdf
No ratings yet
Combinepdf
28 pages
Cuda 1
No ratings yet
Cuda 1
45 pages
Parallel Scan in C CUda
No ratings yet
Parallel Scan in C CUda
3 pages
HPC Final 4-8
No ratings yet
HPC Final 4-8
25 pages
CUDA Programming Guide
No ratings yet
CUDA Programming Guide
57 pages
21.L18 Intro To GPU and CUDA C
No ratings yet
21.L18 Intro To GPU and CUDA C
89 pages
Bubble Sort
No ratings yet
Bubble Sort
2 pages
Parallel Reduction
No ratings yet
Parallel Reduction
2 pages
BFS
No ratings yet
BFS
3 pages
Merge Sort
No ratings yet
Merge Sort
3 pages

Addition Cuda

Uploaded by

Addition Cuda

Uploaded by

Cuda

Write a CUDA Program for :

#####################################################Addition of two large

__global__ void addVectors(int* A, int* B, int* C, int n)

// Allocate pinned memory on the host

// Initialize input vectors

// Allocate memory on the device

// Copy data from host to device

// Copy result from device to host

You might also like

global void addVectors(int* A, int* B, int* C, int n)