0% found this document useful (0 votes)

15 views73 pages

1 Processor Pipeline

The document outlines the concept of pipelining in processor architecture, explaining its benefits and implementation through examples like a car assembly line. It covers the pipelined datapath, execution timing, hazards, and branch prediction, emphasizing the speedup achieved by pipelining compared to non-pipelined execution. Additionally, it discusses the importance of clocked elements and the overall impact on instruction throughput.

Uploaded by

chanddank10

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

15 views73 pages

1 Processor Pipeline

Uploaded by

chanddank10

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 73

The Pipeline

Module Outline
●
Why Pipeline?
– How to pipeline?
●
Speedup of the pipeline
●
Pipelined datapath
– Execution of instructions
– Pipeline Timing diagram
●
Dependences, Hazards
– Structural, Data, Control
– Stalling, Forwarding
●
Branch prediction
Car Assembly Line Example
●
Unpipelined Assembly Line
– Team of engineers build a full car
–
Car Assembly Line Example
●
Unpipelined Assembly Line
– Team of engineers build a full car

Car 1

24 48 72 96
Car Assembly Line Example
●
Unpipelined Assembly Line
– Team of engineers build a full car

Car 1

Car 2

Car 3

Car 4

24 48 72 96
Car Assembly Line Example
●
Pipelined Assembly Line
– 3 (equal) stages to build a Car
– Stages don’t interfere
– Stage 2 consumes previous stage’s output
Car Assembly Line Example
●
Pipelined Assembly Line
– 3 (equal) stages to build a Car
– Split the team into 3. Each team works on one
stage only
– 8H per stage
Car Assembly Line Example
●
Pipelined Assembly Line
– Car 1-Stage 1

C1-S1

24 48 72 96
Car Assembly Line Example
●
Pipelined Assembly Line
– Car 1 moves to Stage 2

C1-S1 C1-S2

24 48 72 96
Car Assembly Line Example
●
Pipelined Assembly Line
– Team 1 is free. Takes up Car 2
– Team 1 and 2 are working
C1-S1 C1-S2

C2-S1

24 48 72 96
Car Assembly Line Example
●
Pipelined Assembly Line
– 3 cars are in different stages of production

C1-S1 C1-S2 C1-S3

C2-S1 C2-S2

C3-S1

24 48 72 96
Car Assembly Line Example
●
Pipelined Assembly Line
– 3 cars are in different stages of production
– Car 1 rolls out
C1-S1 C1-S2 C1-S3

C2-S1 C2-S2

C3-S1

24 48 72 96
Car Assembly Line Example
●
Pipelined Assembly Line
– Steady state

C1-S1 C1-S2 C1-S3

C2-S1 C2-S2 C2-S3

C3-S1 C3-S2 C3-S3

C4-S1 C4-S2 ...

C5-S1 ...
24 48 72 96
Car Assembly Line Example
●
Pipelined Assembly Line
– One car rolls out every 8 hours (24/3)

C1-S1 C1-S2 C1-S3

C2-S1 C2-S2 C2-S3

C3-S1 C3-S2 C3-S3

C4-S1 C4-S2 ...

C5-S1 ...
24 48 72 96
Car Assembly Line Example
●
Non-pipelined vs. Pipelined implementation
●
Speedup
The Processor Datapath
The Processor Datapath
Execution and Timing – Load
Execution and Timing – Loads

Instruction
InstructionFetch
Fetch(IF)
(IF)
Execution and Timing – Loads

ID:
ID:Instruction
Instructiondecode/
decode/
Register file read
Register file read
Execution and Timing – Loads

EX:
EX:Execution/
Execution/
Address
AddressCalculation
Calculation
Execution and Timing – Loads

MEM:
MEM:Memory
Memory
Access
Access
Execution and Timing – Loads

WB:
WB:Write
Write
Back
Back
Datapath Stages

ID:
ID:Instruction
Instructiondecode/
decode/ EX:
EX:Execution/
Execution/ MEM:
MEM:Memory
Memory WB:
WB:Write
Write
Instruction
InstructionFetch
Fetch(IF)
(IF) Address
Register file read
Register file read AddressCalculation
Calculation Access
Access Back
Back
RISC-V Datapath

IF ID EX MEM WB
RISC-V Datapath
●
Where are the clocked elements?

IF ID EX MEM WB
RISC-V Datapath
●
Clocked elements

IF ID EX MEM WB
Datapath – Observations
●
During instruction fetch (IF), other components
are idle
– During ID, ....
Datapath – Observations
●
During instruction fetch (IF), other components
are idle
– During ID, ....
●
Improve hardware utilization
– The entire datapath should be busy
Pipelining the Datapath
●
Pipeline the datapath
Pipelining the Datapath
●
Pipeline the datapath

IF ID EX MEM WB
Pipelining – Desired Effect

Instr i IF
Pipelining – Desired Effect

Instr i IF ID
Pipelining – Desired Effect

Instr i IF ID

Instr i+1 IF
Pipelining – Desired Effect

Instr i IF ID EX

Instr i+1 IF ID

Instr i+2 IF
Pipelining – Desired Effect

Instr i IF ID EX MEM

Instr i+1 IF ID EX

Instr i+2 IF ID

Instr i+3 IF
Pipelining – Desired Effect

Instr i IF ID EX MEM WB

Instr i+1 IF ID EX MEM WB

Instr i+2 IF ID EX MEM WB

Instr i+3 IF ID EX MEM W

Instr i+4 IF ID EX M

Instr i+5 IF ID E

Instr i+6 IF ID
Pipelining – Desired Effect

Steady
SteadyState
State
Instr i IF ID EX MEM WB

Instr i+1 IF ID EX MEM WB

Instr i+2 IF ID EX MEM WB

Instr i+3 IF ID EX MEM W

Instr i+4 IF ID EX M

Instr i+5 IF ID E

Instr i+6 IF ID
Need for Clocked Elements

IF ID EX MEM WB
0.5ns

ld x10, 4(x11)
add x12, x13, x14
Clocked Elements in Pipeline
●
Problem: Signal overwrite/interference

Stage
Stagei i Stage
Stagei+1
i+1
Flip Flop Waveforms

Clock
Clock

Clk-Q
Delay
Clocked Elements in Pipeline
●
Problem: Signal overwrite/interference
●
Solution: Clocked elements (FF or a Latch)

Stage
Stagei i Stage
Stagei+1
i+1
Clock Speed – Non-Pipelined vs. Pipelined

IF ID EX MEM WB

1.0 ns 0.5ns 0.8ns 1.0ns 0.5ns

TT==3.8ns
3.8ns
Clock Speed – Non-Pipelined vs. Pipelined

IF ID EX MEM WB

1.0 ns 0.1ns
Clock Speed – Non-Pipelined vs. Pipelined

IF ID EX MEM WB

1.0 ns 0.1ns

TT=T
=Tcc+T
+Tffff
TT==1.1ns
1.1ns
Clock Speed – Non-Pipelined vs. Pipelined

IF ID EX MEM WB

1.0 ns 0.1ns

TT=T
=Tcc+T
+Tffff
TT==1.1ns
1.1ns

CPI
CPI==1.0
1.0in
inboth
bothcases
cases
Pipelined Datapath

ID:
ID:Instruction
Instructiondecode/ MEM:
decode/ MEM:Memory
Memory
Register file read
Register file read Access
Instruction Access WB:
WB:Write
InstructionFetch
Fetch(IF)
(IF) EX:
EX:Execution/
Execution/ Write
Address Back
AddressCalculation
Calculation Back
Pipelined Execution – Load

Instruction
InstructionFetch
Fetch(IF)
(IF)
Pipelined Execution – Load

ID:
ID:Instruction
Instructiondecode/
decode/
Register file read
Register file read
Pipelined Execution – Load

EX:
EX:Execution/
Execution/
Address
AddressCalculation
Calculation
Pipelined Execution – Load

MEM:
MEM:Memory
Memory
Access
Access
Pipelined Execution – Load

WB:
WB:Write
Write
Back
Back
Pipelined Datapath
Pipelined Control
Execution Sequence
Execution Sequence – Non
pipelined

Time (clock cycles)

ld
ld IF ID EX MA WB
Execution Sequence – Non
pipelined

Time (clock cycles)

ld
ld IF ID EX MA WB

sub
sub IF ID EX MA WB
Execution Sequence – Non
pipelined

Time (clock cycles)

ld
ld IF ID EX MA WB

sub
sub IF ID EX MA WB

add
add IF ID EX

ld
ld
add
add
Execution Sequence – Pipelined

Time (clock cycles)

ld
ld IF
Execution Sequence – Pipelined

Time (clock cycles)

ld
ld IF ID

sub
sub IF
Execution Sequence – Pipelined

Time (clock cycles)

ld
ld IF ID EX

sub
sub IF ID

add
add IF
Execution Sequence – Pipelined

Time (clock cycles)

ld
ld IF ID EX MA

sub
sub IF ID EX

add IF ID
add

ld IF
ld
Execution Sequence – Pipelined

Time (clock cycles)

ld
ld IF ID EX MA WB

sub
sub IF ID EX MA

add IF ID EX
add

ld IF ID
ld
add IF
add
Execution Sequence – Pipelined

Time (clock cycles)

ld
ld IF ID EX MA WB

sub
sub IF ID EX MA WB

add IF ID EX MA WB
add

ld IF ID EX MA WB
ld
add IF ID EX MA WB
add
Execution Sequence – Pipelined
Execution Sequence – Pipelined
Pipelined vs. Nonpipelined
Implementation
●
Ratio of execution times?
– For 106 instructions?
Speedup of the Pipeline
●
The speedup of a k stage pipelined processor
over an unpipelined processor

TT unpipelined
unpipelined n⋅k
n⋅k
SSkk=
= =
= ≈k
≈k
TT pipelined
pipelined
n+(k
n+(k−1)
−1)

n: number of instructions in the program.

k: number of pipeline stages
Pipelined vs. Nonpipelined
Implementation
●
Pipelining increases the instruction throughput
opposed to individual instruction execution
time.
Module Outline
●
Why Pipeline?
– How to pipeline?
●
Speedup of the pipeline
●
Pipelined datapath
– Execution of instructions
– Pipeline Timing diagram
●
Dependences, Hazards
– Structural, Data, Control
– Stalling, Forwarding
●
Branch prediction
Pipelined vs. Nonpipelined
Implementation
●
Ratio of execution times between the two?
– For 106 instructions?
●
Pipelining increases the instruction throughput
opposed to individual instruction execution
time.

IF ID EX MEM WB
Pipelined vs. Nonpipelined Implementation
Pipelined vs. Nonpipelined Implementation

Pipelining Basic and Intermediate Concepts
No ratings yet
Pipelining Basic and Intermediate Concepts
75 pages
Chapter 4.5 - 4.8 Piplined Processor and Hazards
No ratings yet
Chapter 4.5 - 4.8 Piplined Processor and Hazards
68 pages
CA07 2022S3 New
No ratings yet
CA07 2022S3 New
29 pages
Advanced Pipelining Techniques
No ratings yet
Advanced Pipelining Techniques
44 pages
3-Pipelining 241110 203716
No ratings yet
3-Pipelining 241110 203716
59 pages
Bản Sao Của Lecture 9 - Pipelined Processor Design
No ratings yet
Bản Sao Của Lecture 9 - Pipelined Processor Design
11 pages
Advanced Linux Programming
No ratings yet
Advanced Linux Programming
31 pages
Topic 10: Pipelining: Cos / Ele 375 Computer Architecture and Organization
No ratings yet
Topic 10: Pipelining: Cos / Ele 375 Computer Architecture and Organization
64 pages
L14 MipsPipeline Ovw
No ratings yet
L14 MipsPipeline Ovw
17 pages
Understanding Processor Pipelining
No ratings yet
Understanding Processor Pipelining
28 pages
Chapter 6
No ratings yet
Chapter 6
43 pages
Pipe Lining
No ratings yet
Pipe Lining
66 pages
Pipelining and Parallelism
No ratings yet
Pipelining and Parallelism
41 pages
Module 3-Part 2
No ratings yet
Module 3-Part 2
50 pages
07 Pipeline Notes
No ratings yet
07 Pipeline Notes
145 pages
Computer Architecture: Nguyễn Trí Thành
No ratings yet
Computer Architecture: Nguyễn Trí Thành
77 pages
Pipelining: CIT 595 Spring 2007
No ratings yet
Pipelining: CIT 595 Spring 2007
16 pages
Lect8 Pipelined DP Control
No ratings yet
Lect8 Pipelined DP Control
59 pages
Lecture Notes Pipelining Stages 7B
No ratings yet
Lecture Notes Pipelining Stages 7B
7 pages
Module 4-Pipelining
No ratings yet
Module 4-Pipelining
39 pages
CODch 6 Slides
No ratings yet
CODch 6 Slides
77 pages
Pipelining. Pipeline Hazards: Sabina Batyrkhanovna
No ratings yet
Pipelining. Pipeline Hazards: Sabina Batyrkhanovna
19 pages
Lec 04 Pipeline D Processor
No ratings yet
Lec 04 Pipeline D Processor
106 pages
CS530 Fall2015 Lecture9
No ratings yet
CS530 Fall2015 Lecture9
5 pages
Lec11 Pipeline 1 Notes
No ratings yet
Lec11 Pipeline 1 Notes
26 pages
33 Hazards in Pipeline 06-04-2023
No ratings yet
33 Hazards in Pipeline 06-04-2023
27 pages
CSE332 / EEE336 Computer Organization & Architecture Pipelining I
No ratings yet
CSE332 / EEE336 Computer Organization & Architecture Pipelining I
21 pages
Instruction Pipeline
No ratings yet
Instruction Pipeline
4 pages
Lecture 13 Pipelining
No ratings yet
Lecture 13 Pipelining
12 pages
Comparison Between Pipelining
No ratings yet
Comparison Between Pipelining
9 pages
COA Module 3 PPT Part 2
No ratings yet
COA Module 3 PPT Part 2
62 pages
Helping Slides Pipelining Hazards Solutions
No ratings yet
Helping Slides Pipelining Hazards Solutions
55 pages
Lecture-4-08 01 2025
No ratings yet
Lecture-4-08 01 2025
35 pages
Pipeline
No ratings yet
Pipeline
39 pages
Week 11 Reduced
No ratings yet
Week 11 Reduced
29 pages
Unit 6
No ratings yet
Unit 6
30 pages
Instruction Pipeline - Study Notes
No ratings yet
Instruction Pipeline - Study Notes
14 pages
Lec18 Pipeline
No ratings yet
Lec18 Pipeline
59 pages
Pipelining Lecture
No ratings yet
Pipelining Lecture
74 pages
CO Pipelining PDF Notes
No ratings yet
CO Pipelining PDF Notes
10 pages
Computer Systems Pipelining Guide
No ratings yet
Computer Systems Pipelining Guide
7 pages
CAO-II Module 2 Complete
100% (1)
CAO-II Module 2 Complete
32 pages
Pipeline Processing
No ratings yet
Pipeline Processing
28 pages
Pipelining - Modified1
No ratings yet
Pipelining - Modified1
51 pages
Pipelinehazard For Class
No ratings yet
Pipelinehazard For Class
61 pages
Pipelinehazard 160823134502
No ratings yet
Pipelinehazard 160823134502
61 pages
Pipelining
No ratings yet
Pipelining
43 pages
06 Pipeline PDF
No ratings yet
06 Pipeline PDF
17 pages
Pipeline Processing
No ratings yet
Pipeline Processing
43 pages
Module 2
No ratings yet
Module 2
64 pages
Chapter 10 Principles of Pipelining
No ratings yet
Chapter 10 Principles of Pipelining
124 pages
Pipelining & Vector Processing Guide
No ratings yet
Pipelining & Vector Processing Guide
29 pages
Week 11
No ratings yet
Week 11
33 pages
ch4 2
No ratings yet
ch4 2
42 pages
Pipelined Processor Design: Computer Architecture and Assembly Language
No ratings yet
Pipelined Processor Design: Computer Architecture and Assembly Language
22 pages
L11 Pipelined Datapath and
100% (1)
L11 Pipelined Datapath and
31 pages
Module 5 Part2 Pipelining
No ratings yet
Module 5 Part2 Pipelining
36 pages
Advanced Computer Architecture
No ratings yet
Advanced Computer Architecture
112 pages
XX Chapter16 InstructionLevelParallelismAndSuperscalarProcessors PDF
No ratings yet
XX Chapter16 InstructionLevelParallelismAndSuperscalarProcessors PDF
90 pages
CSE 431 Computer Architecture Fall 2005 Lecture 06: Basic MIPS Pipelining Review
No ratings yet
CSE 431 Computer Architecture Fall 2005 Lecture 06: Basic MIPS Pipelining Review
25 pages
Co Question Bank
No ratings yet
Co Question Bank
6 pages
ACA Unit 4
No ratings yet
ACA Unit 4
41 pages
Wa0003.
No ratings yet
Wa0003.
2 pages
DLCA - Solved - Question Bank-1
No ratings yet
DLCA - Solved - Question Bank-1
48 pages
End02 Ca03 Noor
No ratings yet
End02 Ca03 Noor
88 pages
Pipeline in ARM
No ratings yet
Pipeline in ARM
10 pages
Computer Organization & Computer Organization & Computer Organization & Computer Organization & Assembly Languages Assembly Languages
No ratings yet
Computer Organization & Computer Organization & Computer Organization & Computer Organization & Assembly Languages Assembly Languages
119 pages
CCEE 213 - 2006 - 2007 - II - Final
No ratings yet
CCEE 213 - 2006 - 2007 - II - Final
10 pages
UNIT-3 Hardware-Based Speculation
No ratings yet
UNIT-3 Hardware-Based Speculation
27 pages
1) Define MIPS. CPI and MFLOPS.: Q.1 Attempt Any FOUR
No ratings yet
1) Define MIPS. CPI and MFLOPS.: Q.1 Attempt Any FOUR
10 pages
4 20 10 PDF
No ratings yet
4 20 10 PDF
12 pages
5 Marks Q. Describe Array Processor Architecture
No ratings yet
5 Marks Q. Describe Array Processor Architecture
11 pages
Branch Handling 1
No ratings yet
Branch Handling 1
50 pages
L04 Pipelining
No ratings yet
L04 Pipelining
48 pages
Coa Viva
No ratings yet
Coa Viva
5 pages
CH18 COA11e
No ratings yet
CH18 COA11e
40 pages
Sastra Deemed University: Ten Ten Ten
No ratings yet
Sastra Deemed University: Ten Ten Ten
2 pages
Hazard (Computer Architecture)
No ratings yet
Hazard (Computer Architecture)
10 pages
COA Mod 3
No ratings yet
COA Mod 3
30 pages
Microcontroller & RISC Architecture (2 Marks - Question Bank)
100% (3)
Microcontroller & RISC Architecture (2 Marks - Question Bank)
61 pages
111 Computer Organization - Quiz 2
No ratings yet
111 Computer Organization - Quiz 2
3 pages
ILP Limitations
No ratings yet
ILP Limitations
31 pages
CAO IMP All Unit
No ratings yet
CAO IMP All Unit
20 pages
Cs1358 Ece Computer Architecture
No ratings yet
Cs1358 Ece Computer Architecture
8 pages
高级计算机体系结构第四课PPT
No ratings yet
高级计算机体系结构第四课PPT
43 pages
Computer Organization and Architecture
No ratings yet
Computer Organization and Architecture
37 pages
ACA UNIT-2 Kai Hwang
No ratings yet
ACA UNIT-2 Kai Hwang
40 pages

1 Processor Pipeline

Uploaded by

1 Processor Pipeline

Uploaded by

The Pipeline

C1-S1 C1-S2 C1-S3

C1-S1 C1-S2 C1-S3

C2-S1 C2-S2 C2-S3

C3-S1 C3-S2 C3-S3

C4-S1 C4-S2 ...

C1-S1 C1-S2 C1-S3

C2-S1 C2-S2 C2-S3

C3-S1 C3-S2 C3-S3

C4-S1 C4-S2 ...

Instr i+1 IF ID EX MEM WB

Instr i+2 IF ID EX MEM WB

Instr i+3 IF ID EX MEM W

Instr i+1 IF ID EX MEM WB

Instr i+2 IF ID EX MEM WB

Instr i+3 IF ID EX MEM W

1.0 ns 0.5ns 0.8ns 1.0ns 0.5ns

Time (clock cycles)

Time (clock cycles)

Time (clock cycles)

Time (clock cycles)

Time (clock cycles)

Time (clock cycles)

Time (clock cycles)

Time (clock cycles)

Time (clock cycles)

n: number of instructions in the program.

You might also like