👖️ Stanford CS149 Parallel Computing (Fall 2024)

videos are from Stanford CS149 Parallel Computing (Fall 2023) playlist

Lecture 1: Why Parallelism? Why Efficiency?

Challenges of parallelizing code, motivations for parallel chips, processor basics
- Video
Lecture 2: A Modern Multi-Core Processor

Forms of parallelism: multi-core, SIMD, and multi-threading
- Video
Lecture 3: Multi-Core Architecture Part II + ISPC Programming Abstractions

Finish up multi-threaded and latency vs. bandwidth. ISPC programming, abstraction vs. implementation
- Video
Lecture 4: Parallel Programming Basics

Structuring parallel programs. Process of parallelizing a program in data parallel and shared address space models
- Video
- Assignment 1: Analyzing Parallel Program Performance on a Quad-Core CPU
Lecture 5: Performance Optimization I: Work Distribution and Scheduling

Achieving good work distribution while minimizing overhead, scheduling Cilk programs with work stealing
- Video
- Written Assignment 1
Lecture 6: Performance Optimization II: Locality, Communication, and Contention

Message passing, async vs. blocking sends/receives, pipelining, increasing arithmetic intensity, avoiding contention
- Video
Lecture 7: GPU Architecture and CUDA Programming

CUDA programming abstractions, and how they are implemented on modern GPUs
- Video
- Written Assignment 2
Lecture 8: Data-Parallel Thinking

Data-parallel operations like map, reduce, scan, prefix sum, groupByKey
- Video
Lecture 9: Distributed Data-Parallel Computing Using Spark

Producer-consumer locality, RDD abstraction, Spark implementation and scheduling
- Video
Lecture 10: Efficiently Evaluating DNNs (Software Solutions)

Efficiently scheduling DNN layers, mapping convs to matrix-multiplication, transformers, layer fusion
- Video
- Assignment 2: Scheduling Task Graphs on a Multi-Core CPU
Lecture 11: Hardware Specialization

Energy-efficient computing, motivation for and design of hardware accelerators
- Video
- Written Assignment 3
Lecture 12: Programming Specialized Hardware

Modern trends and programming systems for creating specialized hardware
- Video
Lecture 13: Programming Specialized Hardware II + Cache Coherence

Programming hardware, motivation for and definition of memory coherence
- Video
- Assignment 3: A Simple Renderer in CUDA
Lecture 14: Cache Coherence

Invalidation-based coherence using MSI and MESI, false sharing
- Video
- Written Assignment 4
Lecture 15: Lock Implementations, Fine-Grained Synchronization and Lock-Free Programming

Fine-grained synchronization via locks, basics of lock-free programming: single-reader/writer queues, lock-free stacks, the ABA problem
- Video
Lecture 16: Relaxed Consistency + Domain-Specific Programming Systems

Motivation for relaxed consistency, implications to programmers. Performance/productivity motivations for DSLs, case studies on several DSLs
- Video
Lecture 17: Transactional Memory

Motivation for transactions, design space of transactional memory implementations, STM and HTM basics
- Video
Lecture 18: Transactions II + Ask Me Anything with Kayvon and Kunle

Suggestions for post cs149 topics. AMA with the course staff.
- Video
- ~~[ ] Assignment 4: Optimizing DNN Performance on DNN Accelerator Hardware~~ (No access to AWS resources)
- ~~[ ] Assignment 4: NanoGPT149~~ (No money to rent GPU machine)
- Assignment 5: (EC) Big Graph Processing in OpenMP
- Written Assignment 5
- Written Assignment 6 (EC)

Name		Name	Last commit message	Last commit date
Latest commit History 92 Commits
asst1		asst1
asst2		asst2
asst3		asst3
asst4-trainium		asst4-trainium
biggraphs-ec		biggraphs-ec
cs149gpt		cs149gpt
lectures		lectures
written_asst1		written_asst1
written_asst2		written_asst2
written_asst3		written_asst3
written_asst4		written_asst4
written_asst5		written_asst5
written_asst6		written_asst6
.gitignore		.gitignore
Computer Architecture, Sixth Edition_ A Quantitative Approach.pdf		Computer Architecture, Sixth Edition_ A Quantitative Approach.pdf
Is Parallel Programming Hard, And, If So, What Can You Do About It?.pdf		Is Parallel Programming Hard, And, If So, What Can You Do About It?.pdf
LICENSE		LICENSE
README.md		README.md
cuda_by_example.book.pdf		cuda_by_example.book.pdf
programming_massively_parallel_processors_a_hands-on_approach_2nd.pdf		programming_massively_parallel_processors_a_hands-on_approach_2nd.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

👖️ Stanford CS149 Parallel Computing (Fall 2024)

About

Uh oh!

Releases

Sponsor this project

Uh oh!

Packages

Uh oh!

Contributors

Uh oh!

Languages

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

👖️ Stanford CS149 Parallel Computing (Fall 2024)

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Sponsor this project

Uh oh!

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages