硬件-英伟达GPU架构史

date
icon
password
Sub-item
Blocked by
Parent item
type
status
slug
summary
tags
category
Blocking

2010-2022

 
notion image
 
 
 
kepler到Maxwell变化非常大
Maxwell到帕斯卡,变化不大,只是从28纳米换到了16纳米finfet工艺,规模提高了

费米架构

notion image

开普勒、麦克斯韦

notion image
 

帕斯卡

notion image
 

伏特架构

notion image
 
 

图灵

notion image
 
 

安培

重点:BF16
notion image
 
 

Hopper

notion image
 

CUDA core VS Tensor COre

 
区别项
CUDA Core
Tensor Core
出现时间
2010年 费米架构
2017年 伏特架构
出现背景
科学计算迅速发展,为了使用GPU的高算力,科学家需要将科学计算任务适配成图形图像任务
AI迅速发展,对矩阵乘法的算力需求不断增大,有厂商提出TPU概念
设计目的
将高并发浮点计算能力暴露给科学计算领域,加速科学计算,占领科学计算市场
定制性争强矩阵计算能力(AI算力),融入CUDA生态,抢占人工智能计算所需要的算力高地
计算任务类型
浮点加、乘、乘加运算
矩阵乘法运算
计算精度
IEEE-754 标准的float精度
强调低精度:fp16/fp8/int8/int4/b1
SM上的装配数目
*128
*4
调度粒度/执行粒度
warp-level/thread-level
warp-level/warp-level
硬件-NvLinksupervisord