明史

明朝政治架构

欧洲史

简单欧洲史

历史

ES

docker

docker原理与常用命令

docker打包与加密(一) 镜像打包

docker打包与加密(二) Cython加密

计算机网络

建站-域名配置

计算机硬件

硬件-ARM和AMD

硬件-英伟达GPU架构史

Linux常用

Linux基本命令

分布式训练

分布式理论

SMTC

优化算法

可解释性

Language models can explain neurons in language models

LLM

Constitutional AI: Harmlessness from AI Feedback

参数与显存

training LLM from scratch

ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING

Tokenizer

BPE、WordPiece、Unigram LM、SentencePiece

Relation Extraction

Neural Temporal Relation Extraction

relation extraction

Distant Supervision for Relation Extraction with Sentence-Level Attention and Entity Descriptions

Relation Extraction

社会运转

中国权利结构

EasyLM详解

EasyLM详解（一）总体结构

GPT4

GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE

GPU硬件-浮点数

欧洲史

明史

硬件-英伟达GPU架构史

date

icon

password

Sub-item

Blocked by

Parent item

type

status

slug

summary

tags

category

Blocking

2010-2022

notion image

kepler到Maxwell变化非常大

Maxwell到帕斯卡，变化不大，只是从28纳米换到了16纳米finfet工艺，规模提高了

费米架构

notion image

开普勒、麦克斯韦

notion image

帕斯卡

notion image

伏特架构

notion image

图灵

notion image

安培

重点：BF16

notion image

Hopper

notion image

CUDA core VS Tensor COre

区别项	CUDA Core	Tensor Core
出现时间	2010年费米架构	2017年伏特架构
出现背景	科学计算迅速发展，为了使用GPU的高算力，科学家需要将科学计算任务适配成图形图像任务	AI迅速发展，对矩阵乘法的算力需求不断增大，有厂商提出TPU概念
设计目的	将高并发浮点计算能力暴露给科学计算领域，加速科学计算，占领科学计算市场	定制性争强矩阵计算能力（AI算力），融入CUDA生态，抢占人工智能计算所需要的算力高地
计算任务类型	浮点加、乘、乘加运算	矩阵乘法运算
计算精度	IEEE-754 标准的float精度	强调低精度:fp16/fp8/int8/int4/b1
SM上的装配数目	*128	*4
调度粒度/执行粒度	warp-level/thread-level	warp-level/warp-level

硬件-NvLink supervisord

Last update:

date

icon

password

Sub-item

Blocked by

Parent item

type

status

slug

summary

tags

category

Blocking

公告

站在你面前的是天苑四的风暴降生抓根宝，

山民和黄昏种的共主，

溪木镇的潜行者，

七核封印者

萝卜法案出自我手

格拉摩根由我分封

我的善名从爱尔兰到契丹无人不知无人不晓

个人信息

姓名：赵康康

职业：NLP算法工程师

邮箱：_

电话：_

最新文章

热门文章

项目

明史

明朝政治架构

欧洲史

简单欧洲史

历史

ES

docker

docker原理与常用命令

docker打包与加密(一) 镜像打包

docker打包与加密(二) Cython加密

计算机网络

建站-域名配置

计算机硬件

硬件-ARM和AMD

硬件-英伟达GPU架构史

Linux常用

Linux基本命令

分布式训练

分布式理论

SMTC

优化算法

可解释性

Language models can explain neurons in language models

LLM

Constitutional AI: Harmlessness from AI Feedback

参数与显存

training LLM from scratch

ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING

Tokenizer

BPE、WordPiece、Unigram LM、SentencePiece

Relation Extraction

Neural Temporal Relation Extraction

relation extraction

Distant Supervision for Relation Extraction with Sentence-Level Attention and Entity Descriptions

Relation Extraction

社会运转

中国权利结构

EasyLM详解

EasyLM详解（一）总体结构

GPT4

GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE

GPU硬件-浮点数

欧洲史

明史