明史

明朝政治架构

欧洲史

简单欧洲史

历史

ES

docker

docker原理与常用命令

docker打包与加密(一) 镜像打包

docker打包与加密(二) Cython加密

计算机网络

建站-域名配置

计算机硬件

硬件-ARM和AMD

硬件-英伟达GPU架构史

Linux常用

Linux基本命令

分布式训练

分布式理论

SMTC

优化算法

可解释性

Language models can explain neurons in language models

LLM

Constitutional AI: Harmlessness from AI Feedback

参数与显存

training LLM from scratch

ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING

Tokenizer

BPE、WordPiece、Unigram LM、SentencePiece

Relation Extraction

Neural Temporal Relation Extraction

relation extraction

Distant Supervision for Relation Extraction with Sentence-Level Attention and Entity Descriptions

Relation Extraction

社会运转

中国权利结构

EasyLM详解

EasyLM详解（一）总体结构

GPT4

GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE

GPU硬件-浮点数

欧洲史

明史

硬件-NvLink

date

icon

password

Sub-item

Blocked by

Parent item

type

status

slug

summary

tags

category

Blocking

服务器分类

GPU服务器按照GPU芯片之间的互联方式可分为两类：

PCIE机型：

常规的服务器，GPU直接通过PCIE链路进行通信，受限于PCIE的带宽上限，卡与卡双向互联带宽低，不满足大模型训练需求。

Nvlink机型：

也习惯叫SXM机型，指的是在服务器内部，GPU卡之间通过Nvlink链路互联，相比PCIE带宽更高，更适合于大模型训练场景。

类型	GPU	通道数	双向互联带宽
PCIE互联	A100	PCIE 4.0 x16	2GBx16x2=64GB/s
PCIE互联	H100	PCIE 5.0 x16	4GBx16x2=128GB/s
NVLink互联	A100	每个GPU链路Nvlink x12	25GB122=600GB/s
NVLink互联	H100	每个GPU链路Nvlink x12	25GB182=900GB/s

cpu通过PCIE链接GPU VS GPU通过NvLink直接互联

notion image

notion image

硬件-ARM和AMD 硬件-英伟达GPU架构史

Last update:

date

icon

password

Sub-item

Blocked by

Parent item

type

status

slug

summary

tags

category

Blocking

公告

站在你面前的是天苑四的风暴降生抓根宝，

山民和黄昏种的共主，

溪木镇的潜行者，

七核封印者

萝卜法案出自我手

格拉摩根由我分封

我的善名从爱尔兰到契丹无人不知无人不晓

个人信息

姓名：赵康康

职业：NLP算法工程师

邮箱：_

电话：_

最新文章

热门文章

项目

明史

明朝政治架构

欧洲史

简单欧洲史

历史

ES

docker

docker原理与常用命令

docker打包与加密(一) 镜像打包

docker打包与加密(二) Cython加密

计算机网络

建站-域名配置

计算机硬件

硬件-ARM和AMD

硬件-英伟达GPU架构史

Linux常用

Linux基本命令

分布式训练

分布式理论

SMTC

优化算法

可解释性

Language models can explain neurons in language models

LLM

Constitutional AI: Harmlessness from AI Feedback

参数与显存

training LLM from scratch

ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING

Tokenizer

BPE、WordPiece、Unigram LM、SentencePiece

Relation Extraction

Neural Temporal Relation Extraction

relation extraction

Distant Supervision for Relation Extraction with Sentence-Level Attention and Entity Descriptions

Relation Extraction

社会运转

中国权利结构

EasyLM详解

EasyLM详解（一）总体结构

GPT4

GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE

GPU硬件-浮点数

欧洲史

明史