Ctrl+K

个人站点-主NLP

欧洲史

🗒️ 简单欧洲史

开发工具

🗒️ docker基础使用、加密

🗒️ 开发工具

🗒️ ES基本原理与使用

Linux

🗒️ Linux基本命令

🗒️ supervisord

计算机软件

🗒️ 计算机软件

🗒️ 建站-域名配置

DL-训练

🗒️ training LLM from scratch

🗒️ DL-训练

🗒️ GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE

🗒️ Constitutional AI: Harmlessness from AI Feedback

🗒️ ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING

历史-欧洲史

🗒️ 欧洲史

历史-中国史

🗒️ 中国史

中国史

🗒️ 明朝政治架构

DL-公式推导

🗒️ DL-公式推导

🗒️ loss 公式梳理

🗒️ 优化算法

🗒️ 基础概念再次厘清

DL-算法原理

🗒️ DL-算法原理

🗒️ Tokenizer

🗒️ 神经网络优化算法

DL-工程化

🗒️ DL-工程化

🗒️ 分布式理论

DL-数据

🗒️ DL-数据

🗒️ InfiAgent-DABench: Evaluating Agents on Data Analysis Tasks

计算机硬件

🗒️ 计算机硬件

🗒️ 硬件-英伟达GPU架构史

🗒️ 硬件-NvLink

🗒️ 硬件-ARM和AMD

🗒️ GPU硬件-浮点数

可解释性

🗒️ 可解释性

🗒️ Language models can explain neurons in language models

LLM-基础

🗒️ 参数与显存

🗒️ BPE、WordPiece、Unigram LM、SentencePiece

LLM-Tokenizer

🗒️ Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

传统NLP

🗒️ 传统NLP

🗒️ Neural Temporal Relation Extraction

🗒️ Distant Supervision for Relation Extraction with Sentence-Level Attention and Entity Descriptions

🗒️ Relation Extraction

社会运转

🗒️ 社会运转

🗒️ 中国权利结构

训练框架

🗒️ EasyLM详解（一）总体结构

生活记录

🗒️ 生活记录

🗒️ 人间有味

🗒️ 户外露营点

技术报告

🗒️ Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

强化学习

🗒️ 强化学习

🗒️ DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

🗒️ 蒙特卡洛树搜索（Monte Carlo Tree Search, MCTS）

🗒️硬件-NvLink

date

icon

password

Sub-item

Blocked by

Parent item

type

status

slug

summary

tags

category

Blocking

服务器分类

GPU服务器按照GPU芯片之间的互联方式可分为两类：

PCIE机型：

常规的服务器，GPU直接通过PCIE链路进行通信，受限于PCIE的带宽上限，卡与卡双向互联带宽低，不满足大模型训练需求。

Nvlink机型：

也习惯叫SXM机型，指的是在服务器内部，GPU卡之间通过Nvlink链路互联，相比PCIE带宽更高，更适合于大模型训练场景。

类型	GPU	通道数	双向互联带宽
PCIE互联	A100	PCIE 4.0 x16	2GBx16x2=64GB/s
PCIE互联	H100	PCIE 5.0 x16	4GBx16x2=128GB/s
NVLink互联	A100	每个GPU链路Nvlink x12	25GB122=600GB/s
NVLink互联	H100	每个GPU链路Nvlink x12	25GB182=900GB/s

cpu通过PCIE链接GPU VS GPU通过NvLink直接互联

notion image

notion image

硬件-英伟达GPU架构史

硬件-ARM和AMD

Loading...

目录

Last update: 2023-7-10

黏糊糊大王

站在你面前的是天苑四的风暴降生抓根宝，

山民和黄昏种的共主，

溪木镇的潜行者，

七核封印者

萝卜法案出自我手

格拉摩根由我分封

我的善名从爱尔兰到契丹无人不知无人不晓

文章列表

个人站点-主NLP

欧洲史

🗒️ 简单欧洲史

开发工具

🗒️ docker基础使用、加密

🗒️ 开发工具

🗒️ ES基本原理与使用

Linux

🗒️ Linux基本命令

🗒️ supervisord

计算机软件

🗒️ 计算机软件

🗒️ 建站-域名配置

DL-训练

🗒️ training LLM from scratch

🗒️ DL-训练

🗒️ GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE

🗒️ Constitutional AI: Harmlessness from AI Feedback

🗒️ ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING

历史-欧洲史

🗒️ 欧洲史

历史-中国史

🗒️ 中国史

中国史

🗒️ 明朝政治架构

DL-公式推导

🗒️ DL-公式推导

🗒️ loss 公式梳理

🗒️ 优化算法

🗒️ 基础概念再次厘清

DL-算法原理

🗒️ DL-算法原理

🗒️ Tokenizer

🗒️ 神经网络优化算法

DL-工程化

🗒️ DL-工程化

🗒️ 分布式理论

DL-数据

🗒️ DL-数据

🗒️ InfiAgent-DABench: Evaluating Agents on Data Analysis Tasks

计算机硬件

🗒️ 计算机硬件

🗒️ 硬件-英伟达GPU架构史

🗒️ 硬件-NvLink

🗒️ 硬件-ARM和AMD

🗒️ GPU硬件-浮点数

可解释性

🗒️ 可解释性

🗒️ Language models can explain neurons in language models

LLM-基础

🗒️ 参数与显存

🗒️ BPE、WordPiece、Unigram LM、SentencePiece

LLM-Tokenizer

🗒️ Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

传统NLP

🗒️ 传统NLP

🗒️ Neural Temporal Relation Extraction

🗒️ Distant Supervision for Relation Extraction with Sentence-Level Attention and Entity Descriptions

🗒️ Relation Extraction

社会运转

🗒️ 社会运转

🗒️ 中国权利结构

训练框架

🗒️ EasyLM详解（一）总体结构

生活记录

🗒️ 生活记录

🗒️ 人间有味

🗒️ 户外露营点

技术报告

🗒️ Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

强化学习

🗒️ 强化学习

🗒️ DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

🗒️ 蒙特卡洛树搜索（Monte Carlo Tree Search, MCTS）