ENZH

NAND 闪存:把电子关在绝缘层里

DRAM 靠电容存电荷——断电电荷就没了。NAND 的存储单元结构不同:一个"浮栅"晶体管内,加了一层被绝缘体包裹的导电层。给浮栅充电或放电,改变晶体管的阈值电压。读的时候测阈值电压是高还是低——判断存的是 1 还是 0。

因为浮栅被绝缘层包围,电子进去了出不来。断电也出不来。这是 NAND "非易失性"的根。


SLC、MLC、TLC、QLC

一个单元存几个电平,决定它能表示几个比特。

SLC——一个单元两个电平(0/1),存 1 个比特。最快和最耐用。企业级和数据中心用得多。MLC——四个电平,存 2 比特。TLC——八个电平,存 3 比特。消费级 SSD 的主流。QLC——十六个电平,存 4 比特。容量最大,耐用性最差。

电平越多越难区——读的时候噪声和干扰让电平重叠。越需要复杂的纠错码(ECC)。QLC 的原始误码率是 SLC 的 1000 倍以上。所有 QLC SSD 实际工作状态都在"边读边纠错"。


耐久性和写放大

NAND 有一个致命的物理限制:每次写入和擦除都会磨损绝缘层。 绝缘层被电子反复击穿,逐渐退化漏电,最终无法区分电平。

SLC 寿命约 100,000 次编程/擦除。TLC 约 1,000-3,000 次。QLC 约 500-1,000 次。不是你"写满一次"算一次。SSD 内部的写放大:你写 1MB 数据,SSD 内部要搬移、擦除、重写,实际物理写入可能是 3-5 倍。

SSD 的主控芯片核心工作之一就是磨损均衡——把写入分散到所有单元,避免某些块提前报废。垃圾回收:擦除前先把有效数据搬到别的块。映射表(FTL):逻辑地址到物理地址的动态映射。这些东西让 SSD 的"实际可用寿命"远低于纸面寿命。


3D NAND 的革命

传统 NAND 是二维平面——存储单元在芯片表面一字排开。缩小制程增加密度,但绝缘层也得更薄。绝缘层太薄就关不住电子——平面缩微走到物理极限。

3D NAND 把存储单元竖起来堆叠。像城市从平房变成摩天大楼。目前主流 200+ 层,三星 2024 年量产了 290 层。堆叠让密度继续增长——绝缘层不用做得更薄。

3D NAND 是过去十年存储行业最成功的创新。不是物理学突破,是工程学想象力——"既然平面走不通,往上走"。


NAND 在 AI 中的角色

AI 模型加载:模型权重存放在 SSD 上,推理时加载到 HBM/DRAM。SSD → DRAM → GPU 这条链路上,每次模型切换(如推理不同 LoRA adapter),数据都要重新搬移。SSD 速度直接影响 cold-start 延迟。

AI 训练数据集:大规模训练数据集以 TB 甚至 PB 计,存储在 NAND 阵列里。数据加载成为训练瓶颈——GPU 利用率常年低于 70%,很大一部分在等数据从存储搬到内存。

边缘 AI 场景有个有趣的趋势:能不能直接从 NAND 推理?让模型权重重在 NAND 上,只加载需要的层到 DRAM。这是 "offloading" 的前沿方向。

NAND 不像 HBM 那么亮眼。但它决定了 AI 系统整体能跑多快。


© Xingfan Xia 2024 - 2026 · CC BY-NC 4.0