我最近在读《计算机体系结构-定量方法》(第 6 版),在尝试理解第 34 页的一个部分时遇到了一个问题:
Given the tremendous price pressures on commodity products such as DRAM and SRAM, designers
have included redundancy as a way to raise yield. For a number of years, DRAMs have regularly
included some redundant memory cells so that a certain number of flaws can be accommodated.
良率实际上不是指通过测试程序的 DRAM 数量(在批量生产的众多 DRAM 中)吗?如果是这样,那么向单个 DRAM 添加冗余内存单元如何增加该 DRAM 的良率机会。此外,这句话中提到的“一定数量的缺陷”有哪些例子?
答案1
假设您正在制造一个需要 64 个单元来提供 32GB RAM 的 DRAM 芯片(我只是编造了这个;在创建这个响应时没有损害任何实际数字/数据)。
如果您生产的 64 单元芯片的缺陷率为每芯片 0.1 个单元缺陷(或每单元 0.1/64 = 0.0016 个缺陷),则意味着大约每 10 个芯片中就有一个(或每 100 个芯片中就有 10 个)将因无法使用而被丢弃。
相反,如果你构建 65 单元芯片,并添加少量附加电路,只需禁用第一轮测试后选择的一个单元,那么你可以容忍一个单元缺陷,并且仍然生产出可以通过测试的可用 32GB 部件。
换句话说,在一批 100 个芯片中,您不必因为一个缺陷而丢弃 10 个,而是可以进行第一轮测试,看看是否可以识别出一个单元出现故障,然后激活电路以禁用该单元,然后对芯片进行最终测试以确认功能/质量。这样,您就可以从这批 100 个芯片中保留大约 9 个芯片(最后一个芯片有时会有 2 个缺陷),从而将良率从 90% 提高到 99.5% 左右,尽管您添加了另一个可能出现故障的单元。
如果您对这类事情感兴趣,那么统计数据会很有趣;如果您好奇,我很乐意尝试一下。
缺陷通常是芯片生产过程中的故障,导致芯片的某个部分无法按设计运行。这可能是由于材料中的杂质、掩蔽故障、将芯片材料放入芯片封装中的故障……任何原因造成的。并非所有类型的缺陷都可以通过这种方法缓解。