近日,英特尔CEO陈立武在摩根大通全球科技、媒体与通信大会上表示:“我现在正在建立一种新文化。A0版本必须能够直接进入量产。英特尔过去并没有这种文化,所以我现在要求A0一次通过。做到B0版本还能保住工作,再往后,你就要被解雇了。”
这些话听起来很狠,但放在今天的英特尔身上,其实并不意外。过去几年,英特尔最被外界诟病的,不只是工艺落后几代,而是产品节奏慢、迭代拖、缺陷修到一版又一版,最后市场窗口也被对手吃掉了。
首次流片(A0版本):这是芯片设计完成后的第一次实际生产尝试,目的是验证设计在物理芯片上的可行性。A0版本要求芯片能够正常启动、功能正常、满足主要规格要求,且硅片质量接近或达到量产水平,无需重大重新设计。若A0流片成功,意味着芯片设计基本通过验证,可直接进入量产准备阶段。
二次流片(B0版本):若A0流片未成功(如存在缺陷、性能不达标等问题),英特尔会进行二次流片,即B0版本。B0版本是在A0基础上对设计或工艺进行修正后的再次尝试,目标是解决A0阶段发现的问题,提升性能、良率或满足更严格的规格要求。若B0流片仍失败,可能需进一步迭代或调整设计。
英伟达和其他一些芯片公司早已实现芯片首次流片完成后,直接就量产A0版本的芯片;但英特尔以往往往需要历经多次的版本迭代和流片,才能解决缺陷、清除漏洞、优化性能。
例如,英特尔的Xeon Sapphire Rapids服务器处理器曾被曝存在约500个缺陷。为了修复问题并达到预期性能与良率目标,英特尔先后推出了A0、A1、B0、C0、C1、C2、D0、E0、E2、E3、E4 和E5等多个步进版本。
降低芯片的流片失败风险的方法之一是使用经过行业标准验证的芯片IP模块,并在流片前对设计进行严格的验证。此外,为了确保一次性成功,英特尔的工程师可能需要做出风险较低的设计决策。这种方法可能会使英特尔的产品整体上不再激进,但至少公司的业务表现会更加可预测。
事实上,如果芯片流片后才发现一些功能和性能等问题,那说明芯片在架构定义、开发设计、验证测试、软件测试、性能测试等阶段做的还不够充分,没有提前发现这些问题,大部分问题应该是在流片之前就发现并及时解决的。
一款芯片如果因为各种问题和Bug导致需要多次流片,那么将会耗费更多的时间、人力和流片成本,并且会影响产品的交付和推广,会大大影响产品竞争力,会导致整个产品甚至整个公司的落后。
一次流片成功应该是每一个芯片公司的目标,需要建立一套完善的制度来实现这一目标,芯片工程师也必须以此为目标,做到一次就成功。
1054