随着电脑的普及和DIY(英文Do It Yourself的缩写)的盛行,普通百姓可以通过各种渠道买到英特尔、AMD的CPU,配合主板、内存、硬盘、电源等配件组装自己的电脑。在当今CPU价格高度透明的情况下,有一个耐人寻味的现象,那就是洋CPU性能好,价格低,而土CPU价格不见得比洋CPU低,但性能却只有洋CPU的20%-40%。
以英特尔和某国产CPU为例,英特尔的赛扬、奔腾CPU售价为250~500元,中高端的酷睿i5、i7售价一般在1000~2000元不等,而某国产CPU同样采用X86指令集,在性能上只有i5的25%左右,但政府采购价却不比i5低......是国内CPU公司“心黑”?还是其中另有隐情?
要回答这个问题,就得先从CPU的成本构成中寻找答案。从最初的一堆沙子,到最后的一片小小的CPU,期间要经过晶圆制造、掩膜到封装、测试等诸多环节,这其中,到底有哪些成本呢?
一、CPU的成本构成是这个样子滴
1、晶片成本
要制造CPU,第一步是制造晶圆(将晶圆切成小片后即可得到晶片)。晶圆的成分是硅,是地壳内第二丰富的元素(沙子的主要成分就是二氧化硅)。制取晶圆分为三个步骤:
一是制取电子级硅。通过碳和二氧化硅在电弧熔炉中反应得到冶金级硅,再对其进一步提纯,将粉碎的冶金级硅与气态的氯化氢进行氯化反应,生成液态的硅烷,通过蒸馏和化学还原工艺,得到电子级硅,其纯度高达99.999999%。
二是制取硅锭。将电子级硅放在石英坩埚中,并用石墨包围不断加热,温度维持在大约1400℃,炉中充斥着惰性气体,使电子级硅熔化的同时,不会因化学反应而掺杂杂质。
随后将一颗籽晶浸入坩埚中,由拉制棒带着籽晶与坩埚旋转方向逆向旋转,采用旋转拉伸法缓慢将籽晶垂直拉出,熔化的多晶硅会粘在籽晶的底端,最终得到圆柱体的硅锭。
三是切割圆晶。将得到的硅锭横向切割成圆形的单个硅片,然后进行研磨,将凹凸的切痕磨掉,再用化学机械抛光工艺使其至少一面光滑如镜。
目前,国际主流采用的是12英寸晶圆。就国内而言,中芯国际和华力微都有12英寸晶圆厂,英特尔、三星、海力士等公司在大陆也有12英寸晶圆厂。虽然12英寸晶圆厂的投资远远大于8英寸晶圆厂,但是晶圆尺寸越大,意味着单片晶圆能够切割出的芯片越多,芯片成本也就越低。在设备成本被以亿为单位的芯片出货量平摊后,采用尺寸更大的晶圆,不仅芯片价格可以更具竞争力,还能以细水长流的方式获取更多利润。
因此,晶片成本就是以二氧化硅制取晶圆所耗费的资金分摊到每一片晶片后的成本,可以简单理解为每一片芯片所用的材料(硅片)的成本。
2、掩膜成本
在得到晶圆后,要制造CPU,还要进行以下步骤:
一是湿洗。用各种化学药剂清洗晶圆,确保晶圆表面没有杂质。
二是光刻。使用光刻机将激光光束穿透画着线路图的掩膜,经物镜补偿各种光学误差,将电路图成比例缩小后映射到硅片上,然后使用化学方法显影,得到刻在硅晶片上的电路图。
(光刻示意图。最上方的是掩膜,中间的是物镜,用来补偿各种光学误差,最后将电路图成比例缩小后映射到硅片上)
三是离子注入。在硅晶片不同的位置嵌入不同的物质,进而形成场效应管(晶体管)。
四是蚀刻。使用刻蚀机将晶片上多余的部分去掉,得到所想要的结构。
五是等离子冲洗。用较弱的等离子束轰击整个芯片,达到清洁的效果。
六是热处理。瞬间把晶圆加热到1200摄氏度以上,然后慢慢地冷却下来,使得注入的离子能更好地被启动以及热氧化,并在晶片中形成场效应管的栅极。
七是气相淀积。通过物理、化学气相淀积设备进一步精细处理晶片表面,并给晶片镀膜。
八是电镀、化学、机械表面处理。
因此,掩膜成本就是晶片加工成本以及光刻机、刻蚀机、物理、化学气相淀积设备的折旧成本等等。掩膜成本的高低和制程工艺的关系非常大,像40/28nm的工艺已经非常成熟,成本也低,40nm低功耗工艺的掩膜成本为200余万美元;28nm SOI工艺为400万多美元;28nm HKMG成本为600多万美元。
但在最新的制程工艺问世之初,耗费则颇为不菲。在2014年刚出现14nm制程时,曾有消息称其掩膜成本为3亿美元。当然,随着时间的推移和台积电、三星掌握14/16nm制程,现在的价格应该不会这么贵。英特尔正在研发的10nm制程,根据英特尔官方估算,掩膜成本至少需要10亿美元。
新制程工艺之所以贵,一方面是贵在新工艺高昂的研发成本和偏低的成品率,另一方面也是因为光刻机、刻蚀机等设备的价格异常昂贵。
以前道光刻机为例,国内商业化量产依旧停滞在90nm,40/65nm的光刻机虽然取得技术突破,但依旧没有商业化量产,有可能还处于实验室状态。中芯国际、华力微等晶圆厂的28nm光刻机完全依赖进口,而且价格颇为不菲——ASML主流技术水平的光刻机售价为几千万美元,最先进的EUV光刻机问世时售价曾高达1亿美元……
(光刻机)
每片CPU的掩膜成本=掩膜总成本/总产量,因此,如果产量小,CPU的成本会因为掩膜成本而较高,只要产量足够大,比如每年出货以亿计,掩膜成本被巨大的产量分摊到微乎其微。
3、封测成本
(晶圆倒装机)
在晶片完成上述光刻、刻蚀等步骤后,还需要用后道光刻机、减薄机、划片机、装片机、引线键合机、倒装机等制造设备给晶片装个壳,将之前加工好的晶片和基片、散热片堆叠在一起,最终形成我们日常见到的四四方方、带针脚和商标的CPU。
封装成本就是这个过程所需要的资金。在产量巨大的一般情况下,封装成本一般占硬件成本的5%-25%左右,不过IBM的有些芯片封装成本占总成本一半左右,据说最高曾达到过70%......
测试可以鉴别出每一颗处理器的关键特性,比如最高频率、功耗、发热量等,并决定处理器的等级,比如将一堆芯片分门别类为:i5 4460、i5 4590、i5 4690、i5 4690K等,之后英特尔就可以根据不同的等级,开出不同的售价。如果芯片产量足够大的话,测试成本在CPU总成本的占比可以忽略不计。
以已经非常成熟的40nm低功耗工艺为例,采用该制程工艺的CPU,其测试成本约为2美元,封装成本约为6美元。
4、设计成本
设计成本主要包括专利成本、开发工具成本、工程师工资和场地费用等。
一是专利成本。目前,国内只有像龙芯、申威等少数走独立自主技术路线的IC设计公司可以做到自己设计的CPU/微结构不含第三方IP,比如申威411、申威1621,龙芯3A2000/3B2000/3A3000/3B3000,以及微结构GS464E皆不含第三方IP。而国内其他IC设计公司基本上还处于购买国外IP做集成的阶段,主要的IP供应商都是国外公司。
以海思、展讯、联芯、全志、瑞芯微、新岸线等ARM阵营IC设计公司为例,这些公司无一例外依赖于ARM的IP授权——海思的麒麟950就购买了ARM Cortex A53和A72,不仅要一次性支付一笔不菲的授权费,而且每生产一片芯片,还要支付一定的专利费……
这种购买IP授权的商业模式,实际效果是ARM犹如开启了印钞机,而国内IC设计公司只能赚一点辛苦钱,直接导致国内ARM阵营IC设计公司“操的是卖白粉的心,赚的是卖白菜的钱”。
二是开发工具成本。要设计CPU就离不开EDA(电子设计自动化)工具的辅助,比如前端设计的仿真环境,低功耗流程设计工具,时序仿真工具,芯片后端设计的工具等等。
要购买这些EDA工具,同样耗费颇为不菲,特别是国内IC设计公司的EDA工具大多数都依赖于国外公司的情况下(国内研发EDA工具做的最好的是华大九天,但市场份额比较小)。
三是工程师的工资等成本。像IBM、AMD、Marvell等IC设计公司中,有5年以上经验的工程师的月薪在25K-50K之间,国内海思、展讯、联芯有5年以上经验的工程师的月薪也在15K-30K之间。假设一个IC设计公司有500人(英特尔公司有约10万员工),每个员工以月薪20K计算,光工资成本一年就需要1.2亿元……
四是其他成本。比如公司场地租用、宣传营销、行政开销等零零碎碎的成本开销,这些开销因各个公司的情况有所不同,而且有的差距会非常大。
二、国产CPU售价为何居高不下
为了形象地解释这个问题,我们假设两款国产CPU:CPU-X和CPU-Y。
首先看晶片成本。
假设CPU-X采用40nm制程,芯片面积200平方毫米;CPU-Y采用28nm制程,芯片面积140平方毫米(制程越小,晶片面积越小)。
一片12寸晶圆价格为4000美元,面积约为7万平方毫米。经计算可以得出,一片12寸晶圆可以切割出299个CPU-X或495个CPU-Y(40/28nm技术已经非常成熟,切割成本差异非常小,就忽略不计了)。
由于在将晶圆加工、切割成晶片的时候,并不能保证100%成果,因而存在一个成品率的问题,以49%的成品率计算,一片12寸晶圆可以切出146个符合良品标准CPU-X或242个CPU-Y,最后12寸晶圆的价格/切割出的成品晶片,可以得出结论:
采用40nm制程的CPU-X的晶片成本为27.3美元;
采用28nm制程的CPU-Y的晶片成本为16.5美元。
可以看出,采用更先进的制程,能够有效降低晶片成本。
其次看掩膜成本。
上文已经提到过40/28nm的工艺已经非常成熟,40nm低功耗工艺的掩膜成本约为200万多美元。
如果CPU-X的产量为10万片,则分摊到每一片CPU上的成本为20美元;
如果CPU-X的产量为100万片,则分摊到每一片CPU上的成本为2美元;
如果CPU-X的产量为1000万片,则分摊到每一片CPU上的成本为0.2美元;
28nm HKMG掩膜成本为600多万美元,
如果CPU-Y的产量为10万片,则分摊到每一片CPU上的成本为60美元;
如果CPU-Y的产量为100万片,则分摊到每一片CPU上的成本为6美元;
如果CPU-Y的产量为1000万片,则分摊到每一片CPU上的成本为0.6美元。
由此可见,在使用相同工艺的情况下,随着CPU的产量增加,CPU的掩膜成本会逐步降低,如果产量以亿为单位,即便使用最昂贵的14/16nm制程工艺,其掩膜成本也可以被压缩到3美元以内。
再次看封测成本。
封装成本一般占硬件成本的5%-25%左右,之前讲过,比如CPU-X采用非常成熟的40nm制程,其测试成本约为2美元,封装成本约为6美元。
最后看设计成本和其他成本。
设计成本非常不好量化,因为各家IC设计公司员工数量不同,购买IP的耗费、购买EDA工具的成本各异。其他成本同样不好量化,各家公司场地租用、宣传营销、行政开销等所耗费的资金差距非常大。
由于设计成本和其他成本非常不好量化,笔者按国际通用的低盈利芯片设计公司的定价策略8:20定价法来计算最后的售价,也就是硬件成本为8的情况下,定价为20(在不购买国外IP的情况下,一般能做到这个定价)。别觉得这个定价高,其实已经比较低了,英特尔一般定价策略为8:35,AMD历史上曾达到过8:50……
CPU硬件成本包括晶片成本+掩膜成本+测试成本+封装成本四部分。
如果CPU-X的产量达到10万片,则掩膜成本为20美元,加上27.3美元的晶片成本和8美元的封测成本,其硬件成本为55.3美元,采用8:20定价法,其售价为138.25美元。
如果将CPU-X的产量达到100万片,其硬件成本为37.3美元,采用8:20定价法,其售价为93.25。
如果CPU-Y的产量为10万片,则掩膜成本为60美元,之前计算过晶片成本为16.5美元,加上封测成本,那么硬件成本为85美元左右,采用8:20定价法,其售价为212.5美元。
如果CPU-Y的产量为100万片,则掩膜成本为6美元,硬件成本约为30美元,其售价约为75美元。
显而易见,虽然使用更先进的制程会导致掩膜总成本提升,但却可以降低晶片成本。而只要产量足够大,就可以使每片CPU的掩膜成本大幅降低,使拥有“更贵的制程工艺+更大的产量”属性的CPU,会比拥有“便宜的制程工艺+较小的产量”属性的CPU的成本更低,特别是在产量相差100倍的情况下,成本上的差距会犹如鸿沟。
那国产CPU的产量为何上不去呢?像龙芯、申威等自主CPU,由于另起炉灶,自建技术体系,必然和现有的Wintel(微软+英特尔)体系不兼容,在PC市场被Wintel垄断的情况下,自然导致市场化进程步履维艰。
而兆芯虽然同样采用X86指令集,可以跑Windows,不存在软件生态问题,但在技术上完全依赖于威盛公司,自然提高了成本,加上性能孱弱,不具备市场竞争力——即便一味扩大产能,也只能是产量越大,亏得越多,所以只能在党政军市场寻求机会,产量自然非常有限。
总之,抛开国内IC设计公司和英特尔在设计能力的差距不谈,单纯讲制程工艺和产量对性能和成本的影响,在国产CPU产量非常小的情况下,即便使用非常便宜的制程工艺流片,依旧导致其成本比英特尔的CPU要高,价格也更贵。
而英特尔则可以依靠市场的垄断地位,即便使用了最贵的制程工艺,以庞大的产量压低成本,攫取超额利润,使自己的利润率高达60%。