A. APU的架构解析
APU与融合
不同于推土机,Llano APU并没有使用全新的内核架构,甚至不像Brazos APU平台那样至少处理器部分是新的“山猫”(Bobcat)架构,说白了主要就是K10处理器、DX11显卡(以及北桥芯片)的合体,但显然也不是1+1=2那么简单。Llano APU面临的问题不仅仅是要避免1+1<2,还要争取做到1+1>2。
Llano APU的设计目标主要有这么几条:
- CPU、GPU性能综合:同时提供最好的CPU、GPU性能。
- 独立显卡级别的GPU体验:完整的DX11和功能集;拖拽转码和Aero效果等Windows 7体验。
- 独有双显卡技术:配合AMD Radeon独立显卡提供额外性能。
- 下一代视频加速:也就是UVD3引擎,创新的显示和画质功能,更高带宽。
- 行业和开放标准计算API支持:主要是OpenCL、DirectCompute,同时数据传输延迟更低。
- 3D立体:支持HD3D,包括蓝光3D、DisplayPort 1.1(不及独立显卡的DP 1.2)、HDMI 1.4a。
可以看出,六个目标中有五个半是关于GPU的,涉及CPU的只有半个,Llano APU的关注重点也就不言而喻了,也与AMD VISION这样的平台名字相符。
Llano APU芯片采用GlobalFoundries 32nm HKMG工艺制造,又分为两种版本,其一是完整版本,集成14.5亿个晶体管,核心面积228平方毫米,又称为Big Llano或者Llano 1;其二是精简版本,集成7.58亿个晶体管,核心面积暂时不详,又称为Small Llano或者Llano 2。二者都采用了新的micro PGA封装接口Socket FS1,772针无顶盖,引脚间距1.2192毫米,芯片尺寸35×35=1225平方毫米。
从各方面看,首批发布的Llano APU都是采用了第一个完整版本,双核版本也是由四核屏蔽而来的,因此热设计功耗同样较高。不知道何时才能看到原生的双核版本,但是AMD透露说会在近期推出不需要风扇散热的低功耗型号,想来就是了。
和之前的Brazos APU类似,Llano APU也在单独一颗硅片上集成了以下众多模块:x86处理器核心、二级缓存、DDR3内存控制器、图形SIMD阵列(也就是GPU)、显示控制器、UVD解码引擎、PCI-E控制器。从下边这两张图上你就可以看出各个模块的分布位置和相对大小。
Llano APU内集成了如此众多的功能模块,如何确保它们之间的高速互连、以便让整体随时保持在最佳状态、避免任何潜在的瓶颈,这无疑是APU设计过程中最关键的一点,也是获得1+1>2效果的基本前提。AMD在这方面显然是下足了功夫,比如特意设计了全新的Fusion Compute Link(Fusion计算连接)来将北桥模块、GPU、IO输入输出串联在一起,允许GPU访问一致性缓存/内存,同时在GPU和北桥之间还搭建了Radeon Memory Bus(Radeon内存总线),让没有独立显存的GPU通过高速带宽去访问系统内存。
说到底,APU并不是简简单单地把CPU、GPU整合到一块硅片上就完事了,不然也不会花费AMD三年多的时间,反复修改设计才最终修成正果。
CPU与Turbo Core
Llano APU中的处理器部分来源于Stars架构,也就是俗称的K10架构,与Phenom Ⅱ/Athlon Ⅱ系列同宗同源,在移动平台上更确切地说相当于此前的Phenom Ⅱ Mobile系列,自带128-bit浮点单元、一级缓存(每核心64KB+64KB)、二级缓存(每核心1MB),但没有三级缓存。
当然一切都不是完全照搬而来的。除了制造工艺从45nm进步到32nm,从而更有效地控制晶体管集成度、核心面积、频率和功耗,支持C6电源状态,还在细节上进行了大量优化,包括更大容量的二级缓存、改进的硬件预取、更大的窗口尺寸、硬件分割器、支持第二代Turbo Core智能超频技术等等,最终将IPC(每时钟周期指令数)提升了6%以上。
这里特别需要着重介绍的就是Turbo Core,官方中文名:“智能超频”。该技术最早出现于六核心的Phenom Ⅱ X6系列上,如今已经进化到第二代,支持从推土机到APU的全系列产品,不过截至2011年基本还没有软件工具能够实时监测Turbo Core的动态频率,只有AIDA64附带的CPUID还凑合。
我们知道,处理器在不同负载下的实际功耗差别很大,而且都距离最大热设计功耗还有一定的空间,另一方面多核心处理器在不同应用环境中活跃的核心数量也有所不同,这都造成了处理器资源无法得到充分利用,形成了浪费。
解决方案就是由功耗监视器实时测量每个处理器核心的功耗,由北桥汇总,然后统一报告给P-State电源状态管理器,再由其根据需要让处理器的各个核心运行在适当的电源状态下,或者降速或者提速,特别是提速的时候能短时间超过原始频率,并且保证始终不超过整体热设计功耗。
AMD Turbo Core的创新之处在于使用了数字式高级电源管理(APM)模块,相比于类似技术中的模拟温度和电流监测方法,能够提供高灵敏度的电源管理,精确度更高,具备完全可重复性。
更关键的是,Turbo Core会自动协调CPU、GPU,让需要更多资源的能够获得更高速度。在GPU闲置的时候,它就会大幅降低其频率,去尽可能高地提升CPU频率。
如果碰到了较为繁重的图形或者视频任务,GPU就会获得更高优先级,CPU退而求其次。
如果GPU执行的是DVD视频播放等轻负载任务,那么留给CPU的加速空间就要在整体热设计功耗中排除掉GPU的那一部分。
极端情况下,如果CPU、GPU都面临繁忙的任务,或者需要携手进行OpenCL APP加速计算,此时CPU、GPU就会同时得到加速,甚至会在短时间内超过热设计功耗限制,然后再根据情况去降低CPU的频率和功耗(GPU不变),保证核心温度不致于过高。这一点倒是和Sandy Bridge上的第二代Turbo Boost有些相似。
内存支持上,Llano APU移动版支持双通道DDR3 SO-DIMM,每通道一条内存条,也就是总共只能插两条内存,容量最大32GB。频率和电压方面标准版DDR3最高1600MHz,电压1.5V,低压版DDR3L最高1333MHz,电压1.35V,带宽最高25.6GB/s。
Llano APU的桌面版则支持双通道DDR3 DIMM,每通道两条内存条,总共可以插入四条内存,容量最大64GB,支持1.35V DDR3-1333、1.5V DDR3-1866,带宽最高29.8GB/s。
由于CPU、GPU“同处一室”,难免会争夺资源(事实上APU对内存带宽的依赖性确实非常强),为此AMD将GPU与内存控制器之间的带宽提高到了上代平台的四倍,且高于内存控制器与内存之间的带宽。
DX11 GPU
这部分是Llano APU的重点。它的开发代号为“Sumo”(相扑),源于第一代DX11家族中Radeon HD 5600/5500系列的Redwood核心,最多400个流处理器、20个纹理单元、2个渲染后端、8个ROP单元,显存位宽128-bit。遗憾的是,独立的GDDR5显存是没有了,而且也不像880G主板那样有板载硬显存,只能去共享系统DDR3内存。
除了继承原有的TeraScale 2统一处理架构,以及完全的DX11、OpenGL 4.1、各种抗锯齿和各向异性过滤(包括形态抗锯齿MLAA)、APP并行计算加速技术之外,Sumo核心还增加了来自Radeon HD 6000系列家族的UVD3视频解码引擎、功率门控(深度电源管理与节能),重新设计了通往北桥的显存接口,制造工艺也同步采用了最新的GlobalFoundries 32nm。
Sumo核心自然还是VLIW5 5D式流处理器架构,单精度浮点计算性能最高480GFlops,整数计算性能最高480Gints,都是每秒钟4800亿次。
作为Fusion APU的竞争对手,Intel Sandy Bridge所集成的HD Graphics 3000/2000虽然比前一代也有了巨大的进步,但是在图形技术、视频技术方面依然落后得很多,尤其是OpenCL并行计算仅有处理器支持,图形核心并不支持,无法协同加速。
Llano APU的处理器、图形核心部分都支持AMD APP加速并行处理技术,尤其是OpenCL标准规范,为此AMD将不断更新APP SDK开发包,提供更好性能和更多功能。按照规划,APP SDK 2.5版将于八月份推出,主要更新有Windows 7/Linux性能优化、多GPU支持(Windows 7)、快速傅立叶变换(根基数5)、UVD3/MPEG2解码、PowerExpress独显集显切换支持、GPU调试器(Windows 7)等等。
值得一提的是,Llano APU正式支持的OpenCL规范版本已更新至1.2。
芯片组与节能
随着芯片集成度的提高,无论桌面还是移动平台的构成都越来越简单,传统的处理器加南北桥双的三片架构已经消失,取而代之的是处理器加互连芯片的双芯片架构。原来由北桥负责的大部分功能都已经转移到处理器内部,包括图形核心,所谓的芯片组也就剩下了一颗充当南桥功能的小芯片。
Llano APU处理器搭配的Hudson系列芯片组同样是单芯片设计,在移动平台上有A70M、A60M两款型号,代号分别为Hudson-M3、Hudson-M2,通过UMI总线(PCI-E 1.0 x4+DP)与处理器互连。和之前用于Brazos APU平台的Hudson-M1 A50M是同门师兄弟。
A70M/A60M芯片组采用65nm工艺制造,605球脚FC BGA封装,芯片尺寸23×23=529平方毫米,典型热设计功耗2.7-4.7W。
两款芯片组均支持六个SATA 6Gbps存储接口并支持RAID 0/1阵列方式,可提供四条PCI-E 2.0 x1连接通道,集成时钟发生器、消费级红外接收器、风扇控制、电压感应、DAC(支持VGA)等等,主要区别则在于USB接口:A70M原生支持四个USB 3.0、十个USB 2.0和两个内部USB 1.1,A60M则没有USB 3.0,而是改成了十四个USB 2.0。
这套平台上还有个可选的替补角色,那就是Vancouver Radeon HD 6000M系列独立显卡,通过PCI-E x16通道与处理器相连。它不但能为笔记本带来独显性能,还支持与Llano APU集成的图形核心组成双显切换、加速系统。
最后再说一下电源管理与节能技术,这方面同样很丰富,包括32nm HKMG新工艺、AMD Turbo Core 2.0动态调速技术、系统管理模式(SMM)、ACIP兼容、多重性能状态(P-states)、多重节能状态(C-states)、S0/S3/S4/S5休眠状态、每个核心功率门控(CC6)、PCI-E核心功率门控、Radeon流处理器核心与UVD3视频引擎功率门控。
功率门控(Power Gating)尤为值得一提。它是AMD 45nm时代非常欠缺的技术,如今终于得到了彻底的支持。相比于时钟门控(Clock Gating),它不仅可以实时调节各个模块的运行频率、电压,还能在不需要的时候彻底关闭,实现部分零功耗。换句话说,Llano APU的每个处理器核心、每个PCI-E控制器、流处理器阵列、UVD3引擎都是可以完全关闭的,Turbo Core技术也是因此更上一层楼。
以上种种,都属于AMD AllDay全天计算技术。按照AMD给出的数据,ⅥSION 2010移动平台的待机时间最长为6个半小时,迎来了APU的ⅥSION 2011则可长达10个小时;同时相比竞争对手,待机续航时间长一个半多小时,满载续航时间也要长一个小时。
B. 从英特尔收购altera看"国产芯"离世界有多远
本周发生了一件轰动全球半导体产业的大事件——英特尔斥巨资167亿美元收购FPGA生产商Altera。此事件之所以被认为是一次产业地震,不仅仅是因为167亿美元的交易堪称英特尔历史之最(公司手中现金不足,以致于要举债来完成),更因为在这个交易的背后还很可能隐藏了一个未来足以颠覆整个计算产业的宏伟计划。
当然,这个宏伟计划跟中国其实并没有太多的直接关系。本期标题之所以要扯上“国产芯”,更主要还是因为前几期《一周易评》的经验告诉小编——网友喜欢干货,但一篇有内涵的文章里也同时还要有“槽点”才算成功。所以,小编今天的点评大体可以归为如下三个章节:技术深入剖析、吐槽国产芯的差距,以及展望走捷径的可行性。
技术知识科普篇
这里会涉及很多如CPU、GPU、FPGA、ASIC以及DSP等英文缩写及半导体术语(急性子可以直接跳至下一章),为了尽量让大家看得懂,小编会尽可能用接地气的话来描述细节。当然,其中一些比喻可能不够恰当,不准确之处还望网友指正和包容。
首先,我们要理清一个概念,那就是何为“计算芯片”,或者说“处理器”?对于很多人来说,“处理器”就是CPU。这种认识是不准确的!CPU只是传统电脑里被称为“中央处理器”的东西,准确来说它只是一颗“通用计算处理器”,注意这里特别强调的“通用”二字,也就是说,还有一些处理器是可以不通用的,而另作“专用”,譬如我们熟悉的GPU,即显卡处理器。它的专用就是为图像显示进行复杂的浮点计算,但也因为硬件设计上的先天性,GPU在并行计算上要比CPU强大得多,所以就有了后来的GPGPU加速概念,被广泛应用于超级计算机领域。
GPU只是千百种具备专业用途的处理器芯片中的一种,因为广为用户熟知,所以小编就先拿出来举个例子。而其他常见的“专用”处理器还包括了DSP及FPGA等等。
DSP英文全称翻译过来就是“数字信号处理器”,是几乎每部手机里都会有的一个小芯片——其作用很简单,就是对无线信号进行一个处理,譬如过滤杂波等等,这个过程也是在进行各种计算,所以DSP也是“计算芯片”的一种形式。
从严格意义来说,FPGA并不能算是一种专用处理芯片,因为这东西全称叫“现场可编程逻辑门阵列”,即:可以将内部的一个区域通过软件程序变成一个具备特定功能的芯片(多个区域扮演不同功能的芯片并联合起来,就能实现更强大的功能)。换用通俗一点的话来说,就是你想让FPGA变成GPU,它就可以变成GPU;而你想要它成为DSP,它就是DSP了……AMD和英伟达在设计新显卡时,其实都是先通过FPGA进行流片测试的。所以,FPGA不是一种专用处理芯片,而是多种或者说万能的处理芯片。
FPGA如此强大,但这与一直依赖CPU为主要业务的英特尔有何关系?难不成后者打算自废武功,从此改为推FPGA不成?也不是,CPU作为通用计算处理器,其在逻辑计算(判断真或假)方面的优势是其他数学计算(加减乘除)处理器不可替代的,因此几年前业界就有了一个共识——未来处理芯片必将是以“异构架构”为主导的一种趋势,即:用CPU搭上某种其他处理芯片配合使用。说到“异构架构”,这里大家比较熟悉的可能是AMD提出的APU产品。APU是消费市场的东西,是传统CPU + GPU的一种异构搭配。而在企业市场上,同样是基于CPU + GPU的异构设计,方案有来自英特尔的Xeon Phi,以及IBM和英伟达的Power + CUDA等……只不过,财大气粗的英特尔比大家都看得更远——其在2014年6月低调发布了一款集成FPGA的Xeon处理器,这是首款X86 CPU + FPGA的异构设计(Xinlinx和Altera一直都有ARM + FPGA的异构设计SoC),但却预示了未来英特尔要利用FPGA的一切优点进一步颠覆企业市场的决心——所以,小编最初在3月份看到英特尔打算收购Altera的传闻时,完全不感到惊讶。
前面小编说了FPGA可以像“孙悟空72变”一样被编译成任何功能的芯片,但没有具体说其中又是如何实现加速的。那么,这里我们要先了解一下ASIC(专用集成电路)这个概念。ASIC简单说就是一种通过电路设计,从硬件上去实现软件算法的芯片方案,譬如我们前面提到的DSP滤波功能——天线接收到的信号波有很多为杂波,现实里我们有各种算法去过滤它们。这些算法可以写成公式,然后用软件计算来完成过滤,也可以是通过电阻、电容、多路转换器等电子元件的搭配,以硬件手段来实现。很显然,从硬件上去实现算法会比用软件计算要快得多,而FPGA可以随意被编程为某一特定功能的ASIC的特性,自然也就能让其某些领域里独领风骚。如果小编没记错,微软必应和网络都在去年宣布了利用FPGA实现搜索加速的消息,Facebook和谷歌其实也在做着同样的优化。所以说,英特尔看好CPU + FPGA的未来是有远见的。而随着云技术的进一步普及,及市场对数据中心要求的进一步提高,这一切对于英特尔而言也就意味着滚滚不断的财源。
技术内容谈到这里,很多网友可能又要给AMD判死刑了,GPGPU敌不过CPU + FPGA,未来难道英特尔一家独大?也不完全是。其实FPGA比GPGPU加速更优势的主要一点在于功耗,而至于加速效果则要考虑多个方面的综合因素。首先,给FPGA编程并不是一件容易的事情。其次,想要让FPGA实现加速,起码要有相当的ASIC设计经验,而这又是一个不低的门槛。相比之下,GPGPU因为发展较早,已经有了像OpenCL这样比较开放的行业标准,因此代码的优化、开发人员的生态建立都比FPGA完善。此外,过去要实现GPGPU加速,CPU数据总是要先从内存复制到GPU显存后才能进行加速处理,而处理完后,数据还要再复制回内存才可被CPU调用……这种局限性制约了GPGPU的加速效率,不过所幸的是此“落后”技术在HSA基金会确立HSA 1.0标准后已发生了根本性改变(请参阅小编此前介绍AMD的《一周易评》)。未来企业级APU解决方案(内嵌HBM内存颗粒的APU产品)应该会在超算市场上保留相当的竞争力,尤其是性价比方面——FPGA其实并不是新鲜事物,但价格却一直高高在上,所以迄今也没有被大规模普及。英特尔收购Altera能起到促进作用,但短期内也是难以改变眼下的事实。
前面提到CPU + GPU或者CPU + FPGA的异构设计,其实主要是为了指引出一个计算领域的未来方向,而不是要比较孰优孰劣。简单一句话,单纯的CPU在未来是很难满足人类计算需求了。而如果不是一颗拥有异构架构设计的处理器,恐怕未来也很难在动则以EB(=1 000 000 TB)甚至ZB(=1000EB)为计数单位的数据中心里出现。
然而……当国外技术已先进到可以将不同功能的处理内核整合到一起,并封装成SoC或APU时(可不是简单的拼积木哦,CPU和GPU共享内存绝对不是1+1的拼凑),我们的国产芯却还在纠结CPU架构的自主设计,以及某项指标能否媲美英特尔若干年前水平……小编难免不对这样的现实感到淡淡的忧伤,难免不去感叹彼此间技术的巨大差距——我们总说我们只花了十年就追赶上了欧美20年的发展——其实并没有!CPU某些指标可能是拉近距离了,但人家20年的经验累积使得在其他方面的技术推动和产业整合上又比我们快了不知道多少倍……
吐槽一下国产芯的巨大差距
吐槽前,小编要先表明一下态度:小编支持国产芯的发展,且异常坚定。说是吐槽,更多的是痛心。小编没有看不起国产芯的意思,但是对于某些企业、负责人的德行和莫名自满,打心里想骂几句——少一些抛头露面,少说些没意义的话,多做点实事,认真搞科研,这才是眼下唯一应该有的态度。
说起国产芯,其实有两大阵营:一个是龙芯系列(MIPS架构),另一个就是以华为、瑞芯微等为首的ARM架构芯片。
小编之前在某期《易评》里说过,所谓的自主架构设计其实就是在电路层面用自己的方式实现对某一指令集的兼容。所以,小编在这里要先帮龙芯说句话——虽然MIPS指令集是别人的,但具体实现的电路设计确实是龙芯公司自己搞出来的,因此也确实算得上自主设计。至于为什么不搞出一套自主知识产权的“国产指令集”?其实也不是不可以,只是这东西弄出来了也不会有任何人用,Linux内核不会去兼容、微软Windows也不可能去兼容,没有任何意义。至于ARM阵营,原本中国厂商都是采用ARM提供的公版内核设计的,但华为、瑞芯微等一些比较有实力的企业先后开始了自己的架构研发。这里抛开国产ARM架构的性能是否优异不谈,这种主动尝试掌握设计权的决心应该是值得称赞的。
小编一开始就说了,本人非常坚定地支持发展国产芯。理由不必多说,大家看看美国禁止英特尔出口芯片给中国,以及美军禁止使用联想提供的服务器等新闻报道就能够知道——在国家战略层面上,发展国产芯是义不容辞的事情!
但是,虽说发展国产芯是涉及国家战略意义的大事,但这并不等于我们就能以此为借口来绑架用户,让用户为“国情”买单吧?这里小编特别想质疑一下龙芯的市场定位。其实从指令集和架构的先天性差异看,MIPS应该是比ARM更适合发展高端服务器的处理器架构,而我们的龙芯又有中科院支持,潜心研究几年即使赶超不了欧美,自用也是勉强了……但结果,我们看到了龙芯迷你电脑、龙芯笔记本电脑以及龙芯台式电脑——这是硬生生打造出了一整套垂直产业链啊。也不是说龙芯走垂直商业化道路不可以,但问题是产品本就还不具备竞争力,做出来的东西能卖吗?于是又打着“国情牌”流窜于市场上,价格还不便宜!本来我们的技术就落后,资源也有限,把有限的资源和时间消耗在与供应商谈产品设计、谈市场推广等方方面面,这不正是一种浪费吗?
从2002年发布首款龙芯1处理器(主频266 MHz),到2012年底发布8核的龙芯3B处理器(主频1.05GHz),龙芯的确用十年就走完了英特尔20年的路——英特尔发布首个32位33 MHz的386处理器是在1985年,首个1 GHz奔腾处理器是在2000年,而首个双核心奔腾D处理器则是在2005年。但同样是从2002到2012年,英特尔先于2009年发布了迄今仍无对手的Core i系列处理器架构,后又在2012年推出了全球首个采用3D晶体管制造的CPU;即使是台面上输得一塌糊涂的AMD,也在百般困难中于2011年发布了首颗APU……试问,再给我们一个十年,我们能追上Core i架构和APU架构吗?时间并没有因为我们追赶而停止,当我们在跑时,别人也没有停下。
不说距离我们太遥远的10nm生产工艺(英特尔在全球独领风骚的制程技术),就拿网民都喜欢调侃的AMD及其APU来说,我们有吗?十多年来,我们只是发展出了一些个自主设计的CPU架构,不管是借助ARM的帮忙,还是完全的自主原创。可是,我们的GPU架构又在哪里?FPGA更是望尘莫及吧(小编自我纠正一下:国内已经有一些海归团队开始自己的FPGA芯片设计,这是一个好的现象,但仍需大量经验累积)?我们用了十年去追逐CPU的发展,而美国用了十年就把CPU和GPU给融合了……这十年间,我们等同于在跑单核,而国外却是CPU、GPU、FPGA多核齐刷……我们用十年追赶了人家20年?这句话今天也就能哄哄祖国的花朵了。
我们发展自主CPU究竟是为什么?如果是为了成本和产品多样化,华为、瑞芯微目前做的算可以了。如果我们是先打出国家战略这张牌,那么我们这里谈的就是未来技术,未来的计算机处理能力——这是一种远超CPU可以提供的计算能力,别说我们目前还没有掌握,即使是地位不断被弱化的CPU,我们也只有一个半成熟的自主架构。对于这样一个实事,小编更多地是感到忧心,而不是自满,更谈不上值得炫耀!
异构APU比CPU的优势有多大?给大家一个实例:最优秀的龙芯3B号称单双精度浮点峰值性能分别达到256和128 GFlops,AMD用在PlayStation 4上的APU有1.84 TFlops(单精度,双精度不详,但后者不是游戏机要求的性能,不过AMD双精度性能一直是业界最优的,这也是个事实),用在Xbox One上的APU有1.31 TFlops……随便都甩龙芯几条街了,况且这还是民用级产品,可见发展异构架构的必然性和必须性。
可惜,我们没有自主GPU架构怎么办?买授权和收购是两条捷径,但是……
展望未来国产芯的发展可能
总结一下前面长篇大论下的两个实事:1.异构处理器是未来高性能计算的必备;2.我们有自主CPU架构,但没有GPU和FPGA这些“高级货”。
没有怎么办?自我研发太耗时,买呗!ARM有一个图形处理内核Mali,这是可以被授权给其他公司使用的,就像公版的ARM处理内核一样。事实上,英伟达也开放Maxwell的架构授权,AMD也开放GCN架构的授权……只不过,用人家授权的架构永远有一种“寄人篱下”的感觉,东西不是自己的,使用好坏还要看人脸色。从极端情况来说(尽管不太可能发生),美国政府可以禁止出口CPU,也就能禁止授权GPU架构。不是自己的知识产权,说没有还真突然就没有了。
想要彻底一点拥有别人的技术,那就只好去收购别人的公司及专利——譬如某些国人特别津津乐道的收购AMD啦、收购MIPS啦、收购GlobalFoundries等等……MIPS当年倒是有可能被收购,但可惜了,ARM和Inmagination于三年前已捷足先登。至于另外两个,小编必须得抱歉地给抱有这些幻想的企业家们泼盆冷水——不可能!想都不用想,美国政府坚决不会同意,就算政府表面妥协了,英特尔也不会同意。
这里,小编作为一个曾经深入研究过AMD和英特尔专利交叉授权的人(原版协议链接),可以负责任地给大家剖析一下为什么中国企业不应该浪费生命在考虑如何收购AMD或者GlobalFoundries身上。
首先,美国政府视X86处理器技术为尖端技术,不会允许被视为“假想敌”的中国购买和掌握。这是政府层面的政治考虑,小编就不多说了。假设,如果我们过了政府这一关,我们接下来就要面对繁琐和严苛的专利交叉授权了(这也是让很多想收购AMD的公司望而却步的原因所在)。
交叉授权规定,任何一方只要破产、控制人发生变化(某一股东持股比例超过50%),当前的交叉授权立即作废(参见原版协议5.2章节)。作废对双方公司都生效,因此并不存在只有某一方作废,而另一方仍被允许使用对方专利技术的情况——不要小看AMD,X86-64的专利大多在AMD手上,作废了英特尔也举步艰难。所以,这种交叉捆绑的限制让双方的谈判有了很多的周旋余地。
那么是不是任何一家公司只要收购了AMD,就立刻失去X86授权?表面上是,但是——2009年,美国联邦贸易委员会(FTC)对英特尔的反垄断裁决里(链接地址)给出了如下这么一条解释:“如果AMD因为被收购而导致交叉授权协议作废,在控制人发生改变后(被收购)的一年内,英特尔不可以就X86的专利授权问题提起起诉,而更应该积极地展开新的谈判。”
这里又谈到了美国政府。所以还是那句话,中国企业想要收购AMD直接获得CPU和GPU的各种福利,是完全不可能的。先是美国商务部不会同意,即使碍于面子勉强答应,英特尔也必定选择撤回专利授权,而这时候美国政府总不会因为中国企业去处罚英特尔吧?大家做做样子,最后还是不会同意(收购GlobalFoundries也会是这个结果,英特尔将拒绝继续授权)。
倒是韩国三星如果真有兴趣收购AMD,美国或许会答应。毕竟韩国在政治上算得上美国的战略同盟国,地位非凡啊。
不能买,不能收购,想要掌握尖端处理芯片技术,中国还真只能靠自己。话说在硅谷设计芯片的高级工程师,包括英伟达和AMD的两位CEO,很多都是华人。如果中科院真心想要发展长久之计,建议还是从招揽人才这个方向下手。当然,人归不归,国家要不要下血本发展CPU以外的芯片技术,这都不是小编要谈论的内容了。
这里小编要补充一段,国内有一些由海归工程师组成的FPGA芯片设计公司在近几年里陆续出现。这正是上一段小编所呼吁的一种发展途径。因为FPGA毕竟是国外最先提出的技术,所以国内很多FPGA设计团队都是游走在“灰色地带”的(没有技术授权)。不过这并没有关系,随着时间推移,经验的累积,自主的FPGA技术是慢慢会有的。当然,距离实现CPU + FPGA这种异构设计,则恐怕还有相当一段路程。
小编胡乱写了一通,只想说:其实我们的半导体技术真的很落后。那么多年搞出个CPU,其实本就没什么,但一些人却沾沾自喜,完全忘记了整个行业变迁的方向。而在新的领域里,除了半成品的CPU,我们啥都没有。偶尔有一两个博士愿意归国,结果还被美国以偷芯片为由给抓了……我们有的最多的就是一群喜欢暴着青筋在网上对骂的“键盘侠”——这些可都是牛人,什么都懂,什么都看不起。在他们眼里,世界上最能赚钱的苹果是一家没啥真正技术实力的奸商;为中国企业鞠躬尽瘁的谷歌则是产品体验烂得一塌糊涂的恶霸;还有微软和IBM,全都是不思进取的典范;最后是一文不值的AMD,产品差、技术差……哎,可就这个让我们“看不入眼”的技术,却是我们苦苦求都求不来的东西。
C. 关于新加坡特许半导体
半导体FAB有几十种机器种类,每种还有不同的生产厂商,又不知道你会被分在哪一个区域,这里是不可能说清楚具体怎么操作的。你是去做生产线的操作工,不会去做太多机器界面上的操作,大部分是通过系统去让机器跑产品。而且相关的操作再开始阶段会根据你的分区有相关培训的。
D. 列举国内外集成电路的主要供应商
国外 英特尔(Intel)、三星电子(Samsung Electronics)、SK海力士和高通(Qualcomm),镁光(Micro),德州仪器(TI),东芝(Toshiba),Avago、博通(Barodcom),NXP、Freescale(飞思卡尔),AMD,GlobalFoundries;
国内 海思,展讯,中芯国际;
台湾地区 台积电,MTK,联电;
其中 台积电,联电,中芯国际是Foundry厂商。
E. 虹晶科技股份有限公司怎么样
简介:虹晶科技股份有限公司成立于2001年7月,实收资本额逾新台币伍亿元,目前格罗方德半导体(GLOBALFOUNDRIES)为最大的法人股东,虹晶除新竹总公司外,并有上海子公司虹晶电子(上海),拓展业务及服务客户。
F. Global Foundry 的工作机会 有多少中芯人会去
历史上CPU都是自己制造,后来交给嫡出的GlobalFoundries进行代工,而GPU考虑到良品率很低的问题。为了保证利润基本数值。所以必须外包给台积电,APU则根据不同产品线分别交给两家。
G. 新加坡 GF 什么 意思! 应该是一家半导体公司。但具体是哪家
如果你是指一家半导体公司,那么应该是这家 - GLOBAL FOUNDRIES SINGAPORE。
http://www.globalfoundries.com/about/
H. 新加坡半导体制造公司有哪些
如果所谓的半导体代工是指晶圆的话,那么就有:
1)台积电和飞利浦合资的SSMC(但这间主要是做台积电和飞利浦的代工)
2)台湾联华(UMC)在小新的分厂
3)以前属于小新政府的CHARTED(特许半导体),但前几年已经被中东财团收购,现已改名为GLOBAL FOUNDRIES
4)当然新加坡还有几家晶圆厂,如STMicron, IMFlash, Hitachi。
(8)globalfoundries股东扩展阅读:
分类:
半导体材料很多,按化学成分可分为元素半导体和化合物半导体两大类。锗和硅是最常用的元素半导体;化合物半导体包括第Ⅲ和第Ⅴ族化合物(砷化镓、磷化镓等)、第Ⅱ和第Ⅵ族化合物( 硫化镉、硫化锌等)、氧化物(锰、铬、铁、铜的氧化物)。
以及由Ⅲ-Ⅴ族化合物和Ⅱ-Ⅵ族化合物组成的固溶体(镓铝砷、镓砷磷等)。除上述晶态半导体外,还有非晶态的玻璃半导体、有机半导体等。
半导体的分类,按照其制造技术可以分为:集成电路器件,分立器件、光电半导体、逻辑IC、模拟IC、储存器等大类,一般来说这些还会被分成小类。此外还有以应用领域、设计方法等进行分类,虽然不常用,但还是按照IC、LSI、VLSI(超大LSI)及其规模进行分类的方法。
I. 台积电在欧盟被指控不公平竞争了吗
根据当地媒体9月22日报道,业内消息称,美国电子芯片制造商GlobalFoundries已经要求欧盟反垄断部门调查市场领头羊台积电,指控台积电实施不公平竞争。
据悉,按照欧盟的规定,违反欧盟反垄断规定的企业最高可被处以全球营收10%的罚款。欧盟委员会拒绝就指控置评,欧盟委员会监控可能存在的反竞争市场行为和滥用市场支配地位行为,其中包括活跃在半导体领域的厂商行为。
希望欧盟可以早日介入调查,群主的眼睛是雪亮的,清者自清!