时钟统一的概念及意义

  G80图形核心采用TSMC 90NM工艺制造,并采用全新概念的统一渲染架构,核心与外置分离的视频处理及输出单元共拥有高达680M个晶体管。核心代号为G80-300的GPU制成GeForce8800GTX,拥有多大128个Streaming

  类似于CPU,G80图形核心也有一层IHS保护,这是为了防止压坏脆弱的核心部分,NV还动用了夸张的12颗螺丝用做核心位置的固定(下图)。

□-NVIO,外置的视频处理及输出单元

  和过去不同,GeForce 8800系列还把视频处理及输出电路都从GPU中剥离出来,这颗芯片称为NVIO,提供了400MHz RAMDAC并支持Dual-Link DVI输出,TV Out 及HDCP功能。独立NVIO芯片是在现有工艺手段下提高G80的产能的有效方式之一。

   G80图形核心支持DDR1、DDR2、DDR3、DDR4这四种显存,不过综合成本和性能等因素后,G80图形核心最终选择了供货稳定的GDDR3。我们并没有发现8800GTX和8800GTS使用显寸有什么区别,他们都是编号为Samsung K4J52324DE-BC12的GDDR3颗粒,只是在默认频率的设置有所不同。

  我们知道,虽然NV驱动在软件运行SLI模式的启动,但是在效能损失相比采用SLI Bridge的形式多得多,因此依然坚持采用传统的SLI搭桥模式。在GeForce 8800GTS上,我们依然见到熟悉的一个MIO接口,但在GTX上面,却可以看到有两个,NV并没有解释如此设计的原因,我们猜想这可能在NF680i芯片组上物理卡提速所需。

G80——革命性全新图形架构

  作为DX10硬件的要求,G80图形核心具备Geometry Shader(几何着色器)的单元。G80图形核心取消了传统的绑定式纹理单元设计,而采用了不同比例的纹理拾取单元(Texture Address Unit,负责传统TMU的纹理拾取操作,一共有32个)和纹理过滤单元(Texture Filtering Unit,负责浮点纹理过滤,一共有64个)来适应未来3D程序发展的要求。

  G80图形核心的后端渲染单元(ROP)和显存控制部分也被彻底的重新设计,GeForce8800一共6个64bit的交错式显存控制器,总位宽为384bit,支持带抗锯齿的浮点高动态范围渲染。G80图形核心所进行的重大改进还有很多,下文我们将给大家详细讲解这些改进的目的。


G80的工作流程猜想图

  发布前,业内大多数则认为G80图形核心会选择保守的分离式架构,但G80图形核心最终是一个彻底的Unified Shaders架构。所谓统一渲染架构,最容易的理解方式就是Shader单元不再分离,显示核心不再为Shader类型不同而配置不同类型的Shader单元,所有的Shader单元都可以为需要处理的数据进行处理,不管是Pixel Shader数据还是Vertex Shader数据。而调配哪几组Shader单元负责处理什么数据或者进行什么样子类型的计算,则由一个被称为small sets of instructions(SSI)的部分来控制。这样在硬件上,设计者就无需为不同的着色引擎设计不同的执行单元,只要按照所对应的接口以及操作方式全部融为一体,这无疑节约了宝贵的硬件资源。

  作为一款面向未来的GPU架构,G80图形核心对新一代DirectX10 API的通用Shader架构给予了完整的原生支持。实际上,DX10并没有对硬件的Unified Shaders架构做出硬性要求,只是在API层上将不区分各种Shader。虽然现在DX10的Vertex Shader、Pixel

  在很多时候如果我们处理的一个场景是以Pixel Shader计算为主,Vertex Shader计算仅占一小部分,如果采用分离Shader设计的显示核心,就可能存在Vertex Shader计算单元空闲,但Pixel Shader单元过渡计算的现象。同样的也可能存在Pixel Shader数据比较少,但Vertex Shader计算数据过多的问题。这就往往造成了一方面着色单元闲置,另一方着色单元资源紧缺的情况。


目前的分离式渲染架构实际上浪费了不少硬件资源


采用统一Shader后所有的渲染单元都可以得到充分利用

  像游戏《上古卷轴4:埋没》中常见的大树林或者草丛,树叶是由庞大数量的多边形构成,对GPU的顶点渲染提出了严酷的要求,这时候并不需要太多像素操作。统一渲染架构显示了它智能的一面,不受限制地使用纹理资源,并可以使用任意长度的着色指令,游戏速度即时提升了。

  毫无疑问,GPU架构的革新也带来直接的速度提升。通常的做法是增加GPU内部的渲染管线(Pipeline)来获得更多的计算能力,但G80图形核心的实现方式截然不同。

Shader时代图形渲染的基本操作是以各种指令为基本单位的,而这些操作可以分为两类:vector(矢量)和scalar(标量)。scalar是基本的单位,一个scalar操作可以包括一个mad或mul这种基本指令,被称为1D操作;一个vector就是n个标量,一般来说n = 4,因为现在最流行的RGBA中,3D刚好满足RGB操作,1D则适应Alpha通道的操作要求。因为指令是3D+1D,所以被称做4D操作,传统的GPU管线中ALU的操作能力就是这样。

  像R5XX和G7X的每个ALU都有能力单周期完成一个3D+1D(也就是3D矢量+1D标量指令,它们如果并行,被称做co-issue)或者2D+2D(一般是贴图坐标的处理, 因为一般是2d的坐标, 所以可以两个同时进行)总共4D这样的指令操作。而观察G80图形核心的着色单元设计,我们会发现最大的不同就是G80图形核心将3D+1D或者2D+2D这样执行能力为4D的“大”ALU拆分为单个执行能力为1D的“小”ALU,然后将这些ALU组成8个阵列(TCP),每个TCP拥有16个ALU,它们被称做1D Scalar Streaming Processors。通过独特的内部分频技术,这些着色单元阵列能以超过时钟频率2倍多的频率(1.35GHz)运行。

  G80的纹理单元也被重新设计。前面已经提到,G80取消了传统的纹理单元。将传统纹理单元(TMU)的功能拆分为两种单元-- 纹理拾取单元(Texture Address Unit)和纹理过滤单元(TexTure Filtering Unit),它们以跟核心频率相同的频率(575MHz)运作,以1:2的比例组成了新的纹理渲染阵列(Tex Array)。


G80图形核心的TCP阵列

  那么,这种“瘦身高频”的做法到底有什么好处呢?

1D单元遇到4D指令虽然要4个周期才能完成,但期间的延迟通过G80图形核心庞大的Thread资源完全可以掩盖。但是,shader中的操作数不可能每时每刻都为4D,更多的是常用的mul或add这种简单指令,这种操作对于传统4D流水线就有些划不来了,因为不管操作数是多少,单个周期内它们都要占据一个ALU的运算资源。而对于G80图形核心来说,不管是多么“细小”的操作,它的这种分散式流水线都有很强的适应能力。


G80的单个标量处理单元示意图

  另外,即使是标准的3D+1D的标量+矢量并行操作,co-issue也不是每时每刻都有效的,当前的各个GPU,在内部指令执行方面都有一定限制。比如,R4XX、R5XX要求程序对RGB+Alpha的co-issue进行配对优化;R580这种非对称架构需要着色器指令的顺序针对不同的过滤方式、不同的纹理格式使用不同的TMU、ALU指令配对比例;G7X要求nrm_pp指令紧挨着TMU指令执行..…等等等等。一旦出现不符合它们“胃口”的Shader顺序或者指令搭配方式,那么它们的理论指标就会大打折扣。


G80的单个纹理渲染阵列示意图

  在纹理渲染方面,G80也充分为未来进行了考虑。传统的GPU中TMU兼负纹理拾取和纹理过滤两重功能,而G80对这两种功能采用了分离设计,能最大限度的适应当前shader中需要对主内存进行操作的纹理拾取指令减少,而与HDR等相关的纹理过滤指令增多的情况。

  除了在底层执行单元效率上的彻底革新外,G80图形核心还为整个流水线引入了一道更加严格科学且富有效率的管理体系——Gigathread技术。实际上,G80图形核心整个架构动力的源泉就来自于此。

  当数据从游戏引擎传送至G80图形核心的流水线之后,会首先被送入一个叫做Thread Control Unit的地方,相当于G80图形核心整个流水线的仲裁和控制机构。这个类似于处理器的线程管理单元会将所有的着色单元的数据平行的拆成超过1000个平行的Threading(线程),并动态监测整个shader array流水线的工作状况。一旦它发现其下某个着色单元由于等待数据或工作完成而处于闲置状态,就会马上递交一个新的线程供其执行。这样让整个流水线保持极高的运行效率。

  Gigathread带来的另一个好处就是,能够减缓SIMD流水线中指令间的依存。在之前的G7X或R5XX架构中,由于SIMD流水线本身指令发射数有限,而它们能保有的threading数目又受到限制,流水线中的Alu算术指令和Tex纹理指令必须按照一定的比例配对,才能发挥出全部的运算能力。而G80上,由于Gigathread能硬件的将各个thread的stage(如Register file与各种控制的现况)保存下来,所以整个流水线对非规则指令的“忍耐”能力大大提高,即使是未经过优化排序的指令,也能被高效方便的执行。

  由于DX10将所有的Pixel和Vertex视做同等的Shader操作,因此这个管理器也负责进行高效的VS or PS的鉴别。它同时还会判定当前需要渲染场景的具体Vertex以及Pixel Shader的计算需求量,根据这个数据动态的调整所有通用着色单元中PS和VS的比例。

  Gigathread除了负责整个流水线的动态管理外,还担负着另一项重要使命,那就是对抗延迟。对于当今频率越来越高的GPU而言,如何对抗外部存储器延迟成为了一个关系到最终性能发挥的重要课题。一个以500MHz时钟频率运行的GPU,它的单个GPU时钟周期的长度在2ns以下。而我们可怜的外部存储器(显存),还在以200MHZ左右的速度工作。这就意味着,如果碰到一个Texture Fetch(纹理拾取指令,它需要GPU去读取显存里某个部位的数据),GPU从开始存取外部DRAM,到DRAM的第一个数据包实际送出之间,大概有十几到几十个ns的时间差,换算成GPU内部的时钟,就是几十乃至数百个周期的数据等待延迟,这种延迟会让整个流水线都陷入停顿,对于高速运行的GPU来说无疑是灾难性的。


完善的Threading管理体系可以隐藏存取显存动作所造成的延迟 

file(临时寄存器)里,然后立刻将另外的新Threading提交给这个Shader Unit执行,直到Texture Fetch完成为止,从而保证了整个流水线的效率不受DRAM延迟的影响。可以说,是Gigathread保证了整个流水线的运行效率,使它们得以免受延迟等因素的困扰。 

□-维持SIMD正常运转

  在之前的GPU架构中,除了运算能力之外,GPU本身对3D渲染流程的进行还有很多限制。比如,面对阴影作边缘柔和取样的时候,通过合理的使用if / else指令可以让Shader在不需要取样的像素直接跳过,节省出大量的Pixel shader资源,这就是动态分支(Flow Control)。

  对于大多数DX9规格的GPU而言,如何保持SIMD流水线的平行度是个很令人头痛的问题。因为SIMD流水线单指令,多数据流的特点,位于同一个Quad内的4条Pixel Shader着色管线都共享同一套指令分配体系,并处于同一个控制电路的控制之下。所以,在执行动态分支的时候,这个Quad内的4条Pixel Shader着色管线在每个时钟周期只有跑同一种指令,才能让所有ALU都保持工作。如果遇到不同的指令介入,那么因为指令发射器和控制单元共享的问题,实际无法在单周期完成。

  那么,对于要尽量维持并行能力的SIMD体系来说,这种状况就毫无意义了。G80图形核心的Gigathread架构能够为流水线维持尽量多的平行线程,从而能将进行分支时的Batch Size(可以理解为分支工作的区域)做得很小(G80图形核心最小能够做到对单个连续的4*4象素块进行分支处理而保持峰值性能)。这样就能尽量减少在一个象素块里遇到两条不同指令的可能性, 从而避免SIMD流水线的并行度被破坏。

NVIDIA于全新一代G80图形核心绘图核心中进一步强化3D游戏画面质量,称为Lumenex引擎。

   G80图形核心所解放的特性中,一个比较重要的就是带MSAA的高动态范围光照(HDR)。在R5XX VS G7X的时候,闹得沸沸扬扬的HDR和MSAA冲突就源自于此。DX9没有FP格式的Backbuffer(后端缓存,用于存储一些中间运算的结果),因此从NV40到G71,NV的硬件在ROP中提供HDR功能的同时干脆一直没有做MSAA。ATI看中了这点,它们改善了自己X1000系列产品的ROP,允许程序建立一个MSAA的FP16 render


采用了HDR渲染技术在开启MSAA后拥有惊人的画面效果

Buffer”(直译为“正交帧缓存”)的功能,现在公开的资料还难于了解其详细情况,不过从《The art of unix programming》对于Orthogonalized的定义中我们可以窥其一二:“在纯粹的正交设计中,任何操作均无副作用;每一个动作只改变一件事,不会影响其它”。这意味着,任何对于Frame Buffer的操作都是独立的,而不会影响其他操作的进行。直接消除了FP32

Anti-aliasing(MSAA)模式相约,但画面质量将有明显加强。CSAA采用了一种全新的算法实现了几何取样和覆盖取样的结合。对于通常的超级取样抗锯齿(SSAA)来说,每一个被采样的象素都将被进行更细分的采样和计算,但对同一物体材质内部将可能得到非常相近的色彩,这毫无疑问会造成资源浪费,所以现在流行的MSAA模式将首先会对像素的位置进行检测,对于材质内部将不进行处理,只发生一次采制读取。CSAA将MSAA颜色和深度值(Color/Z)的取样点位置延伸到了被取样的Pixel之内,颜色值在被取样的Pixel点中心得到, 并且将Color和Z数据存放在缓存中,这样,我们能在保存同样的Color/Z数据下得到更多的取样点。实际上16XCSAA只需要保存4份Color和Z数据,却可以得到16个sample points(取样点)。


CSAA和MSAA存放相同取样点信息分别所占用的显存空间

  相对于通常的采样模式,CSAA的好处是,在覆盖取样点数相同的情况下,它所要保存的Z数据(深度缓冲数据)和Color数据(颜色数据)将减小50%至75%,这大大节约了宝贵的显存带宽。不过,当游戏采用大量的Stencil运算(比如容积阴影)时,CSAA模式将不会被启动而被降至4xMSAA模式。

  QAA源自NVIDIA很早就有的一个名为的“五点梅花排列采样法”(Quincunx)抗锯齿算法。这个算法在上采样时对每个象素只产生两个子采样点,而下采样的时候却对5个子采样点进行了运算(通过从临近象素那里去“借用”子采样点的方法来获得多出的3个子采样点),这样以用2倍MSAA的性能损耗达到类似4AA的取样效果。NV这次在G80上改变了QAA的取样模板,将最大取样倍数提高到了16X,实现了更高的效果。


各类AA的取样信息和所占资源比较

  由于G80图形核心拥有高达64个浮点纹理过滤单元(Texture Filtering Unit),在各种纹理格式下都提供比现今任何一款G80图形核心高得多的性能,其各向异性过滤(AF)操作也变成了免费的功能。NV还特意取消了之前一直用使用的角度优化功能,来展示它的强大。

  G80图形核心的ROP(后端处理单元)也进行了重大改进,具备新型Early Z技术的GeForce 8800 GTX GPU可以相对于7900 GTX提升4倍的无用像素选择速度,最大限度的利用了带宽资源,配合高达384bit的外部存储器提供的超过80GB/S的带宽,足够免费为4倍MSAA这个级别的应用提供强力支持。

  技术部分中Lumenex引擎章节中,我们已经向大家介绍了NV GeForce 8800GTX引入了全新的抗锯齿模式。现在我们利用游戏《半条命2——失落的海岸线》来演示开启不同模式抗锯齿以及速度方面的影响。测试画面是由分辨率设置为的画面按照1:1截取。由于gif格式的固有特性,画质有部分损失。

  读者也可直接下载压缩包(),解压后用幻灯片模式浏览图片效果更佳。

SLI的32xAA选项,因此没有进行进一步的测试。

  在抗锯齿的画质和速度综合考虑,我们建议GF8800系列显卡用户在游戏中使用8xQAA模式。


G80提供了真正的全角度各向异性纹理过滤品质,是目前这个项目表现最为出众的显卡,不需任何加工。

、量子物理、视频引擎----G80的通用计算架构


当前GPU架构的通用计算潜力

  GPU通用计算(GPGPU)扩展,在NV30时代就曾被提起。CPU由于主要针对复杂控制和低延迟环境设计,而使得它的运算单元偏少,带宽也不足。相比之下,GPU本身就是一个SIMD(单指令多数据流)的“”,拥有众多的运算单元和强悍的外部存储器带宽,更加适于高并行性、高密集度的计算。随着GPU本身可编程特性和灵活度方面的改善和越发强大的浮点处理,越来越多的人开始用GPU做一些非绘制方面的事。另外,Cg、HLSL以及GLSL等实时的高级绘制语言的出现和发展也对改善GPU通用计算的编程环境起到了推波助澜的作用。

  ATi R5XX系列发布后,因为它宽松的编程环境,这个词语更多的出现在各大媒体的报道中。GPU的通用计算,从长远来看是GPU功能扩展的另一个要点,也是下一轮GPU竞赛热点功能。现在,挟DX10余威的G80又能在通用计算领域又将代来一次飞跃。统一渲染流水线架构、多达上千个线程的高平行度流水线、32位精度的无损浮点象素混合、强化的Render Target多目标输出、几乎无损的动态分支和循环shader操作、整数的支持...这一切都为它的通用计算能力打下了良好的基础,让我们来看看G80目前已经列在纸上的通用计算技术有哪些。

  由于游戏的发展,游戏引擎中的物理效果已经越来越引起开发商和玩家的兴趣。能在一个拥有真实物理效果的游戏场景里驰骋肯定是每个玩家的愿望。目前游戏里的物理运算一般都由CPU负责,但物理运算所消耗的大量浮点处理能力并不适合于CPU,将它从游戏里剥离出来已经是大势之趋。NV这次又占得先机,为G80图形核心引入了名为“Quantum”的GPGPU(GPU通用化计算)物理加速技术。G80图形核心将会是业内第一个支持3D图形和视频处理以外功能的GPU。


基于SLI架构的物理渲染流程

□-CUDA通用计算架构


G80的多线程通用计算管线构成

  CUDA是Compute Unified Device Architecture的缩写,直译就是通用计算架构。CUDA是一项新的基础计算体系,它不但支持图形芯片模拟物理计算,也加入了GPU的首个C编译开发环境。
实际上,CUDA提供了一个基于C语言的底层函数库, 可以直接使用一些D3D或者OpenGL不包含的特性。这项技术能让GPU的芯片核心同步协调地进行通用计算,速度比传统方式大有提升。另一方面,首个面向GPU的C编译开发环境让开发者拥有了新的解决方案,一些复杂的计算例如产品设计、数据分析、技术处理、游戏物理应用等方面现在都是游刃有余。

  GeForce 8800目前已经应用到这项技术,NVIDIA未来的Quadro专业图形解决方案也会随之而来,CUDA打破了传统的GPU处理数据方式的局限性,让GPU的核心能联合、同步地共享数据。


G80基于并发多线程的通用计算

Reduction(高清影讯除噪声)及HD edge enhancement( 高清影讯边缘强化) 。难怪在HQV高清影像测试中,拿下现今独立图形卡最高分。

3.0只允许16个);材质texture格式变为硬件支持的RGBE格式,其中的"E"是Exponent的省略,是RGB共同的说明,这在HDR的处理上有很大的作用,摒弃了以往需要专门decoding处理HDR渲染的流程。 另外,对于纹理的尺寸Shader Model4.0也有惊人的提升,的最高纹理分辩率比原先最高的分辩率要高出4倍。G80图形核心对以上规格都给予了完整的硬件支持。


带几何着色器和流输出的流水线架构图

  原来的Vertex Shader和Pixel Shader只是对逐个顶点或像素进行处理,而新的Geometry Shader可以批量进行几何处理,快速的把模型类似的顶点结合起来进行运算。虽然其操作不会象Vertex Shader那样完整,只是处理器单个顶点的相关函数操作,但是这种操作却可以确定整个模型的物理形状。这将大大加速处理器速度,因为其它Shader单元将不再去需要判定数据所存在的位置,而只是需要简单的为特定区域进行操作就可以了。

  Geometry Shader可以把点、线、三角等多边形联系起来快速处理、同时创造新的多边形,在很短时间内直接分配给其他Shader和显存而无需经过CPU,烟雾、爆炸等复杂图象不再需要CPU来处理。从而极大的提高了CPU速度和显卡速度。游戏图象中可以出现许多精细场景,如不锈钢茶壶上清楚的反射出周围物体、超精细的人物皮肤等。

  为了最大程度的发挥Geometry Shader的威力,DX10硬件还专门设置了一个名为流输出层(Stream Output State)的部件来配合它使用。这个层的功能是将Vertex Shader和Pixel Shader处理完成的数据输出给用户,由用户进行处理后再反馈给流水线继续处理。我们可以通过Stream Out把GPU拆成两段,只利用前面的一段几何运算单元。对某些科学研究,也许可以通过stream out来利用GPU的数学运算能力,等于在CPU之外又平白多得了一个数学协处理器。举个例子,Doom3常用的Stencil shadow,因为CPU负担很重,广受批评。但是因为GS可以计算轮廓线, 还可以动态插入新的多边形,有了Stream out之后,Shadow volume的生成就可以放到GPU端进行,实现Stencil shadow的硬件化,这将大大降低CPU占用。

特别章节:如何组装适合你的G80系统

组装一台合适的G80系统并不是一件容易的事情,在接下来的篇章我们陆续向大家提供一些建议。

  在主板平台的选择方面,我们将在这里省去相关的章节,因为下周我们将发布全面的有关NF680i及975X等系列芯片组的横向评比测试,敬请留意。

  在nVIDIA给我们的技术文档中,清楚的标明了新显卡对电源的要求,GF8800GTX要求使用450W和以上功率电源,12V实际电流应达30A;GF8800GTS要求使用400W或更大功率电源,12V实际电路应达26A。除此之外,NV还提供了推荐GF8800GTX用户使用的电源名单(如下图)。在这份列表中,除Zippy、Silverstone和Thermaltake外,其余品牌并未于大陆开展销售。值得强调的是,列表中仅有Zippy PSL-6850P通过了SLI认证且正在销售,但是符合认证的应该是型号后缀为(G1)-PCIE4的产品,目前我们手中的样品还只是配备2个PCIe电源接口。

下一页,我们将会通过实际测试来说明问题。

EXP观点:NVIDIA进行的内存、主板,电源等多项认证不过是其牟利和彰显影响力的表现。

  特别说明,下文录得的所有数据皆为整机功耗数值,单位瓦特。测试中,我们让OC 1.500V的C2D E6600满载时整机功耗就可达265W,但是用户的实际运用中CPU和GPU同时达满载的情况不多,在不同操作环境中会有不同的负载情况出现(对CPU/GPU需求波动),这也是为什么整机功耗不能单纯依靠理论值累加的原因。那么我们该如何选择我们所需的电源?

  在完全标准的状态下(即不进行任何超频动作),使用的全汉300W和康舒400W电源都没有出现问题,可以看到,海韵Power Angle录得的最大功耗读数也仅仅是240W而已。对于“循规蹈矩”的用户,市面上足功率的300~400W电源就可提供丰余的动力;对于超频玩家,实际情况有些不同。

  除了上面的测试,我们还让CPU和8800GTX负载最大化(分别运行Superpi和ATi tool小球模式,并指派不同CPU核心),此时录得的最大读数也仅仅是372W而已。值得注意,负载时的X1950XTX能耗与NV旗舰8800GTX非常接近,高于剩下的其他NV显卡。

另:电源的转换效率也要充分考虑。

对于GF8800GTX SLI用户而言,Silverstone SST-ST60F不失为第一选择,这是我们目前从市面上唯一可以直接购买到配备4个PCIe电源接口(实际上应该是5个)的模组化电源,它的额定功率为600W,市场售价为¥1300(),上文GTX SLI系统的测试就使用了这个电源来完成的。


是否担心你的CPU成为瓶颈?

  作为史上最强大的娱乐型显卡,GeForce880GTX是否会因为CPU瓶颈而限制发挥了?我们用8款游戏的成绩进行测试。

Heroes对于CPU的依赖程度不高。可以看出新一代显示卡发挥不多受限于CPU效能,这也和Intel Core 2 Duo处理器强大的游戏效能不无关系。

  以GF8800GTX为例,它的卡长达26.8cm,这比大部分标准ATX主板的宽度值都要大,在选购机箱的时候如果不多加心眼,难免就会遇到尴尬的情况。

  映众(Inno3d)作为香港的一个AIC,也是NVIDIA的官方发布伙伴(Official Launch Partner)之一,其显卡统一采用NV图形核心。这次映众在第一时间就为我们提供了测试所需的样品,对于专题的顺利完成功不可没。目前映众GeForce8800 GTX和8800GTS的售价分别为人民币5999元和4999元。

  讯景(XFX)GeForce8800 GTX和8800GTS再次重演天价本色,成对销售价为19999和16999(成对购买送七盟 ST-750EAJ 750W电源),不过这次和过去7950GX2的情况不同(XFX显卡出厂BIOS就让显卡超频),讯景不得不遵守NVIDIA的规则,除了一年保换的优质服务外之外,这厮天价不知有谁愿意“买单”。

  或许是仓促推出驱动的原因,现有的驱动只能侦测到核心的温度表现,环境温度和保护温度设置仍然无效。在针对GF8800系列显卡的96.94beta驱动上,我们已经看不到传统的控制面版,尚不清楚NV是否会学习ATi的“陋习”强制用户使用全新的控制面板。

  默认情况下,GeForce8800系列显卡的风扇是以59%转速进行运转,噪音很小,要进行转速设置必须安装驱动之外的nTune软件。我们使用ATi Tool 0.25 beta16的小球模式让GPU处在高负载的状态下。

  在实际的散热效果方面,全新的GeForce8800系列显卡的表现让人满意,即便是全负载下的GeForce8800GTX,它的核心侦测读数也不过是86℃而已,如果能手动将风扇调至全速,那么温度将会下降接近10℃(8800GTS达15℃),效果非常显著,只是此时风扇噪音相较之下增加不少。由于nTune支持的风扇转速模式是从0~100%,用户可自行寻找风扇转速(等同于噪音)和散热效果的平衡性。考虑到目前室温较低和裸机测试等因素,我们还是建议用户配备散热良好的机箱。

  虽然我们这次没有提供详细的实际噪音读数,但是测试中还是可以直观的发现GeForce8800系列显卡要较Radeon X1950XTX更安静一些,后者在满载时,软件读取的核心温度在83℃左右。

  我们将显卡散热器调至全速(参照上一页)来进行超频,最终把GeForce8800GTX显卡核心/显存频率从默认的575/1800MHz成功超频至650MHz/2080MHz。超频幅度很小,这和BIOS的限制也有一定关系,在G80发布之前,NV就勒令任何厂商不得擅自将显卡超频。除了驱动程序自带的超频选项之外,部分玩家还喜欢用ATi Tool进行超频。

  测试所用的主板是NVIDIA NF680i参考版,除7950GX2外,其他显卡会自动启用“Linkboost”总线加速功能。我们将在稍晚时候放出这款主板的评测时会作出更多介绍。为了让系统受CPU影响的可能性降低,我们将C2D E6600超频至400MHzX9,此时内存运行在同步1:1的DDR2-800 4-4-4-12 1T timing下。

  除了3Dmark系列进行了或等默认测试采用的分辨率外,其他测试的起步分辨率统一为并开启HDR或者抗锯齿设置。特别指出的是,我们的CPU已经被超频至400MHzX9了,而内存1:1同步运行在DDR2-800 4-4-4-12 1T timing下,其他选项默认。为贴近用户实际操作环境,板载的HDA声卡也被我们启动。

  测试时NV可提供的最新驱动为96.94 beta,这也是我们当前可以启用GeForce8800系列显卡的的唯一驱动(9日当天,NV又发布了G80专用的97.02),而对比的7950GX2使用最新的93.71驱动由于无法开启多GPU工作,成绩最终在96.94beta驱动下取得,这个驱动的分值要比93.71要高一些。

  测试所用的主板是NVIDIA NF680i参考版,除7950GX2外,其他显卡会自动启用“Linkboost”总线加速功能。我们将在稍晚时候放出这款主板的评测时会作出更多介绍。为了让系统受CPU影响的可能性降低,我们将C2D E6600超频至400MHzX9,此时内存运行在同步1:1的DDR2-800 4-4-4-12 1T timing下。

  除了3Dmark系列进行了或等默认测试采用的分辨率外,其他测试的起步分辨率统一为并开启HDR或者抗锯齿设置。特别指出的是,我们的CPU已经被超频至400MHzX9了,而内存1:1同步运行在DDR2-800 4-4-4-12 1T timing下,其他选项默认。为贴近用户实际操作环境,板载的HDA声卡也被我们启动。

  测试时NV可提供的最新驱动为96.94 beta,这也是我们当前可以启用GeForce8800系列显卡的唯一驱动(9日当天,NV又发布了G80专用的97.02)。在进行7900GTX SLI系统的测试时,NVIDIA提供的最新93.71驱动虽然具备SLI的开启选项,但是分值表现与单卡无异,最后我们使用前一个版本的官方正式驱动(91.47)完成测试。我们保留了7950GX2(使用96.94beta驱动)的成绩作为参考,由于样卡数量问题,最终无法加入成绩。对于NV SLI用户而言,93.71驱动应该直接删除,单卡用户不受此影响。

特别注明:我们漏了进行7900GTX SLI的英雄连测试。


参考报价由影驰(AIC)及蓝宝石(AIB)提供

  在比较单卡双核的7950GX2时,GeForce8800GTX的领先幅度在两成左右;GeForce8800GTS在和7950GX2的较量中没有什么优势,除了3DMark06和游戏英雄连微弱领先不到5%,大多数时候反倒落后8%。在目前价格一致的情况下,8800GTS唯一的优势一是对DX10的完全硬件支持,同时在游戏画质方面提供更大的保证。

  反观对手ATi X1950XTX,仅仅实在面对GeForce7900GTX时才难得见到一丝的胜利曙光,后者便宜足足人民币1000元,对比NV其他的情况,我想最好还是忽略不提。在新世代对比中,我们不得不遗憾的将ATi(AMD?)从神台上请下去,将掌握大权的胜利旗帜插在NVIDIA上面。

  从前文的成绩列图可以看到,GeForce 8800GTX SLI系统的游戏效能极其出众,除了游戏COD2外,所有游戏的FPS都超过100,不愧为骨灰级游戏玩家首选。

  作为首款完全符合Microsoft DirectX10的通用Shader架构图形处理器,G80顾及了效率与未来性,是让人惊叹的"革新结构的第一代作品",在接下来的全新Windows Vista操作系统及DX10游戏中,它的强大效能将首先爆发。围绕着强大的G80核心,制成的GeForce 8800GTX和GeForce 8800GTS两款显卡在发布后就为我们展现了威力,他们组成了当之无愧的王者组合。

  在上文冗长的测试中,GeForce8800 GTX领先对手旗舰产品X1950XTX达50%以上,还是首款在3DMark06基准测试中突破一万分的娱乐型显示卡。不论在3D图形处理的速度,面面质量,甚至是每瓦特性能,GeForce8800系列显卡都取得最出色的成绩,我们再次看到了NVIDIA的无与伦比。


唯一遗憾的是目前GeForce8800系列显卡仍然没有一个真正完善的驱动。

  在革命的架构背后,GeForce 8800系列显卡也有一些不足,问题集中在稍显仓促的驱动。除了无法运行倍受关注的Splinter Cell Double Agent,不少拥有HDR技术的游戏依然无法正常的开启抗锯齿效果,过去同样的问题也一度困扰着ATi,但愿这次黄仁勋(NVIDIA CEO)也能效仿ATi,对于率先解决让游戏支持HDR+AA问题的程序员作出奖励,或许能缩短这个进程所需要的时间。

  最后提醒各位GeForce8800显卡的玩家,在急着把显卡装进机箱时千万别忘了插上PCIe电源接口,和过去善良的警报不同,这次NVIDIA将喇叭的音量调得很大,别让可怕得“啸叫”把你吓个半死......enjoy yourself!!!

1.1 智能终端产业飞速发展带来历史性机遇

当今世界物联网飞速发展,PC、手机、Pad 以及其他 IoT 设备等智能 终端飞速发展,呈指数级的增长趋势,我们逐渐进入万物互连,万物 智能的时代。

1.2 万物互联时代对操作系统提出新要求

IoT 、5G 的飞速发展带来了大量的智能终端设备,但目前不同的智 能终端应用不同的操作系统,设备间的连接复杂、操控繁琐,导致消 费者的智能体验分割,需要一个简便统一的操作系统来优化智能体 验。

1.3 中美关系背景下国产化操作系统是迫切的需求

如今,整个 PC 操作系统市场基本被 Windows 和 OS X 所占领,移动 操作系统则被 Android 和 iOS 统一,由于这些操作系统的主动权基本 掌握在外国公司手里,没有国产化的操作系统,未来中国公司还是有可能面临谷歌突然暂停向华为提供系统技术支持(GMS)这样的困境。

1.4 中国已具备终端产业的领先优势

当前,中国在 5G、智能设备、人工智能、大数据、云边计算和芯片 均有深厚的产业基础,有终端产业发展的肥沃土壤,未来中国有很大 的机会领导 5G+AI+IOT 的产业革命。

早在 2019 年,华为就有预见性地发布了——“1+8+N”全场景智慧生 活战略。未来 10 年,华为希望通过该长期战略,构建起牢固的终端 消费者生态系统。这个生态的构建,既包括华为自身的产品,也打通 了与生态伙伴之间的产品。

“1+8+N”战略的核心是 1,即智能手机。8 是指 PC、平板、智慧屏、 音箱、眼镜、手表、车机、耳机,这 8 项将由华为公司亲自研发和参 与市场,并且会追求市场领先地位。N 是摄像头、扫地机、智能秤等 外围智能硬件,涵盖移动办公、、运动健康、影音娱乐、智 慧出行五大场景模式。这些领域是与鸿蒙生态的合作伙伴进行共同开 发,在合作过程中,鸿蒙生态提供 HiLink 协议标准,HiAI 组件,Lite OS 等技术平台,同时将鸿蒙操作系统开源。

5G 为万物互联提供动力,而鸿蒙 OS 更是给万物互联提供了桥梁,给 “1+8+N”战略提供了统一的控制中心。未来,围绕鸿蒙 OS,华为可 以打造全场景智慧化生活设计。

2 及华为全场景新品发布会,正式发布鸿蒙 OS 2。

2.1 鸿蒙初衷和定位:一套代码、一个系统多终端使用

鸿蒙从一开始设计就采用全栈解耦的架构,做到一套代码满足大小系 统和硬件的要求。鸿蒙将所有业务逻辑切割开,给予每个模块标签, 根据用户需求进行模块组装,实现面对全场景的操作。“依托 HarmonyOS 的分布式能力,消费者可以按需调用、组合不同设备的软 硬件能力,为用户带来最适合其所在场景的智慧体验。今天除了鸿蒙 系统以外,没有一个系统能够做到全系统覆盖所有的设备。

2.2 基于分布式软总线的独立设备连接和自由硬件组合

鸿蒙创造性地提出分布式软总线技术,将各种各样的独立设备连接起 来。软总线就好象各个设备之间连接的一条高速公路,有了这样的能 力,消费者可以根据自己的需要来组装不同的硬件成一个超级终端。

比如一个手机想做多机位的拍摄,鸿蒙通过软总线的方式把无人机、 运动摄像头、其他设备的摄像头全部跟手机连接起来,手机可以根据 用户的需要,像调度本机摄像头一样调动其他硬件不同角度的摄像 头,组成一个多机位拍摄的超级终端。

2.3 统一控制中心,协助组建超级终端

鸿蒙系统统一的控制中心,让用户可以非常方便的操控本机以及与本 机连接的其他设备,更方便用户组成各种各样的超级终端。通过统一 控制中心的服务卡片可以完成音乐选择、输出选择、设备网络连接以 及设备状态的实时查看等功能。通过界面触控,无需复杂的硬件线连 接,只需点开超级终端页面,将悬浮在手机周围的设备拉动,就能一 键完成设备的发现、配对、连接以及组合,包括对设备的身份验证, 实现周边设备互联,组建超级终端。

超级终端将各种终端的硬件能力和终端分离开,打破终端之间的物理 边界,不仅将不同终端设备连接起来,更集每个终端最强的优势于一 身,虽然分属不同终端,但却如同在同一个终端一样。

2.4 软时钟+抗干扰算法实现高质量音画同步

超级终端使用场景:当用户在手机上观看一段非常精彩的视频,想要 提升观影体验,将视频转到客厅的大屏观看,只需要打开超级终端页 面轻轻一拉,让手机和大屏组成一个超级终端,那么瞬间手机的视频 就能在大屏上展示出来;在夜晚,为了不打扰家人,用户只需要把耳 机拉到智能终端,就能和手机、大屏组了一个新的超级终端,实现更 好的观影体验。

以上场景的实现,鸿蒙使用了软时钟同步和抗干扰算法两大关键技 术。软时钟同步通过对各路解码视频的视频数据在时钟域和数据域上 双重同步,使连接在一起的超级终端设备共同遵守一个时钟基准,保 持播出的电视画面稳定,提高观看效果;此外,无线通信频段集中了 大量无线发射、接收设备,包括路由器、手机、平板、电视以及其他 IOT 设备,大量设备同时工作会互相干扰,造成抖动、时延和丢包。 鸿蒙抗干扰算法可以将干扰降低到能够容忍的范围内。

2.5 打破硬件边界,多设备协同工作

当需要把手机图片传送到 Pad 文档时:传统场景下需要通过第三方软 件达到手机和 Pad 之间的联通,然后将所需图片传到 Pad,再进行拷贝和粘贴。在鸿蒙系统中,只需 Pad 和手机组成超级终端,在 Pad 屏 幕上操作将手机中的图片拖动到文档内,方便快捷。

对运行 Windows 系统的 PC,只需在 PC 的系统内安装鸿蒙分布式的 插件,通过鸿蒙分布式插件,能够使不同的操作系统设备之间文件管 理系统互通,方便的实现互相传输,共同组建超级终端。

2.5.3 任意组装场景化的超级终端,无穷创意空间

鸿蒙多机位模式,基于强大的分布式能力,呈现不同机位视角,超级 终端可以随意调用终端各个摄像头。

2.5.4 蚂蚁市场破局者,降低 IoT 使用成本,释放家电智慧化能力

如今的智能家电市场竞争激烈,品牌混杂,行业标准不统一,使用不 同的智能家电需要安装多个不同的 APP,导致家电 IoT 设备使用成本 高,使用便捷度低,智能设备配备的智能能力未得到发挥。

根据华为的统计情况,拥有智能家电设备的消费者,仅 10%安装了对 应的 APP,而在安装 APP 的消费者中只有 5%真正使用智能功能。 鸿蒙系统帮助智能家电设备的智慧化能力得到释放,大幅度降低 IoT设备的使用成本。通过接入鸿蒙系统的手机轻触一下搭载鸿蒙系统的 智能厨电上的 NFC 标志,无需下载 APP 直接跳转控制界面,简单实 现手机与智能家电的联网。

烤箱:用搭载鸿蒙系统的手机轻触安装鸿蒙系统的电烤箱快速联网,智 能功能通过卡片的形式展示。例如根据展示的菜谱配比食材,放入烤 箱,手机一按就完成了操作。

冰箱:过去消费者不确定食材的适当保存温度来降低营养流失,搭载鸿 蒙系统后,轻触即可看到智能化温控推荐,将食材放到最合适的温度。

2.5.5 带屏设备均能成为控制中心

基于鸿蒙分布式能力,手机、手表、PAD 均能运行统一的控制中心。 在未来鸿蒙生态里所有带屏的设备均具备控制中心能力,消费者可以 随时随地便捷操控所有设备,做到方便地控制中心与物互联。

2.6 全新的原子化服务,应用无需安装跨设备自由流转

鸿蒙操作系统基于分布式编程框架,通过原子化服务实现一次应用开 发适用所有终端。原子化服务下鸿蒙应用可以解耦出业务功能的最小 颗粒,通过免安装,卡片式交互让应用服务更高效;并可以随场景而 变,通过超级终端的组建,按场景在不同设备之间实现应用可分可合 可流转可分发,应用在不同的终端之间进行流转。

2.7 全栈优化,极致性能体验,超越安卓时代

鸿蒙全栈系统优化,通过内核层、硬件抽象层、RUNTIME 层以及框 架方面的优化努力。鸿蒙系统综合性能较基于安卓系统的 E-MUI 有大 幅度提升,有效降低内存顺序读/写,随机读/写的老化程度,给消费 者带来流畅的体验。

鸿蒙采用华为全新图形栈,图形渲染不仅仅依靠 GPU,而是联合 CPU 联合调度,解耦业务处理逻辑和渲染逻辑线程,提升画面流畅度和帧 率,并带来续航能力提升。 多设备协同认证,保证消费者隐私安全。经过验证 ID 设备才可以加 入超级终端,目前鸿蒙所有的终端认证均获得全球最高级别。

3 几大技术特性支撑鸿蒙万物互联

鸿蒙 OS 是基于微内核的全场景分布式操作系统,实现模块化解耦, 内核安全、分布架构、生态共享是鸿蒙系统的三大特性。

3.1 更灵活更安全的微内核系统

在微内核结构中,各模块采用 IPC 传递信息,这种方式天然支持分布 式系统运行,大大提高系统执行效率。基于微内核模块化、低耦合的 特性,操作系统的组件故障不会导致系统重启,系统稳定性大大提高; 微内核下的系统功能可以按需扩展,也非常容易移植。同时,鸿蒙 OS 微内核天然没有 Root,相当于微内核每个部分都有一把锁,只靠 一把钥匙无法获得所有权限,因此可以从源头提升系统安全性。

3.2 硬件互助、资源共享的分布式架构

分布式软总线架构,为异端设备互联互通提供统一基座;分 布式数据管理使得用户数据与物理设备不再绑定,实现流畅地跨终端 运行;分布式设备虚拟化平台将多种设备形成一个超级虚拟终端,各 终端可便捷调用;分布式任务调度根据不同设备的能力、位置、业务 运行状态、资源使用情况,选择合适的设备运行分布式任务。以上四大分布式技术使得鸿蒙可以实现不同的终端设备之间的快速连接、能 力互助、资源共享,匹配合适的设备、提供流畅的全场景体验。

比如场景:在烹饪时,手机可以通过碰一碰和烤箱连接,并 将自动按照菜谱设置烹调参数,控制烤箱来制作菜肴。与此类似,料 理机、油烟机、空气净化器、空调、灯、窗帘等都可以在手机端显示 并通过手机控制。设备之间即连即用,无需繁琐的配置。

3.3 一次开发,多端部署的生态共享

HarmonyOS 提供了用户程序框架、Ability 框架以及 UI 框架,借助统 一 IDE 及工具链,开发者能够实现应用的一次开发、多端部署,实现 跨终端生态共享。同时通过组件化和小型化等设计方法,支持多种终 端设备按需弹性部署。因此,基于以上三大特性:

对消费者而言,HarmonyOS 能够将生活场景中的各类终端进行能 力整合,可以实现不同的终端设备之间的快速连接、能力互助、 资源共享,匹配合适的设备、提供流畅的全场景体验。

对应用开发者而言,HarmonyOS 采用了多种分布式技术,使得应 用程序的开发实现与不同终端设备的形态差异无关。这能够让开 发者聚焦上层业务逻辑,更加便捷、高效地开发应用。

对设备开发者而言,HarmonyOS 采用了组件化的设计方案,可以 根据设备的资源能力和业务特征进行灵活裁剪,满足不同形态的 终端设备对于操作系统的要求。

在 GMS(谷歌应用服务)被谷歌“断供”后,华为转向研发和使用 自己的 HMS。华为 HMS 对标谷歌 GMS,为华为设备生态系统提供 的一套应用程序和服务,包含直接面向消费者的 HMS

未来 HMS 将协助鸿蒙构建全球内容生态。与安卓系统类似,第三方 应用开发时可以直接基于鸿蒙 OS 的 API 而不完全依赖于 HMS,同 时,HMS 也支持安卓操作系统,并且开发者未来从安卓系统向鸿蒙 系统切换时,无需对所开发应用进行修改。

3.5 为何升级鸿蒙的华为手机完全兼容此前的安卓应用生态

2007 年谷歌公司正式展示 Android 操作系统,宣布建立一个全球性的 联盟组织,该组织由 34 家手机制造商、软件开发商、电信运营商以 及芯片制造商共同组成。联盟将支持谷歌发布的手机操作系统以及应 用软件,将共同开发 Android 系统的开放源代码。

AOSP:安卓开源项目,所有手机厂商可以免费获得 Android 开源代 码。

代码开发,因此 升级鸿蒙的华为手机完全兼容此前的安卓应用生态。 此外,方舟编译器是华为为支持多种编程语言、多种芯片平台的联合 编译、运行而设计的统一编程平台,是鸿蒙生态建设的重要支撑。方 舟编译器在软件史上首次将 Java/C/C++等混合代码一次编译成机器 码直接在手机上运行,彻底告别 Java 的 JNI 额外开销,也彻底告别了 虚拟机 GC 内存回收带来的应用进程掉线,既实现了安卓 APP 无缝迁 移到鸿蒙系统,也让操作流畅度大幅提升。

4 鸿蒙成功的关键:生态

对于一个操作系统,生态就是它的生命。通常情况下,操作系统的竞 争同步发生在智能硬件的普及化阶段,比如 PC 互联网时代 Windows 造就了微软,移动互联网时代 Android 成就了谷歌。16%是华为内部 通过技术评估、市场调研得出的一个市场份额参照,只有 HarmonyOS 在智能手机市场的安装占比超过 16%,鸿蒙才有可能被市场承认成为 通用操作系统。

所做的第一个发行版。同时,华为开放了一整套的鸿蒙开发平台与工具链生态,欢迎其 他厂商一起基于 OpenHarmony 的开源社区,去开发各个领域的应用 和产品。

华为通过开放源代码、SDK、开发板/模组、HUAWEI DevEco 等平台 和工具链,使能南向的硬件生产厂商;通过为开发者提供鸿蒙编程框 架、APIs、DevEco、方舟编译器等一系列平台及工具链,使能北向的 应用开发者。

4.2 开放且持续扩大的鸿蒙生态圈

鸿蒙操作系统有望在物联网时代加速国产化方案整合与整体落地进 度,国产软硬件自主可控动能加速释放,华为生态合作伙伴也有望在 鸿蒙生态体系的快速扩张路径中持续受益。 从 2020 年 9 月 10 号鸿蒙系统开放给鸿蒙生态合作伙伴以来,鸿蒙生 态已经吸引了美的、九阳、等家电设备厂商以及、 等模组厂商、解决方案公司加入到鸿蒙生态阵营。未来,随 着鸿蒙的进一步开放和发展,相信会有更多领域更多应用场景的公司 加入鸿蒙生态。

6 月 2 日,华为正式发布鸿蒙手机系统,该系统正式搭载到智能手机。 同时,据华为消费者业务 CEO 与 HarmonyOS 的进 一步统一,有望进一步提升鸿蒙接入设备的数量。

5 鸿蒙生态的商业模式

5.1 华为、产品合作伙伴、方案公司三方共赢

华为从做通讯和硬件的公司,到推出鸿蒙 OS,和苹果软硬件一体化 的模式比较像,苹果靠高毛利的硬件赚钱,但华为高毛利的手机由于 芯片问题快速下滑,必须采用新的模式。

鸿蒙操作系统免费,但鸿蒙可以通过渠道来赚钱。从华为的角度来说, 虽然现在手机、笔记本等由于缺芯片,销量快速下滑,但华为这么多 年建立的线上线下渠道,短期内是可以变现的一种方式。华为的合作 伙伴公司的产品想进华为的渠道,第一个需要渠道认证、渠道准入; 合作伙伴的产品想进入华为商城的普选或者优选,有不同的认证标 准。合作伙伴的产品进入华为商城可以提高产品销量,华为也可以对 认证和渠道收费。

这里还有方案公司的商业机会,类似润和股份、中软国际、等公司。例如 A 是产品公司,B 是方案公司,A 的产品想进华为渠道 有一定的门槛,一是 A 想用鸿蒙系统但不知道怎么用,二是不知道 准入问题怎么解决。那么 B 就可以提供带鸿蒙的一套模组的解决方 案,使能 A 快速在鸿蒙系统上运行,并且通过一系列的 XTS 认证和 测试等。对 A 来说虽然提高了一定成本,但是通过合作顺利进入华为 大的生态体系,进入华为渠道以后可能带来更高的销量,可以继承华 为手机零售的成功经验。所以商业模式对产品公司、方案公司、华为 三方都是成立的,商业正循环就可以运行起来。

总的来说,在鸿蒙生态的跑马圈地过程中,华为技术赋能伙伴,认证 后通过华为渠道卖货(认证和渠道收费),达到双赢的目标。鸿蒙的 诞生使消费者有了超级终端体验:极简连接、万能卡片、极简交互、 硬件互助,实现 one as all, all as one,即一生万物,万物归一。横向: 从扩展到全场景,覆盖 7 大场景核心智能设备,建立全场景 鸿蒙精品设备圈;纵向:从品牌厂家扩展到全产业链,联合芯片、模 组、IDH、品牌厂家、服务商,快速打造鸿蒙生态产业链。

华为始终坚持平台+生态的战略,鸿蒙诞生加大在生态领域的投入, 和小米(自有产品)+涂鸦(中小企业服务)的战略不同,帮助伙伴 做好产品,卖好产品、运营好产品,低成本让大家接入鸿蒙智联,通 过华为商城卖货。

做好产品:鸿蒙易用、好用的特点,让生态伙伴快速低成本接入鸿蒙 网络。华为提供芯片、模组、OS 和上面软件的服务包套餐,预先集 成了全栈的解决方案,支撑生态伙伴的快速开发认证。

卖好产品:华为全渠道、全场景帮助伙伴卖好产品,网上包括华为商 城(3 亿会员)、天猫(2900 万粉丝)和京东旗舰店(5100 万粉丝), 线下 60000 多华为自有零售/服务渠道,还有 15000 多第三方垂直领域 专业/行业渠道。

运营好产品:用 10 亿设备圈,超过 10 万的原子化服务,帮助伙伴提 升产品活跃度,通过开放运营平台,帮助生态品牌持续曝光。

5.2 发现智能化的痛点,解决问题

据三方厂商统计,当前市面上出售的智能设备平均入网率仅 为 15%,平均 APP 安装率仅为 10%,智能特性使用率甚至只有 5%, 存在连不上、用不了、留不住等问题,这意味着消费者把智能产品买 回去后,95%的人还当传统设备在使用,存在联网体验差、学习成本 高、服务不持续、家居生态单一等很多问题。而经过 HarmonyOS Connect 认证的生态硬件产品则能够很好地解决这些痛点,让消费者 真正享受到智能设备所带来的便利。

生态产品将在系统层面融为一 体,成为超级终端的一部分,通过极简配网(入网率提升 2-4 倍)、万 能卡片(服务免安装、精准直达)、极简交互(更多入口、跨端联动)、 硬件互助等能力,轻松唤醒设备智能,有效解决了设备智能特性使用 率低等难题,实现快速、低成本连接设备,给消费者带来简捷,流畅, 连续,安全可靠的全场景交互体验。

过去是单设备非智能(按键/面板操控设备功能),现在是单设备智能 化(APP 控制功能+服务),华为鸿蒙实现多设备智慧体+跨设备服务, 用场景化超级终端,让设备更好用。以美的、九阳、海尔等合作伙伴 打造的 HarmonyOS Connect 智能硬件产品为例,展示出它们所带给消 费者的全新体验,厨房的改变让厨电触手可及,可以一碰连接、一碰 操作,精准控制设备,智能提醒。与手机只需轻轻一碰,美 的蒸烤箱就可以选择菜谱一键烹饪,九阳豆浆机根据健康数据推荐饮 品,让厨电设备变成私人营养师。

5.3 高频刚需的设备和服务,场景化联动提升产品的活跃度

1+8+N 全场景终端设备:“1”代表智能手机,每个人现在都离不开你 的手机,手机是分钟级交互,属于高频刚需;“8”代表 PC、平板、 手表、智慧屏、AI 音箱、耳机、AR/VR 眼镜、车机,一个小时的交 互的设备,属于中频设备,“N”代表 loT 生态产品,天级的交互设备, 低频的交互设备,每天会操作一两次这样的一个智能家具。

因为华为在手机-分钟级设备和 8 大-小时设备上,有非常多的存量, 华为将用高频刚需的设备来带动低频设备,提升所有安装设备的使用 激活。例如用户拿手机碰家电,弹出一张家电相关的卡片,实际上是 拿一个分钟级的设备去使用一个天级设备,高频设备带动低频设备, 这是华为给伙伴提供的一个商业价值。华为还有高频的一些内容和服 务的生态,会有 10 万种以上的原子化服务提供给伙伴,核心在于高 频设备拉低频设备,高频服务赋能所有的服务生态。

:跑步机秒变AI 教练

华为在手机、手环等健康领域有很多积累,结合鸿蒙能力加持,助力 的跑步机全智能,秒变 AI 教练,具有 AI 数据分析、专属语 音教练,开启科学运动旅程。一碰进入个人运动空间,懂你的身体状 态、多模式跑步场景、多设备联动,也可以安全退出,个人数据随人 走,跑步机不留痕迹。

教练。跑步前,基于鸿蒙极简连接能力,实现 快速登录,跑步机秒切个人运动空间,并根据运动能力、健康状态, 推荐适合的运动方案;跑步中,基于鸿蒙分布式能力实现多设备联动 获得更多维度的运动指标,智能监测和分析个人运动状态,提供科学 的实时语音指导;跑步后,科学评估运动能力和状态。更为方便的是, 手机视频还可以一键流转到跑步机,运动追剧两不误。

:XC3 成为华为鸿蒙生态的首辆电动车

新日电动车成为电动车行业第一家且唯一一家入驻华为鸿蒙生态的 电动两轮出行产品。新日与华为合作的重要意义在于,从简单功能到 骑行全场景的智慧出行,每一部华为手机都是打开新日电动车的“钥 匙”,从而让华为的智能工具到新日电动车都成为构建万物互联的载 体。新日与华为的合作对于整个电动车行业也具有划时代的意义,为 智能电动车可以实现的全场景的智慧化提供了范本。

通过华为智慧生活 APP 开启电源、上锁、解锁,甚至可以实现无钥匙 出行;在 APP 上查询电量和剩余里程,续航焦虑得到了解决;通过 APP 进行车辆健康诊断,电池、控制器、电机、转把的状态随时可以 查看,有问题及时发现,为出行安全增加一份保障。

华为这次将鸿蒙生态系统升级释放出了一个积极的信号,那就是未来 华为会和品牌方一道,为万物互联提供更好的解决方案。未来家电、出 行工具、手机等将是同处于一个鸿蒙生态系统下的有机个体。在下班 路上,可以通过向智能头盔发出指令,就可以开启家中的空调、洗衣机等,生活将带来翻天覆地的变化。

5.5 鸿蒙生态与小米的不同点

和小米自己做产品支持和通讯模组不同,华为授权润和、中软国际、 等做服务和通讯模组,并且华为对生态伙伴的收费也比较 低,加上华为的高端品牌力,对伙伴吸引力很大。

华为习惯后发制人,虽然小米生态发展的比较早,但小米的生态公司 毛利比较低,而且小米生态的开放度相对没有鸿蒙高。小米生态产品 都有一个网关的概念,设备需要设置相同的路由器和网络,产品通过 网关来交互。而鸿蒙设备是近场通讯,通过软总线,虽然设备间物理 是分离的,但鸿蒙设备间可以自己通讯,不需要网关去绕一层,并且 通讯器材本身就是华为的强项。对鸿蒙产品来说它的硬件形态只有一 个超级终端,超级终端里面有若干个硬件载体,然后组成一个系统。

6 鸿蒙生态上市公司

公司 2006 年成立,2012 年在深交所上市(股票代码:300339)。经过 十多年的发展,公司已经建立了完整的“预研-设计-开发-测试-交付运维”的一站式综合服务体系,是中国领先的产品与解决方案提供商、 平台运营商。 公司主营业务横跨、物联网两大领域,以国产化、数字化为 核心,致力于提供从芯片、硬件、底层软件到应用平台的综合解决方案与优质科技服务。

6.1.1 战略重心调整,物联网业务突飞猛进

公司营收自上市以来稳定增长,至 2020 年公司总营收超过 24 亿,其 中主要贡献来源于、智能物联和智慧能源信息化三方面业 务。2018 年前,润和发展重心和主要营收来源于金融科技业务,营收占比 超过 70%;2018 年润和战略规划调整,大力发展物联网相关业务,到 2020 年公司营收近 50%来自于金融科技业务,另外近 50%来源于物 联网下的智能物联和智慧能源信息化业务。 在过去三年公司毛利一直处于压力之下,主要由于金融科技业务收入 未达预期,员工薪酬成本总额大幅增加,公司向外外包减少。

公司 HiHope 芯片全栈解决方案平台是涵盖芯片设计服务、硬件开发 生产、硬件测试认证、板级支持软件、 芯片调测软件、应用解决方 案原型等的一站式芯片解决方案平台,领域涉及智慧联接、智慧视觉、 智慧工业、智慧媒体、智能计算。HiHope 芯片全栈解决方案平台沉 淀了包括华为、海思、紫光展锐、阿里平头哥、等多个重量 级合作伙伴,合作的国内外行业组织包括 Linaro、HDMI、开放原子 开源基金会、软件绿色联盟等,是 OpenHarmony 发起单位之一、华 为 HarmonyOS 生态共建者、 海思芯片及 IoT 战略合作伙伴等。

公司提供多芯片平台的适配和使能,提供搭载鸿蒙的模块以及板卡, 提供鸿蒙针对、智能支付终端、智能车载等不同场景的发行 版。公司提供了官方首批支持 Harmony OS

6.2 中国软件国际: 全栈式使能鸿蒙智联生态

中软国际成立于 2000 年,2008 年香港主板上市,是国内首家纯软件 服务收入突破百亿的企业。目前公司业务主要是四方面:第一增长曲线的基石业务;第二增长曲线的云智能业务;第三增长曲线的鸿蒙生态业务;推动解放号作为软件产业互联网平台全面升级。

6.2.1 搭建鸿蒙万物互联桥梁,一站式使能鸿蒙生态

中软国际与华为多领域的合作由于已久,深度参与华为生态建设。作 为第一家与华为签署“HUAWEI HiLink 生态方案服务合作协议”的合 作伙伴,中软国际已助力众多厂商接入 HUAWEI HiLink 生态,涵盖 、运动健康等领域,并同步储备硬件能力,加快厂商批量接 入。中软国际也荣获 2020 年度 HUAWEI HiLink 生态使能服务“卓越 合作伙伴”大奖。

未来,中软国际将为鸿蒙生态提供一站式使能服务。包括鸿蒙 Harmony Connect 接入服务、认证服务、数据运营、智能化解决方案。

认证服务:提供各项国际化标准认证服务加速认证完成,赢取市场信 任;

数据运营:数据中心、运营中心、品牌营销多维度管理,赋能产品提 升竞争力;

智能化解决方案:全品类、行业解决方案,助力极速完成智能化演进。

是中国领先的软件与信息技术服务商,致力于成为具有全球 影响力的数字技术服务领导企业,企业数字化转型可信赖合作伙伴。

拥有深厚的行业积累,领先和全面的技术实力,长期为客户 提供端到端的数字化解决方与服务,包括数字化转型咨询、数字化解 决方案设计与实施、云与 IT 基础设施建设与运维、软件开发与测试 服务和数字化运营服务等。以人工智能、区块链等 10 大类 70+项技术 作为基础行发展战略投入方向,推动创新链、产业链和市场需求有机 衔接,应对数字化转型需求。

服务于 10 余个行业,包括通讯设备、互联网服务、高 科技与智能制造、金融等,拥有 200 多个行业解决方案。公司的主要 业务可划分为软件与数字技术服务及数字化运营服务,软件与数字技 术服务占其营收的近 94%,其中软件与数字技术服务又分为通用技术 服务、数字技术服务及咨询与解决方案。公司的软件与数字技术服务 是根据客户需求,为其提供针对软件、信息系统、电子电路产品等的 设计、开发、测试、运维、数据处理等全方位服务。通过提供全栈数 字化服务,致力于成为是能者和企业数字转型可信赖合作伙 伴。

能够为各个客户提供产品全生命周期的 HarmonyOS Connect 定制化服务,既可以端到端完成客户产品的 HarmonyOS 接入,也可 以为客户对中间某个环节提供高质高效的 HarmonyOS 接入服务。

模组,以完成为客户多环节定制化服务中硬 件研发的重要一环。通过其长期积累的技术与能力,做到高校交付, 帮助客户短时间接入产品。携手华为,共建鸿蒙生态。目前公司已与 50 多家厂商和软通构筑长期稳定、互利共赢的合作伙 伴关系。已接入产品包括智能枕头、智能跳绳、智能马桶、智能护膝 等。

1. 鸿蒙 OS 系统接入设备量不及预期,导致生态建设滞后,产业链 厂商订单不足。

2. 中美关系持续恶化进入新一轮更高规格的制裁,影响华为正常的 企业经营及鸿蒙 OS 的持续推广。

3. 因苹果、安卓等众多竞争对手切入,加速市场竞争,竞争格局恶 化,导致鸿蒙 OS 渗透率不及预期。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

我要回帖

更多关于 什么叫双时钟 的文章

 

随机推荐