被挤多的牙膏? Coffee Lake 8700K暨STRIX Z370F GAMING评测报告(上)

2017年10月16日 柠檬粉俱乐部


宁美国度创新实验室


结合"互联网+"的特点,开创独特的研究模式,在主机的配置选择和兼容性上下足功夫,追求极致体验,让主机产品在开发阶段就已经趋于完善,通过极致的研发,快速的迭代,更好的为消费者服务。


从RYZEN挤多牙膏说起



在10月5日首发的Coffee Lake一共有4个型号,分别是8700K、8700、8600K、8400、8350K和8100,分别替代前辈7700K、7700、7600K、7400、7350K和7100。



这次更新,可以说是intel是在nahelam之后,CPU规格/性能提升最大的一次:I3从2C4T变成4C4T,I5从4C4T变成6C6T,而i7则是从4C8T直接变成了6C12T。这些处理器虽然大多的Baseclock有所降低,但boost频率却进一步拉高。因此这代处理器的理论规格相比上代Kabylake-S基本有50-100%的提升。



最近几年,英特尔每年的产品性能提升基本只有不到3%水平,被一些人戏称为牙膏厂。而英特尔在Coffee Lake上的不再挤牙膏,有很多人将其归功于AMD Ryzen系列的给力,甚至有人说AMD这次给英特尔压力太大,都把牙膏挤的过多了。(上面这个GIF虽然粗糙,但还是可以反应出不少人的想法)



判断牙膏是否挤多需要更多的数据支撑,需要分析英特尔的Tick-Tock策略和核心面积变化的规律。芯片是由整个晶圆切割而成,在相同工艺的情况下,单个晶圆的成本相对固定,单个芯片的核心面积越小,那单个晶圆可以切割的处理器数量就越多,这样处理器的平均成本就更低。这张图可以反应出intel 4+2处理器的核心面积变化,一般而言在tock变换架构的时候芯片规模会变大,而在Tick变更工艺线宽的时候芯片面积就会缩小。当然也有例外情况,Broadwell到Skylake虽然是tock变换架构,但芯片面积还是缩小了,这是因为5775C的集显规模过大。虽然有这个小波折,整体而言,4+2的级别处理器核心面积规模整体趋势是稳中有降。作为Tock的Coffee Lake核心面积从kaby Lake的126mm2增长到149.5mm2,这也属于正常范畴。

 

新一代的Coffee lake在intel的Tick-Tock里属于Tock,就是架构更新,而不更新工艺。当然,这个仅仅是传统的Tick-Tock策略说法的延续,但严格的说这样的策略已经不能完全套用现在的实际情况。14nm的首发Boardwell,也就是5775C那代产品,仅仅是存在产品,并无实际意义。而从Boardwell-Skylake-Kabylake再到Coffee Lake连续四代产品都采用14nm工艺,看来Tick-Tock策略似乎已经不能延续了,要破产了,但实际是这样么?

 

从工艺线宽而言,这4代14nm是没什么变化,但看工艺我们不能仅仅只看线宽,其实从首代的14nm到现在的14nm从性能上还是有很大的差别。首代的Boardwell和后续的Skylake是14nm FF,而后续的Kabylake,虽然延续了Skylake的架构,工艺线宽依然停留在14nm,但其采用的14nm FF+工艺相比原始的14nm FF性能大幅提升。这个性能提升从6700K默认4.2GHz,风冷超频的基本盘4.5GHz提升到7700K默认4.5GHz、超频4.8GHz还是很明显。因此Kabylake严格的说,不仅仅是单纯的优化 ,而是工艺有了很大的进步,应该算是Tick。



Coffee Lake架构变化了,毫无疑问是Tock,但仅仅是Tock么?Coffee Lake的制程又升级了,从Kabylake的14 FF+升级到了14 FF++,并且这个++很强,强得都脱离了工艺发展的基线。从上面intel官方PPT看,14FF++性能不仅大幅优于14FF+,甚至都要远好于10nm的初代性能,即使是与icelake的10FF+相比也毫不逊色,甚至还略胜一筹。8700K在核心增加一半的情况下,依然可以维持4.3GHz的默认频率,而超频甚至可以上5.0GHz,这相比7700K又有了一定的提升。性能要比目前14 FF++更好的10 FF++就是2020年以后的事情了。


英特尔上月在北京举行的英特尔精尖制造日公开的数据显示,14FF++相比14FF+性能提升24%,而14FF+相比第一代14FF提升幅度只有12%。14FF++在性能等级上完全是一个新级别的工艺,因此说其是Tick并不为过。


挤牙膏的艺术



当然,芯片成本不仅是核心面积,还需要考虑很多其他要素。这张图反馈的是英特尔12年以来的芯片成本变化曲线,新线宽工艺在初期由于晶圆产线的成本均摊和良品率问题,成本就会大幅上升(如22nm首发的Ivy Bridge和14nm首发的Broadwell),而新架构(如Tock的haswell和skylake)往往伴随更多的研发投入和更大的芯片规模,使得成本也有一定幅度增长,但这个涨幅是小于工艺切换的。不过,这个成本会随着良品率提升和制程优化、还有晶圆产线成本/研发费用均摊下降,处理器产品的成本也会逐渐走低,并且无论是tick还是tock,都会触及一条无形的成本底线。Kabylake既没有切换制程线宽,也没有变化架构,仅仅是优化,因此成本一直维持在很低水准。而这次Coffee Lake成本曲线应该比较类似skylake,由于芯片核心数的增加,这样规模增长幅度会稍大,使得成本再稍高一点,但这个增长幅度还是远低于工艺线宽切换的变化。


反观AMD,采用14nm工艺的RYZEN 7核心面积为195mm2,这个面积要比Coffee Lake大上1/3,而且是在没有集显的情况下。其实RYZEN 7的情况还不算太糟糕,更大的问题在于中低价位4/6核心的RYZEN 3/5在核心面积上同8核心的RYZEN 7相同,仅仅是对部分核心和缓存进行了屏蔽,这样虽然可以解决不良率问题,但却使得晶圆成本大幅增加。因此现在的英特尔以小搏大的确没有什么压力。



而后续的Canon Lake和Ice Lake则会采用英特尔首代10nm FF工艺,首代10nm FF工艺虽然在性能上并没有提升,但在密度上大大提高了:英特尔10nm制程的最小栅极间距从70nm缩小至54nm,且最小金属间距从52nm缩小至36nm。尺寸的缩小使得逻辑晶体管密度可达到每平方毫米1.008亿个晶体管,是之前英特尔14nm制程的2.7倍。更高的密度对于英特尔而言有两个意义,第一是更小的核心面积,虽然新工艺产线投资巨大、新工艺的单个晶圆成本会上涨,但从长远看切割更多的die会使得成本更低;另外一方面密度的提升,也使得在合理的成本区间可以实现更大的芯片规模,现在坊间有传言,下一代的Ice Lake-S旗舰会有8C16T的规模,考虑英特尔10nm FF这样幅度的密度提升,这也不足为奇了。

 

以前的Tick-Tock是工艺和架构以隔年为周期交替迭代,但随着晶圆厂升级,动辄几十亿甚至上百亿美元基础投资,两年一换并不经济,因此英特尔更多深挖每代线宽工艺的潜能,从14FF/14FF+/14FF++,再到10FF/10FF+/10FF++,都是相同路径,将每代线宽工艺性能牙膏挤到极限,并且又确实可以看到巨大的提升,这就是英特尔挤牙膏的艺术。

 

因此继续沿用14nm工艺的Coffee Lake依然是英特尔按部就班的挤牙膏,并继续将14nm余量压榨干净,这样的进步仅仅是计划之中,而和AMD RYZEN并无太大干系。


不那么Tock的Tock


前面多次提及Coffee Lake是Tock,那这次Tock究竟有什么变化?我们先说结论:相比Kabylake核心增加了50%,从4C8T增加到了6C12T,同步末端缓存也扩大了一半,从8MB扩大到了12MB。Coffee Lake的IPC有提升,但这仅仅是受益于缓存容量的提升。



我们先从核心图自上而下来说明:上面是6核心的coffee Lake Die照片,左上部分是内存控制器,左边是System Agent,中间的六个是6个 物理核心+L3缓存,右边青色的部分是UHD 630集显。4C和6C的集显为24 EU,而低端的Pentium则为一半规模,12EU。



再将这个图抽象化一些,L3的RING BUS环形总线连接6个核心,还有集显和System Agent。System Agent内有双通道内存控制器和PCIE控制器。这和Skylake/Kabylake的结构也没明显区别,仅仅是扩大了2个核心的路径。



单个核心内部结构和Skylake/Kabylake并无明显区别,前端、执行引擎和缓存的结构和资源数都一样。(图片来源wikichip)

 

再来看看Coffee Lake从4核心增加到6核心对于内部效能有何种影响。我们使用Sisoftware Sandra的多核心效率测试同频4GHz的7700K、8700K和7800X,这个测试包括三个部分:



第一个部分是组合内部核间带宽,是通过传输不同容量的Chain Size x Block Size来测试平均传输带宽,带宽越高越好。8700K在1MB以下数据相比7700K都有优势。相比7800X,8700K在64KB以下区块和7800X持平,但在64KB以上数据,8700K的资源冲突就大于7800X,同频情况性能就开始落后。



第二个部分是测试相同容量的数据块从一个核心分发到其他核心的最快速度,这个数据会从L2到L3,经过内部互联的Ring Bus进行传输,这个测试结果是越高越好。8700K核间通信带宽从7700K的33.8GB/s提升到了45.6GB/s。

 

从前两个测试看,在同频情况下,Skylake-X的网状Mesh互联带宽还是要优于Coffee Lake的环状Ring Bus,毕竟通路线路更多。但我们这里测试的是同频,实际情况8700K运行频率更高,实际核间通讯效率还是可以和7800X基本持平,甚至更好。

 

究其原因,8700K和7700K RING BUS每个核心每个周期都是可以进行32B读写操作的,但8700K核心更多,使得RING BUS从32Bx4变成了32Bx6,环总线随内核数增加了,每个内核理论通信带宽仍能维持不变。

 

第三个部分是核间延迟,这个延迟是核心之间传输最小量数据耗费的最短时间,单位以纳秒计算。具体是测试数据一致性的响应耗时,这个结果是数值越低越好。这部分测试结果,8700K相比7700K的核间通讯延迟略有加大,从43提升到44ns,具体原因是这个环形总线要多途经2个核心,路程变长了,延迟稍微变大也在预料之中。不过这个延迟还是远低于mesh结构的Skylake-X 7x ns的水平。

 

虽然说Coffee Lake是Tock,但从架构上而言相比Skylake/Kabylake并无明显变化,仅仅是暴力的将规模扩大了一半。这样看来Coffee Lake的这个Tock也并不算很彻底的Tock。反而是14nm FF++的工艺进步给人留下更为深刻的印象,Coffee Lake的规模得以扩大,其实也更加应该受益于工艺的进步,这么说Coffee Lake其实更像是Tick而不是Tock。

 

半路出道的Z370


Coffee Lake是平台,而不单单是CPU。Coffee lake首发的配套主板是Z370,但Z370并不是8代处理器配套芯片组的完全体。有这样的传言,Coffee Lake本来计划是和完整体在明年Q1一起出,但结果Coffee Lake进展过于顺利,大幅提前,为了应对竞争提前发布Coffee Lake,intel将Z270的PCH直接搬了过来,这就是Z370。

 


也是由于这样,Z370延续Z270的PCH,使得其和PCH相关功能和规格并无提升。



既然Z370并不是完整体,那完整体是什么呢?完整体是Z390。Z370的ME版本还是11,而完整体Z390的ME升级到12。较低规格的H370/B360/Q350/H310由于还是依照原计划明年Q1推出,也是采用最新的ME12。由于Z370采用的还是老版的ME11,这使得其不能支持后续的Ice Lake,而其他型号的300系列主板就没有这个问题。Z390相比Z370其他特性方面差别不大,主要是将USB 3.1 Gen1升级成2,带宽从5Gb/s升级到10Gb/s,其他PCIe Lanes数量,M.2、SATA和USB支援情况都没什么差别。仅仅是增加了对SDXC高速存储卡接口的支持,这对大多用户都没什么影响。



新的PCH还有一点很重要的变化是集成了WIFI+蓝牙的主芯片,就是说Z390/H370/B360/Q350/H310并不再需要额外的WIFI主芯片,而只需要外引射频模块和天线就可以实现802.11AC的WIFI功能。这样可以大大降低主板扩展WiFi的成本,当然这个功能主要是针对移动平台开发,而desktop附带仅仅是额外的福利。不过即使如此,大多数主板从成本考虑,还是不会增加WIFI功能。


由于Z370继续沿用之前Z270的PCH,因此在外部接口和磁盘接口的规格和性能上并没什么变化,所以磁盘和接口性能就没有必要重复测试。


平台实物解读

 


我们本次的测试平台主板采用的是STRIX Z370F GAMING,其延续了之前STRIX Z270F GAMING的定位,STRIX是ROG玩家国度的轻量化系列。它不像EXTREME那样旗舰,也不像APEX那样追求极致OC,更不像FORMULA那样为分体式水冷和MOD而生。但也有ROG Style的基因,更多的游戏和电竞风格,合适那些追求个性而非追求极限的轻量级玩家群体。



STRIX Z370F GAMING基本延续了之前STRIX Z270F GAMING的设计思路,其最大的改变是PCH上增加了大面积的散热片,同时可以覆盖M.2。



供电部分延续了之前STRIX Z270F GAMING的规格,8+2相。这个供电规模虽然不如Hero或者APEX这样高端和奢华,但相比其他总低价位的Z370还是更为丰满。



LGA1151 V2?其实我也不知道应该叫什么,看上去和LGA1151并没什么差别。之前的SkyLake/Kabylake也能够放上去。



4根DIMM内存插槽,可以支持到4000MHz的频率,相比上一代的3866MHz又有一定的提升,后面部分会具体测试。



以往主板内存布线是十分考验水平的,需要通过各种蛇行走线使得内存信号延迟一致化。而Z370华硕在PCB工艺上,PCB导孔技术可以跨层布置走线,这种技术不仅可以简化走线设计,还可以进一步缩短信号延迟差,提升内存的超频性能。



主板后部的接口有3组USB 3.0,2组USB 2.0,1组USB Type-C。显示输出接口方面DisplayPort、HDMI和DVI一应俱全。后部左边存在缺口,因为STRIX Z370F GAMING和STRIX Z370E GAMING是公用设计,STRIX Z370E GAMING这个位置增加了WIFI天线的接口。



存储方面有6组SATA 6Gbps,还有2组NVME的M.2,其中下面一组是直连PCH,可以支持 Optane Memory。



PCIE配置方面为PCIE 16x+1x+1x+8x+1x+4x。16x和8x支持SLI和CrossFire,由于需要承载大重量的显卡,这两个插槽有金属外框加强。并且这两个槽位中间有2个PCI位的间隔,这样的设计使得即使插上2张双槽位大散热器的显卡,中间依然有空间来散热。第一个PCIE上面的M.2支持2280长度的NGFF。



PCH上的巨大散热片是铝制材质,表面采用金属拉丝工艺处理。其上还有个镀镍的败家之眼的LOGO,这进一步提升了整个主板的逼格。



取下三个螺丝,可以看见硕大的散热片下面有导热垫可以直接贴合SSD的主控和NAND芯片。此外的PCH还有个单独的散热片,这样非共用散热片的设计是考虑支援类似浦科特M8SE这种自带马甲的SSD,在不安装上部散热片的情况下PCH依然有散热片覆盖。这个M.2可以支持到22110长度的NGFF设备。这个散热片对于M.2的散热效果如何,会在稍后具体测试。



SupremeFX金属屏蔽罩下面是S1220A CODEC,集成声卡。我个人一直用外置DAC,板载我一直都不怎么感冒。但声卡附带的声波雷达功能很好玩,后面再具体介绍。

 



AURA是STRIX的标配功能,除了支持板载的内存和显卡同步,还额外提供了2组4pin的AURA接口,可以用来外接机箱、灯带,水冷、风扇这些外围AURA设备。两组AURA接口分列在主板的顶部和底部,这样的分开布置走线更为方便,如果AURA设备数量比较多,还可以通过串联方式进行扩展。上面视频中我们就使用AURA统一控制主板+STRIX 1080TI GAMING O11G显卡+芝奇幻光戟内存的灯光效果,AURA接口外借乔思伯WT240一体式水冷+3把FR-301风扇,进行整体氛围灯光控制。



再来看看处理器的外观:Coffee Lake()和Kaby lake()在金属外壳封装上并无差别,基板也一致。(两个处理器都为工程样板)



右侧的Coffee lake相比左边的kabylake在针脚部分数量和布局并无差别,但coffee lake触点中间的电容电阻更多。



虽然都是LGA1151,看上去排列也基本一致,但KabyLake()和Coffee Lake()的针脚定义还是有很大差别。之前保留无功能针脚有46个,而现在仅有25个,地线和火线分别增加了14和18个,因此是不能混插的。混插传说中是可能会烧毁CPU的(反正肯定不能用,我就没去作死尝试),但英特尔没有对此作防备,所以上市后相信还是会有人去作死。



我们还对Coffee Lake进行了开盖,内部不出意料依然还是高科技硅脂。既然高贵的i9和更为高贵的Xeon Platinum都是高科技硅脂,那主流的Coffee Lake我也不曾有幻想是钎焊。高科技硅脂必然大幅影响散热表现。用户如果相信自己人品和稍微有点动手能力,可以使用开盖器,更换液金或者如GEILD这样导热系数更高的硅脂,温度应该可以有10度以上的改善。这个操作其实对动手能力要求不高,更为需要的是人品和不差钱,相信自己的CPU不会坏,开盖可能会影响RMA和以后二手的卖价。



同时我们也使用游标卡尺验证了 8700K的die size是在150mm2左右。


测试平台和说明



我们本次测试的具体测试平台如下:



性能测试我们在Windows 10电源管理里将性能设置模式改为高性能,这样可以避免频率在轻载的时候跌倒Base clock之下。如果使用默认的平衡设置会有两个问题:一是在性能测试过程中由低频加速到高频时会有个加速过程,这将影响测试成绩,特别是对于耗时较短的测试项目,也许加速到4.3GHz的时候测试差不多都结束了。二是游戏测试,其对于处理器的占用率并不高,系统会在这个情况判断游戏不需要处理器性能,擅自降低处理器频率,甚至会降到2GHz频率以下,但实际上游戏性能还是对频率很敏感的。

Coffee Lake的超频测试


之前Skylake-X改变了缓存策略,扩大L2,缩小L3,而在Coffee Lake又回到传统策略,每个核心256K L2 Cache,而L3则是共享的12MB。


在超频之前我们必须正确认识8700K的频率,对于频率现在有两种看法,第一种是想:8700K Base clock才3.7GHz,这是不是太低了,7700K都有4.2GHz啊。而第二种看法是8700K boost可以到4.7GHz,距离5GHz不远啊,大胜利。

 

其实这两种看法都是不准确的:3.7GHz的base clock基本碰见过热保护才会降到,而这个 4.7GHz的睿频频率仅仅是在打开程序单个核心可以达到的瞬时响应频率。这两个频率实际都不是CPU运行的典型频率。因此在这里我们首先需要强调不是Base clock,也不是boost clock,而是更有意义的全核心满载稳定频率,这个频率才是最有意义的频率。8700K和8700的全核满载频率都是4.3GHz,这个频率相比7700K的4.4GHz低了0.1GHz,但又远高于7800x的4.0GHz。

 

14nm FF++虽然使得boost clock提升,但全核频率仅为4.3GHz,这使得超频的空间很大,让超频有更多可玩性。需要说明的是,我这里说的超频测试是在一般风冷或者一体式水冷状态下,可以长期安定使用的超频。不是那种超高电压温度就要爆炸的超频,也不是那种稳定性着急,勉强跑完R15或者3Dmark,但玩玩游戏就蓝屏的那种过把瘾就死的频率。

 

之前7800X超频的基本盘是1.2V 4.5GHz,虽然有人超到4.8GHz,但需要更高电压,这不是一般风冷或者一体式水冷可以压制住的,因此实用超频也就4.5GHz就截然而止。那i7 8700K的情况呢?

 


我们使用ROG STRIX Z370F GAMING作为平台经过多次尝试,对于i7 8700K的甜点频率在1.4V 4.8GHz,这个频率在日常应用和游戏中没有问题。再高5GHz频率就需要更高电压,虽然5GHz依然可以跑benchmark和游戏,但如果长时间高负载,如跑AIDA 64稳定性测试和Keyshot渲染,会由于温度过高触发保护,强制降频到3.7GHz。

 

另外我们还可以设置AVX Offset,由于处理器在跑AVX指令集时的运作方式是SIMD单指令流多数据流,比较类似GPU的并行运算方式,负载极大,对于处理器的稳定性有更高要求。可能会出现CPU跑整数浮点这些日常应用时候稳如POI,但运行模拟器或者压片等这些需要使用AVX指令集的时候稳定性出现问题。我们就可以设置AVX Offset的倍频,如我们处理器日常应用和游戏跑5GHz,如果我们将AVX Offset设定在2,那在跑AVX负载的情况下,外频就会低上两个倍频,跑4.8GHz。



超频不仅仅是拉拉频率、提提电压那么简单,还需要手工进行一些细节设置,如CPU负载保持,CPU电流上限和CPU供电相数控制,这样才能真正解除处理器上的禁锢。



超频除了超核心频率,还有uncore的频率,默认的uncore频率是大概比主频低0.3GHz,不过我们也可以在BIOS里手动设置uncore的频率,实际我们测试8700K的uncore和核心同步也没问题,如可以上到5GHz,而之前7700K uncore一般就4.5GHz水平。不过超uncore性能收益较小,我们后面的超频设置在没特别说明的情况下默认都是没有单独超uncore的。(而7800X uncore默认才2.7GHz,超频uncore的收益就比较明显)


我们具体进行负载测试时使用的AIDA64是稳定性测试,同时给CPU、FPU和Cache加负载,这个设定负载稳定性要求虽然低于Prime 95,但如果可以通过就说明可以保证日常应用的稳定。测试使用的散热器是海盗船H115i,具体是280mm冷排规格,风扇策略是默认,这基本可以代表一体式水冷的最高水平。具体测试平台是裸机测试,其实风道散热良好的机箱配合机箱风扇的测试温度和裸机测试并不会有太大差别。



在开启节电的情况下,8700K的整机待机功耗(包括GTX1080TI)仅为44W,甚至要低于7700K,更远低于7800X的80W,温度情况也类似。默认设置满载功耗,8700K为167W,温度为72,由于CPU核心规模扩大一半,功耗高上30W,温度高3度已经十分理想,而7800X的功耗已经接近200W。


8700K在1.4V4.8GHz的情况下,8700K的整机功耗会上升到220W,温度也会到达100度。温度和功耗都是明显高于7700K的。8700K由于工艺特点,其更吃电压,更高的电压可以达成更高的频率,当然前提是你有足够好的散热。



在4.8GHz烤机情况下,供电的散热片温度会高达72度以上,这还是ROG STRIX Z370-F GAMING供电相数较高和散热片规模较大的情况下,如果是较低规格的Z370主板采用更小规模的供电和更小体积的散热片,在超频情况下的供电稳定性就很难保证,对于超频玩家来说,选择一款较高规格的主板还是很有必要的。

 

但这说明处理器是有能力稳定在4.8GHz的,只不过顶级的一体式水冷依然不能满足散热需求,开盖或者分体式水冷还是有希望可以搞定4.8GHz,甚至5GHz的8700K也是有希望的。



当然,小超怡情,大超灰飞烟灭。玩家如果难得研究,不想在BIIOS里一个参数一个参数的去研究,也可以在BIOS里开启XMP,然后选择同步核心频率,那处理器就被设定在4.7GHz,并且其他参数也都设定在一个比较保险的数值,这样就可以安心使用了。

未完待续……

各位好:

为了满足大家更多的阅读需求,更好提升服务体验,我们另一个微信公众号“宁美国度无限可能”诞生啦!动动手指,长按识别关注!

行业动态、电脑知识、硬件干货、游戏资讯陆续更新!

更多精彩内容请点击阅读:


 机友问答 | 详解电脑win10系统安装,你的win7该换了

 Win10 RS4快速预览版17017推送

 双11预售大开挂 这些便宜一定要占!

 “吃鸡”的时候鬼知道下一秒会发生什么!#GeForceExperience# 录下来!

 英特尔推出十七个超导量子位芯片


收藏 已赞