硬科技:AMD同时多执行绪SMT4是什么?图解CPU各种核心与执行绪关系

如题所述

第1个回答  2022-10-10

如果问笔者,「真正的K10」Zen微架构到底有哪个地方最让人感慨万千,大概就是AMD落后Intel整整「15年(2002年二月 vs. 2017年三月)」的同时多执行绪(SMT)了。去年AMD公布产品时程图,确认Zen3已完成开发,并将于2020年下半年采用台积电用上EUV光刻技术的7nm+制程生产,然后网路上就冒出了Zen3将支援「SMT4」的传言,讲的白话一点就是单核心四执行绪,是现有Zen的2倍。换言之,包2颗Chiplet的16核心的Ryzen 9 3950X就是64执行绪,包8颗Chiplet的64核心的EPYC 7742则是骇人听闻的256执行绪。

其实SMT4不是新概念

听起来好像很恐怖?可是IBM从Power7就是SMT4了,Power8和Power9则是SMT8,不过Power9有2种组态,包括SMT4 x 24核与SMT8 x 12核。唯一的差别只有IBM Power体系的核心数量没有AMD Zen家族这么夸张。从这个角度来看持续发展x86伺服器,还真的是RISC高阶产品的超大潜在威胁,EPYC 7742那256MB容量的L3 Cache到底是想逼死谁

那问题来了,假若AMD Zen3真的是SMT4好了,除了工作管理员的逻辑CPU数量更加吓人外,对AMD有没有任何好处?过去CPU导入多执行绪架构,无论是粗质多执行绪(发生很长的延迟才切换)、细质多执行绪(一有风吹草动马上就切)、同时多执行绪(充分利用传统OOOE处理器内部丰沛的资源),或是失败的丛集式多执行绪(AMD想省浮点运算器的成本),原因不外乎提高处理器的使用效率,或著提升整体的吞吐量(Throughput)。

但基本上,无论是何种型态的多执行绪,或多或少都会伤害到单执行绪的效能,意味着更长的延迟(Latency),所以这也是为何过去某些云端资料中心,即使采用具有多执行绪的处理器,例如支援HyperThreading的Intel桌上型CPU。有时候基于「缩短服务反应时间」的考量,关闭多执行绪功能。单执行绪效率对于一般个人电脑更是重中之重,最起码还有游戏需求这个不得不关照的重点市场。

x86处理器的取舍与难处

x86处理器微架构因开发时间漫长,所费不赀,难以针对不同市场开发全新的架构,导致Intel和AMD都必须根据市场需求和公司策略,设法在伺服器、桌机、笔电之间寻求平衡,也必须有所取舍。贸然倍增执行绪数量,恐怕未蒙其利反倒先受其害,光作业系统能否支援加倍的逻辑处理器,恐怕就是一个大问号了。

也因此,除非Zen3在微架构层面有巨大的扩张,类似当年IBM从Power4到Power5的剧烈演进,笔者是对AMD在Zen3提供SMT4这件事,态度有所保留。

当然,我们也不能不排除AMD真的把头洗下去,但具备调整的弹性,例如同样核心的EPYC和Threadripper,前者因伺服器需求开SMT4但时脉较低,后者因桌上应用仅SMT2但时脉较高的状况,这倒是蛮值得各位科科观察一下的可能性。科科。

如果你对于硬体世界充满好奇,想多了解这些别的地方看不到的观点,不妨追踪我们的最新讯息,填上email看看免费文章不吃亏。

追踪 硬体世界考古探险王 硬科技

相似回答
大家正在搜