上周在斯坦福大学召开的"Hot Chips 23"大会上Intel、IBM、AMD等没拿出来什么新的猛料,对比之下ARM和Oracle透露下一代处理器的相关技术细节更多。其中Oracle接手Sun后开发的SPARC架构处理器依旧面向服务器和HPC(超级计算机)领域,而目前世界排名第一的日本RIKEN(理化学研究所)和富士通合力打造的超级计算机“京”就是采用SPARC架构V8fx CPU。接下来我们就一起来看看Oracle下一代服务器/HPC用处理器SPARC T4的具体面貌。
这款开发中的次世代SPARC处理器T4开发代号名为"Yosemite Falls"。作为Oracle收购Sun System后推出的首款SPARC处理器T3的后续产品,T4的主要改进部分在单线程和加密运算性能上。
单个T4处理器的核心数量为8,比起前代T3的16个减少到了一半。每个核心可同时执行8线程,与T3相比维持不变。整个处理器执行的线程数量为64,对比T3的128同样减半,Oracle表示T4的单个线程执行效率和性能是T3的2倍,两者对比T4整体性能仍旧占优。同时Oracle旗下处理器从T4开始将集成三级缓存,T4的L3 Cache容量为4MB,采用共享方式存取。
次世代SPARC处理器T4面向的应用范围
T4处理器的核心设计图,其中S3为单个CPU核心,L3为三级缓存,CCX为总线
T4处理器运行频率超过3GHz,集成的晶体管数量为8亿5千5百万个,对比T3的约10亿个减少15%左右。制造工艺则和T3相同,采用台积电40nm CMOS技术。Oracle此次没有公布T4处理器的核心面积和运行功耗,不过根据相同工艺这一条件以及T3的核心面积为377mm2,按比例我们可以推算出T4的核心面积范围在320-330mm2左右。
T4采用的单个CPU核心为Oracle新开发的"S3",具备乱序执行技术。整数运算流水线(Pipeline)达到16级,对比前代T3使用的S2核心,整数运算性能(SPECint2006测试值)达到约5倍,浮点运算性能(SPECfp2006测试值)约7倍。
每个S3核心内部集成16KB一级数据缓存(L1 Data Cache),16KB一级命令缓存(L1 Command Cache),128KB二级缓存。而前代T3使用的S2核心L1只有16KB命令+8KB数据,对比之下S3大大提高。
S3核心内部运算模块化流程
S3核心内部流水线示意图
T4与前代CPU的性能对比
同时,Oracle此次宣讲中着重强调的一点就是T4集成对应模块,大大强化了加密编码运算处理的性能。主要得益于增加了专门对应AES和DES、Kasumi、Camellia、CRC32c等算法的低延迟"in-pipe"命令,以及对应MD5、SHA-1、SHA-256、SHA-512、MPMUL等算法的高延迟"out-of-pipe"命令。
加密编码模块处理流程
T4与T4的加密编码性能比较
Oracle称,SPARC T4处理器最早有望在2012年前发布,如此看来甲骨文也不是一家只有法务部门靠打官司吃饭的公司,Sun除了Java外的另一项遗产看来还能被继承下去。