Pascalæ¶æçç¹ä¹ä¸ï¼è®¡ç®æ§è½æ¯å
³é®ï¼å精度æ§è½éå¸åå½
ããGP100çæ§è½ä¸ç»å
¬å¸ï¼ç»æ们çæè§å°±æ¯NVIDIAè¿æ¬¡åå½äºGK110å¤§æ ¸å¿æ¶ä»£æ³¨éå精度è¿ç®ç设计ï¼èä¸æ¯ä¹åæ´å åæââGK110æ¶æä¸FP64å精度ä¸FP32å精度çæ¯ä¾ä¸è¿1ï¼3ï¼æ¯ç»SMXåå
ä¸æ192个FP32åå
ï¼64个FP64åå
ï¼ä½GP100æ ¸å¿ä¸æ¯ç»SMåå
ä¸æ64个FP32åå
ï¼ä½æ32个FP64åå
ï¼FP64ä¸FP32æ¯ä¾æ¯1ï¼2ã
ããè¦ç¥éï¼Maxwellæ¶æä¸åå精度æ¯ç å°äº1/32ï¼GK104æ ¸å¿ä¸åå精度æ¯æ¯1/24ï¼è¿é½è¿è¿ä½äºPascalæ ¸å¿ï¼å¯ä¸è½ä¸ä¹åª²ç¾çå°±æ¯å½å¹´Fermiæ ¸å¿çTeslaå éå¡äºã
ããå æ¤å¨å精度æ§è½ä¸ï¼GP100æ ¸å¿å¯ä»¥è¯´çªç ´å¤©é
äºï¼FP64æµ®ç¹æ§è½å¯è¾¾5.3TFLOPSï¼èGK110æ ¸å¿ä¸è¿1.68TFLOPSï¼GM200æ ¸å¿æ´æ¯åªæå¯æç0.21TFLOPSï¼GP100å精度æ§è½è¾¾å°äºGK110æ ¸å¿ç3åå¤ï¼æ¯GM200æ ¸å¿ç20å¤åã
ããHPCå¾å¤åºç¨éè¦å精度æ§è½ï¼ä¸è¿è¿æ ·ç计ç®å¹¶ä¸éè¦é«ç²¾åº¦è¿ç®ï¼å 为å®å¤©çèªå¸¦çº éè½åï¼èGP100çFP32 CUDAæ ¸å¿å¯ä»¥åæ¶æ§è¡2个FP16å精度è¿ç®ï¼å æ¤FP16æµ®ç¹æ§è½é«è¾¾21.6TFLOPSãNVIDIAå¨Tesla P100ä¹å¤è¿æ¨åºäºåºäºGP100æ ¸å¿çDGX-1深度å¦ä¹ è¶
级计ç®æºï¼ç±8é¢GP100æ ¸å¿å2é¢16æ ¸Xeon E5å¤çå¨ç»æï¼æ·±åº¦è®¡ç®æ§è½è¾¾å°äº170TFLOPSï¼å·ç§°æ¯250å°X86æå¡å¨è¿è¦å¼ºå¤§ã
ããGP100为äºæå计ç®æ§è½ï¼å¢å¼ºçä¸ä»
ä»
æ¯å精度åå
ï¼å
¶L2ç¼åãå¯åå¨æ件ä¹å¤§å¹
æåï¼æ»è®¡æ¥æ4MB L2ç¼åã14MBå¯åå¨æ件ãæ»ä¹ï¼NVIDIAçGP100æ ¸å¿ä¸ºäºè®¡ç®æ§è½å¯è°ç
è´¹è¦å¿ï¼å精度æ§è½ç®ç´é天ï¼ä¸è¿NVIDIAé对é«æ§è½è¿ç®æåç设计åºç¶è®¨å¥½HPCå¸åºï¼ä½å¯¹æ¸¸æå¸åºæ¥è¯´å精度æ¯æ²¡å¤å°ç¨å¤çï¼åè浪费äºæ¶ä½ç®¡åå
ï¼æé«äºææ¬ååèã
Pascalæ¶æçç¹ä¹äºï¼å级16nmå·¥èºï¼å¯åº¦ãè½ææå
ããä»AMDçHD 7970æ¾å¡çå
使ç¨28nmå·¥èºå¼å§ç®èµ·ï¼TSMCç28nmå·¥èºå·²ç»éªä¼´æ们åå¹´æ¶é´äºï¼æé´AMDãNVIDIAæ°æ¬¡å级çæ°æ ¸å¿é½æ²¡æå·¥èºå级ï¼ä¾ç¶åæ28nmå·¥èºï¼åæ¹é½è·³è¿äº20nmå·¥èºãç´æ¥è¿å
¥äºæ§è½æ´å¥½çFinFETå·¥èºèç¹ï¼åªä¸è¿AMDéæ©äºä¸æ/GFç14nm FinFET LPPå·¥èºï¼NVIDIAåæäºèæåTSMCç16nm FinFET Pluså·¥èºã
TSMCç16nm FinFETå·¥èºä¼å¿
ãã对å导ä½è¯çæ¥è¯´ï¼å级工èºé常æå³çæ¶ä½ç®¡æ§è½æåãåèä¸éï¼åæ¶æ¶ä½ç®¡å¯åº¦å¤§å¹
æåãå
·ä½å°TSMCç16nmå·¥èºï¼è¯¥å
¬å¸æ¤å表示å
¶16nmå·¥èºçæ¶ä½ç®¡å¯åº¦æ¯28nm HPMå·¥èºç2åå·¦å³ï¼åæ ·çåèä¸æ§è½æå38%ï¼åæ ·çé度ä¸åèéä½54%ï¼å¯¹æ¯20nmå·¥èºåæ¯20%é度æåã35%åèä¸éã
æ们åæ¥çä¸GP100æ ¸å¿çç¸å
³æ°æ®ï¼
GP100æ ¸å¿çæ¶ä½ç®¡å¯åº¦ãé¢çåTDPåè
ããæ们ç®åå°æå 款GPUçæ¶ä½ç®¡å¯åº¦æ¢ç®äºä¸ï¼æ¶ä½ç®¡æ°éé¤ä»¥æ ¸å¿é¢ç§¯ï¼ç±äºGPUæ ¸å¿ççµè·¯å¤æï¼è¿ç§ç®æ³ä¸ä¸å®ç²¾ç¡®ï¼ä»
ä¾åèï¼ï¼16nmå·¥èºçGP100æ ¸å¿æ¶ä½ç®¡å¯åº¦å¤§çº¦æ¯2510ä¸æ¯å¹³æ¹æ¯«ç±³ï¼ç®èµ·æ¥æ¶ä½ç®¡å¯åº¦æ¯ä¹å28nmå·¥èºçMaxwellãKepleræ°å¥½å¤ä¸åã
ããè³äºæ¯ç¦æ§è½æ¯ï¼è¿é使ç¨çæ¯FP32æµ®ç¹æ§è½ä¸TDPåèçæ¯å¼ï¼èèå°ä¸è¿°æ ¸å¿é¢åçå¸åºä¸åï¼æ们è¦ç¥é侧éé«æ§è½çGP100ä¸æ¸¸æå¸åºçGM204ãGK104对æ¯TDPæ¯ä¸å
¬å¹³çï¼ä¸è¿æç»çç»æä¾ç¶æ¾ç¤ºåº16nmå·¥èºçGP100å¨æ¯ç¦æ§è½æ¯ä¸æææ¾ä¼å¿ã
ããä»è¿ä¸ç¹ä¹å¯ä»¥çæµï¼æªæ¥é对游æå¸åºçPascalæ ¸å¿ï¼æ¯å¦GP104ãGP106ï¼é®ä¸ä¹åï¼å®ä»¬å¿å¿
è¦éå²æGP100æ ¸å¿ä¸å¾å¤ä¸å¿
è¦çåè½ï¼ä¼ååèï¼æ以å
¶æ¯ç¦æ§è½æ¯æ çä¼æ´åºè²ã
Pascalæ¶æçç¹ä¹ä¸ï¼HBM 2æ¾åç»åºï¼16GBå¾å¥½å¾å¼ºå¤§
ããæ©å¨2å¹´åçGTC大ä¼ä¸ï¼NVIDIAå°±å
¬å¸äºPascalæ¾å¡ç2大ç¹è²ââä¸ä¸ªæ¯NVLinkæ»çº¿ï¼ä¸ä¸ªå°±æ¯3D Memoryï¼å·ç§°å®¹éã带宽æ¯ç®åæ¾å¡ç2-4åï¼å¸¦å®½å¯è¾¾1TB/sï¼è¿ä¸ªæ¾åå®é
ä¸å°±æ¯HBM 2æ¾åãæææçæ¯ï¼NVIDIAæ¤ä¸¾ä¹æå³ç尽管AMD Furyæ¾å¡æ¢å
使ç¨HBMæ¾åï¼ä½NVIDIAè¿æ¯å¨æ°ä¸ä»£HBMæ¾åä¸æ¢äºå
ï¼ä¸ç¥éAMDé¢å¯¹è¿ç§æ
åµåæ¯å¦ä½ççå¢ï¼
ãã对äºHBM 2æ¾åï¼æ们ä¹åä¹å¤æ¬¡åè¿ä»ç»ï¼HBM 2æ¾åç°å¨å·²ç»è¢«JEDECå¸çº³ä¸ºæ åãç¸æ¯ç¬¬ä¸ä»£HBMæ¾åï¼HBM 2æ¾åIOä½å®½ä¸åï¼ä½æ ¸å¿å®¹éä»2Gbæåå°äº8Gbï¼æ¯æ4Hiã8Hiå æ ï¼é¢çä»1Gbpsæåå°äº2Gbpsï¼å¸¦å®½ä»512GB/sæåå°äº1024GB/sï¼è¿ä¹æ¯TB/s带宽çç±æ¥ã
ããç®åä¸æãSK Hynixå·²ç»æè
æ£å¨é产HBM 2æ¾åï¼åé¢å®¹éæ¯4GBçï¼NVIDIAçGTC大ä¼ä¸å±ç¤ºäºSK HynixçHBM 2æ¾åï¼GP100æ ¸å¿ä½¿ç¨çåºè¯¥ä¹æ¯Hynixç产åï¼æ¯ä¸ªGP100æ ¸å¿å¨å´å æ äº4é¢HBM 2æ¾åï¼æ»å®¹éæ¯16GBï¼è¦æ¯AMDçFuryæ¾å¡ç4GB HBMæ¾å容éé«å¾å¤ã
ããæ¯æHBMæ¾å对NVIDIAæ¥è¯´è¿æ个好å¤ï¼é£å°±æ¯ECCæ ¡éªãæ¤åçæ¶æä¸ï¼NVIDIA Teslaæ¾å¡çECCæ ¡éªéè¦å ç¨6.25%çæ¾å空é´ï¼è¿æå³çæç¸å½é¨åçæ¾åè¦è¢«â浪费âï¼Tesla K40å éå¡ç12GBæ¾åä¸æ750MBé¢çç»ECCæ ¡éªï¼å¯ç¨çå
å容éå°±å©ä¸11.25GBï¼èä¸è¿è¿ä¼å½±åå
å带宽ãç¸æ¯ä¹ä¸ï¼HBM 2æ¾ååçæ¯æECCæ ¡éªï¼ä¸éè¦é¢å¤çå
åå ç¨ï¼è¿ä¸ä»
æé«äºæ¾åå©ç¨çï¼å¸¦å®½ä¹ä¸ä¼åå½±åã
GTC大ä¼å±ç¤ºçSK Hynixå
¬å¸ç4GB HBM2æ¾å
ãã16GB HBM2æ¾åæ»éå¨TeslaåQuadroä¸ä¸å¡ä¸ä¸ç®ç¬¬ä¸ï¼ä½HBM 2æ¾åè¶
é«ç带宽æ¯GDDR5æ¾åæå°è«åçãä¸è¿å¼å¾æ³¨æçæ¯ï¼å¨GTC大ä¼ä¸å±ç¤ºçHBM 2æ¾åé¢çæ ææ¯2Gbpsçï¼ä½NVIDIAçGP100æ ¸å¿ç®å带宽åªæ720GB/sï¼å¹¶æ²¡æè¾¾å°ä¹å宣称çTB/s带宽ï¼ç®ä¸æ¥é¢çåºè¯¥åªæ1.4Gbpså·¦å³ï¼è¿è¯´æGP100æ ¸å¿çHBM 2æ¾å并没æå
¨éè¿è¡ï¼ä¸æ¸
æ¥NVIDIA为ä½çäºä¸æã
Pascalæ¶æçç¹ä¹åï¼NVLinkå¯æ¯æ8è·¯æ¾å¡å¹¶è¡
ããå¦æ说3Dæ¾åæ¯NVIDIAå
¬å¸çPascalç第ä¸ä¸ªå
³é®ç¹æ§ï¼é£ä¹NV Linkæ»çº¿å°±æ¯å¦å¤ä¸ä¸ªå
³é®äºï¼å®åæ ·æ¯NVIDIAé对é«æ§è½è¿ç®å¼åçææ¯ï¼å·ç§°é度æ¯PCI-Eæ»çº¿ç5-12åï¼åé¢æå°çDGX-1深度计ç®è¶
级计ç®æºå°±ä½¿ç¨äºNV Linkææ¯ã
GP100æ¾å¡èåçNV Linkæ¥å£
ããNV Linkçä¼ç¹å°±æ¯å¸¦å®½è¶
é«ï¼ç®åPCI-E 3.0 x16带宽ä¸è¿16GB/sï¼ç¨å¨æ¸¸ææ¾å¡ä¸æ¯è¶³å¤çï¼ä½å¨è¶
ç®ä¸å°±ä¸å¤çäºï¼æ°ä¸ä»£çPCI-E 4.0è§èå延æäºï¼è¿å°±å¾é NV Linkæ»çº¿äºãNV Linkå®é
ä¸æ¯NVIDIAä¸IBMåä½å¼åçï¼æ¯ä¸ªééç带宽æ¯40GB/sï¼GP100æ ¸å¿æ¯æ4个NV Linkï¼åå带宽é«è¾¾160GB/sï¼èä¸å¸¦å®½æçé«è¾¾94%ï¼è¿äºé½è¦æ¯PCI-Eæ»çº¿æ´æä¼å¿ã
DGX-1ç8è·¯GP100æ¾å¡å¹¶è¡å°±é äºNV Linkææ¯
ããNV Linkææ¯ä¸»è¦æ¯ä¸ºé«æ§è½è¿ç®èççï¼IBMä¼å¨ä»ä»¬çPower 9å¤çå¨ä¸ä½¿ç¨è¯¥ææ¯ï¼Intelå°±ä¸å¤ªå¯è½ä½¿ç¨NVIDIAçææ¯äºï¼ä»ä»¬æèªå·±ç并è¡æ»çº¿ææ¯ã对äºæ®éæ¶è´¹è
æ¥è¯´ï¼NV Linkæä¹ä¸å¤§ï¼ä¸è¿è¶
é«ç带宽ãæ´ä½ç延è¿ä½¿å¾NV Linkææ¯å¯ä»¥æ¯æ8è·¯æ¾å¡å¹¶è¡ï¼å¯¹é«ç©æ¥è¯´æä¸å®å¸å¼åï¼ä¸è¿å¤å¡äºèçå
³é®å¨äºç®åææ没æåªäºåºç¨æè
游æè½å¤å®ç¾æ¯æ8å¡è¿è¡ã
Pascalæ¾å¡æå
³é®çé®é¢ï¼æ¶è´¹çº§æ¾å¡å¦ä½âéå²â
ãã以ä¸åç¹åªæ¯NVIDIA Pascalæ¾å¡çé¨åç¹è²ï¼ç±äºå®æ¹å
¬å¸çç»èè¿ä¸å¤å¤ï¼æ们对Pascalæ¾å¡çäºè§£è¿éè¦è¿ä¸æ¥æ·±å
¥ã毫æ çé®çæ¯GP100å¤§æ ¸å¿å¨é«æ§è½è®¡ç®å¸åºå¤§æç¨æ¦ä¹å°ï¼ä¸è®ºæ¯è¶
é«çå精度æ§è½ãè¶
é«çæ¯ç¦æ§è½æ¯è¿æ¯è¶
é«çæ¾å带宽ãè¶
é«çNV Linkæ»çº¿ï¼GP100å¤§æ ¸å¿é½æ¥ææ强çç«äºåï¼ä¹æ æªä¹è¯¥å¡ååå¸ï¼æ¬§æ´²æ强çè¶
级计ç®æºå°±åå¤ä½¿ç¨Tesla P100ä¸ä¸å¡å级äºã
ããä¸è¿éä¸ä¸ç¨æ·å¯¹GP100æ大çæ
å¿ä¹æ¥æºäºæ¤ï¼å 为å®èº«ä¸éæäºå¤ªå¤çä¸ä¸ææ¯ï¼å精度è¿ç®å¯¹æ¸¸æåºç¨æ²¡å¤å°ç¨å¤ï¼16GB HBM 2æ¾åè½ç¶å¤YYï¼ä½ææ¬è®©äººæ
å¿ï¼NV Linkæ»çº¿å¯¹æ¸¸ææ¾å¡æ¥è¯´æ´æ¯å± é¾ä¹æï¼åªæ16nmå·¥èºçé«è½æ对游æç©å®¶æ¥è¯´æ¯æç¨çã
温馨提示:答案为网友推荐,仅供参考