Laskentatehotarpeeseen Nvidia on esitellyt uudet Pascal-arkkitehtuuriin perustuvat Tesla P40- ja Tesla P4-ohjaimet. Transistoreita niistä löytyy 12 (P40) ja 7,2 miljardia (P4) kappaletta, mikä on varsin iso hyppäys edellisen sukupolven Tesla M40- ja M4-ohjaimista (8 ja 3 miljardia transistoria).
Transistoreiden määrän kasvun ja uuden arkkitehtuurin käyttöönoton myötä myös suorituskykykin on kasvanut, FP32-tarkkuudella mitattuna Tesla P40 yltää 12 TFLOPSin ja Tesla P4 5,5 TFLOPSin suorituskykyyn (M40 ja M4: 7 TFLOPS, 2,2 TFLOPS). Laskennallisesti uutta on INT8-käskykannat pienempää tarkkuutta ja suurempaa suorituskykyä vaativia tehtäviä varten.
Ohjaimien lisäksi Nvidia esitteli TensorRT-päättelymoottorin, jonka avulla kehittäjät voivat hyödyntää valmiiksi opetettuja päättelymalleja omissa tuotteissaan. DeepStream-kehitystyökalujen avulla palvelukehittäjät voivat vuorostaan hyödyntää tekoälyä analysoidessaan videomateriaalien sisältöä.
Kirjoittaja: Manu Pitkänen @ 13. syyskuuta, 2016 13:28