ที่งาน GDC วันนี้ทาง Nvidia ประกาศเปิดตัว Testla Volta V100 processor, นี้ตือ Volta เป็น GPU จาก Tensor architecture ตัวใหม่. Tesla Volta V100 จะใช้กระบวนการผลิตแบบ TSMC 12nm finfet process
สำหรับ Tesla Volta V100 graphics processor มีจำนวนแกนทั้งสิ้น 5,120 CUDA / Shader cores และประกอบไปด้วยตัว transistors มากถึง 21 พันล้านชิ้นทีเดียว. นี้คือประสิทธิภาพการประมวลผลทางด้านการคำนวณขนาด 120 Tensor TeraFLOPS. สำหรับ Gaming นั้นจะอยู่แถวๆ 15 TFLOP (fp32), มาพร้อมการประมวลผลของสถาปัตยกรรมใหม่ล่าสุดที่เรียกกันว่า Tensor cores. ทีมพัฒนาหรือ R&D ผู้ที่อยู่เบื้องหลังงานชิ้นนี้ใช้เงินในการวิจัยไปประมาณ สามพันล้านเหรียญ. และจะพร้อมเสริฟให้กับกลุ่ม server และ deep learning segmented ประมาณไตรมาสที่สามปีนี้ 2017. สำหรับตัว Tensor Core ใหม่นี้เป็น 4×4 matrix array และเหมาะมากสำหรับนำไปใช้กับ deep learning. หากคุณคิดว่า Pascal เร็วพอแล้ว, ขอบอกว่ามันยังเร็วไม่พอ. สำหรับขนาดของตัวชิปนั้น-กล่าวได้เลยพอๆกับฝ่ามือของคุณ 815mm2.
- Massive 815mm2 die size/ขนาด
- 12nm FinFet (TSMC)/กระบวนการผลิตรูปแบบ
- 21B Transistors/ทรานซิสเตอร์
- 15 FP32 TFLOPS / 7.5 FP64 TFLOPS/ค่าคำนวณ
- 120 Tensor TFLOPS
- 16GB HBM2 which manages @ 900 GB/s/เมโมรี่และความเร็ว
- 5120 Shader processor cores/จำนวนแกน
Tesla Volta V100 มีค่าการคำนวณขนาด 15 FP32 TFLOPS และแรงได้เหมือนหรือแรงกว่า Pascal GP100 และมาพร้อม 4096-bit HBM2 graphics memory (เรียงเป็นชั้นบนได/stacked on-die cache). สำหรับรุ่นนี้จะมีขนาดความจุ 16GB แบ่งออกเป็นสี่ชั้น (= 4GB per stack). ตัว memory นั้นมาจาก Samsung. ขนาดตัว die วัดได้ที่ 815 mm2 ผลิตโดย TSMC เป็นกระบวนการผลิตแบบ 12nm FFN fabrication process. ในไตรมาสที่สามที่จะถึงจะได้เห็นตัวเป็นๆอย่างแน่นอนเพื่อมาสนองต่อความต้องการต่อองค์กรใหญ๋ๆเคาะราคามาที่ 69.000 dollar. สำหรับเกมส์เมอร์, หากถึงเวลาของ GeForce GTX 1180 หรือ 2080 ออกมาเมื่อไหร่-คงจะต้องคุยกันยาวๆว่าจะเอายังไง. ด้านล่างเป็นภาพเทียบสเป็คของ Tesla GPUs ที่วิ่งด้วยตัว Volta,พร้อมกับตัว processors ที่มาพร้อม 5120 shader เร่งที่ 1.45 GHz สำหรับ Boost frequency. มันจะมี 320 Texture Units
สำหรับ GV100 GPU นี้รูปแบบเต็มๆไม่มีตัดทอนมี 6 GPCs, 84 Volta SMs, 42 TPCs (แต่ละตัวมี 2 SMs), และแปด-512-bit memory controllers (ทั้งหมดก็ 4096 bits). แต่ละ SM มี 64 FP32 Cores, 64 INT32 Cores, 32 FP64 Cores, และ 8 Tensor Cores. แต่ละ SM จะมี 4 texture units.
ทั้งหมดก็ 84 SMs, GV100 GPU ก็จะมีจำนวนทั้งหมด 5376 FP32 cores, 5376 INT32 cores, 2688 FP64 cores, 672 Tensor Cores, และ 336 texture units. แต่ละ memory controller ยังมาพร้อม 768 KB ที่เป็น L2 cache, และแต่ละ HBM2 DRAM stack จะถูกควบคุมด้วย memory controllers สองตัว. GV100 GPU ก็จะมีจำนวนทั้งหมด 6144 KB ที่เป็น L2 cache. ตารางด้านบนแสดงให้เห็น GV100 GPU พร้อมด้วย 84 SMs (รุ่นอื่นๆอาจจะมี configurations/องค์ประกอบที่แตกต่างจาก GV100). และสำหรับ Tesla V100 accelerator/ตัวบู๊ธ จะใช้ 80 SMs.
ที่มาเครดิต/Sources:
http://www.guru3d.com/news-story/nvidia-shows-testla-v100-based-on-volta.html
You must be logged in to post a comment.