ผลทดสอบ NVIDIA Tesla P100 Accelerator
การทดสอบในครั้งนี้รู้จักกันในชื่อ AMBER ซึ่งย่อมาจาก Assisted Model Building with Energy Refinement. เครื่องมือตัวนี้เป็นตัวช่วยในการพัฒนาสินค้าจาก มิสเตอร์ Ross Walker มาจากเมือง San Diego Supercomputer Center and Scott Le Grand from Amazon Web Services. ตัว Amber มีลักษณะการใช้สองหลักใหญ่ๆคือ การจำลองตัวฟอร์ซฟิลหรือคลื่นพลังไฟฟ้ามีผลกระทบต่อ biomolecules มากน้อยขนาดไหน และยังมีโปรแกรมที่จำลองจำนวนโมเลกูลที่เป็น source codes/แหล่งที่มาของรหัสและการสาธิต.
ผลการทดสอบนี้เป็นส่วนหนึ่งของการจำลองตัว HPC/hyperscale computing/การคำนวนระดับสูงที่มีจำนวนหรือค่ามหาศาล ซึ่งไม่มีส่วนเกี่ยวข้องกับทางด้านประสืทธิภาพทางเกมส์ แต่ได้บ่งบอกหรือพิสูจน์ได้ว่าตัว GP100 GPU นั้นสามารถประมวลผลและขีดความสามารถได้มากถึงขนาดไหนโดยเฉพาะกับสินค้าของทาง NVIDIA GPUs เช่น GP104, GM200 และ GK110. ซึ่งได้นำมาเปรียบเทียบกัน
Exxact AMBER Certified 2U GPU Workstation/รายละเอียดทางเทคนิค:
- CPU = Dual x 8 Core Intel E5-2650v3 (2.3GHz), 64 GB DDR4 Ram
- (ตัว 6 Core E5-2620v3 และ v4 CPUs ที่มีราคาถูกกว่าก็ยังสามารถนำมาใช้ได้เพราะมีประสิทธิภาพเดียวกันสำหรับนำมาขับเคลื่อนตัว GPU)
- MPICH v3.1.4 – GNU v4.8.5 – Centos 7.2
- CUDA Toolkit NVCC v7.5 (8.0RC1 สำหรับ GTX-1080 และ P100)
- NVIDIA Driver Linux 64 – 361.43
- Precision Model = SPFP (GPU), Double Precision (CPU)
ก่อนที่จะไปดูผลทดสอบอยากเกลิ่นก่อนบางอย่างว่า การทดสอบในครั้งนี้ ทำและทดสอบภายใต้ SPFP (GPU) precision model. หมายความว่า GPUs ทั้งหมดนี้ใช้รูปแบบคำนวน single precision ในการประมวลผลของการทดสอบส่วน CPUs นั้นจะเป็นรูปแบบ double precision (FP64) model. และการทดสอบในครั้งนี้ ทั้งตัว Tesla P100 และ GTX 1080 ยังไม่ได้เปิดตัวอย่างเป็นทางการต่อสาธารณชน
Amber นั้นทำงานร่วมกับทาง NVIDIA อย่างใกล้ชิด และ ตัวโปรแกรมก็ได้ช่วยในด้านการเขียนแบบในด้านประสิทธิภาพโดยการทำหรือจำลองขึ้นมา, และทาง Amber ก็เป็นกลุ่มแรกๆเลยที่สามารถจับต้องหรือทดสอบตัวการ์ดเหล่านี้ ซึ่งก็หมายความการทดสอบครั้งนี้ ตัวการ์ดนั้นยังอยู่ในสถานะของขั้นพัฒนา ยังไม่ใช่รุ่นไฟนอลหรือรุ่นที่วางขาย ณ ตอนนี้ ตัว NVIDIA Pascal GPUs ยังเป็นรุ่น pre-release version ที่เป็น CUDA 8.0
บทความนี้ตอนที่เขียนอยู่ ตัว GTX-1080 และ P100 (DGX-1) cards ยังไม่เปิดสู่สาธารณชน และผลทดสอบก็เป็นรุ่น pre-release hardware/ก่อนผลิตจริง. และการทดสอบเล่นกันแบบอัดเต็มที่ เพื่อที่จะได้ผ่านหลักเกณ AMBER 16 specific และผลทดสอบตัว Pascal architecture นั้นจะสามารถมีขีดความสามารถเพิ่มขึ้นมากขนาดไหน:
ผลทดสอบ NVIDIA Tesla P100 GP100 GPU:
ผลทดสอบด้านล่างนี้ เราจะเห็นได้ว่า Tesla P100 เพียงตัวเดียวสามารถมีประสิทธิภาพที่เหนือกว่าตัว quad Titan X configuration ด้วยซ้ำ. ตัว GeForce GTX 1080 นั้นการประมวลผลเร็วพอกับตัว GP100 GPU ซึ่งก็หมายความว่าตัว GP104 ก็น่าจะทำได้ 9.3 TFLOPs graphics chip ซึ่งตัวเลขใกล้เคียง 10 (10.6) TFLOPs output เมื่อเทียบกับ Tesla P100 accelerator. แต่ทุกอย่างจะเปลี่ยนถ้าติดตั้งในรูปแบบ multiple boards. Tesla P100 นั้นเร็วที่สุดโดยไม่มีข้อสงสัย แต่หากมีการติดตั้ง NVLINK อย่างถูกต้องในขั้นรุ่นผลิตจริงที่จะส่งและเปิดจำหน่าย แน่นอนว่าตัวเลขจะขยับไปมากกว่านี้
NVIDIA DGX-1 system ใช้การ์ด Tesla P100 boards ถึง 8 ตัวราคาค่าตัวทั้งหมด $129,000 US. และในระบบทั้งหมดมีส่วนประกอบดังนี้:
- ค่าการประมวลผลสูงถึง 170 teraflops ในรูปแบบ half-precision (FP16) ในขั้นสูงที่สุด
- การ์ดTesla P100 GPU accelerators 8 ตัว, 16GB memory per/ต่อ GPU
- NVLink Hybrid Cube Mesh
- 7TB SSD DL Cache
- Dual 10GbE, Quad InfiniBand 100Gb networking
- 3U – 3200W
ผลทดสอบมีค่าหรือผลกระทบที่เปลี่ยนแปลงเล็กน้อยในรูปแบบการติดตั้งแบบ multiple modern GPUs และนี้เป็นการทดสอบก่อนการผลิตจริง, ตัว NVLINK นั้นไม่มีผลหรือความจำเป็นสำหรับ Tesla P100 hardware
ที่มาเครดิต
http://wccftech.com/nvidia-gp100-gpu-tesla-p100-benchmarks/
You must be logged in to post a comment.