ข่าวรายละเอียดเพิ่มเติมเกี่ยวกับ NVIDIA GeForce GTX 1080 โดยเฉพาะกับ – Async Compute, SMTP VR Processing, Higher Efficiency

ข่าวอย่างเป็นทางการตัว NVIDIA GeForce GTX 1080 เกี่ยวกับ– Async Compute, SMTP และลูกเล่นอื่นๆที่เด่นๆ

การทำรีวิวตัว NVIDIA GeForce GTX 1080 จะตามมาเรื่อยๆกับการเปิดตัวในวันทที่ 27 พฤษภาคม ที่จะถึงนี้ ตัว GeForce GTX 1080 จะวางจำหน่ายทั่วโลกทั้งแบบ reference และ non-reference การ์ด. โดยทาง NVIDIA ได้ตั้งราคารุ่น Founders Edition อยู่ที่ $699 US ส่วนรุ่น non-reference ราคาจะเริ่มอยู่ที่ $599 US. NVIDIA GeForce GTX 1080 นั้นจะมีราคาที่แพงกว่า GTX 980 ถึง $50 ตอนช่วงเปิดตัว และ ถูกกว่า $50 กับตัว GeForce GTX 980 Ti แต่ประสิทธิภาพที่ได้มานั้นดีกว่าทั้ง GTX Titan X และ GTX 980 ที่เป็นระบบ SLI.

GTX 1080_4

ประสิทธิภาพที่เพิ่มขึ้นมาอย่างก้าวกระโดดนี้ไม่ใช่แค่เพียงได้ตัวชิพเซ็ตใหม่เท่านั้น (FinFET process) แต่ด้วยโครงสร้างการออกแบบใหม่ของตัวสถาปัตยกรรม/architecture นี้ด้วย. GeForce 10 series cards ได้ใช้ NVIDIA’s Pascal architecture มาขับเคลื่อนตัวการ์ดจออยู่ก็หลายรุ่นด้วยกัน เช่น GP100, GP106 และมาตอนนี้ก็มีมาเพิ่ม GP104. NVIDIA GP104 GPUs จะเป็นสายพันธ์แรกที่จะมาขับเคลื่อนตัวการ์ดจอเพื่อมาตอนสนองความต้องการของผู้ที่ชื่นชอบความแรงเป็นพื้นฐานด้วย NVIDIA GPU architecture รุ่นใหม่นี้

รายละเอียดของ NVIDIA GP104 GPU Block Diagram/แผนผังความต่อเนื่องอย่างละเอียด –  มีตัวไดซ์ขนาด 314mm2 เป็นตัวขับเคลื่อน GeForce 10 Series Graphics Cards

NVIDIA GeForce 10 series graphics cards ขับเคลื่อนด้วย Pascal GPU หรือเรียกอีกอย่างว่า GP104. ตัว GPU มี SKUs อยู่หลายรูปแบบที่เป็นส่วนประกอบอยู่ในการ์ดจอของแต่ละรุ่น GP104 GPU มีส่วนประกอบของ transistors จำนวนทั้งหมด 7.2 Billion และมี 2560 CUDA cores. ด้วยการออกแบบมาลักษณะนี้สามารถทำให้มีส่วนประกอบของแกน 128 cores ต่อ/per streaming multiprocessor ซึ่งเทียบเท่ากับตัว GM204 แต่เมื่อเปรียบเทียบกับตัว GP100 GPU จะไม่เหมือนกันเพราะว่ามีแค่ 64 CUDA Cores ต่อ/per SM unit

NVIDIA GP104 GPU Block Diagram

คราวนี้มาดูรายละเอียดปลีกย่ยอของแผนผัง ตัว GP104 block diagram, จะเห็นได้วามี graphics processing clusters/การประมวลผลทางกราฟฟิก 4 กลุ่มด้วยกันใน GP104 GPU. แต่ละ GPC มี 5 streaming multiprocessor units. ตัว streaming multi processor units มีจำนวนแกน 128 cores, 8 ROPs และแต่ละ GPC ของการคำนวณมี 16 TMUs/texture mapping unit/จำนวนหน่วยควบคุมการสร้างโพลิกอน  ของทั้งหมด ทั้งหมดนี้จึงมาเป็นจำนวนแกน 2560 CUDA cores, 160 TMUs และ 64 ROPs/Render Output Units/ขั้นตอนสุดท้ายของการจ่ายภาพ ที่เป็นองค์ประกอบทั้งหมดบน chip. มี memory controllers ทั้งหมด 8 ตัว แตละตัวมี 32-bit ที่อยู่ในการ์ดจอที่จะมาขับเคลื่อน GDDR5 และ GDDR5X memory

NVIDIA GeForce GTX 1080_GDDR5Xรุ่นที่ดีที่สุดของ GP104 GPU สามารถทำความเร็วในด้านคำนวณได้ที่ 9 TFLOPs ของการตั้งค่าหรือเซ็ตค่าแบบปรกติ/stock configuration. ตัววงจรทั้งหมดถูกติดตั้งบนไดซ์ขนาด 314mm2 die size ซึ่งเป็นที่น่าทึ่งมาก เพราะได้มาทั้งประสิทธิภาพและขีดความสามารถทางด้านประหยัดพลังงาน หากเปรียบเทียบกับตัวการ์ดจอรุ่น Titan X ซึ่งสร้างอยู่บนฐานขนาด 601mm2 die และมีจำนวน transistors อยู่ถึง 8 Billion transistors. ความหนาแน่นของตัว transistor นั้น หากมองดูกันที่ ตารางมิลลิเมตรนั้น จาก 10 million กระโดดไปถึง 23 million ต่อตารางมิลลิเมตรเลยทีเดียว

รายละเอียดทางเทคนิคของ NVIDIA GeForce GTX 1080 อย่างเป็นทางการ – 8 GB GDDR5X, 2560 Cores, 180W TDP และระบบทำความเย็น

NVIDIA GeForce GTX 1080 ใช้ GP104-400-A1 GPU เป็นตัวขับเคลื่อน มีตัว transistors ทั้งหมด 7.2 Billion ตัว GPU มี 2560 CUDA cores, 160 Texture Mapping Units และ 64 Raster Operation Units. ตัวการ์ดสามารถทำ clock ได้ที่ 1604 MHz และ 1733 MHz และแตะระดับความเร็วการคำนวณที่ 9 TFLOPs ในรูปแบบ single precision compute performance และยังสามารถทำ boost clockได้เร็วมากกว่านี้ โดยใช้ GPU Boost 3.0 algorithm รุ่นใหม่่

nvidia-geforce-gtx-1080_boost-clocks

nvidia-geforce-gtx-1080_gpu-boost-3-0

ตัว NVIDIA GPU Boost 3.0 สามารถดึงพลังออกมาได้เต็มที่เล่นกันแบบวัตท์ต่อวัตท์เลยที่เดียว ประโยชน์ที่ได้ก็คือความเร็วทางด้าน clock speeds นั้นสามารถทำได้มากกว่าการตั้งค่าแบบปรกติได้มากกว่าการ์ดจอที่ทำ boost clocks เสียอีก ( reference boost clocks). ตัว GPU หากมองกันตามทฤษฎีแล้ว สามารถ boost ได้เพิ่มถึง 2 GHz โดยการทำ overclock ด้วยวิธีแบบเดียวกันนี้ (ดูรูปด้านล่าง)

jjn

NVIDIA มี 8 GB ที่เป็น GDDR5X memory ประกอบอยู่ในตัว GeForce GTX 1080 graphics card. ตัว GDDR memory รุ่นใหม่นี้ทำความเร็วได้ที่ 10 GB/s คงที่พร้อมด้วยกับตัว 256-bit bus. และค่า bandwidth ได้ที่ 320 GB/s. ตัวการ์ดมีค่าความเร็วพิกเซลที่ 102.8 GPixels/s และค่า texture อยู่ที่ 257.1 GTexels/s. ค่าพลังงานใช้อยู่ที่ 180W TDP ซึ่งอาศัยเพียง 8-Pin connector เพียงเส้นเดียว. Display outputs ก็มี 3 Display Port 1.4a, HDMI 2.0b และ DVI-D port.

nnj

nvidia-geforce-gtx-1080_gallery_1

nvidia-geforce-gtx-1080_gallery_9

nvidia-geforce-gtx-1080_display-support

nvidia-geforce-gtx-1080_hdr

nvidia-geforce-gtx-1080_gamestream-hdr

หากกล่าวถึงขีดความสามารถของทางด้านจ่ายภาพ GeForce GTX 1080 สามารถทำได้ถึง 6 จอภาพในเวลาเดียวกันด้วยความละเอียดที่ 7680×4320 อยู่ที่ 60 Hz. ตัวการ์ดมี H.264 Encode/รหัส(2x 4K @ 60 Hz)/Decode/ถอดรหัส (2x 4K @ 120 Hz up 240 Mbps) , HEVC Encode (2x 4K @ 60 Hz)/ Decode (2x 4K @ 120 Hz / 8K @ 30 Hz up 320 Mbps), 10-bit HEVC Encode และ HEVC 10-bit Decode และ VP9 Decode. ตัวการ์ดจอรุ่นใหม่นี้ยังรองรับระบบ HDR compliant และยังสามารถจ่ายภาพไปยังเครื่องรับภาพที่เป็นระบบ HDR ด้วย gamestream technology

รายละเอียดปลีกย่อยของ NVIDIA GeForce 10 Series “Pascal”

คราวนี้จะกล่าวถึงการทำงานของระบบ Async compute ใน NVIDIA’s Pascal architecture และ Pascal’s dynamic load balancing system

NVIDIA Pascal GeForce 10 Series – Async Compute / Preemption/หยุดชั่วคราวและแทรกแซง (Pixel/Instruction Level):

เรื่มแรก, ทาง NVIDIA ได้กล่าวถึง Asynchronous compute ในงานเปิดตัวซึ่งดูแล้วลูกเล่นนี้เหมือนกับตัว DirectX 12 API. ซึ่ง GeForce 10 series cards จะใช้ Async compute กับ applications หลายชนิดด้วยกันที่รวมถึง Physics, VR และ post processing/ปรับปรุงแก้ไขรูปให้ดียิ่งขึ้นในด้าน ความลึก/แสงจ้า/คมชัด ของภาพ

NVIDIA GeForce GTX 1080_Async Compute

ด้วยลูกเล่นใหม่นี้จะทำให้ทาง NVIDIA สามารถนำขีดความสามารถทางด้านการคำนวณของตัว Pascal chips ไปใช้ได้หลายด้านด้วยกัน ซึ่งตัว Async compute นั้นจะสามารถมีผลต่อกับตัว architecture ใหม่นี้ในด้านประสิทธิภาพได้มากขนาดไหนโดยเฉพาะในด้านเกมส์ เรามาดูพร้อมกันในบทความนี้

Async NVIDIA

ทาง NVIDIA ลงทุนในการพัฒนาเทคนิคทางด้าน preemption techniques/แทรกแซง ในตัว Pascal สำหรับ VR อยู่ไม่น้อย . Preemption ใน VR นั้นสามารถทำให้การดีเลย์นั้นดีมากขึ้น/latency, ความเร็วดีขึ้นและเวลาที่ไม่ต่อเนื่องทำได้ดีต่อเนื่องขึ้นใน VR titles. ทาง NVIDIA เรียกวิธีนี้ว่า first Pixel-level graphics preemption ซึ่งจะทำให้ตัวต้นทางกราฟฟิกสามารถแทรกแซง command buffer, pixels และ triangles. ตัว Pixel level graphics และ thread level compute preemption ก็จะให้ sub-100us preemption ในเกมส์ ส่วน instruction level compute preemption จะมีประสิทธิภาพที่เพิ่มขึ้นในด้านงานคำนวณทั่วไป

nvidia-geforce-gtx-1080_preemption

nvidia-geforce-gtx-1080_preemption-vr

nvidia-geforce-gtx-1080_preemption-in-vr

NVIDIA Pascal GeForce 10 Series – Dynamic Load Balancing:

อีกลูกเล่นหนึ่งที่มีส่วนเกี่ยวข้องโดยตรงกับ Async compute ก็คือ Pascal’s dynamic load balancing system. โดยปรกติแล้ว ตัวต้นน้ำ/ทรัพยากรของ GPU resources เช่นตัวกราฟฟิกและคำนวณจะนำมาใช้ที่แตกต่างกัน ตัวกราฟฟิก สามารถทำงานและถ่ายโอนได้เร็วกว่าชนิดแบบไม่เหลืออะไรที่คั่งค้างเอาไว้ แต่ การคำนวณนั้นจะช้ากว่าๆที่จะนำไปใช้หมดหรือแม้กระทั้งการถ่ายโอนตัวกราฟฟิกถูกนำไปใช้หมดแล้วแต่ทางคำนวณก็ยังหลงเหลืออยู่

NVIDIA GeForce GTX 1080_Dynamic Load Balancing

Dynamic balancing สามารถทำให้การคำนวณนั้นถูกนำไปใช้ได้อย่างเต็มที่หลังจากที่ตัวกราฟฟิกนั้นจบงานไปแล้ว ด้วยวิธีนี้สามารถทำให้ตัว GPU ทำงานมีประสิทธิภาพดียิ่งขึ้นในด้าน applications และจะไม่มีช่องว่างหรือพื้นที่ว่างเปล่าให้เสียของอีกต่อไป คำตอบก็คือทำให้ กราฟฟิกและการคำนวณสามารถทำเวลาได้ระยะพอๆกันหหรือเทียบเท่า

NVIDIA Pascal GeForce 10 Series – Simultaneous Multi-Projection:

เทคนิคทางด้าน Simultaneous Multi-Projection ตัวการ์ดจอจะสามารถทำหน้าที่ได้อย่างเต็มที่ในระบบ VR applications ได้โดยการมุ่งเน้นไปที่การจ่ายภาพหรือเนื้อหาที่ผู้ใช้จะได้รับรู้หรือเห็นดีกว่าที่จะรักษาหรือหน่วงประสิทธิภาพหรือขีดความสามารถเอาไว้

NVIDIA GeForce GTX 1080_SMTP

คราวนี้มาดูตัว Oculus Rift สามารถจ่ายภาพออกมาได้ละเอียดที่ 4.2 MPixels แต่ไม่ใช่ต่อข้าง (ตาทั้งคู่) SMTP renders สามารถจ่ายภาพอย่างต่อเนื่องได้ที่ 2.8 MPixels ซึ่งใช้ขีดความสามารถที่เหลือปัจจุบันจากที่กล่าวมาข้างต้น เพื่อมาขับดันประสิทธิภาพในด้านภาพต่อเฟรมให้ได้เร็วยิ่งขึ้นในการมองเห็น SMTP ยังสามารถสร้างภาพหรือให้ภาพที่เป็นรูปร่างหรือสิ่งแดวล้อมของภาพได้เร็วเป็น 2 เท่า โดยการคำนวณและสร้างไดเมนชั่นของภาพก่อนที่จะจ่ายออกไป ทั้งหมดนี้จึงมาซึ่ง ประสิทธิที่ทำงานได้ดีขึ้นด้วยศักยภาพใหม่ของตัว Pascal พร้อมกับนวัตกรรมและความคิดโครงสร้างฐานใหม่ไปพร้อมๆกันเพื่อที่จะได้ประสบการ์ณที่ดีในการเล่น VR gaming

NVIDIA GeForce GTX 1080_2

SMTP นั้นอาจจะรองรับการทำงานร่วมกับโครงสร้างฐานเก่าของ NVIDIA architectures แต่ไม่ดีเทียบเท่ากับตัว Pascal. เพราะว่าทาง NVIDIA ได้ทำการอัพเดท Polymorph Engine 4.0 เพื่อที่มารองรับการทำงานร่วมกับ SMTP. ด้วยผังใหม่ที่ถูกสร้างและออกแบบมา จะทำให้ GeForce 10 series และการ์ดจอรุ่นต่อๆไปสามารถทำหน้าที่ของตัวเองได้ดียิ่งขึ้นเป็น 2 เท่า กับตัว predecessors.

NVIDIA Pascal GeForce 10 Series – กับ Memory Compression ในรุ่นที่ 4:

จะว่าไปแล้ว NVIDIA’s Maxwell architecture ได้นำเสนอนวัตกรรมใหม่ๆเพื่อมารองรับและตอบสนองกับเทคโนโลจีโลกปัจจุบันได้ดีไม้น้อย โดยเฉพาะกับตัว memory compression technique แต่ Pascal ได้ก้าวข้ามไปอีกหนึ่งขั้น GeForce 10 series มาพร้อมวิธีการใหม่ในด้านบีบอัด memory ซึ่งทำให้ตัว bandwidth ทำหน้าที่ได้ดีขึ้นถึง 1.7 เท่า เมื่อเทียบกับ Maxwell. ด้วยเหตุนี้ตัว GPU และ application จะไม่ทำให้ตัว memory bandwidth นั้นมีสภาพแบบคอขวดอีกต่อไป

nvidia-geforce-gtx-1080_pascal-memory-compressionnvidia-geforce-gtx-1080_pascal-memory-compression-1nvidia-geforce-gtx-1080_pascal-compressionnvidia-geforce-gtx-1080_maxwell-compression

NVIDIA Pascal GeForce 10 Series – กับลูกเล่นใหม่ High-Bandwidth SLI Bridges:

NVIDIA ได้เสนอแนวคิดหรือเทคโนดลจีใหม่กับตัว Pascal cards (GTX 1080 and GTX 1070) รู้กันในชื่อ HB SLI (High Bandwidth Scale Link Interface). เมื่อเปรียบเทียบกับ SLI ทั่วไป, ตัว HB SLI solution สามารถทำให้ bandwidth ทำงานได้ดีขึ้นเป็นสองเท่า โดยการนำ SLI connectors ทั้งคู่ ที่อยู่บนบอร์ด GeForce Pascal boards มาต่อเชื่อมกันแบบไม่รู้สึกเลยว่าคุณกำลังอยู่ในโหมด multi-GPU setup พร้อมด้วยการจ่ายภาพที่มีความละเอียดสูงอยู่

nvidia-geforce-gtx-1080_hb-sli-bridgesnvidia-geforce-gtx-1080_4k-surround

ด้วยเทคนิคใหม่นี้ HB SLI bridges สามารถจ่ายภาพได้ดีขึ้นดีเลย์น้อยลง และได้ความละเอียดของภาพได้สมจริงมากขึ้น สิ่งแวดล้อมในการเล่นเกมส์ดูมีสีสันและกราฟฟิกที่ละเอียด ด้วยเหตุที่ว่าคุณกำลังอยู่ในโหมด multi-GPU setup แบบไม่รู้ตัว

รุ่นแรก NVIDIA GeForce GTX 1080 Graphics Card มาพร้อมบล๊อคระบบทำความเย็นด้วยน้ำ พร้อมด้วยความแรงระดับ 2 GHz หรือมากกว่า

GeForce GTX 1080 graphics card มาพร้อมตัวบล๊อคระบบทำความเย็นด้วยน้ำ ซึ่งสามารถทำให้ตัวการ์ดนั้น ทำความเร็วทะลุผ่าน 2 GHz ได้แบบง่ายๆ (รุปข้างล่างเป็นตัวอย่างหนึ่งที่ทางประเทศจีได้ผลิตตัวบล๊อคระบบทำความเย็นด้วยน้ำสำหรับใช้กับตัว GeForce GTX 1080)

NVIDIA GeForce GTX 1080 WaterBlock_1และอีกเพียงแค่อาทิตย์เดียวเท่านั้น ก็จะมีงานแสดงเกี่ยวกับการ์ดจอ และบรรดาคายต่างๆที่เป็นตัวแทนทั้งหลายก็จะมาอวดโฉมการ์ดจอของตัวเอง

ที่มาเครดิต

http://wccftech.com/nvidia-geforce-gtx-1080-official-slides-leak/

 

 

 

 

 

 

 

 

Related articles

PowerColor เผยฟีเจอร์ Edge AI ใช้ชิป NPU ช่วยให้การ์ดจอกินไฟลดลง สูงสุดถึง 22% !!

ช่วงนี้ AI กำลังมาแรง จะเห็นว่าในซีพียูจะมีชิป NPU เพื่อช่วยการประมวลผล AI โดยเฉพาะ ซึ่งทาง...

[เรื่องน่ารู้] Cybernetics vs. 80 Plus มาตรฐาน PSU แบบไหนดีกว่ากัน ??

เชื่อว่าหลาย ๆ คนที่เลือกซื้อซีพียู ส่วนหนึ่งต้องพิจารณามาตรฐาน 80 Plus เพื่อบอกถึงความคุ้มค่าและประสิทธิภาพในการจ่ายไฟ แต่ยังมีอีกมาตรฐานหนึ่งที่นิยมนำมาใช้ด้วย นั่นคือมาตรฐาน...

GIGABYTE เปิดตัวผลิตภัณฑ์ในซีรีส์ AI TOP – ตอบโจทย์คอม AI ทั้งฮาร์ดแวร์และซอฟต์แวร์

ปีนี้มันปีของ AI จริง ๆ จะเห็นว่าผลิตภัณฑ์คอมชิ้นไหน ๆ ก็เน้น AI เป็นพิเศษ...

1-Click Auto Tune คลิกเดียวการ์ดจอก็แรงขึ้น แถมปรับค่า OC ได้ ด้วย NVIDIA App

ในงาน Computex ที่ผ่านมา NVIDIA ไม่ได้มีการเปิดตัวฮาร์ดแวร์ด้านเกมมิ่งออกมานะครับ แต่อย่าน้อยใจไป เพราะอย่างน้อยก็มีการอัปเดตซอฟต์แวร์ใหม่ NVIDIA App...

รู้จัก Project G-Assist ผู้ช่วย AI สุดยอดคลังความรู้ ให้การเล่นเกมของเราสนุกขึ้นกว่าเดิม !!

นี่น่าจะเป็นหนึ่งในโปรเจ็กต์ AI ของค่ายเขียว ที่ถูกใจเหล่าเกมเมอร์อย่างแน่นอนกับ Project G-Assist ผู้ช่วยในการเล่นเกม ซึ่งครั้งหนึ่งเคยเป็นมุกตลกในวัน April...

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

ตั้งค่าความเป็นส่วนตัว

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

ยอมรับทั้งหมด
จัดการความเป็นส่วนตัว
  • เปิดใช้งานตลอด

บันทึกการตั้งค่า