คุณคิดว่าจะใส่ GPUs ได้กี่ตัวในหนึ่งเครื่อง/single system?

คุณคิดว่าจะใส่ GPUs ได้กี่ตัวในหนึ่งเครื่อง/single system?

หากจะมองว่าการที่จะนำ GPUs หลายๆตัวนำมารวมกันเป็นหนึ่งเครื่อง คิดว่าจะสามารถทำได้กี่ตัว คำถามอันนี้ไม่ได้ตอบโจทย์ทางด้านเกมส์ หรือแม้กระทั่งตัว VR เลย เพราะแม้การจะดึงขีดความสามารถทั้งหมด แค่ GPUs ตัวเดียวหรือ สองตัวนำมาใช้แบบเต็มประสิทธิภาพนั้น ในงานแสดง GPU Technology Conference นั้นมีคำตอบให้เห็นว่าหากจะนำมาเพื่อเล่นเกมส์ น่าจะเกินความจำเป็นเกินไป แต่หากนำมาใช้ทางด้านการคำนวณนั้น นี้แหล่ะคือคำตอบ

an

มาเริ่มกันด้วย desktop workstation จาก Velocity Micro ที่นำเอา  GTX 980 Ti (อยู่ในระดับตลาดผู้บริโภค) ถึง 8 ตัวมาอยู่รวมกัน ซึ่งแตกต่างจากบู๊ธอื่นๆที่จะใช้ GTX Titan X เสียมากกว่า ส่วนตัว Quadro และ Tesla จะเน้นไปทาง professional servers และ workstations เท่านั้น การ์ดจอทุกตัวที่มาจากVelocity Micro ใช้ของ  EVGA, ส่วนประมวลผลใช้แบบคู่ของ dual Xeon processors (ซึ่งเป็นรุ่นที่เก่ากว่าตัว E5-2660 v3). สิ่งที่เป็นที่น่าสนใจก็คือตัวการ์ดทั้งหมดติดตั้งแบบเปิดโล่งแทนที่จะต้องมีตัวเป่าลมเพื่อช่วยในการระบายความร้อน

และยังมีอีกหลายบู๊ธที่ใช้การ์ดระดับตลาดบริโภคตัว GM200 cards ในระบบ workstations, ประสิทธิภาพที่ได้ก็ไม่ได้สูงไปกว่าตัว FP64 Quadro card ที่เป็น Maxwell. สิ่งที่น่าสนใจก็คืออายุในด้านตลาดของตัวมันเองจะสั้น และในอีกไม่นานตัว GTX Titan X cards อาจจะหยุดการผลิต ด้วยตัวใหม่ที่จะมาแทนอย่างเช่น Pascal ที่จะมาแทน ส่วนทางด้าน Quadro และ Tesla ที่อยู่ในระดับมืออาชีพนั้นอาจจะถูกลากออกไปยาวหน่อย เพราะยังไงก็ต้องเปรียบเทียบระหว่างความต้องการของสินค้าเป็นหลัก และหากเล่นในระดับบน แน่นอนตัวราคาก็ย่อมที่จะต้องให้คุ้มกับปริมาณที่ถูกจำหน่ายออกไป หรือความต้องการน้อย ราคาก็สูง ความต้องการเป็นจำนวนมาก ราคาก็ย่อมมาหน่อยเพื่อให้คุ้มกับต้นทุน ส่วนความเร็วทางด้าน  clocke ก็น้อยลงหากเทียบกับตัวตลาดผู้บริโภค

an2

จากรูปด้านบน ตัวเครื่องระบบนี้เรียกกันว่า 3U chassis หรือ GPUltima มาจากบริษัท One Stop Systems. การ์ด 4 ตัว 8 ตัว สำหรับการทำงานแบบ server น้อยไป แต่นี้รวมกันได้ถึง 16 GPUs อันนี้แหละมีอึ้ง มันไม่ใช่การ์ดจอรุ่นเก่าๆมารวมกันแต่เป็นTesla K80s, ซึ่งหากแปลตรงตัว แต่ละการ์ดจอมี GK210 GPUs ร่วมอยู่ด้วยถึง 2 ตัว ก็เท่ากับ 32 GPUs ที่อยู่ในเครื่องเดียวกัน

แต่ว่าไม่ได้มีตัว processors;มาร่วมอยู่ด้วย เพราะว่ามันมีหน้าที่หลักที่เป็น InfiniBand connectors สำหรับ networking. ตัว GPUltima ถูกออกแบบมาเพื่อใช้กับตัว server หลายๆตัว , ซึ่งโดยปรกติแล้วการออกแบบของ One Stop Systems จับเป้นคู่ เพื่อรองรับ dual-socket 2U server. ก็หมายความว่าในจำนวน GPU ทั้งหมดนี้ มันไปอยู่ที่ 5U (32 GPUs per 5U), และใน  42U rack/เป็นชั้นๆ—และถ้า 2U จะเป็นเท่าไหร่ของจำนวน การ์ดที่จะต้องใช้ ก็หมายความว่าทั้งหมดนี้จะสามารถนำไปใช้หรือประกอบขึ้นเป็น 8 เครื่องหรือ  256 GPUs per rack, ซึ่งไม่ต้องพูดเลยว่าจะมากขนาดไหน แต่นี้ก็ยังไม่สุด ยังมีอีกบริษัท SuperMicro ที่สร้างแค่ 1U servers แต่สามารถนำเอา  tTesla K80 cards 4 ตัวใส่เข้าไป ก็เป็น 40 ตัว สำหรับ 1U servers (หาก 2U สำหรับ networking again) ก็จะเป็น 320 GPUs ต่อ single rack

an3

มาดู Tesla K80 GPUs ที่จำนวน 128 ตัว ที่แตละตัวมีขีดความสามารถที่ 8.74 FP32 TFLOPS ต่อตัว  บวกรวมกันก็จะเป็น 1,120 TFLOPS per rack. หรือหากใช้ FP64, ความเร็วก็จะตกลงมาอยู่ที่ 373 TFLOPS. ปํญหาไม่ใช่จะไม่มี ด้านพลังงานกับการระบายความร้อนหล่ะ คำตอบที่ได้ก็คือต้องมีอย่างน้อย 5000W และหากอยู่ช่วงที่ทำงานเต็มที่ก็จะเพิ่มขึ้นอีก แต่ละ 3U rack จะประกอบมาด้วย 3000W 240V PSUs ซึ่งก็หมายความว่าแต่ละ data center จะต้องมี 50kW per rack, จาก 76kW ของแต่ละชั้น/rack เผื่อเอาไว้

ส่วนทาง Nvidia’s ตัว DGX-1 server รุ่นใหม่ที่กำลังจะเปิดตัวจะประกอบไปด้วย Telsa P100 Pascal GPUs ถึง 8 ตัวขีดความสามารถก็ 170 TFLOPS ใน 3U chassis, และทั้งหมดที่กล่าวมามี 12 ชุดใน หนึ่ง rack, ก็จะเป็ฯ 2035 TFLOPS per rack. (เป็น FP16 TFLOPS) หากว่าเป็น FP32 precision ความเร็วก็จะเป็น 1017 TFLOPS, หรือ 509 TFLOPS ทีใช้ FP64. หากใช้ K80, GPUltima ก็จะเร็วขึ้นมาหน่อยที่ใช้ FP32 per rack, แต่จะช่ากว่าตัว FP64. ประเด็นสำคัญก็คือ ตัว Tesla P100, การใช้พลังงานช่วงหนักสุดควรจะต้องน้อยกว่าตัว K80, หมายความว่าหากมีการติดตั้งแบบจัดเต็มต่อ rack ที่มี DGX-1 servers 12 ตัว ก็จะใช้พลังงานเพียง  30-40kW.

คำถามที่น่าสนใจก็คือ จะเอาไปใช้กับอะไร อันนี้จะนำไปใช้กับ artificial intelligence/AI/ระบบเรียนรู้ด้วยตนเอง, weather systems/พยากรณ์อากาศ, และการคำนวณแบบ supercomputing

an4

ลองมาคำนวณดูว่า เราจะต้องใช้ ขีดความสามารถของคอมพิวเตอร์ทั้งหมดเท่าไหร่ หากต้องการจำลองมนุษยืขุึ้นมา 1 คน คำตอบก็คือ 10^16FLOPS (Kurzweil) หรือ 10^18 FLOPS. เทียบใหม่ 1 exa-FLOPS (EFLOPS). หากเป็น 2 PFLOPS per rack, DGX-1 ก็จะเป็น  1 EFLOPS ทีเป็น 512 racks. และก็ยังต้องการตัวซอร์ฟแวร์ที่จะให้ทำงานได้อย่างมีประสิทธิภาพ และพลังงานที่จะต้องใช้ก็เป็น  15-20MW เปรียบเทียบกับสมองมนุษย์ที่ต้องการพลังงานเพียง 20W

หากจะมามองดูว่าตอนนี้ความก้าวหน้าของมนุษย์ต่อคอมพิวเตอร์นั้นไปได้ไกลขนาดไหนก็จะเปรียบเทียบแบบง่ายก็คือ ขีดความสามารถของคอมพิวเตอร์หรือ super computers จะไม่สามารถทำงานหรือเป็น OS สำหรับเกมส์ Crysis ได้, แต่มันมีความสามารถที่จะตัดสินใจและเล่นเกมส์ Crysis ด้วยตัวมันเอง อันนี้บอกเลยว่า หากหุ่นยนต์เป็นเรื่องไกลตัวสำหรับคุณ คิดใหม่ได้

ที่มาเครดิด maximumpc

Related articles

realme เสริมทัพ Portrait Master! เตรียมนำเข้ารุ่นเล็กสเปกคุ้ม ทั้ง “realme 12 5G” และ “realme 12X 5G” กับ Lossless 3X Zoom รุ่นแรกในระดับราคาเดียวกันพร้อมรองรับ 5G ในราคาหลักพัน

กรุงเทพฯ 18 เมษายน 2567 – หลังสร้างปรากฏการณ์The New Portrait Masterที่มาพร้อมแคมเปญกิจกรรมการถ่ายภาพสุดปังแห่งปี Make It Real!สร้างความตื่นตาตื่นใจให้กับวงการสมาร์ตโฟนเมืองไทยไปตามคาด...

AIS เผยข้อมูลการใช้งาน สงกรานต์ 67 คึกคัก เย็นฉ่ำทั่วไทย ถนนข้าวหลามครองแชมป์คนใช้งานเน็ตสูงสุด นักท่องเที่ยวต่างชาติปักหมุดเล่นน้ำยอดโตพุ่ง 38%

AIS เปิดพฤติกรรมการใช้งานช่วงเทศกาลสงกรานต์ ปี 2567 ของลูกค้าและคนไทย โดยได้จัดเต็มโครงข่าย ทั้งมือถือและเน็ตบ้านสาดสัญญาณฉ่ำตลอดเทศกาล ครอบคลุมโมเมนต์ความสุขทุกไลฟ์สไตล์การใช้ชีวิต โดยปีนี้พฤติกรรมการใช้งานของคนไทยในช่วงเทศกาลสงกรานต์พบว่ามีการกระจายตัวของการใช้งานในพื้นที่สำคัญทั่วประเทศ...

OPPO เปิดตัวนวัตกรรม AI ที่งาน Google Cloud Next ’24 นำเสนอโมเดล Gemini ของ Google บนโทรศัพท์ AI

l OPPO และ OnePlus ร่วมมือกันเพื่อนำประสบการณ์โทรศัพท์ AI ใหม่มาสู่ผู้ใช้มากกว่า 10 ล้านคน l...

โปรแกรมสมนาคุณ Genius ช่วยประหยัดงบได้! Booking.com แชร์เคล็ดลับที่จะช่วยให้คุณได้รับข้อเสนอสุดพิเศษ ยกระดับการเดินทางให้น่าประทับใจยิ่งขึ้น

จากแบบสำรวจความคิดเห็นของผู้เดินทางเพื่อคาดการณ์เทรนด์การเดินทางท่องเที่ยวในปี 2567 ของ Booking.com พบว่าเทรนด์ ‘ขอให้ได้ลุ้น’ หรือ ‘Surrender Seekers’ เป็นที่นิยมเพิ่มมากขึ้นในหมู่ผู้เดินทางชาวไทยที่ต้องการปล่อยใจไปกับความเซอร์ไพรส์...

เราใช้คุกกี้เพื่อพัฒนาประสิทธิภาพ และประสบการณ์ที่ดีในการใช้เว็บไซต์ของคุณ คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

ตั้งค่าความเป็นส่วนตัว

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

ยอมรับทั้งหมด
จัดการความเป็นส่วนตัว
  • เปิดใช้งานตลอด

บันทึกการตั้งค่า