การตั้งค่า Motion Capture ของ Swing Catalyst
บทนำ
บทความนี้อธิบายวิธีการเตรียมตัวและกำหนดค่าฟังก์ชัน Motion Capture ภายใน Swing Catalyst ฟีเจอร์นี้อาจไม่พร้อมใช้งานสำหรับใบอนุญาตทุกประเภท โปรดดูคำถามที่พบบ่อยเกี่ยวกับ Motion Captureสำหรับข้อมูลเพิ่มเติม
ข้อกำหนด
- ต้องติดตั้งคอมโพเนนต์ลงในไดเรกทอรีคอมโพเนนต์
คอมพิวเตอร์ของคุณต้องตรงตามคำแนะนำข้อกำหนด PC ของเรา โดยเฉพาะอย่างยิ่งการ์ดจอต้องตรงตามคำแนะนำของเรา
การกำหนดค่า
การตั้งค่า Motion Capture สามารถพบได้จากเมนูการตั้งค่าหลักในส่วน “Video & Capture” จากที่นี่คุณสามารถเลือกหรือเปลี่ยน execution provider และขนาด batch ได้
เราแนะนำขนาด batch ระหว่าง 12 ถึง 24 ขึ้นอยู่กับจำนวนกล้องที่ใช้งานอยู่ / เปิดใช้งาน
Execution Provider ที่แนะนำ
NVIDIA
GPU รุ่น NVIDIA RTX 3060 หรือใหม่กว่า -> TensorRT
หาก TensorRT ใช้งานไม่ได้ ให้ลอง CUDA
การ์ดจออื่น ๆ
- DirectML
ค่าเริ่มต้นคือ DirectML เนื่องจากเป็น provider ที่รองรับการใช้งานได้กว้างที่สุด แต่น่าเสียดายที่มันช้าที่สุดด้วย
จากการทดสอบประสิทธิภาพ เราพบว่า TensorRT มีประสิทธิภาพสูงที่สุดในบรรดา execution provider ทั้งหมด
TensorRT เร็วกว่า DirectML โดยเฉลี่ย 35-45% และเร็วกว่า CUDA โดยเฉลี่ย 20-25%
CUDA มีประสิทธิภาพดีกว่า DirectML ในระดับปานกลาง (เฉลี่ย 10-12%)
CUDA ใช้หน่วยความจำ GPU (VRAM) มากกว่า TensorRT อย่างมีนัยสำคัญ โปรดลองลดขนาด batch หากคุณใช้ CUDA
การดาวน์โหลดคอมโพเนนต์
หากคุณเลือกคอมโพเนนต์ที่ยังไม่ได้ติดตั้ง ระบบจะแจ้งให้ดาวน์โหลด
หากต้องการใช้ TensorRT หรือ CUDA คุณต้องดาวน์โหลดคอมโพเนนต์ก่อน
note: ฟีเจอร์นี้พร้อมใช้งานในเวอร์ชัน 25.2 เท่านั้น
ขนาด Batch ที่แนะนำ
จากการทดสอบของเรา ขนาด batch ที่ใหญ่กว่าจะให้ประสิทธิภาพที่ดีกว่า เราแนะนำขนาด batch ระหว่าง 16 ถึง 24 สำหรับการเตรียมตัวด้วยกล้อง 2-3 ตัวทั่วไป หากคุณใช้ซอฟต์แวร์อื่นพร้อมกันที่ต้องการทรัพยากรกราฟิก การลองใช้ขนาด batch ที่เล็กลงอาจเป็นประโยชน์ ท้ายที่สุดแล้ว ขนาด batch ที่ดีที่สุดอาจขึ้นอยู่กับขั้นตอนการทำงานของคุณและโปรแกรมประเภทใดที่คุณรันควบคู่ไปกับ Swing Catalyst
การตั้งค่าขั้นสูง
ด้านล่างการตั้งค่า execution provider คือการตั้งค่าขั้นสูง ซึ่งคุณสามารถเปลี่ยนโมเดลการตรวจจับหรือเปิดใช้งาน “FP16” ได้
การเปลี่ยนโมเดลการตรวจจับจาก Medium เป็น Nano สามารถลดปริมาณหน่วยความจำที่การ์ดจอของคุณใช้และปรับปรุงประสิทธิภาพได้ แต่แลกมาด้วยความแม่นยำที่ลดลง
หากคุณมีปัญหาในการตรวจจับที่ดี ให้ลองเปลี่ยนโมเดลเป็น Medium แล้วรีสตาร์ท Swing Catalyst และลองอีกครั้ง
โมเดลการตรวจจับเริ่มต้นคือ Nano
“FP16 for TensorRT” จะไม่ถูกเลือกไว้โดยค่าเริ่มต้น
FP16
การใช้ FP16 สามารถลดการใช้หน่วยความจำและปรับปรุงประสิทธิภาพได้ (แต่แลกมาด้วยความแม่นยำที่ลดลง)
จากการทดสอบ เราพบว่า FP16 สามารถปรับปรุงประสิทธิภาพได้ 20-35%
นอกจากนี้ยังอาจให้ผลลัพธ์ที่ไม่สม่ำเสมอระหว่างการบันทึกมากกว่าค่าเริ่มต้น FP32 อาจคุ้มค่าที่จะลองหากคุณมีปัญหาด้านประสิทธิภาพหรือหน่วยความจำไม่เพียงพอ
การเปรียบเทียบประสิทธิภาพ
TensorRT (สีม่วง), CUDA (สีชมพู), และ DirectML (สีเขียว), จากซ้ายไปขวา แกน Y (FPS) คือจำนวนเฟรมต่อวินาทีที่โมเดล Motion Capture สามารถประมวลผลได้ และไม่ได้เกี่ยวข้องโดยตรงกับอัตราเฟรมของกล้องคุณ
เมตริกประสิทธิภาพ (FPS) คือจำนวนเฟรมต่อวินาทีที่ถูกประมวลผล ยิ่งตัวเลขสูงยิ่งประมวลผลได้เร็วขึ้น ดังที่เห็นในภาพประกอบด้านบน ทั้ง CUDA และ TensorRT มีความสัมพันธ์แบบเกือบเส้นตรง เช่น เมื่อเพิ่มจากกล้องหนึ่งตัวเป็นสองตัว ประสิทธิภาพจะลดลงเกือบครึ่งหนึ่ง ผลกระทบด้านประสิทธิภาพนี้จะสังเกตเห็นได้น้อยลงกับการ์ดจอ NVIDIA รุ่นใหม่กว่า
อัปเดตล่าสุด: 2025-05-16 | ดูบนเว็บไซต์ฝ่ายสนับสนุนทางการ




