Swing Catalyst 动作捕捉设置
简介
本文介绍如何在 Swing Catalyst 中设置和配置动作捕捉功能。此功能可能并非适用于所有许可证类型,请查阅我们的动作捕捉常见问题解答了解更多信息。
系统要求
- 组件需要安装到组件目录中。
您的计算机需要满足我们的 PC 规格建议,其中最重要的是显卡符合我们的推荐要求。
配置
动作捕捉设置可在主设置菜单的"视频与捕捉"部分找到。在此处,您可以选择或更改执行提供程序及批处理大小。
我们建议根据您启用的摄像机数量,将批处理大小设置在 12 到 24 之间。
推荐的执行提供程序
NVIDIA
NVIDIA RTX 3060 或更新的 GPU -> TensorRT
如果 TensorRT 无法正常使用,请尝试 CUDA
其他显卡
- DirectML
默认选项为 DirectML,因为它兼容性最广。但遗憾的是,它也是速度最慢的。
在基准测试中,我们发现 TensorRT 是所有执行提供程序中性能最强的。
TensorRT 平均速度比 DirectML 快 35-45%,比 CUDA 快 20-25%
CUDA 相比 DirectML 有适度提升(平均提升 10-12%)
CUDA 使用的 GPU 显存(VRAM)明显多于 TensorRT,如果使用 CUDA,请尝试降低批处理大小
组件下载
如果您选择了尚未安装的组件,系统将提示您进行下载。
要使用 TensorRT 或 CUDA,您需要先下载相应组件。
note: 此功能仅在 25.2 版本中可用。
推荐批处理大小
根据我们的测试,较大的批处理大小可带来更好的性能表现。对于典型的 2-3 个摄像机配置,我们建议将批处理大小设置在 16 到 24 之间。如果您同时运行其他需要图形资源的软件,尝试较小的批处理大小可能会有所帮助。最终,最佳批处理大小可能取决于您的工作流程以及在运行 Swing Catalyst 的同时还运行了哪些程序。
高级设置
在执行提供程序设置下方是高级设置,您可以在此更改检测模型或启用"FP16"。
将检测模型从 Medium 切换为 Nano 可以减少显卡的内存占用并提升性能,但代价是精度降低。
如果您难以获得理想的检测效果,请尝试将模型更改为 Medium,重启 SwingCatalyst 后再试。
默认检测模型为 Nano
“TensorRT 的 FP16"默认为未勾选状态
FP16
使用 FP16 可以减少内存占用并提升性能(但会降低精度)。
在测试中,我们发现 FP16 可将性能提升 20-35%。
与默认的 FP32 相比,它在不同录制之间可能产生更不一致的结果。如果您遇到性能问题或内存不足的情况,不妨尝试此选项。
性能对比
从左到右依次为 TensorRT(紫色)、CUDA(粉色)和 DirectML(绿色)。Y 轴(FPS)表示动作捕捉模型每秒能够处理的帧数,与您摄像机的帧率没有直接关系。
性能指标(FPS)表示每秒处理的帧数,数值越高处理速度越快。如上图所示,CUDA 和 TensorRT 的性能表现几乎呈线性关系。例如,从一个摄像机增加到两个摄像机时,性能几乎下降一半。这种性能损耗在较新的 NVIDIA 显卡上不那么明显。
最后更新:2025-05-16 | 在官方支持网站上查看




