Swing Catalyst 动作捕捉设置

简介

本文介绍如何在 Swing Catalyst 中设置和配置动作捕捉功能。此功能可能并非适用于所有许可证类型,请查阅我们的动作捕捉常见问题解答了解更多信息。

系统要求

  • 组件需要安装到组件目录中。

您的计算机需要满足我们的 PC 规格建议,其中最重要的是显卡符合我们的推荐要求。

配置

动作捕捉设置可在主设置菜单的"视频与捕捉"部分找到。在此处,您可以选择或更改执行提供程序及批处理大小。

我们建议根据您启用的摄像机数量,将批处理大小设置在 12 到 24 之间。

MotionCatalyst_YXRW7bXdCW.png MotionCatalyst_YXRW7bXdCW.png

推荐的执行提供程序

NVIDIA

  • NVIDIA RTX 3060 或更新的 GPU -> TensorRT

  • 如果 TensorRT 无法正常使用,请尝试 CUDA

其他显卡

  • DirectML

默认选项为 DirectML,因为它兼容性最广。但遗憾的是,它也是速度最慢的。

在基准测试中,我们发现 TensorRT 是所有执行提供程序中性能最强的。

  • TensorRT 平均速度比 DirectML 快 35-45%,比 CUDA 快 20-25%

  • CUDA 相比 DirectML 有适度提升(平均提升 10-12%)

  • CUDA 使用的 GPU 显存(VRAM)明显多于 TensorRT,如果使用 CUDA,请尝试降低批处理大小

组件下载

如果您选择了尚未安装的组件,系统将提示您进行下载。

要使用 TensorRT 或 CUDA,您需要先下载相应组件。

eZkrGi1hnK.png eZkrGi1hnK.png

note: 此功能仅在 25.2 版本中可用。

推荐批处理大小

根据我们的测试,较大的批处理大小可带来更好的性能表现。对于典型的 2-3 个摄像机配置,我们建议将批处理大小设置在 16 到 24 之间。如果您同时运行其他需要图形资源的软件,尝试较小的批处理大小可能会有所帮助。最终,最佳批处理大小可能取决于您的工作流程以及在运行 Swing Catalyst 的同时还运行了哪些程序。

高级设置

在执行提供程序设置下方是高级设置,您可以在此更改检测模型或启用"FP16"。

将检测模型从 Medium 切换为 Nano 可以减少显卡的内存占用并提升性能,但代价是精度降低。

如果您难以获得理想的检测效果,请尝试将模型更改为 Medium,重启 SwingCatalyst 后再试。

  • 默认检测模型为 Nano

  • “TensorRT 的 FP16"默认为未勾选状态

FP16

使用 FP16 可以减少内存占用并提升性能(但会降低精度)。

在测试中,我们发现 FP16 可将性能提升 20-35%。

与默认的 FP32 相比,它在不同录制之间可能产生更不一致的结果。如果您遇到性能问题或内存不足的情况,不妨尝试此选项。

MotionCatalyst_1HvvrDLr0m.png MotionCatalyst_1HvvrDLr0m.png

性能对比

Screen Shot 2024-12-17 at 16.25.42.png Screen Shot 2024-12-17 at 16.25.42.png

从左到右依次为 TensorRT(紫色)、CUDA(粉色)和 DirectML(绿色)。Y 轴(FPS)表示动作捕捉模型每秒能够处理的帧数,与您摄像机的帧率没有直接关系。

firefox_NQ3XNoVqhI.png firefox_NQ3XNoVqhI.png

性能指标(FPS)表示每秒处理的帧数,数值越高处理速度越快。如上图所示,CUDA 和 TensorRT 的性能表现几乎呈线性关系。例如,从一个摄像机增加到两个摄像机时,性能几乎下降一半。这种性能损耗在较新的 NVIDIA 显卡上不那么明显。


最后更新:2025-05-16 | 在官方支持网站上查看