Swing Catalyst 动作捕捉设置

简介

本文介绍如何在 Swing Catalyst 中设置和配置动作捕捉功能。此功能可能并非适用于所有许可证类型，请查阅我们的动作捕捉常见问题解答了解更多信息。

系统要求

组件需要安装到组件目录中。

您的计算机需要满足我们的 PC 规格建议，其中最重要的是显卡符合我们的推荐要求。

配置

动作捕捉设置可在主设置菜单的"视频与捕捉"部分找到。在此处，您可以选择或更改执行提供程序及批处理大小。

我们建议根据您启用的摄像机数量，将批处理大小设置在 12 到 24 之间。

推荐的执行提供程序

NVIDIA

NVIDIA RTX 3060 或更新的 GPU -> TensorRT
如果 TensorRT 无法正常使用，请尝试 CUDA

其他显卡

DirectML

默认选项为 DirectML，因为它兼容性最广。但遗憾的是，它也是速度最慢的。

在基准测试中，我们发现 TensorRT 是所有执行提供程序中性能最强的。

TensorRT 平均速度比 DirectML 快 35-45%，比 CUDA 快 20-25%
CUDA 相比 DirectML 有适度提升（平均提升 10-12%）
CUDA 使用的 GPU 显存（VRAM）明显多于 TensorRT，如果使用 CUDA，请尝试降低批处理大小

组件下载

如果您选择了尚未安装的组件，系统将提示您进行下载。

要使用 TensorRT 或 CUDA，您需要先下载相应组件。

note: 此功能仅在 25.2 版本中可用。

推荐批处理大小

根据我们的测试，较大的批处理大小可带来更好的性能表现。对于典型的 2-3 个摄像机配置，我们建议将批处理大小设置在 16 到 24 之间。如果您同时运行其他需要图形资源的软件，尝试较小的批处理大小可能会有所帮助。最终，最佳批处理大小可能取决于您的工作流程以及在运行 Swing Catalyst 的同时还运行了哪些程序。

高级设置

在执行提供程序设置下方是高级设置，您可以在此更改检测模型或启用"FP16"。

将检测模型从 Medium 切换为 Nano 可以减少显卡的内存占用并提升性能，但代价是精度降低。

如果您难以获得理想的检测效果，请尝试将模型更改为 Medium，重启 SwingCatalyst 后再试。

默认检测模型为 Nano
“TensorRT 的 FP16"默认为未勾选状态

FP16

使用 FP16 可以减少内存占用并提升性能（但会降低精度）。

在测试中，我们发现 FP16 可将性能提升 20-35%。

与默认的 FP32 相比，它在不同录制之间可能产生更不一致的结果。如果您遇到性能问题或内存不足的情况，不妨尝试此选项。

性能对比

从左到右依次为 TensorRT（紫色）、CUDA（粉色）和 DirectML（绿色）。Y 轴（FPS）表示动作捕捉模型每秒能够处理的帧数，与您摄像机的帧率没有直接关系。

性能指标（FPS）表示每秒处理的帧数，数值越高处理速度越快。如上图所示，CUDA 和 TensorRT 的性能表现几乎呈线性关系。例如，从一个摄像机增加到两个摄像机时，性能几乎下降一半。这种性能损耗在较新的 NVIDIA 显卡上不那么明显。

最后更新：2025-05-16 | 在官方支持网站上查看