Nâng Cao Chụp Chuyển Động Không Đánh Dấu Cú Gôn Golf và Baseball Sử Dụng RTMPose và RTMDet: Phương Pháp Từ Trên Xuống
Nâng Cao Chụp Chuyển Động Không Đánh Dấu Cú Gôn Golf và Baseball Sử Dụng RTMPose và RTMDet: Phương Pháp Từ Trên Xuống
Tóm Tắt
Bài viết này trình bày ứng dụng của RTMPose và RTMDet để ước lượng tư thế chính xác và hiệu quả cho cú gôn golf và baseball. Tận dụng các kỹ thuật tiên tiến được tối ưu hóa cho hiệu suất thời gian thực, các mô hình này cho phép theo dõi chi tiết chuyển động của cơ thể trong quá trình cú gôn golf và baseball—một tính năng quan trọng để cải thiện hiệu suất trong phân tích thể thao. Chúng tôi nhấn mạnh những lợi thế của phương pháp từ trên xuống, trong đó bộ phát hiện RTMDet sẵn có xác định golfer và cầu thủ baseball trong mỗi khung hình, và RTMPose ước lượng vị trí của các khớp chính của cơ thể.
1. Giới Thiệu
Ước lượng tư thế đã trở thành then chốt trong phân tích hiệu suất thể thao, cho phép theo dõi chính xác chuyển động của vận động viên. Trong golf và baseball, việc ghi lại dữ liệu sinh biomechanics của cú gôn của cầu thủ cung cấp những hiểu biết quý giá về động lực học của cú gôn, giúp các chuyên gia và những người chơi sở thích cải thiện kỹ thuật của họ. Các phương pháp ước lượng tư thế 2D truyền thống thường gặp phải thách thức về độ trễ và độ chính xác, đặc biệt trong các tình huống thời gian thực. Bài viết này đề xuất một giải pháp sử dụng RTMPose và RTMDet trong mmpose Framework để ước lượng tư thế chi tiết trong quá trình cú gôn golf và baseball.
2. Nền Tảng
Tính phức tạp của cú gôn golf và baseball đòi hỏi phải đo lường chính xác chuyển động của cơ thể. Các phương pháp ước lượng tư thế hiện tại có thể không cung cấp độ chính xác cần thiết cho hiệu suất thời gian thực. Những tiến bộ trong học sâu và thị giác máy tính đã giới thiệu các mô hình như RTMPose và RTMDet, giúp cải thiện độ chính xác và hiệu quả.
3. Phương Pháp Từ Trên Xuống Với RTMDet Và RTMPose
–insert figure–
3. RTMPose: Mô Hình Ước Lượng Tư Thế Hiệu Suất Cao
RTMPose [1] được thiết kế cho ước lượng tư thế thời gian thực hiệu suất cao, được tối ưu hóa để chạy hiệu quả trên phần cứng hạn chế.
Các Tính Năng Chính:
Kiến Trúc Mô Hình và Hiệu Quả: RTMpose sử dụng CSPNeXt làm backbone [1, 2], cân bằng giữa tốc độ và độ chính xác. CSPNeXt được tối ưu hóa cho các tác vụ dự đoán dày đặc như ước lượng tư thế và phát hiện đối tượng, cung cấp độ phân giải cao và độ chính xác trong khi duy trì hiệu quả tính toán.
Dự Đoán Điểm Chính: Sử dụng thuật toán dựa trên SimCC [1, 3], coi vị trí ngang và phương thẳng đứng của các điểm chính là các tác vụ phân loại riêng biệt. Biểu diễn nhỏ gọn này giảm tải tính toán và phù hợp với triển khai trên các thiết bị khác nhau.
4. RTMDet: Backbone Phát Hiện
RTMDet [4] hoạt động như bộ phát hiện trước RTMPose trong đường ống từ trên xuống, xác định vị trí của golfer hoặc cầu thủ baseball trong mỗi khung hình.
Các Tính Năng Chính:
Kiến Trúc Mô Hình và Hiệu Quả: RTMDet sử dụng phiên bản được sửa đổi của CSPDarkNet [5] có tính huấn luyện cao và chính xác hơn nhiều mô hình YOLO. Phiên bản được sửa đổi tận dụng các tích chập depth-wise với kernel lớn để cân bằng độ phức tạp và tốc độ, và hiệu quả trên cả GPU và CPU. Nó lý tưởng cho các ứng dụng thời gian thực như theo dõi hiệu suất thể thao.
Tính Linh Hoạt: Xử lý nhiều tác vụ phát hiện đối tượng khác nhau, bao gồm phân đoạn thực thể và phát hiện đối tượng xoay. Đảm bảo định vị chính xác của cầu thủ, ngay cả trong các cảnh động.
5. Những Lợi Thế Của Việc Sử Dụng RTMDet Và RTMPose Trong Phân Tích Cú Gôn Golf và Baseball
5.1 Độ Chính Xác Cao Hơn Trong Các Cảnh Không Đông Đúc
Trong các cài đặt golf/baseball điển hình với ít cá nhân trong khung hình, RTMDet cách ly golfer/cầu thủ baseball, cho phép RTMPose xử lý từng người được phát hiện với độ chính xác cao. Điều này tránh được tính phức tạp của các phương pháp từ dưới lên xử lý tất cả các điểm chính cho tất cả những người trong khung hình cùng một lúc. Phương pháp từ trên xuống cũng có thể bao gồm thuật toán xử lý hậu kỳ của RTMdet nhằm xác định người đúng (tức là golfer hoặc cầu thủ baseball) trước khi thực hiện ước lượng tư thế. Ngoài ra, RTMPose đã được huấn luyện trước trên tài liệu hình ảnh mở rộng chứa
5.2 Tính Toán Hiệu Quả và Hiệu Suất Thời Gian Thực
Sử dụng các mô hình nhẹ như RTMdet và RTMpose, duy trì độ trễ thấp, cho phép phân tích cú gôn thời gian thực trên phần cứng cấp tiêu dùng. Điều này đặc biệt hữu ích để cung cấp phản hồi trực tiếp trong quá trình coaching hoặc các phiên tập luyện. Hệ thống chụp chuyển động không đánh dấu SwingCatalyst là một trong số ít hệ thống studio cung cấp phản hồi chụp chuyển động trực tiếp cho golfers và cầu thủ baseball.
5.3 Phân Tích Điểm Chính Chi Tiết
RTMPose phát hiện một bộ 26 điểm chính cơ thể [6] được hiển thị trong hình 1 dưới đây cần thiết để phân tích động học cú gôn golf và baseball. Halpe26 là một bộ mở rộng bao gồm các điểm đánh dấu bổ sung trên bàn chân và đầu so với bộ Coco tiêu chuẩn hơn với 17 điểm đánh dấu.
–Insert Figure–
6. Phương Pháp Luận Cho Chụp Chuyển Động Không Đánh Dấu Cú Gôn Golf và Baseball
6.1 Giai Đoạn Phát Hiện: RTMDet
Được áp dụng cho các khung hình video của golfer hoặc cầu thủ baseball, RTMDet tạo ra các hộp giới hạn quanh cầu thủ, được chuyển đến RTMPose. Điều này tập trung ước lượng tư thế vào các vùng hình ảnh liên quan, giảm tải tính toán.
–Insert Image–
6.2 Giai Đoạn Ước Lượng Tư Thế: RTMPose
RTMPose ước lượng vị trí điểm chính trong hộp giới hạn. Các khớp quan trọng để phân tích cú gôn golf và baseball bao gồm cổ tay, khuỷu tay, vai, hông và đầu gối. Các điểm chính này đánh giá các góc và vị trí cơ thể trong các giai đoạn của cú gôn: lật gậy, swing xuống và follow-through.
–Insert Image–
6.3 Các Chỉ Số Hiệu Suất
Hiệu suất chung của RTMPose được đo lường bằng các chỉ số như Average Precision (AP) trên các điểm chuẩn ước lượng tư thế như MS COCO. Dưới đây là hiệu suất của các mô hình được xếp hạng cao nhất trên điểm chuẩn Coco thường được sử dụng. Trên dataset MS COCO val, RTMPose-X là mô hình hoạt động tốt nhất có khả năng cung cấp phản hồi thời gian thực và đạt tới 75.8% AP với tốc độ khung hình vượt quá ?? FPS trên GPU cấp tiêu dùng, phù hợp cho phân tích thể thao tốc độ cao.
Xếp Hạng Mô Hình Độ Phân Giải Kích Thước/Tham Số (Triệu) AP Suy Luận Thời Gian Thực
1 Sapiens-2B 1024x768 2000 82.2 Không
2 Sapiens-1B 1024x768 1000 82.1 Không
3 Sapiens-0.6B 1024x768 600 81.2 Không
4 Sapiens-0.3B 1024x768 300 79.6 Không
5 VitPose-H 256x192 632 79.4 Không
6 RTMPose-X 384x288 49 78.8 Có
7 VitPose-L 256x192 307 78.6 Không
8 RTMPose-L 384x288 28 78.3 Có
9 HRFormer 256x192 43 77.2 Không
10 HRNet-UDP 384x288 64 77.2 Có
11 VitPose-B 256x192 86 77.0 Có
12 RTMPose-L 256x198 28 76.7 Có
13 RTMPose-M 384x288 14 76.6 Có
14 HRNet 384x288 64 76.3 Có
15 VitPose-S 256x192 43 75.8 Có
16 RTMPose-M 256x192 14 74.9 Có
17 SimpleBaseline 256x192 60 73.5 Có
18 FastPose 256x192 79 73.3 Có
7. Ứng Dụng trong Phân Tích Cú Gôn
Bằng cách áp dụng framework RTMPose-X và RTMDet-M:
Theo Dõi Chuyển Động Khớp Theo Từng Khung Hình: Cung cấp dữ liệu toàn diện để phân tích từng giai đoạn của cú gôn.
Cung Cấp Phản Hồi Theo Thời Gian Thực: Cho phép nhận được thông tin tức thì về tư thế và kỹ thuật swing trong các phiên tập luyện.
So Sánh với Cơ Học Lý Tưởng: Cho phép so sánh với cơ học swing lý tưởng để xác định các lĩnh vực cần cải thiện.
8. Kết Luận
Sự tích hợp của RTMPose-X và RTMDet-M cung cấp một giải pháp mạnh mẽ cho phân tích cú gôn theo thời gian thực. Với độ chính xác cao, độ trễ thấp và khả năng tương thích trên nhiều nền tảng phần cứng, phương pháp từ trên xuống này cung cấp những thông tin chi tiết về cơ học cú gôn. Nó có tiềm năng to lớn để hỗ trợ cả các golfer nghiệp dư và chuyên nghiệp trong việc nâng cao hiệu suất của họ.
9. Hướng Phát Triển Tương Lai
Những phát triển trong tương lai có thể bao gồm:
Tích Hợp Các Thuật Toán Học Máy: Để cung cấp phân tích dự báo và gợi ý các điều chỉnh nhằm cải thiện hiệu quả cú gôn.
Mở Rộng sang Các Tình Huống Đa Người: Nâng cao khả năng ứng dụng trong các môn thể thao tập thể hoặc môi trường tập luyện nhóm.
Phát Triển Giao Diện Thân Thiện với Người Dùng: Tạo các ứng dụng hoặc công cụ giúp công nghệ này dễ tiếp cận với huấn luyện viên và vận động viên mà không cần chuyên môn kỹ thuật.
Phụ Lục
Phương Pháp Chi Tiết: Phương Pháp Từ Trên Xuống cho Ước Lượng Tư Thế Cú Gôn Sử Dụng RTMPose-X và RTMDet-M
Tổng Quan
Phương pháp được mô tả ở đây nêu ra các bước chi tiết liên quan đến phương pháp từ trên xuống cho ước lượng tư thế theo thời gian thực của một cú gôn, tận dụng sức mạnh của RTMPose để định vị điểm chính và RTMDet để phát hiện đối tượng. Quá trình được chia thành nhiều giai đoạn: phát hiện, định vị điểm chính và xử lý hậu kỳ, mỗi giai đoạn đều góp phần vào việc ước lượng chính xác và hiệu quả các khớp cơ thể trong cú gôn để phân tích sinh học.
–Chèn hình ảnh–
1. Giai Đoạn Phát Hiện: Định Vị Theo Thời Gian Thực với RTMDet-M
Giai đoạn đầu tiên của phương pháp từ trên xuống liên quan đến việc phát hiện golfer trong mỗi khung hình của video. Trong các tình huống thể thao, đặc biệt là gôn, cảnh thường bao gồm một người chơi duy nhất, đơn giản hóa nhiệm vụ phát hiện so với các cảnh đông đúc.
1.1 Kiến Trúc Mô Hình
RTMDet-M được sử dụng làm bộ phát hiện đối tượng trong pipeline. Nó sử dụng một mạng nơ-ron tích chập (CNN) backbone, cụ thể là backbone CSPNeXt, được thiết kế để tối ưu hóa hiệu suất phát hiện đối tượng theo thời gian thực trong khi duy trì sự cân bằng giữa tốc độ và độ chính xác. Các khía cạnh chính của kiến trúc bao gồm:
Các phép tích chập theo chiều sâu kernel lớn: Chúng được sử dụng trong các lớp backbone và neck, tăng trường tiếp nhận trong khi duy trì chi phí tính toán thấp.
Mạng kim tự tháp đặc trưng (FPN): Một kỹ thuật trích xuất đặc trưng đa tỷ lệ cho phép phát hiện các đối tượng ở các tỷ lệ khác nhau, đảm bảo rằng golfer có thể được phát hiện bất kể khoảng cách của họ từ máy ảnh.
1.2 Gán Nhãn Động
RTMDet-M tận dụng chiến lược gán nhãn động cải thiện độ chính xác phát hiện bằng cách gán nhãn mềm cho các đối tượng dựa trên sự kết hợp của lỗi phân loại và định vị. Gán nhãn được điều chỉnh bởi thuật toán SimOTA, động lực chọn các mẫu dương dựa trên khả năng khớp của chúng với đối tượng giá trị thực. Phương pháp này đảm bảo phát hiện mạnh mẽ trong các điều kiện ánh sáng và môi trường khác nhau thường gặp phải trong các cảnh gôn ngoài trời.
1.3 Dự Đoán Hộp Giới Hạn
Bộ phát hiện xuất ra các Hộp Giới Hạn bao quanh Golfer trong mỗi Khung Hình. Những Hộp Giới Hạn này cung cấp các ràng buộc không gian trong đó mô hình ước lượng Tư Thế sẽ hoạt động, giảm tải tính toán cho giai đoạn ước lượng Tư Thế tiếp theo bằng cách chỉ tập trung vào các khu vực liên quan của Khung Hình. Trong bối cảnh này, RTMDet-M tạo ra các Hộp Giới Hạn theo thời gian thực với tốc độ trên 300 FPS trên phần cứng hiệu suất cao, đảm bảo rằng nó có thể theo kịp động lực nhanh chóng của một Cú Gôn.
1.4 Loại Bỏ Những Phát Hiện Không Cực Đại của Người (NMS)
Trong các bối cảnh đa người (mặc dù hiếm trong phân tích Cú Gôn), RTMDet-M kết hợp một thuật toán Loại Bỏ Những Phát Hiện Không Cực Đại (NMS) của Tư Thế loại bỏ các phát hiện Điểm Chính dư thừa, đảm bảo rằng chỉ những phát hiện có độ tin cậy cao nhất được giữ lại cho mọi người. Điều này rất quan trọng trong các trường hợp có thể phát hiện các Hộp Giới Hạn chồng lấp trong các cảnh đông người hoặc các chuỗi video.
1.5 Dataset Dữ Liệu Huấn Luyện và Hiệu Suất
RTMDet-M được huấn luyện trên một tác vụ phân loại nhị phân trên các đối tượng người trong Dataset Object356.
2. Giai đoạn Ước Lượng Tư Thế: Định Vị Điểm Chính RTMPose-X
Sau khi Hộp Giới Hạn của Golfer đã được thiết lập, giai đoạn tiếp theo liên quan đến việc ước lượng vị trí chính xác của các khớp cơ thể chính trong khu vực này. RTMPose-X, một mô hình ước lượng Tư Thế có hiệu suất cao, được sử dụng cho mục đích này.
2.1 Định Vị Điểm Chính Dựa Trên SimCC
RTMPose-X sử dụng thuật toán SimCC (Simple Coordinate Classification), xử lý định vị Điểm Chính như một bài toán phân loại. Trái ngược với các phương pháp dựa trên Bản Đồ Nhiệt truyền thống, SimCC chia các Tọa độ x và y của mỗi Điểm Chính thành các thùng và phân loại thùng chính xác nơi mỗi Điểm Chính nằm. Cách tiếp cận này giảm đáng kể độ phức tạp tính toán và cải thiện tốc độ suy luận trong khi duy trì độ chính xác cao cho các tác vụ ước lượng Tư Thế của con người.
2.2 Xương Sống CSPNeXt
Tương tự như RTMDet-M, RTMPose-X cũng sử dụng xương sống CSPNeXt, được điều chỉnh cho các tác vụ dự đoán dày đặc như ước lượng Tư Thế. Xương sống CSPNeXt có lợi trong kịch bản này vì những lý do sau:
Kiến trúc nhẹ: Kiến trúc mô hình được thiết kế để giảm thiểu số lượng tham số trong khi tối đa hóa thông lượng, làm cho nó lý tưởng cho các ứng dụng thời gian thực.
Trích xuất đặc trưng hiệu quả: Các lớp trích xuất đặc trưng của CSPNeXt được tối ưu hóa để xử lý hình ảnh độ phân giải cao, rất quan trọng để phát hiện các chi tiết nhỏ trong các bộ phận cơ thể chuyển động nhanh trong một Cú Gôn, chẳng hạn như cổ tay, Khuỷu tay và Đầu Gối.
2.3 Biểu Diễn Điểm Chính
RTMPose-X xuất ra các vị trí Điểm Chính cho tất cả các bộ phận cơ thể liên quan, bao gồm:
Các khớp nửa thân trên: Vai, Khuỷu tay, Cổ tay và Cổ
Các khớp phần thân dưới: Hông, Đầu Gối và Mắt cá chân
Các khớp bổ sung: Đầu, Cột sống và các Điểm Chính khác liên quan đến phân tích Cú Gôn
Độ phân giải 384x288 cho các hình ảnh đầu vào đảm bảo rằng ngay cả những chuyển động tinh tế trong các khớp cũng có thể được ghi lại chính xác, trong khi vẫn duy trì khả năng của hệ thống hoạt động theo thời gian thực.
2.4 Xử lý Trước RTMPose: Xử Lý Dữ Liệu Không Thiên Vị (UDP)
Trước khi hình ảnh được cắt nhỏ được đưa vào mô hình RTMpose, một bước Xử Lý Dữ Liệu Không Thiên Vị (UDP) được thực hiện. UDP giải quyết các thiên vị quan trọng trong xử lý dữ liệu của RTMpose trong quá trình huấn luyện và thử nghiệm, đặc biệt là trong các phép biến đổi Hệ tọa độ và định dạng Điểm Chính. Trong các quy trình ước lượng Tư Thế của con người thông thường, các hoạt động tiêu chuẩn như lật và thay đổi kích thước thường không căn chỉnh các đầu ra, đặc biệt là do các phép biến đổi dựa trên pixel, dẫn đến mất độ chính xác và không căn chỉnh các hình ảnh bị lật. UDP sửa chữa những điều này bằng cách thiết lập Biến đổi hệ tọa độ không thiên vị, bảo tồn Căn chỉnh ngữ nghĩa trên các không gian Tọa độ khác nhau trong các hoạt động thiết yếu (cắt nhỏ, thay đổi kích thước, xoay, lật). UDP cũng giới thiệu Biến đổi định dạng Điểm Chính không thiên vị bằng cách mã hóa Điểm Chính thành các Bản Đồ Nhiệt mà không giới thiệu thiên vị vị trí, được tinh chỉnh thêm thông qua một quy trình giải mã nhận biết phân bố Gaussian. Cách tiếp cận xử lý dữ liệu này cải thiện một cách có hệ thống hiệu suất mô hình, như được thể hiện trong các thử nghiệm rộng rãi trên các Dataset COCO và CrowdPose, nơi nó đạt được độ chính xác được cải thiện và giảm độ trễ suy luận trên các mô hình từ trên xuống và từ dưới lên [Ref].
3. Xử Lý Hậu Kỳ và Tinh Chỉnh Tư Thế
Sau khi các Điểm Chính được dự đoán, một số bước Xử Lý Hậu Kỳ được áp dụng để tinh chỉnh ước lượng Tư Thế và đảm bảo tính ổn định trên các Khung Hình.
3.1 Làm Mịn Tư Thế
Các Cú Gôn liên quan đến chuyển động nhanh chóng, có thể giới thiệu nhiễu hoặc biến động trong các vị trí Điểm Chính được ước lượng trên các Khung Hình. Để giảm thiểu điều này, một Bộ Lọc One-Euro được áp dụng để làm mịn các quỹ đạo Điểm Chính theo thời gian, đảm bảo rằng các biến động nhỏ, không phải vật lý trong các dự đoán Điểm Chính bị loại bỏ. Bộ Lọc One-Euro hoạt động bằng cách điều chỉnh động tính băng thông của Bộ Lọc dựa trên tốc độ chuyển động, lý tưởng cho các kịch bản như Cú Gôn, nơi chuyển động thay đổi đáng kể về tốc độ trên các giai đoạn khác nhau (Lật Gậy, Swing Xuống và Follow-Through).
3.2 Cơ Chế Bỏ Qua Khung Hình
Để tối ưu hóa thêm, một cơ chế bỏ qua Khung Hình được triển khai, trong đó phát hiện được thực hiện chỉ trên các Khung Hình chính, và ước lượng Tư Thế được nội suy cho các Khung Hình trung gian. Điều này làm giảm đáng kể tải tính toán mà không hy sinh độ chính xác trong các kịch bản với chuyển động hạn chế giữa các Khung Hình, chẳng hạn như phân tích chuyển động chậm của một Cú Gôn.
4. Theo Dõi Thời Gian và Tính Nhất Quán Chuỗi
Với các Cú Gôn vốn dĩ là tuần tự, duy trì tính nhất quán thời gian trong ước lượng Tư Thế là rất quan trọng. RTMPose-X giải quyết điều này thông qua các kỹ thuật theo dõi thời gian, đảm bảo rằng các dự đoán Điểm Chính nhất quán trên các Khung Hình liên tiếp. Điều này liên quan đến việc theo dõi các vị trí Điểm Chính theo thời gian và đảm bảo rằng các quỹ đạo của chúng tuân theo các mẫu chuyển động thực tế dựa trên các ràng buộc sinh học.
4.1 Phân Tích Vận Tốc và Gia Tốc Điểm Chính
Ngoài việc theo dõi các vị trí Điểm Chính, RTMPose-X cũng ước lượng Vận tốc và Gia tốc của mỗi Điểm Chính. Thông tin này rất quan trọng để phân tích động lực của một Cú Gôn, cung cấp cái nhìn sâu sắc về các Chỉ Số hiệu suất chính như:
Tốc độ swing: Được tính toán dựa trên Vận tốc cổ tay trong Swing Xuống.
Xoay Hông: Được phân tích thông qua Vận Tốc Góc của các khớp Hông.
Đường dẫn Gậy và tốc độ đầu: Được suy ra gián tiếp từ các quỹ đạo Cổ tay và Khuỷu tay.
Những Chỉ Số này có thể được so sánh với các tiêu chuẩn chuyên nghiệp để đưa ra phản hồi về Cơ Học Cú Gôn của một vận động viên.
5. Suy Luận và Hiệu Suất Thời Gian Thực
Toàn bộ quy trình từ trên xuống được tối ưu hóa cho hiệu suất thời gian thực, cho phép ước lượng Tư Thế với tốc độ trên 90 FPS trên các GPU hiện đại. Việc sử dụng các kiến trúc mô hình cực kỳ hiệu quả (CSPNeXt) và các kỹ thuật suy luận nhanh (SimCC) đảm bảo rằng hệ thống có thể xử lý đầu vào video với tốc độ Khung hình cao, làm cho nó phù hợp cho phản hồi thời gian thực trong các phiên huấn luyện.
6. Đánh Giá và Xác Thực
Các mô hình RTMPose-X và RTMDet-M được đánh giá trên các Dataset tiêu chuẩn như COCO và MPII, cho thấy hiệu suất mạnh mẽ với độ chính xác trung bình (AP) 75,8% trên Dataset COCO cho các Điểm Chính cơ thể. Những kết quả này được xác thực dựa trên các chú thích giá trị cơ bản trong các Dataset Cú Gôn, đảm bảo sự mạnh mẽ của mô hình trong việc ghi lại các chuyển động thể thao động.
6.1 Các Chỉ Số Hiệu Suất
Mean Squared Error (MSE): Được sử dụng để định lượng độ chính xác của các dự đoán Điểm Chính so với các chú thích giá trị tham chiếu.
Average Precision (AP): Đánh giá hiệu suất tổng thể của mô hình Ước Lượng Tư Thế.
Thời Gian Xử Lý Khung Hình: Được chuẩn hóa để đảm bảo hệ thống đáp ứng các yêu cầu thời gian thực (<10 ms trên mỗi Khung hình).
7. Kết Luận
Phương pháp từ trên xuống sử dụng RTMPose-X và RTMDet-M cung cấp một phương pháp hiệu quả và chính xác để Ước Lượng Tư Thế thời gian thực trong phân tích thể thao, đặc biệt là phân tích Cú Gôn Golf. Với phát hiện Điểm Chính mạnh mẽ, theo dõi thời gian và suy luận thời gian thực, phương pháp này cung cấp những hiểu biết sâu sắc về Cơ học về động lực học Cú Gôn Golf, hỗ trợ cải thiện hiệu suất và phòng chống chấn thương.
Tài Liệu Tham Khảo
[1] RTMpose https://arxiv.org/pdf/2303.07399
[2] CSPNeXt https://www.sciencedirect.com/science/article/pii/S0952197624000447
[3] SIMCC https://arxiv.org/abs/2107.03332
[4] RTMdet https://arxiv.org/pdf/2212.07784
[5] CSPDarkNet
[6] Halpe26
[] Dataset thách thức AI:
[] Dataset MS Coco:
[7] Dataset Crowdpose: https://arxiv.org/pdf/1812.00324
[] Dataset MPII:
[] Dataset sub-JHMBD:
[] Dataset Halpe:
[] Dataset PoseTrack18:
Cơ sở dữ liệu Object365: https://openaccess.thecvf.com/content_ICCV_2019/papers/Shao_Objects365_A_Large-Scale_High-Quality_Dataset_for_Object_Detection_ICCV_2019_paper.pdf
Cập nhật lần cuối: 2025-03-05 | Xem trên trang hỗ trợ chính thức