RTMPose ve RTMDet Kullanarak Golf ve Beyzbol Swing İşaretçisiz Hareket Yakalamayı Geliştirme: Yukarıdan Aşağıya Yaklaşım

RTMPose ve RTMDet Kullanarak Golf ve Beyzbol Swing İşaretçisiz Hareket Yakalamayı Geliştirme: Yukarıdan Aşağıya Yaklaşım

Özet

Bu teknik rapor, RTMPose ve RTMDet’in golf ve beyzbol swing’lerinin doğru ve verimli Pozisyon Tahmini için uygulanmasını belgeler. Gerçek zamanlı performans için optimize edilmiş son teknoloji tekniklerin yararlanılması, bu modeller golf ve beyzbol swing’leri sırasında vücut hareketlerinin detaylı takibini sağlar—spor analitiğinde performansı iyileştirmek için kritik bir özellik. Yukarıdan Aşağıya Yaklaşım’ın avantajlarını vurguluyoruz; burada hazır bir RTMDet dedektörü her karede golfer ve beyzbol oyuncusunu tanımlar ve RTMPose anahtar vücut eklemlerinin pozisyonlarını tahmin eder.

1. Giriş

Pozisyon Tahmini, spor performans analizinde önemli hale gelmiştir ve sporcuların hareketlerinin hassas takibine olanak tanır. Golf ve beyzbolda, bir oyuncunun swing’inin biyomekanik verilerini yakalaması swing dinamikleri hakkında değerli bilgiler sağlar; profesyoneller ve amatörler tekniklerini geliştirmelerine yardımcı olur. Geleneksel 2D Pozisyon Tahmini yöntemleri genellikle gecikme ve doğruluk sorunlarıyla karşılaşır, özellikle gerçek zamanlı senaryolarda. Bu makale, golf ve beyzbol swing’leri sırasında detaylı Pozisyon Tahmini için mmpose Framework’ü içinde RTMPose ve RTMDet kullanan bir çözüm önerir.

2. Arka Plan

Golf ve beyzbol swing’lerinin karmaşıklığı, vücut hareketlerinin hassas ölçülmesini gerektirir. Mevcut Pozisyon Tahmini yöntemleri, gerçek zamanlı performans için gerekli doğruluğu sağlayamayabilir. Derin öğrenme ve bilgisayar görüşündeki gelişmeler, RTMPose ve RTMDet gibi geliştirilmiş doğruluk ve verimlilik sunan modelleri ortaya çıkarmıştır.

3. RTMdet ve RTMpose ile Yukarıdan Aşağıya Yaklaşım

–şekil ekle–

3. RTMPose: Yüksek Performanslı Pozisyon Tahmini Modeli

RTMPose [1] yüksek performanslı, gerçek zamanlı Pozisyon Tahmini için tasarlanmış, sınırlı donanımda verimli bir şekilde çalışmaya optimize edilmiştir.

Temel Özellikler:

Model Mimarisi ve Verimlilik: RTMpose, hız ve doğruluğu dengeleyen backbone olarak CSPNeXt kullanır [1, 2]. CSPNeXt, Pozisyon Tahmini ve nesne algılama gibi yoğun tahmin görevleri için optimize edilmiş, yüksek çözünürlülük ve kesinlik sağlarken hesaplama verimliliğini korur.

Anahtar Nokta Tahmini: SimCC tabanlı bir algoritma kullanır [1, 3]; anahtar noktaların yatay ve dikey pozisyonlarını ayrı sınıflandırma görevleri olarak ele alır. Bu kompakt temsil hesaplama yükünü azaltır ve çeşitli cihazlara dağıtım için uygun hale getirir.

4. RTMDet: Algılama Backbone’u

RTMDet [4], Yukarıdan Aşağıya Yaklaşım ardışık işlem hattında RTMPose’dan önce gelen dedektör olarak hareket eder, her karede golfer’in veya beyzbol oyuncusunun konumunu tanımlar.

Temel Özellikler:

Model Mimarisi ve Verimlilik: RTMDet, birçok YOLO modelinden daha eğitilebilir ve hassas olan CSPDarkNet’in değiştirilmiş bir versiyonunu kullanır [5]. Değiştirilen versiyon, karmaşıklık ve hızı dengelemek için büyük kernel derinliği-bazlı evrişimlerden yararlanır ve GPU ve CPU’da verimlidir. Spor performans takibi gibi gerçek zamanlı uygulamalar için idealdir.

Çok Yönlülük: Örnek segmentasyon ve döndürülmüş nesne algılama dahil olmak üzere çeşitli nesne algılama görevlerini gerçekleştirir. Dinamik sahnelerde bile oyuncunun hassas lokalizasyonunu sağlar.

5. Golf ve Beyzbol Swing Analizinde RTMDet ve RTMPose Kullanmanın Avantajları

5.1 Kalabalık Olmayan Sahnelerde Daha Yüksek Doğruluk

Karede az sayıda kişinin bulunduğu tipik golf/beyzbol ortamlarında, RTMDet golfer/beyzbol oyuncusunu izole eder ve RTMPose her algılanan kişiyi yüksek doğrulukla işlemek için izin verir. Bu, karedeki tüm kişilerin tüm anahtar noktalarını aynı anda işleyen aşağıdan yukarıya yöntem yönteminin karmaşıklığından kaçınır. Yukarıdan Aşağıya Yaklaşım, ayrıca Pozisyon Tahmini gerçekleştirmeden önce doğru kişiyi (yani golfer veya beyzbol oyuncusunu) tanımlayan RTMdet’in son işleme algoritmasını içerebilir. Ek olarak, RTMPose, çeşitli görüntü materyallerini içeren uzatılmış veri üzerinde önceden eğitilmiştir.

5.2 Verimli Hesaplama ve Gerçek Zamanlı Performans

RTMdet ve RTMpose gibi hafif modeller kullanmak, düşük gecikmeyi korur ve tüketici sınıfı donanımda gerçek zamanlı swing analizi sağlar. Bu, özellikle antrenörlük veya eğitim seansları sırasında anında canlı geri bildirim sağlamak için yararlıdır. SwingCatalyst işaretçisiz Hareket Yakalama sistemi, golfer’lere ve beyzbol oyuncularına canlı Hareket Yakalama geri bildirimi sağlayan birkaç studio sisteminden biridir.

5.3 Detaylı Anahtar Nokta Analizi

RTMPose, golf ve beyzbol swing kinematiğini analiz etmek için gerekli olan, aşağıdaki şekil 1’de gösterilen 26 vücut Anahtar Noktası’nın bir kurulumunu algılar [6]. Halpe26, ayaklar ve baş üzerindeki ek işaretleyiciler de dahil olmak üzere daha standart 17 işaretleyici içeren Coco kurulumuna kıyasla genişletilmiş bir kurulumdur.

–Şekil Ekle–

6. Golf ve Beyzbol Swing İşaretçisiz Hareket Yakalama Metodolojisi

6.1 Algılama Faz: RTMDet

Bir golfer veya beyzbol oyuncusunun video karelerine uygulanan RTMDet, oyuncu etrafında sınırlayıcı kutular oluşturur ve bunları RTMPose’ye iletir. Bu, Pozisyon Tahminini ilgili görüntü bölgelerine odaklar ve hesaplama yükünü azaltır.

–Görüntü Ekle–

6.2 Pozisyon Tahmini Faz: RTMPose

RTMPose, sınırlayıcı kutu içindeki Anahtar Nokta pozisyonlarını tahmin eder. Golf ve beyzbol swing analizi için kritik eklemler bilekleri, direkleri, omuzları, kalçaları ve dizleri içerir. Bu Anahtar Noktalar, swing’in fazları sırasında vücut açılarını ve pozisyonlarını değerlendirir: Geri Dönüş, İniş Sürüşü ve Takip Sürüşü.

–Görüntü Ekle–

6.3 Performans Metrikler

RTMPose’un genel performansı MS COCO gibi Pozisyon Tahmini kıyaslamalarında Ortalama Kesinlik (AP) gibi metrikler kullanılarak ölçülür. Aşağıda, yaygın olarak kullanılan Coco kıyaslamasında en iyi sıralanan modellerin performansı bulunmaktadır. MS COCO val dataset’inde RTMPose-X, gerçek zamanlı geri bildirim sağlayabilen en iyi performans gösteren model olup, tüketici sınıfı GPU’larda ?? FPS’i aşan kare hızlarıyla %75,8’e kadar AP elde eder; bu da yüksek hızlı spor analizi için uygun hale getirir.

Sıra Model Çözünürlük Boyut/parametreler (Milyon) AP Gerçek zamanlı çıkarım

1 Sapiens-2B 1024x768 2000 82,2 Hayır

2 Sapiens-1B 1024x768 1000 82,1 Hayır

3 Sapiens-0.6B 1024x768 600 81,2 Hayır

4 Sapiens-0.3B 1024x768 300 79.6 Hayır

5 VitPose-H 256x192 632 79.4 Hayır

6 RTMPose-X 384x288 49 78.8 Evet

7 VitPose-L 256x192 307 78.6 Hayır

8 RTMPose-L 384x288 28 78.3 Evet

9 HRFormer 256x192 43 77.2 Hayır

10 HRNet-UDP 384x288 64 77.2 Evet

11 VitPose-B 256x192 86 77.0 Evet

12 RTMPose-L 256x198 28 76.7 Evet

13 RTMPose-M 384x288 14 76.6 Evet

14 HRNet 384x288 64 76.3 Evet

15 VitPose-S 256x192 43 75.8 Evet

16 RTMPose-M 256x192 14 74.9 Evet

17 SimpleBaseline 256x192 60 73.5 Evet

18 FastPose 256x192 79 73.3 Evet

7. Golf Swing Analizi Uygulaması

RTMPose-X ve RTMDet-M çerçevesini uygulayarak:

Eklem Hareketlerini Kare-Kare İzleyin: Swing’in her fazını analiz etmek için kapsamlı veriler sağlar.

Gerçek Zamanlı Geri Bildirim Sağlayın: Eğitim seansları sırasında swing duruşu ve formuna ilişkin anında içgörüler sunar.

İdeal Mekanikle Karşılaştırın: İdeal swing kinematiğine karşı karşılaştırma yaparak iyileştirme alanlarını belirlemeyi sağlar.

8. Sonuç

RTMPose-X ve RTMDet-M entegrasyonu, gerçek zamanlı golf swing analizi için güçlü bir çözüm sunar. Yüksek hassasiyet, düşük gecikme ve çeşitli donanım platformları arasında uyumlulukla, bu yukarıdan aşağıya yaklaşım swing mekaniğine ilişkin ayrıntılı içgörüler sağlar. Hem amatör hem de profesyonel golfçülerin performanslarını artırmalarına yardımcı olma potansiyeline sahiptir.

9. Gelecek Çalışmalar

Gelecekteki gelişmeler şunları içerebilir:

Makine Öğrenmesi Algoritmalarını Entegre Etmek: Tahmine dayalı analitikler sağlamak ve swing verimliliğini iyileştirmek için ayarlamalar önerebilmek.

Çok Kişilik Senaryolara Genişletmek: Takım sporları veya grup eğitim ortamlarında uygulanabilirliği artırmak.

Kullanıcı Dostu Bir Arayüz Geliştirmek: Bu teknolojiyi teknik uzmanlığa sahip olmayan antrenörlere ve sporcuların erişebileceği hale getiren uygulamalar veya araçlar oluşturmak.

Ek

Detaylı Metodoloji: RTMPose-X ve RTMDet-M Kullanarak Golf Swing Pozisyon Tahmini için Yukarıdan Aşağıya Yaklaşım

Genel Bakış

Burada açıklanan metodoloji, golf ve beyzbol swing’inin gerçek zamanlı Pozisyon Tahmini için yukarıdan aşağıya yaklaşımda yer alan detaylı adımları özetlemektedir. RTMPose’ın Anahtar Nokta yerelleştirmesi ve RTMDet’in Nesne Algılama güçlerinden yararlanır. Süreç, algılama, Anahtar Nokta yerelleştirmesi ve Son İşleme olmak üzere birkaç aşamaya bölünmüştür; her biri biyomekanikal analiz için bir golf swing’inde vücut eklemlerinin kesin ve verimli tahmininde katkıda bulunur.

–Şekil Ekle–

1. Algılama Fazı: RTMDet-M ile Gerçek Zamanlı Yerelleştirme

Yukarıdan aşağıya yaklaşımının ilk aşaması, videonun her karesinde golfçüyü algılamayı içerir. Özellikle golf olmak üzere spor senaryolarında, sahne genellikle tek bir oyuncudan oluşur ve bu da kalabalık sahnelere kıyasla algılama görevini basitleştirir.

1.1 Model Mimarisi

RTMDet-M, boru hattında Nesne Algılayıcısı olarak kullanılır. Hız ve doğruluk arasında bir denge korurken gerçek zamanlı Nesne Algılama performansını optimize etmek için tasarlanan CSPNeXt omurga olan bir evrişimli sinir ağı (CNN) omurgası kullanır. Mimarinin temel yönleri şunlardır:

Geniş çekirdekli derinlik-yönlü evrişimler: Bunlar omurga ve boyun katmanlarında kullanılır, alıcı alanını artırırken düşük hesaplama maliyetini korur.

Özellik piramit ağı (FPN): Çeşitli ölçeklerdeki nesnelerin algılanmasını sağlayan, golfçünün kameradan uzaklığından bağımsız olarak algılanabilmesini sağlayan çok ölçekli özellik çıkarma tekniği.

1.2 Dinamik Etiket Atama

RTMDet-M, sınıflandırma ve yerelleştirme kaybının kombinasyonuna dayalı olarak nesnelere yumuşak etiketler atayarak algılama doğruluğunu iyileştiren dinamik bir etiket atama stratejisinden yararlanır. Etiket ataması SimOTA algoritması tarafından yönetilir; bu, yer gerçeği nesnesiyle eşleşme olasılıklarına dayalı olarak pozitif örnekleri dinamik olarak seçer. Bu yöntem, açık hava golf sahnelerinde sıkça karşılaşılan değişken aydınlatma ve çevresel koşullarda sağlam algılamayı sağlar.

1.3 Sınırlayıcı Kutu Tahmini

Dedektör, her karede golferi çevreleyen Sınırlayıcı Kutular çıktı verir. Bu Sınırlayıcı Kutular, Pozisyon Tahmini modelinin çalışacağı alanda mekansal kısıtlamalar sağlayarak, sonraki Pozisyon Tahmini aşamasındaki hesaplama yükünü karenin yalnızca ilgili alanlarına odaklanarak azaltır. Bu bağlamda, RTMDet-M yüksek performanslı donanımda 300 FPS’nin üzerinde gerçek zamanlı olarak Sınırlayıcı Kutular oluşturarak, golf swingin hızlı dinamikleriyle adım adım gidebilmesini sağlar.

1.4 Kişi Non-Maximum Suppression (NMS)

Çok kişili ortamlarda (golf swing analizi için nadir olsa da), RTMDet-M, gereksiz Anahtar Nokta algılamalarını ortadan kaldıran ve herkes için yalnızca en güvenilir algılamaların korunmasını sağlayan bir Pozisyon Non-Maximum Suppression (NMS) algoritması içerir. Bu, kalabalık sahneler veya video dizilerinde çakışan Sınırlayıcı Kutuların algılanabileceği durumlarda kritik öneme sahiptir.

1.5 Eğitim Dataset’i ve Performans

RTMDet-M, Object356 dataset’indeki kişi örneklerinde ikili sınıflandırma görevinde eğitilmiştir.

2. Pozisyon Tahmini Aşaması: RTMPose-X Anahtar Nokta Lokalizasyonu

Golfer için Sınırlayıcı Kutu belirlendikten sonra, sonraki aşama bu bölge içindeki önemli vücut eklemlerinin kesin konumunu tahmin etmeyi içerir. Bu amaç için yüksek performanslı bir Pozisyon Tahmini modeli olan RTMPose-X kullanılır.

2.1 SimCC Tabanlı Anahtar Nokta Lokalizasyonu

RTMPose-X, Anahtar Nokta lokalizasyonunu bir sınıflandırma problemi olarak ele alan SimCC (Simple Coordinate Classification) algoritmasını kullanır. Geleneksel ısı haritası yöntemlerinin aksine, SimCC her Anahtar Noktanın x ve y koordinatlarını bölmelere ayırır ve her Anahtar Noktanın bulunduğu tam bölmeyi sınıflandırır. Bu yaklaşım, hesaplama karmaşıklığını önemli ölçüde azaltır ve insan Pozisyon Tahmini görevleri için yüksek doğruluğu korurken çıkarım hızını iyileştirir.

2.2 CSPNeXt Omurga

RTMDet-M’ye benzer şekilde, RTMPose-X de Pozisyon Tahmini gibi yoğun tahmin görevleri için uyarlanmış CSPNeXt omurgasını kullanır. CSPNeXt omurgası bu senaryoda aşağıdaki nedenlerden dolayı avantajlıdır:

Hafif mimari: Modelin mimarisi parametre sayısını en aza indirmek ve verimli çalışmayı maksimize etmek için tasarlanmıştır, bu da onu gerçek zamanlı uygulamalar için ideal kılar.

Verimli özellik çıkarımı: CSPNeXt’in özellik çıkarımı katmanları yüksek çözünürlüklü görüntüleri işlemek için optimize edilmiştir; bu, golf swingi sırasında bilek, dirsek ve dizler gibi hızla hareket eden vücut parçalarındaki küçük ayrıntıları algılamak için önemlidir.

2.3 Anahtar Nokta Gösterimi

RTMPose-X, aşağıdakiler dahil olmak üzere tüm ilgili vücut parçaları için Anahtar Nokta konumlarını çıktı verir:

Üst Vücut eklemleri: Omuzlar, Dirsekler, Bilekler ve Boyun

Alt Vücut eklemleri: Kalçalar, Dizler ve Ayak Bileği

Ek eklemler: Baş, Omurga ve swing analizi için ilgili diğer önemli noktalar

Giriş görüntüleri için 384x288 çözünürlüğü, eklemlerdeki ince hareketlerin bile doğru bir şekilde yakalamasını sağlarken, sistemin gerçek zamanlı çalışabilme yeteneğini de korur.

2.4 RTMPose ön işleme: Tarafsız Veri İşleme (UDP)

Kırpılmış görüntü RTMPose modeline girmeden önce, Tarafsız Veri İşleme (UDP) adımı gerçekleştirilir. UDP, RTMpose’un eğitim ve test sırasında veri işlemede kritik önyargıları, özellikle Koordinat Sistemi ve Anahtar Nokta format dönüşümlerini ele alır. Geleneksel insan Pozisyon Tahmini boru hatlarında, çevirme ve yeniden boyutlandırma gibi standart operasyonlar, özellikle piksel tabanlı dönüşümler nedeniyle çıktıları yanlış hizalar ve bu da hassasiyet kaybı ve çevrilen görüntülerin yanlış hizalanmasına yol açar. UDP bunu Tarafsız Koordinat Sistemi dönüşümü kurarak düzeltir, temel operasyonlar (kırpma, yeniden boyutlandırma, döndürme, çevirme) sırasında farklı Koordinat Sistemleri arasında anlamsal hizalamayı korur. UDP ayrıca, Anahtar Noktaları yer sapması ortaya çıkarmadan ısı haritalarına kodlayarak Tarafsız Anahtar Nokta format dönüşümünü tanıtır, daha da hassaslaştırılarak Gauss dağılımı farkında bir kod çözme işlemi aracılığıyla. Bu veri işleme yaklaşımı, COCO ve CrowdPose dataset’lerindeki kapsamlı testlerde gösterildiği gibi model performansını sistematik olarak iyileştirir; burada yukarıdan aşağıya ve aşağıdan yukarıya modellerde gelişmiş doğruluk ve azaltılmış çıkarım gecikmesi elde edilmiştir [Ref].

3. Son İşleme ve Pozisyon Rafinemanı

Anahtar Noktalar tahmin edildikten sonra, Pozisyon tahminini rafine etmek ve kareler arasında stabiliteyi sağlamak için birkaç son işleme adımı uygulanır.

3.1 Pozisyon Yumuşatma

Golf swingleri hızlı hareketi içerir; bu da kareler arasında tahmini Anahtar Nokta konumlarında gürültü veya dalgalanmalar ortaya çıkarabilir. Bunu azaltmak için, küçük, fiziksel olmayan Anahtar Nokta tahmin dalgalanmalarının ortadan kaldırılması için Anahtar Nokta trajektori zaman içinde yumuşatılmasını sağlamak amacıyla One-Euro Filtresi uygulanır. One-Euro Filtresi, filtrenin bant genişliğini hareketin hızına göre dinamik olarak ayarlayarak çalışır; bu, hareketi farklı fazlarda (Geri Dönüş, İniş Sürüşü ve Takip Sürüşü) önemli ölçüde değişen golf swingleri gibi senaryolar için idealdir.

3.2 Kare Atlama Mekanizması

Daha ileri optimizasyon için, algılama yalnızca ana karelerde gerçekleştirilen ve Pozisyon Tahmini ara kareler için enterpolasyon yapılan bir kare atlama mekanizması uygulanır. Bu, golf swingin yavaş hızlı analizi gibi kareler arasında sınırlı hareket olan senaryolarda doğruluğu feda etmeden hesaplama yükünü önemli ölçüde azaltır.

4. Zamansal İzleme ve Sıra Tutarlılığı

Golf swingleri yapısal olarak sırasaldır; bu nedenle Pozisyon tahmininde zamansal tutarlılığı korumak hayatidir. RTMPose-X bunu, Anahtar Nokta tahminlerinin ardışık kareler arasında tutarlı olmasını sağlayan zamansal izleme teknikleri aracılığıyla ele alır. Bu, Anahtar Nokta konumlarını zaman içinde izlemeyi ve biomiyometrik kısıtlamalara dayanan gerçekçi hareket paternlerini takip etme traektotilerini sağlamayı içerir.

4.1 Anahtar Nokta Hız ve İvme Analizi

Anahtar Nokta konumlarını izlemenin yanı sıra, RTMPose-X her Anahtar Noktanın Hız ve İvmesini de tahmin eder. Bu bilgi, golf swing dinamiklerini analiz etmek için kritik öneme sahiptir ve aşağıdakiler gibi temel performans metriklerine ilişkin bilgiler sağlar:

Swing Hızı: İniş Sürüşü sırasında bilek Hızına göre hesaplanır.

Kalça Rotasyonu: Kalça Eklemleri Dönme Hızı aracılığıyla analiz edilir.

Baston Yolu ve başlık hızı: Bilek ve Dirsek traektotilerinden dolaylı olarak çıkarılır.

Bu Metrikler, bir oyuncunun Swing Mekaniği hakkında geri bildirim sunmak için profesyonel karşılaştırma ölçütleriyle karşılaştırılabilir.

5. Çıkarım ve Gerçek Zamanlı Performans

Tüm yukarıdan aşağıya Pozisyon Tahmini boru hattı gerçek zamanlı performans için optimize edilmiştir; bu da modern GPU’larda 90 FPS’nin üzerinde Pozisyon Tahmini sağlar. Yüksek verimli model mimarileri (CSPNeXt) ve hızlı çıkarım teknikleri (SimCC) kullanımı, sistemin yüksek kare hızı video girdisini işleyebilmesini sağlayarak, eğitim seansları sırasında gerçek zamanlı geri bildirim için uygun hale getirir.

6. Değerlendirme ve Doğrulama

RTMPose-X ve RTMDet-M modelleri, COCO ve MPII gibi standart dataset’lerde değerlendirilmiş; vücut Anahtar Noktaları için COCO dataset’inde ortalama 75,8% kesinlik (AP) ile güçlü performans göstermiştir. Bu sonuçlar golf swing dataset’lerindeki temel gerçek açıklamalarına karşı doğrulanmış ve dinamik spor hareketlerini yakalamada modelin sağlamlığını garantiye almıştır.

6.1 Performans Metrikleri

Ortalama Kare Hatası (MSE): Anahtar nokta tahminlerinin doğruluğunu temel referans ek açıklamalarına karşı ölçmek için kullanılır.

Ortalama Kesinlik (AP): Pozisyon tahmini modelinin genel performansını değerlendirir.

Kare İşleme Süresi: Sistemin gerçek zamanlı gereksinimleri karşılamasını sağlamak için kıyaslanmıştır (<10 ms kare başına).

7. Sonuç

RTMPose-X ve RTMDet-M kullanılan yukarıdan aşağıya yaklaşımı, spor analitikleri için özellikle golf swing analizi için verimli ve doğru bir gerçek zamanlı pozisyon tahmini yöntemi sağlar. Sağlam anahtar nokta algılama, zamansal izleme ve gerçek zamanlı çıkarımla, bu metodoloji golf swing dinamikleri hakkında detaylı biyomekanik içgörüler sunarak performans iyileştirmesine ve yaralanma önlenmesine yardımcı olur.

Kaynaklar

[1] RTMpose https://arxiv.org/pdf/2303.07399

[2] CSPNeXt https://www.sciencedirect.com/science/article/pii/S0952197624000447

[3] SIMCC https://arxiv.org/abs/2107.03332

[4] RTMdet https://arxiv.org/pdf/2212.07784

[5] CSPDarkNet

[6] Halpe26

[] AI mücadelesi dataset:

[] MS Coco dataset:

[7] Crowdpose dataset: https://arxiv.org/pdf/1812.00324

[] MPII dataset:

[] sub-JHMBD dataset:

[] Halpe dataset:

[] PoseTrack18 dataset:

Object365 veritabanı: https://openaccess.thecvf.com/content_ICCV_2019/papers/Shao_Objects365_A_Large-Scale_High-Quality_Dataset_for_Object_Detection_ICCV_2019_paper.pdf

Son güncelleme: 2025-03-05 | Resmi destek sitesinde görüntüle