RTMPose ve RTMDet Kullanarak Golf ve Beyzbol Swing İşaretçisiz Hareket Yakalamayı Geliştirme: Yukarıdan Aşağıya Yaklaşım
RTMPose ve RTMDet Kullanarak Golf ve Beyzbol Swing İşaretçisiz Hareket Yakalamayı Geliştirme: Yukarıdan Aşağıya Yaklaşım
Özet
Bu teknik rapor, RTMPose ve RTMDet’in golf ve beyzbol swing’lerinin doğru ve verimli Pozisyon Tahmini için uygulanmasını belgeler. Gerçek zamanlı performans için optimize edilmiş son teknoloji tekniklerin yararlanılması, bu modeller golf ve beyzbol swing’leri sırasında vücut hareketlerinin detaylı takibini sağlar—spor analitiğinde performansı iyileştirmek için kritik bir özellik. Yukarıdan Aşağıya Yaklaşım’ın avantajlarını vurguluyoruz; burada hazır bir RTMDet dedektörü her karede golfer ve beyzbol oyuncusunu tanımlar ve RTMPose anahtar vücut eklemlerinin pozisyonlarını tahmin eder.
1. Giriş
Pozisyon Tahmini, spor performans analizinde önemli hale gelmiştir ve sporcuların hareketlerinin hassas takibine olanak tanır. Golf ve beyzbolda, bir oyuncunun swing’inin biyomekanik verilerini yakalaması swing dinamikleri hakkında değerli bilgiler sağlar; profesyoneller ve amatörler tekniklerini geliştirmelerine yardımcı olur. Geleneksel 2D Pozisyon Tahmini yöntemleri genellikle gecikme ve doğruluk sorunlarıyla karşılaşır, özellikle gerçek zamanlı senaryolarda. Bu makale, golf ve beyzbol swing’leri sırasında detaylı Pozisyon Tahmini için mmpose Framework’ü içinde RTMPose ve RTMDet kullanan bir çözüm önerir.
2. Arka Plan
Golf ve beyzbol swing’lerinin karmaşıklığı, vücut hareketlerinin hassas ölçülmesini gerektirir. Mevcut Pozisyon Tahmini yöntemleri, gerçek zamanlı performans için gerekli doğruluğu sağlayamayabilir. Derin öğrenme ve bilgisayar görüşündeki gelişmeler, RTMPose ve RTMDet gibi geliştirilmiş doğruluk ve verimlilik sunan modelleri ortaya çıkarmıştır.
3. RTMdet ve RTMpose ile Yukarıdan Aşağıya Yaklaşım
–şekil ekle–
3. RTMPose: Yüksek Performanslı Pozisyon Tahmini Modeli
RTMPose [1] yüksek performanslı, gerçek zamanlı Pozisyon Tahmini için tasarlanmış, sınırlı donanımda verimli bir şekilde çalışmaya optimize edilmiştir.
Temel Özellikler:
Model Mimarisi ve Verimlilik: RTMpose, hız ve doğruluğu dengeleyen backbone olarak CSPNeXt kullanır [1, 2]. CSPNeXt, Pozisyon Tahmini ve nesne algılama gibi yoğun tahmin görevleri için optimize edilmiş, yüksek çözünürlülük ve kesinlik sağlarken hesaplama verimliliğini korur.
Anahtar Nokta Tahmini: SimCC tabanlı bir algoritma kullanır [1, 3]; anahtar noktaların yatay ve dikey pozisyonlarını ayrı sınıflandırma görevleri olarak ele alır. Bu kompakt temsil hesaplama yükünü azaltır ve çeşitli cihazlara dağıtım için uygun hale getirir.
4. RTMDet: Algılama Backbone’u
RTMDet [4], Yukarıdan Aşağıya Yaklaşım ardışık işlem hattında RTMPose’dan önce gelen dedektör olarak hareket eder, her karede golfer’in veya beyzbol oyuncusunun konumunu tanımlar.
Temel Özellikler:
Model Mimarisi ve Verimlilik: RTMDet, birçok YOLO modelinden daha eğitilebilir ve hassas olan CSPDarkNet’in değiştirilmiş bir versiyonunu kullanır [5]. Değiştirilen versiyon, karmaşıklık ve hızı dengelemek için büyük kernel derinliği-bazlı evrişimlerden yararlanır ve GPU ve CPU’da verimlidir. Spor performans takibi gibi gerçek zamanlı uygulamalar için idealdir.
Çok Yönlülük: Örnek segmentasyon ve döndürülmüş nesne algılama dahil olmak üzere çeşitli nesne algılama görevlerini gerçekleştirir. Dinamik sahnelerde bile oyuncunun hassas lokalizasyonunu sağlar.
5. Golf ve Beyzbol Swing Analizinde RTMDet ve RTMPose Kullanmanın Avantajları
5.1 Kalabalık Olmayan Sahnelerde Daha Yüksek Doğruluk
Karede az sayıda kişinin bulunduğu tipik golf/beyzbol ortamlarında, RTMDet golfer/beyzbol oyuncusunu izole eder ve RTMPose her algılanan kişiyi yüksek doğrulukla işlemek için izin verir. Bu, karedeki tüm kişilerin tüm anahtar noktalarını aynı anda işleyen aşağıdan yukarıya yöntem yönteminin karmaşıklığından kaçınır. Yukarıdan Aşağıya Yaklaşım, ayrıca Pozisyon Tahmini gerçekleştirmeden önce doğru kişiyi (yani golfer veya beyzbol oyuncusunu) tanımlayan RTMdet’in son işleme algoritmasını içerebilir. Ek olarak, RTMPose, çeşitli görüntü materyallerini içeren uzatılmış veri üzerinde önceden eğitilmiştir.
5.2 Verimli Hesaplama ve Gerçek Zamanlı Performans
RTMdet ve RTMpose gibi hafif modeller kullanmak, düşük gecikmeyi korur ve tüketici sınıfı donanımda gerçek zamanlı swing analizi sağlar. Bu, özellikle antrenörlük veya eğitim seansları sırasında anında canlı geri bildirim sağlamak için yararlıdır. SwingCatalyst işaretçisiz Hareket Yakalama sistemi, golfer’lere ve beyzbol oyuncularına canlı Hareket Yakalama geri bildirimi sağlayan birkaç studio sisteminden biridir.
5.3 Detaylı Anahtar Nokta Analizi
RTMPose, golf ve beyzbol swing kinematiğini analiz etmek için gerekli olan, aşağıdaki şekil 1’de gösterilen 26 vücut Anahtar Noktası’nın bir kurulumunu algılar [6]. Halpe26, ayaklar ve baş üzerindeki ek işaretleyiciler de dahil olmak üzere daha standart 17 işaretleyici içeren Coco kurulumuna kıyasla genişletilmiş bir kurulumdur.
–Şekil Ekle–
6. Golf ve Beyzbol Swing İşaretçisiz Hareket Yakalama Metodolojisi
6.1 Algılama Faz: RTMDet
Bir golfer veya beyzbol oyuncusunun video karelerine uygulanan RTMDet, oyuncu etrafında sınırlayıcı kutular oluşturur ve bunları RTMPose’ye iletir. Bu, Pozisyon Tahminini ilgili görüntü bölgelerine odaklar ve hesaplama yükünü azaltır.
–Görüntü Ekle–
6.2 Pozisyon Tahmini Faz: RTMPose
RTMPose, sınırlayıcı kutu içindeki Anahtar Nokta pozisyonlarını tahmin eder. Golf ve beyzbol swing analizi için kritik eklemler bilekleri, direkleri, omuzları, kalçaları ve dizleri içerir. Bu Anahtar Noktalar, swing’in fazları sırasında vücut açılarını ve pozisyonlarını değerlendirir: Geri Dönüş, İniş Sürüşü ve Takip Sürüşü.
–Görüntü Ekle–
6.3 Performans Metrikler
RTMPose’un genel performansı MS COCO gibi Pozisyon Tahmini kıyaslamalarında Ortalama Kesinlik (AP) gibi metrikler kullanılarak ölçülür. Aşağıda, yaygın olarak kullanılan Coco kıyaslamasında en iyi sıralanan modellerin performansı bulunmaktadır. MS COCO val dataset’inde RTMPose-X, gerçek zamanlı geri bildirim sağlayabilen en iyi performans gösteren model olup, tüketici sınıfı GPU’larda ?? FPS’i aşan kare hızlarıyla %75,8’e kadar AP elde eder; bu da yüksek hızlı spor analizi için uygun hale getirir.
Sıra Model Çözünürlük Boyut/parametreler (Milyon) AP Gerçek zamanlı çıkarım
1 Sapiens-2B 1024x768 2000 82,2 Hayır
2 Sapiens-1B 1024x768 1000 82,1 Hayır
3 Sapiens-0.6B 1024x768 600 81,2 Hayır
4 Sapiens-0.3B 1024x768 300 79.6 Hayır
5 VitPose-H 256x192 632 79.4 Hayır
6 RTMPose-X 384x288 49 78.8 Evet
7 VitPose-L 256x192 307 78.6 Hayır
8 RTMPose-L 384x288 28 78.3 Evet
9 HRFormer 256x192 43 77.2 Hayır
10 HRNet-UDP 384x288 64 77.2 Evet
11 VitPose-B 256x192 86 77.0 Evet
12 RTMPose-L 256x198 28 76.7 Evet
13 RTMPose-M 384x288 14 76.6 Evet
14 HRNet 384x288 64 76.3 Evet
15 VitPose-S 256x192 43 75.8 Evet
16 RTMPose-M 256x192 14 74.9 Evet
17 SimpleBaseline 256x192 60 73.5 Evet
18 FastPose 256x192 79 73.3 Evet
7. Golf Swing Analizi Uygulaması
RTMPose-X ve RTMDet-M çerçevesini uygulayarak:
Eklem Hareketlerini Kare-Kare İzleyin: Swing’in her fazını analiz etmek için kapsamlı veriler sağlar.
Gerçek Zamanlı Geri Bildirim Sağlayın: Eğitim seansları sırasında swing duruşu ve formuna ilişkin anında içgörüler sunar.
İdeal Mekanikle Karşılaştırın: İdeal swing kinematiğine karşı karşılaştırma yaparak iyileştirme alanlarını belirlemeyi sağlar.
8. Sonuç
RTMPose-X ve RTMDet-M entegrasyonu, gerçek zamanlı golf swing analizi için güçlü bir çözüm sunar. Yüksek hassasiyet, düşük gecikme ve çeşitli donanım platformları arasında uyumlulukla, bu yukarıdan aşağıya yaklaşım swing mekaniğine ilişkin ayrıntılı içgörüler sağlar. Hem amatör hem de profesyonel golfçülerin performanslarını artırmalarına yardımcı olma potansiyeline sahiptir.
9. Gelecek Çalışmalar
Gelecekteki gelişmeler şunları içerebilir:
Makine Öğrenmesi Algoritmalarını Entegre Etmek: Tahmine dayalı analitikler sağlamak ve swing verimliliğini iyileştirmek için ayarlamalar önerebilmek.
Çok Kişilik Senaryolara Genişletmek: Takım sporları veya grup eğitim ortamlarında uygulanabilirliği artırmak.
Kullanıcı Dostu Bir Arayüz Geliştirmek: Bu teknolojiyi teknik uzmanlığa sahip olmayan antrenörlere ve sporcuların erişebileceği hale getiren uygulamalar veya araçlar oluşturmak.
Ek
Detaylı Metodoloji: RTMPose-X ve RTMDet-M Kullanarak Golf Swing Pozisyon Tahmini için Yukarıdan Aşağıya Yaklaşım
Genel Bakış
Burada açıklanan metodoloji, golf ve beyzbol swing’inin gerçek zamanlı Pozisyon Tahmini için yukarıdan aşağıya yaklaşımda yer alan detaylı adımları özetlemektedir. RTMPose’ın Anahtar Nokta yerelleştirmesi ve RTMDet’in Nesne Algılama güçlerinden yararlanır. Süreç, algılama, Anahtar Nokta yerelleştirmesi ve Son İşleme olmak üzere birkaç aşamaya bölünmüştür; her biri biyomekanikal analiz için bir golf swing’inde vücut eklemlerinin kesin ve verimli tahmininde katkıda bulunur.
–Şekil Ekle–
1. Algılama Fazı: RTMDet-M ile Gerçek Zamanlı Yerelleştirme
Yukarıdan aşağıya yaklaşımının ilk aşaması, videonun her karesinde golfçüyü algılamayı içerir. Özellikle golf olmak üzere spor senaryolarında, sahne genellikle tek bir oyuncudan oluşur ve bu da kalabalık sahnelere kıyasla algılama görevini basitleştirir.
1.1 Model Mimarisi
RTMDet-M, boru hattında Nesne Algılayıcısı olarak kullanılır. Hız ve doğruluk arasında bir denge korurken gerçek zamanlı Nesne Algılama performansını optimize etmek için tasarlanan CSPNeXt omurga olan bir evrişimli sinir ağı (CNN) omurgası kullanır. Mimarinin temel yönleri şunlardır:
Geniş çekirdekli derinlik-yönlü evrişimler: Bunlar omurga ve boyun katmanlarında kullanılır, alıcı alanını artırırken düşük hesaplama maliyetini korur.
Özellik piramit ağı (FPN): Çeşitli ölçeklerdeki nesnelerin algılanmasını sağlayan, golfçünün kameradan uzaklığından bağımsız olarak algılanabilmesini sağlayan çok ölçekli özellik çıkarma tekniği.
1.2 Dinamik Etiket Atama
RTMDet-M, sınıflandırma ve yerelleştirme kaybının kombinasyonuna dayalı olarak nesnelere yumuşak etiketler atayarak algılama doğruluğunu iyileştiren dinamik bir etiket atama stratejisinden yararlanır. Etiket ataması SimOTA algoritması tarafından yönetilir; bu, yer gerçeği nesnesiyle eşleşme olasılıklarına dayalı olarak pozitif örnekleri dinamik olarak seçer. Bu yöntem, açık hava golf sahnelerinde sıkça karşılaşılan değişken aydınlatma ve çevresel koşullarda sağlam algılamayı sağlar.
1.3 Sınırlayıcı Kutu Tahmini
Dedektör, her karede golferi çevreleyen Sınırlayıcı Kutular çıktı verir. Bu Sınırlayıcı Kutular, Pozisyon Tahmini modelinin çalışacağı alanda mekansal kısıtlamalar sağlayarak, sonraki Pozisyon Tahmini aşamasındaki hesaplama yükünü karenin yalnızca ilgili alanlarına odaklanarak azaltır. Bu bağlamda, RTMDet-M yüksek performanslı donanımda 300 FPS’nin üzerinde gerçek zamanlı olarak Sınırlayıcı Kutular oluşturarak, golf swingin hızlı dinamikleriyle adım adım gidebilmesini sağlar.
1.4 Kişi Non-Maximum Suppression (NMS)
Çok kişili ortamlarda (golf swing analizi için nadir olsa da), RTMDet-M, gereksiz Anahtar Nokta algılamalarını ortadan kaldıran ve herkes için yalnızca en güvenilir algılamaların korunmasını sağlayan bir Pozisyon Non-Maximum Suppression (NMS) algoritması içerir. Bu, kalabalık sahneler veya video dizilerinde çakışan Sınırlayıcı Kutuların algılanabileceği durumlarda kritik öneme sahiptir.
1.5 Eğitim Dataset’i ve Performans
RTMDet-M, Object356 dataset’indeki kişi örneklerinde ikili sınıflandırma görevinde eğitilmiştir.
2. Pozisyon Tahmini Aşaması: RTMPose-X Anahtar Nokta Lokalizasyonu
Golfer için Sınırlayıcı Kutu belirlendikten sonra, sonraki aşama bu bölge içindeki önemli vücut eklemlerinin kesin konumunu tahmin etmeyi içerir. Bu amaç için yüksek performanslı bir Pozisyon Tahmini modeli olan RTMPose-X kullanılır.
2.1 SimCC Tabanlı Anahtar Nokta Lokalizasyonu
RTMPose-X, Anahtar Nokta lokalizasyonunu bir sınıflandırma problemi olarak ele alan SimCC (Simple Coordinate Classification) algoritmasını kullanır. Geleneksel ısı haritası yöntemlerinin aksine, SimCC her Anahtar Noktanın x ve y koordinatlarını bölmelere ayırır ve her Anahtar Noktanın bulunduğu tam bölmeyi sınıflandırır. Bu yaklaşım, hesaplama karmaşıklığını önemli ölçüde azaltır ve insan Pozisyon Tahmini görevleri için yüksek doğruluğu korurken çıkarım hızını iyileştirir.
2.2 CSPNeXt Omurga
RTMDet-M’ye benzer şekilde, RTMPose-X de Pozisyon Tahmini gibi yoğun tahmin görevleri için uyarlanmış CSPNeXt omurgasını kullanır. CSPNeXt omurgası bu senaryoda aşağıdaki nedenlerden dolayı avantajlıdır:
Hafif mimari: Modelin mimarisi parametre sayısını en aza indirmek ve verimli çalışmayı maksimize etmek için tasarlanmıştır, bu da onu gerçek zamanlı uygulamalar için ideal kılar.
Verimli özellik çıkarımı: CSPNeXt’in özellik çıkarımı katmanları yüksek çözünürlüklü görüntüleri işlemek için optimize edilmiştir; bu, golf swingi sırasında bilek, dirsek ve dizler gibi hızla hareket eden vücut parçalarındaki küçük ayrıntıları algılamak için önemlidir.
2.3 Anahtar Nokta Gösterimi
RTMPose-X, aşağıdakiler dahil olmak üzere tüm ilgili vücut parçaları için Anahtar Nokta konumlarını çıktı verir:
Üst Vücut eklemleri: Omuzlar, Dirsekler, Bilekler ve Boyun
Alt Vücut eklemleri: Kalçalar, Dizler ve Ayak Bileği
Ek eklemler: Baş, Omurga ve swing analizi için ilgili diğer önemli noktalar
Giriş görüntüleri için 384x288 çözünürlüğü, eklemlerdeki ince hareketlerin bile doğru bir şekilde yakalamasını sağlarken, sistemin gerçek zamanlı çalışabilme yeteneğini de korur.
2.4 RTMPose ön işleme: Tarafsız Veri İşleme (UDP)
Kırpılmış görüntü RTMPose modeline girmeden önce, Tarafsız Veri İşleme (UDP) adımı gerçekleştirilir. UDP, RTMpose’un eğitim ve test sırasında veri işlemede kritik önyargıları, özellikle Koordinat Sistemi ve Anahtar Nokta format dönüşümlerini ele alır. Geleneksel insan Pozisyon Tahmini boru hatlarında, çevirme ve yeniden boyutlandırma gibi standart operasyonlar, özellikle piksel tabanlı dönüşümler nedeniyle çıktıları yanlış hizalar ve bu da hassasiyet kaybı ve çevrilen görüntülerin yanlış hizalanmasına yol açar. UDP bunu Tarafsız Koordinat Sistemi dönüşümü kurarak düzeltir, temel operasyonlar (kırpma, yeniden boyutlandırma, döndürme, çevirme) sırasında farklı Koordinat Sistemleri arasında anlamsal hizalamayı korur. UDP ayrıca, Anahtar Noktaları yer sapması ortaya çıkarmadan ısı haritalarına kodlayarak Tarafsız Anahtar Nokta format dönüşümünü tanıtır, daha da hassaslaştırılarak Gauss dağılımı farkında bir kod çözme işlemi aracılığıyla. Bu veri işleme yaklaşımı, COCO ve CrowdPose dataset’lerindeki kapsamlı testlerde gösterildiği gibi model performansını sistematik olarak iyileştirir; burada yukarıdan aşağıya ve aşağıdan yukarıya modellerde gelişmiş doğruluk ve azaltılmış çıkarım gecikmesi elde edilmiştir [Ref].
3. Son İşleme ve Pozisyon Rafinemanı
Anahtar Noktalar tahmin edildikten sonra, Pozisyon tahminini rafine etmek ve kareler arasında stabiliteyi sağlamak için birkaç son işleme adımı uygulanır.
3.1 Pozisyon Yumuşatma
Golf swingleri hızlı hareketi içerir; bu da kareler arasında tahmini Anahtar Nokta konumlarında gürültü veya dalgalanmalar ortaya çıkarabilir. Bunu azaltmak için, küçük, fiziksel olmayan Anahtar Nokta tahmin dalgalanmalarının ortadan kaldırılması için Anahtar Nokta trajektori zaman içinde yumuşatılmasını sağlamak amacıyla One-Euro Filtresi uygulanır. One-Euro Filtresi, filtrenin bant genişliğini hareketin hızına göre dinamik olarak ayarlayarak çalışır; bu, hareketi farklı fazlarda (Geri Dönüş, İniş Sürüşü ve Takip Sürüşü) önemli ölçüde değişen golf swingleri gibi senaryolar için idealdir.
3.2 Kare Atlama Mekanizması
Daha ileri optimizasyon için, algılama yalnızca ana karelerde gerçekleştirilen ve Pozisyon Tahmini ara kareler için enterpolasyon yapılan bir kare atlama mekanizması uygulanır. Bu, golf swingin yavaş hızlı analizi gibi kareler arasında sınırlı hareket olan senaryolarda doğruluğu feda etmeden hesaplama yükünü önemli ölçüde azaltır.
4. Zamansal İzleme ve Sıra Tutarlılığı
Golf swingleri yapısal olarak sırasaldır; bu nedenle Pozisyon tahmininde zamansal tutarlılığı korumak hayatidir. RTMPose-X bunu, Anahtar Nokta tahminlerinin ardışık kareler arasında tutarlı olmasını sağlayan zamansal izleme teknikleri aracılığıyla ele alır. Bu, Anahtar Nokta konumlarını zaman içinde izlemeyi ve biomiyometrik kısıtlamalara dayanan gerçekçi hareket paternlerini takip etme traektotilerini sağlamayı içerir.
4.1 Anahtar Nokta Hız ve İvme Analizi
Anahtar Nokta konumlarını izlemenin yanı sıra, RTMPose-X her Anahtar Noktanın Hız ve İvmesini de tahmin eder. Bu bilgi, golf swing dinamiklerini analiz etmek için kritik öneme sahiptir ve aşağıdakiler gibi temel performans metriklerine ilişkin bilgiler sağlar:
Swing Hızı: İniş Sürüşü sırasında bilek Hızına göre hesaplanır.
Kalça Rotasyonu: Kalça Eklemleri Dönme Hızı aracılığıyla analiz edilir.
Baston Yolu ve başlık hızı: Bilek ve Dirsek traektotilerinden dolaylı olarak çıkarılır.
Bu Metrikler, bir oyuncunun Swing Mekaniği hakkında geri bildirim sunmak için profesyonel karşılaştırma ölçütleriyle karşılaştırılabilir.
5. Çıkarım ve Gerçek Zamanlı Performans
Tüm yukarıdan aşağıya Pozisyon Tahmini boru hattı gerçek zamanlı performans için optimize edilmiştir; bu da modern GPU’larda 90 FPS’nin üzerinde Pozisyon Tahmini sağlar. Yüksek verimli model mimarileri (CSPNeXt) ve hızlı çıkarım teknikleri (SimCC) kullanımı, sistemin yüksek kare hızı video girdisini işleyebilmesini sağlayarak, eğitim seansları sırasında gerçek zamanlı geri bildirim için uygun hale getirir.
6. Değerlendirme ve Doğrulama
RTMPose-X ve RTMDet-M modelleri, COCO ve MPII gibi standart dataset’lerde değerlendirilmiş; vücut Anahtar Noktaları için COCO dataset’inde ortalama 75,8% kesinlik (AP) ile güçlü performans göstermiştir. Bu sonuçlar golf swing dataset’lerindeki temel gerçek açıklamalarına karşı doğrulanmış ve dinamik spor hareketlerini yakalamada modelin sağlamlığını garantiye almıştır.
6.1 Performans Metrikleri
Ortalama Kare Hatası (MSE): Anahtar nokta tahminlerinin doğruluğunu temel referans ek açıklamalarına karşı ölçmek için kullanılır.
Ortalama Kesinlik (AP): Pozisyon tahmini modelinin genel performansını değerlendirir.
Kare İşleme Süresi: Sistemin gerçek zamanlı gereksinimleri karşılamasını sağlamak için kıyaslanmıştır (<10 ms kare başına).
7. Sonuç
RTMPose-X ve RTMDet-M kullanılan yukarıdan aşağıya yaklaşımı, spor analitikleri için özellikle golf swing analizi için verimli ve doğru bir gerçek zamanlı pozisyon tahmini yöntemi sağlar. Sağlam anahtar nokta algılama, zamansal izleme ve gerçek zamanlı çıkarımla, bu metodoloji golf swing dinamikleri hakkında detaylı biyomekanik içgörüler sunarak performans iyileştirmesine ve yaralanma önlenmesine yardımcı olur.
Kaynaklar
[1] RTMpose https://arxiv.org/pdf/2303.07399
[2] CSPNeXt https://www.sciencedirect.com/science/article/pii/S0952197624000447
[3] SIMCC https://arxiv.org/abs/2107.03332
[4] RTMdet https://arxiv.org/pdf/2212.07784
[5] CSPDarkNet
[6] Halpe26
[] AI mücadelesi dataset:
[] MS Coco dataset:
[7] Crowdpose dataset: https://arxiv.org/pdf/1812.00324
[] MPII dataset:
[] sub-JHMBD dataset:
[] Halpe dataset:
[] PoseTrack18 dataset:
Object365 veritabanı: https://openaccess.thecvf.com/content_ICCV_2019/papers/Shao_Objects365_A_Large-Scale_High-Quality_Dataset_for_Object_Detection_ICCV_2019_paper.pdf
Son güncelleme: 2025-03-05 | Resmi destek sitesinde görüntüle