visual-recognition

Here are 43 public repositories matching this topic...

uglyeyes / FastVGGT

⚡️ Accelerate visual processing with FastVGGT, a training-free method that boosts the efficiency of Visual Geometry Transformers.

machine-learning computer-vision deep-learning tensorflow optimization image-processing pytorch feature-extraction neural-networks image-classification object-detection data-augmentation visual-recognition model-training fast-vggt

Updated Sep 5, 2025
Python

Mengqi-Lei / SoftHGNN

Star

Implementation of the paper "SoftHGNN: Soft Hypergraph Neural Networks for General Visual Recognition".

computer-vision object-detection visual-recognition hypergraph-neural-networks

Updated Aug 11, 2025
Python

iMoonLab / yolov13

Star

Implementation of "YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception".

yolo object-detection visual-recognition real-time-object-detection hypergraph-learning correlation-modelling yolov13

Updated Aug 1, 2025
Python

NVlabs / MambaVision

Star

[CVPR 2025] Official PyTorch Implementation of MambaVision: A Hybrid Mamba-Transformer Vision Backbone

deep-learning transformers image-classification object-detection semantic-segmentation mamba visual-recognition instance-segmentation self-attention hybrid-models huggingface-transformers vision-transformer foundation-models

Updated Jul 22, 2025
Python

NVlabs / FasterViT

Star

[ICLR 2024] Official PyTorch implementation of FasterViT: Fast Vision Transformers with Hierarchical Attention

deep-learning backbone image-classification coco object-detection semantic-segmentation visual-recognition ade20k self-attention image-net pre-trained-model vision-transformer foundation-models

Updated Jul 22, 2025
Python

Transyltooniaa / vr_project

Star

python pytorch lora visual-recognition blip fine-tuning llm

Updated May 18, 2025
Python

OSU-MLB / Fine-Tuning-Is-Fine-If-Calibrated

Star

Official Implementation of "Fine-Tuning is Fine, if Calibrated.", NeurIPS 2024

machine-learning deep-learning transfer-learning visual-recognition domain-adaptation fine-tuning vision-recognition pre-trained-model

Updated Apr 25, 2025
Python

cocoalex00 / Mamba2D

Star

Official PyTorch Implementation of Mamba2D: A Natively Multi-Dimensional State-Space Model for Vision Tasks

computer-vision deep-learning mamba visual-recognition state-space-model self-attention foundation-models

Updated Apr 17, 2025
Python

X-PLUG / mPLUG-Owl

Star

mPLUG-Owl: The Powerful Multi-modal Large Language Model Family

Updated Apr 2, 2025
Python

Aayush-Bhargav / VR_Assignment1_AayushBhargav_IMT2022089

Star

This contains the codes for VR-Assignment1 - Coin Detection and Counting and Image Stitching

python3 image-stitching visual-recognition coin-detection

Updated Mar 2, 2025
Python

Build Change - Post-Disaster Rapid Response Retrofit. Following Build Change's main premise to Build Disaster Resistant Buildings and Change Construction Practices Permanently, PD3R Team's main objective is to improve the safety conditions of buildings and reduce human and economic loss after the occurrence of a natural disaster.

android machine-learning visual-recognition call-for-code build-change

Updated Oct 31, 2024
Python

tigaue / uncanny-valley-in-clip

Star

Data repository for "Signatures of the uncanny valley effect in an artificial neural network", Computers in Human Behavior, 2023

sentiment-analysis artificial-neural-network visual-recognition uncanny-valley

Updated Oct 26, 2024
Python

whwu95 / GPT4Vis

Star

GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition?

visual-recognition video-recognition point-cloud-classification prompt-engineering gpt-4-vision-preview

Updated May 22, 2024
Python

NVlabs / GCVit

Star

[ICML 2023] Official PyTorch implementation of Global Context Vision Transformers

deep-learning backbone imagenet coco object-detection semantic-segmentation visual-recognition ade20k self-attention pre-train pre-trained-model imagenet-classification vision-transformer

Updated Dec 22, 2023
Python

Heathcliff-saku / ViewFool_

Star

This repository contains the ViewFool and ImageNet-V proposed by the paper “ViewFool: Evaluating the Robustness of Visual Recognition to Adversarial Viewpoints” (NeurIPS2022).

visual-recognition robustness ood-generalization neurips2022 viewpoint-changes