Các mô hình được Ultralytics hỗ trợ

Chào mừng bạn đến với tài liệu về các mô hình của Ultralytics! Chúng tôi cung cấp hỗ trợ cho nhiều loại mô hình, mỗi loại được tùy chỉnh cho các tác vụ cụ thể như phát hiện đối tượng, phân đoạn thực thể, phân loại hình ảnh, ước tính tư thế, và theo dõi đa đối tượng. Nếu bạn muốn đóng góp kiến trúc mô hình của mình cho Ultralytics, hãy xem Hướng dẫn đóng góp của chúng tôi.

Biểu đồ so sánh Ultralytics YOLO11

Các mô hình nổi bật

Dưới đây là một số mô hình chính được hỗ trợ:

  1. YOLOv3: Phiên bản thứ ba của dòng mô hình YOLO, ban đầu được phát triển bởi Joseph Redmon, nổi tiếng với khả năng phát hiện đối tượng thời gian thực hiệu quả.
  2. YOLOv4: Bản cập nhật darknet-native cho YOLOv3, được Alexey Bochkovskiy phát hành vào năm 2020.
  3. YOLOv5: Một phiên bản cải tiến của kiến trúc YOLO bởi Ultralytics, mang lại hiệu suất và tốc độ tối ưu hơn so với các phiên bản trước.
  4. YOLOv6: Được Meituan phát hành năm 2022 và đang được sử dụng trong nhiều robot giao hàng tự động của công ty.
  5. YOLOv7: Các mô hình YOLO cập nhật được phát hành vào năm 2022 bởi các tác giả của YOLOv4. Chỉ hỗ trợ suy luận (inference).
  6. YOLOv8: Một mô hình linh hoạt với các khả năng nâng cao như phân đoạn thực thể, ước tính tư thế/điểm đặc trưng, và phân loại.
  7. YOLOv9: Một mô hình thực nghiệm được huấn luyện trên mã nguồn YOLOv5 của Ultralytics, triển khai Programmable Gradient Information (PGI).
  8. YOLOv10: Từ Đại học Thanh Hoa, có tính năng huấn luyện không dùng NMS và kiến trúc hướng đến hiệu quả-độ chính xác, mang lại hiệu suất và độ trễ tiên tiến nhất.
  9. YOLO11: Các mô hình YOLO của Ultralytics mang lại hiệu suất cao cho nhiều tác vụ bao gồm phát hiện, phân đoạn, ước tính tư thế, theo dõi và phân loại.
  10. YOLO26 🚀 MỚI: Mô hình YOLO thế hệ tiếp theo mới nhất của Ultralytics, được tối ưu hóa để triển khai trên thiết bị biên (edge) với suy luận end-to-end không cần NMS.
  11. Segment Anything Model (SAM): Segment Anything Model (SAM) gốc của Meta.
  12. Segment Anything Model 2 (SAM2): Thế hệ tiếp theo của Segment Anything Model của Meta cho video và hình ảnh.
  13. Segment Anything Model 3 (SAM3) 🚀 MỚI: Segment Anything Model thế hệ thứ ba của Meta với Promptable Concept Segmentation cho phân đoạn dựa trên ví dụ văn bản và hình ảnh.
  14. Mobile Segment Anything Model (MobileSAM): MobileSAM dành cho các ứng dụng di động, bởi Đại học Kyung Hee.
  15. Fast Segment Anything Model (FastSAM): FastSAM từ Nhóm Phân tích Hình ảnh & Video, Viện Tự động hóa, Viện Hàn lâm Khoa học Trung Quốc.
  16. YOLO-NAS: Các mô hình Neural Architecture Search (NAS) của YOLO.
  17. Real-Time Detection Transformers (RT-DETR): Các mô hình Transformer phát hiện thời gian thực (RT-DETR) chạy trên PaddlePaddle của Baidu.
  18. YOLO-World: Các mô hình phát hiện đối tượng với vốn từ vựng mở (Open Vocabulary) thời gian thực từ Tencent AI Lab.
  19. YOLOE: Một bộ phát hiện đối tượng với vốn từ vựng mở được cải tiến, duy trì hiệu suất thời gian thực của YOLO trong khi phát hiện các lớp tùy ý nằm ngoài dữ liệu huấn luyện của nó.


Watch: Run Ultralytics YOLO models in just a few lines of code.

Bắt đầu: Ví dụ sử dụng

Ví dụ này cung cấp các ví dụ đơn giản về huấn luyện và suy luận YOLO. Để biết tài liệu đầy đủ về các chế độ (modes) này và các chế độ khác, hãy xem các trang tài liệu Predict, Train, ValExport.

Lưu ý ví dụ dưới đây tập trung vào các mô hình YOLO11 Detect cho phát hiện đối tượng. Đối với các tác vụ được hỗ trợ khác, hãy xem tài liệu về Segment, ClassifyPose.

Ví dụ

PyTorch pretrained *.pt models as well as configuration *.yaml files can be passed to the YOLO(), SAM(), NAS() and RTDETR() classes to create a model instance in Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")

# Display model information (optional)
model.info()

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Đóng góp các mô hình mới

Bạn quan tâm đến việc đóng góp mô hình của mình cho Ultralytics? Tuyệt vời! Chúng tôi luôn cởi mở với việc mở rộng danh mục mô hình của mình.

  1. Fork Repository: Bắt đầu bằng việc fork Ultralytics GitHub repository.

  2. Clone bản Fork của bạn: Clone bản fork của bạn về máy cục bộ và tạo một nhánh mới để làm việc.

  3. Triển khai mô hình của bạn: Thêm mô hình của bạn theo các tiêu chuẩn mã hóa và nguyên tắc được cung cấp trong Hướng dẫn đóng góp của chúng tôi.

  4. Kiểm tra kỹ lưỡng: Đảm bảo kiểm tra mô hình của bạn một cách nghiêm ngặt, cả khi cô lập và là một phần của đường ống xử lý (pipeline).

  5. Tạo Pull Request: Khi bạn hài lòng với mô hình của mình, hãy tạo một pull request tới repository chính để xem xét.

  6. Xem xét mã nguồn & Hợp nhất: Sau khi xem xét, nếu mô hình của bạn đáp ứng các tiêu chí của chúng tôi, nó sẽ được hợp nhất vào repository chính.

Để biết các bước chi tiết, hãy tham khảo Hướng dẫn đóng góp của chúng tôi.

Câu hỏi thường gặp (FAQ)

Mô hình Ultralytics YOLO mới nhất là gì?

Mô hình Ultralytics YOLO mới nhất là YOLO26, được phát hành vào tháng 1 năm 2026. YOLO26 có tính năng suy luận end-to-end không cần NMS, triển khai trên thiết bị biên được tối ưu hóa và hỗ trợ tất cả năm tác vụ (phát hiện, phân đoạn, phân loại, ước tính tư thế và OBB) cùng với các phiên bản vốn từ vựng mở. Đối với các khối lượng công việc sản xuất ổn định, cả YOLO26 và YOLO11 đều là những lựa chọn được khuyến nghị.

Làm thế nào tôi có thể huấn luyện một mô hình YOLO trên dữ liệu tùy chỉnh?

Việc huấn luyện một mô hình YOLO trên dữ liệu tùy chỉnh có thể được thực hiện dễ dàng bằng các thư viện của Ultralytics. Đây là một ví dụ nhanh:

Ví dụ
from ultralytics import YOLO

# Load a YOLO model
model = YOLO("yolo26n.pt")  # or any other YOLO model

# Train the model on custom dataset
results = model.train(data="custom_data.yaml", epochs=100, imgsz=640)

Để biết hướng dẫn chi tiết hơn, hãy truy cập trang tài liệu Train.

Những phiên bản YOLO nào được Ultralytics hỗ trợ?

Ultralytics hỗ trợ một loạt các phiên bản YOLO (You Only Look Once) toàn diện từ YOLOv3 đến YOLO11, cùng với các mô hình như YOLO-NAS, SAM và RT-DETR. Mỗi phiên bản được tối ưu hóa cho nhiều tác vụ khác nhau như phát hiện, phân đoạn và phân loại. Để biết thông tin chi tiết về từng mô hình, hãy tham khảo tài liệu Các mô hình được Ultralytics hỗ trợ.

Tại sao tôi nên sử dụng Nền tảng Ultralytics cho các dự án học máy?

Nền tảng Ultralytics cung cấp một nền tảng no-code, end-to-end để huấn luyện, triển khai và quản lý các mô hình YOLO. Nó đơn giản hóa các quy trình làm việc phức tạp, cho phép người dùng tập trung vào hiệu suất mô hình và ứng dụng. HUB cũng cung cấp các khả năng huấn luyện đám mây, quản lý tập dữ liệu toàn diện và giao diện thân thiện với người dùng cho cả người mới bắt đầu và các nhà phát triển có kinh nghiệm.

Các mô hình Ultralytics YOLO có thể thực hiện những loại tác vụ nào?

Các mô hình Ultralytics YOLO rất linh hoạt và có thể thực hiện các tác vụ bao gồm phát hiện đối tượng, phân đoạn thực thể, phân loại, ước tính tư thế và phát hiện đối tượng định hướng (OBB). Mô hình mới nhất, YOLO26, hỗ trợ tất cả năm tác vụ cộng với phát hiện vốn từ vựng mở. Để biết chi tiết về các tác vụ cụ thể, hãy tham khảo các trang Tác vụ (Task pages).

Bình luận