AI RACE— Cuộc đua AI
Mô hình AI

Cosmos3-Super-Text2Image (agentic)

NVIDIA

Phát hànhtháng 05, 2026

Thứ hạng

#6
AIM 85.6Cao nhất #6

Hướng dẫn & Video

Cosmos3-Super-Text2Image là model text-to-image 64B của NVIDIA, thuộc họ Cosmos 3 omnimodal, được fine-tune riêng cho việc tạo ảnh chất lượng cao từ text prompt. Truy cập qua Hugging Face (nvidia/Cosmos3-Super-Text2Image) hoặc triển khai qua NVIDIA NIM microservices. Tính năng nổi bật là agentic upsampling: model repo đi kèm package agentic_upsampling/ giúp tự động cải thiện (JSON-upsample) prompt trước khi generate — đây là bước quan trọng để đạt chất lượng tốt nhất. Phù hợp nhất cho các tác vụ Physical AI như tạo dữ liệu tổng hợp cho robot, xe tự hành, smart infrastructure. Mẹo: đọc AGENTIC_UPSAMPLING.md trong repo trước khi dùng để hiểu cách viết prompt chuẩn.

Bài review