Phát hànhtháng 05, 2026
Thứ hạng
Hướng dẫn & Video
Cosmos3-Super-Text2Image là model text-to-image 64B của NVIDIA, thuộc họ Cosmos 3 omnimodal, được fine-tune riêng cho việc tạo ảnh chất lượng cao từ text prompt. Truy cập qua Hugging Face (nvidia/Cosmos3-Super-Text2Image) hoặc triển khai qua NVIDIA NIM microservices. Tính năng nổi bật là agentic upsampling: model repo đi kèm package agentic_upsampling/ giúp tự động cải thiện (JSON-upsample) prompt trước khi generate — đây là bước quan trọng để đạt chất lượng tốt nhất. Phù hợp nhất cho các tác vụ Physical AI như tạo dữ liệu tổng hợp cho robot, xe tự hành, smart infrastructure. Mẹo: đọc AGENTIC_UPSAMPLING.md trong repo trước khi dùng để hiểu cách viết prompt chuẩn.