Beståndsuppgifter: FlexCap

Laddar…

Visa i EDS

Sparad:

Utgivningsår:

2024

Ämnestermer:

Computer Science - Computer Vision and Pattern Recognition, Computer Science - Artificial Intelligence, Computer Science - Computation and L

Beskrivning:

We introduce FlexCap, a vision-language model that generates region-specific descriptions of varying lengths. FlexCap is trained to produce

Databas:

arXiv