clip-vit-large-patch14-336
clip-vit-large-patch14-336 es el modelo CLIP ViT-L de OpenAI con resolución de 336 px para clasificación de imágenes zero-shot y emparejamiento imagen-texto.
Tarjeta del Modelo
This model was trained from scratch on an unknown dataset. It achieves the following results on the evaluation set:
Model description
More information needed
Intended uses & limitations
More information needed
Training and evaluation data
More information needed
Training procedure
Training hyperparameters
The following hyperparameters were used during training:
- optimizer: None
- training_precision: float32
Training results
Framework versions
- Transformers 4.21.3
- TensorFlow 2.8.2
- Tokenizers 0.12.1
Entiende todo el contexto.
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.
Entiende todo el contexto.
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.