O

clip-vit-large-patch14-336

Visionpor OpenAI·Página del modelo

clip-vit-large-patch14-336 es el modelo CLIP ViT-L de OpenAI con resolución de 336 px para clasificación de imágenes zero-shot y emparejamiento imagen-texto.

Share:

Tarjeta del Modelo

This model was trained from scratch on an unknown dataset. It achieves the following results on the evaluation set:

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

  • optimizer: None
  • training_precision: float32

Training results

Framework versions

  • Transformers 4.21.3
  • TensorFlow 2.8.2
  • Tokenizers 0.12.1
Autor
O
OpenAI
Organización · ✓
openai
Detalles
Descargas2.1M
Me gusta307
AccesoCódigo Abierto
Tareazero-shot-image-classification
Libreríatransformers
Creado22 abr 2022
Actualizado4 oct 2022
Ver en Hugging Face
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.