Q

Qwen2.5 VL 72B Instruct

Multimodalpor Qwen·Página del modelo

Modelo visión-lenguaje de 72B parámetros de Qwen con un contexto de 128K tokens para comprensión multimodal y razonamiento.

Share:

Tarjeta del Modelo

Qwen2.5-VL is proficient in recognizing common objects such as flowers, birds, fish, and insects. It is also highly capable of analyzing texts, charts, icons, graphics, and layouts within images.

Autor
Q
Qwen
Organización
Qwen
Detalles
Descargas
Me gusta
AccesoCódigo Abierto
Contexto131K tokens
Precio entrada$0.8 /1M
Precio salida$1 /1M
Conocimiento hasta30 jun 2024
Creado1 feb 2025
Actualizado
Ver en Hugging Face
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.