Z

GLM 4.5V

Multimodalpor Z.ai·Página del modelo

Modelo de visión y lenguaje de Z.ai para comprensión de imagen y texto con un contexto de 65k tokens.

Share:

Tarjeta del Modelo

GLM-4.5V is a vision-language foundation model for multimodal agent applications. Built on a Mixture-of-Experts (MoE) architecture with 106B parameters and 12B activated parameters, it achieves state-of-the-art results in video understanding,...

Autor
Z
Z.ai
Organización
z-ai
Detalles
Descargas
Me gusta
AccesoCódigo Abierto
Contexto66K tokens
Precio entrada$0.6 /1M
Precio salida$1.8 /1M
Conocimiento hasta31 dic 2024
Creado11 ago 2025
Actualizado
Ver en Hugging Face
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.