GLM 4.5V
Modelo de visión y lenguaje de Z.ai para comprensión de imagen y texto con un contexto de 65k tokens.
Tarjeta del Modelo
GLM-4.5V is a vision-language foundation model for multimodal agent applications. Built on a Mixture-of-Experts (MoE) architecture with 106B parameters and 12B activated parameters, it achieves state-of-the-art results in video understanding,...
Entiende todo el contexto.
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.
Entiende todo el contexto.
Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.