B

UI-TARS 7B

Multimodalpor ByteDance·Página del modelo

Modelo multimodal de 7B parámetros de ByteDance para comprensión de interfaces gráficas e interacción automática con UI.

Share:

Tarjeta del Modelo

UI-TARS-1.5 is a multimodal vision-language agent optimized for GUI-based environments, including desktop interfaces, web browsers, mobile systems, and games. Built by ByteDance, it builds upon the UI-TARS framework with reinforcement...

Autor
B
ByteDance
Organización
bytedance
Detalles
Descargas
Me gusta
AccesoCódigo Abierto
Contexto128K tokens
Precio entrada$0.1 /1M
Precio salida$0.2 /1M
Conocimiento hasta31 ene 2025
Creado22 jul 2025
Actualizado
Ver en Hugging Face
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.