Bienes RaícesIngeniería de Software

Cómo AppFolio Redujo la Latencia de LLM un 80–90% con Datadog Observability

AppFolio es una plataforma de gestión inmobiliaria que da servicio a más de 20.000 clientes y más de 8 millones de unidades gestionadas. Tras construir Realm-X Messages —un buzón potenciado por LLM para gestores de propiedades— sobre Amazon Bedrock, AppFolio usó Datadog LLM Observability para identificar cuellos de botella y reducir la latencia un 80–90%, lo que impulsó un aumento del 300% en la adopción del producto y ahorra a los gestores una media de cinco horas semanales.

Impacto

80–90%

Reducción de latencia

300%

Incremento en la adopción del producto

5 hours

Horas ahorradas por gestor de propiedades a la semana

Under 1 week

Tiempo hasta producción tras la configuración de QA

20,000+

Gestores de propiedades en la plataforma

Desafío

AppFolio necesitaba desplegar y escalar un producto de mensajería impulsado por LLM construido sobre Amazon Bedrock, pero sin una solución de observabilidad de IA diseñada ad hoc no podía monitorizar la calidad de las respuestas, identificar cuellos de botella de latencia ni detectar cambios en el comportamiento del modelo.

Solución

AppFolio desplegó Datadog LLM Observability para instrumentar Realm-X Messages con visibilidad a nivel de traza en toda la cadena LLM, permitiendo la monitorización en tiempo real de la latencia, el uso de tokens, las evaluaciones de calidad del modelo y el análisis de clústeres de categorías de temas de residentes.

Herramientas y tecnologías

Lo que dicen los líderes

Datadog LLM Observability nos ayudó a garantizar un alto rendimiento y calidad del modelo, y nos permitió ampliar la funcionalidad de forma rápida y segura.

Teddy Ho, Director Principal de Producto, AppFolio

Con LLM Observability, nuestro equipo puede comprender, depurar y evaluar el uso y el rendimiento de nuestras aplicaciones de IA generativa. Podemos monitorizar la calidad de las respuestas para prevenir interacciones negativas y garantizar que ofrecemos a nuestros usuarios una experiencia positiva.

Kyle Triplett, Vicepresidente de Producto, AppFolio
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

Los gestores de propiedades dedican una parte desproporcionada de su jornada laboral a la correspondencia con los inquilinos. AppFolio, que proporciona la plataforma de software utilizada para gestionar propiedades que van desde alquileres unifamiliares hasta grandes carteras comerciales, identificó claramente este punto de fricción: hasta el 50% de las horas laborales de un gestor de propiedades se destinaban a las comunicaciones con los residentes. Para una plataforma que se enorgullece de maximizar la productividad, eso era una brecha que valía la pena resolver con IA.

AppFolio construyó Realm-X Messages sobre Amazon Bedrock —un buzón potenciado por LLM que organiza los mensajes entrantes, sugiere respuestas y señala los puntos de acción—. La ambición técnica era clara, pero también el desafío: las aplicaciones de LLM son no deterministas. La calidad de las respuestas varía. La latencia aumenta de forma impredecible. Escalar un producto de IA generativa de forma segura requiere una visibilidad que la mayoría de las herramientas de observabilidad no estaban diseñadas para proporcionar.

El equipo eligió Datadog LLM Observability para monitorizar Realm-X Messages desde el principio. La integración con Amazon Bedrock requirió anotaciones de código mínimas, lo que permitió a AppFolio instrumentar toda la cadena LLM —desde las llamadas a funciones hasta la recuperación de documentos y las llamadas al modelo— sin una gran carga de ingeniería. Los paneles de Datadog mostraban las tendencias de latencia y el consumo de tokens a lo largo del tiempo, mientras que las evaluaciones listas para usar señalaban las tasas de toxicidad y de fallo en las respuestas. El mapa de clústeres ayudó al equipo a comprender qué temas de los residentes el modelo gestionaba bien y cuáles necesitaban mejora.

En las primeras fases del lanzamiento, AppFolio detectó una fuerte correlación entre menor latencia y mayor adopción por parte de los usuarios. Usando LLM Observability para rastrear las solicitudes más lentas, el equipo identificó cuellos de botella concretos: prompts ineficientes y llamadas a API lentas dentro de la cadena LLM. La optimización de prompts y las actualizaciones de arquitectura redujeron la latencia entre un 80 y un 90%, lo que se correspondió con un aumento de la adopción de casi el 300%. Tras la configuración inicial de QA, AppFolio pasó Realm-X Messages a producción en menos de una semana.

Hoy, Realm-X Messages ahorra a los gestores de propiedades una media de cinco horas semanales en comunicaciones con residentes, tiempo que se redirige al arrendamiento, la coordinación de mantenimiento y el crecimiento de la cartera. El caso ilustra un patrón más amplio que emerge en el software empresarial: las empresas que desarrollan funcionalidades potenciadas por IA están descubriendo que la calidad de la capa de observabilidad determina si esas funcionalidades escalan del piloto al producto. La capacidad de AppFolio para moverse rápido sin sacrificar la fiabilidad provino directamente de saber, en tiempo real, qué estaba haciendo su LLM.

Casos similares

FD
Fifth Dimension
Days or weeks → 30 minutes
investment memo drafting time

Fifth Dimension, a global AI platform for commercial real estate asset managers and owner-operators, built a multi-model workflow on Google Cloud using Gemini for large-scale document ingestion and Claude for high-precision reasoning. The platform compressed investment memo drafting from days or weeks to just 30 minutes and achieved 99.9% reliability for multi-hour workflows, driving deals with top-10 U.S. asset managers.

Real EstateGCGoogle Cloud StorageGCGoogle Cloud Run
P
Postman
Up to 1,150/year
developer hours saved

Postman selected Claude Opus 4.6 as the default model for Agent Mode, saving developers up to 1,150 hours per year and nearly $1M annually for a 10-person team in API development automation.

TechnologyCAClaude APIABAmazon Bedrock
CA
Cox Automotive
17 (from 57 evaluated)
production ai solutions

Cox Automotive deployed 17 production AI agent solutions using Amazon Bedrock AgentCore, reducing estimate completion from 48 hours to 30 minutes, achieving 3x consumer response rates, and projecting 17,000 hours saved.

AutomotiveABAmazon Bedrock AgentCoreABAmazon Bedrock
N
N26
70%
task automation in targeted processes

N26 deployed Claude via AWS Bedrock across 15+ internal use cases in its first year, automating up to 70% of tasks in targeted customer service processes and cutting manual processing by 50% across 24 European markets. New AI implementations now go from ideation to evaluation in 1–2 weeks.

Financial ServicesABAmazon BedrockCEClaude Enterprise
V
Vectorize.io
~2 hours
time to deploy ai solution for new client

Vectorize.io is a US-based software company that builds agentic and generative AI infrastructure, helping organizations in law, insurance, and finance make vast volumes of unstructured data usable by large language models. By integrating Elastic’s hybrid search and Elastic Cloud Serverless with Amazon Bedrock, Vectorize deploys production-ready AI solutions for clients in hours rather than weeks. One client whose developer community grew by a million users in a year relied on Vectorize’s real-time learning agent—built on Elasticsearch—to answer support queries and instantly index new answers for future use.

ABAmazon BedrockEElasticsearch
NR
Nomura Research Institute
50%
document review time reduction

Nomura Research Institute deployed Claude 3.5 Sonnet via Amazon Bedrock to automate complex Japanese document analysis, cutting review times by 50% for clients in financial, manufacturing, and distribution sectors.

Professional ServicesABAmazon BedrockC3Claude 3.5 Sonnet
TR
Thomson Reuters
3,000+
subject matter experts' knowledge delivered via ai

Thomson Reuters integrated Claude via Amazon Bedrock into its AI platform, CoCounsel, to make the expertise of 3,000+ subject matter experts and 150 years of authoritative content accessible to legal and tax professionals. The solution combines Retrieval-Augmented Generation (RAG) architecture with multi-model deployment to deliver comprehensive, accurate professional analysis. Early adopters report dramatic efficiency gains, with some estimating task time cut in half or more.

Professional ServicesC3Claude 3 HaikuRGRetrieval-Augmented Generation (RAG)
P
Pinterest
17% YoY
revenue growth

Pinterest built an AI-powered discovery engine on AWS processing 18TB daily, delivering 10 million AI recommendations per second across 10,000+ GPU instances, driving 17% revenue growth and 70% AI-driven discovery.

TechnologyAEAmazon EKSASAmazon SageMaker