Lee el Informe — Estado de la IA Aplicada →
CiberseguridadIngeniería de Software

Cómo BigID usa Elasticsearch para acelerar las consultas de datos 120 veces a escala

BigID, plataforma de seguridad de datos, privacidad, cumplimiento normativo y gestión de datos para IA fundada en 2016, desplegó Elasticsearch en Elastic Cloud y AWS para superar la grave degradación del rendimiento de las consultas a medida que crecieron los volúmenes de datos de sus clientes. Al migrar sus módulos principales orientados a datos a Elasticsearch, BigID redujo los tiempos de consulta de 20 minutos a segundos — una mejora de 120 veces —, eliminó todos los timeouts en los módulos de búsqueda, panel y reporting, y construyó una base capaz de gestionar miles de millones de registros con filtrado y agregación complejos.

Impacto

120x

Mejora en la velocidad de consultas

-100%

Tasa de timeouts de consultas

Desafío

A medida que BigID escalaba, su plataforma de almacenamiento existente requería frecuentes migraciones de esquema y adiciones de índices para gestionar los crecientes volúmenes de datos de sus clientes, lo que arruinaba el rendimiento de las búsquedas ad hoc. Las consultas complejas en conjuntos de datos con miles de millones de registros tardaban hasta 20 minutos y frecuentemente generaban timeouts, degradando la experiencia del cliente y bloqueando la velocidad de desarrollo.

Solución

BigID migró sus módulos principales orientados a datos a Elasticsearch en Elastic Cloud y AWS, habilitando búsqueda indexada en tiempo real y análisis de datos no estructurados a cualquier escala, con tuberías configurables por el cliente, filtrado y agregación complejos sobre miles de millones de registros, y paneles de Kibana para analíticas predefinidas y personalizadas.

Herramientas y tecnologías

Lo que dicen los líderes

Las consultas que antes tardaban 20 minutos ahora se ejecutan en cuestión de segundos, 120 veces más rápido: es una mejora enorme.

Tomer Negbi, Director de Ingeniería, BigID

La escalabilidad de Elastic Cloud está perfectamente alineada con las necesidades de nuestros clientes: gestionar grandes volúmenes de datos con detalles complejos y habilitar filtrado y agregación sofisticados.

Tomer Negbi, Director de Ingeniería, BigID
Entiende todo el contexto.

Regístrate para leer casos de estudio completos, acceder a métricas detalladas y recibir todos los reportes.

Historia completa

BigID ayuda a las organizaciones a obtener una visión completa de sus datos dispersos entre entornos cloud, SaaS y locales. Su plataforma permite a los clientes descubrir datos sensibles, abordar vulnerabilidades de seguridad, simplificar el cumplimiento normativo y gobernar los datos de IA de forma eficaz. A medida que la base de clientes de BigID creció y los volúmenes de datos se escalaron, mantener el rendimiento que sus clientes requerían se volvió cada vez más difícil.

El problema central era la búsqueda. La plataforma de almacenamiento de datos existente en BigID requería frecuentes migraciones de esquema y adiciones de índices solo para mantener el ritmo del crecimiento de los volúmenes de datos — un enfoque frágil que se volvió más difícil de sostener a escala. Las búsquedas ad hoc a través de diversos campos de datos eran especialmente problemáticas. Para un cliente del sector asegurador con miles de millones de registros, ejecutar una consulta compleja — como identificar objetos con atributos específicos dentro de un rango de fechas y fuente de datos — habría sido ineficiente y habría requerido una preindexación que podría rivalizar en tamaño con los propios datos. Tomer Negbi, director de Ingeniería de BigID, reconoció que la empresa necesitaba una arquitectura de búsqueda fundamentalmente más escalable.

BigID migró sus módulos orientados a datos a Elasticsearch ejecutado en Elastic Cloud con AWS como proveedor en la nube. La nueva arquitectura permitió a los clientes configurar sus tuberías de datos a través de la interfaz de BigID, especificando fuentes de datos y conectores, con las exploraciones priorizadas según sus necesidades. Elasticsearch gestionó la indexación y el análisis en tiempo real de datos no estructurados a cualquier escala, permitiendo filtrado y agregación complejos sin penalizaciones por preindexación. Los paneles de Kibana predefinidos mostraban las métricas clave, y los clientes podían colaborar con BigID para crear analíticas personalizadas adaptadas a sus requisitos específicos de cumplimiento o riesgo.

La mejora del rendimiento fue inmediata y drástica. Las consultas que antes tardaban 20 minutos ahora se completaban en segundos — 120 veces más rápido. Los timeouts de consultas en los módulos de búsqueda, panel y reportes desaparecieron por completo, sustituidos por respuestas consistentemente rápidas. Esta nueva fiabilidad permitió al equipo de ingeniería de BigID pasar de desarrollar soluciones alternativas a problemas de rendimiento a crear nuevas funcionalidades y capacidades.

BigID y Elastic trabajan estrechamente juntos, con BigID aportando retroalimentación sobre nuevas versiones y Elastic anticipando de forma proactiva las necesidades del producto. Negbi describe la relación como esencial para una empresa donde la innovación rápida es un requisito competitivo. BigID cuenta ahora con una plataforma capaz de gestionar los casos de uso empresariales más intensivos en datos — con filtrado complejo geográfico, regulatorio y basado en riesgo — manteniendo la flexibilidad necesaria para adaptarse a las demandas cambiantes de la seguridad y el cumplimiento de datos.

Casos similares

C
Cogent
97% faster
vulnerability resolution speed

Cogent built an AI-powered cybersecurity platform with Claude as the reasoning layer, reducing critical vulnerability exposure from days/weeks to minutes — a 97% reduction — while reclaiming 40+ hours monthly from manual reporting.

CybersecurityCAClaude API
T
Trellix
Days → minutes
log parsing time

Trellix, a global cybersecurity firm serving 40,000+ enterprise customers, built Sidekick — an internal agentic platform powered by LangGraph and LangSmith — to automate log parsing and security integration development. What previously took engineers 2–3 days per request now takes minutes, and plugin development that spanned multiple days now completes in a single afternoon.

CybersecurityLLangSmithLLangGraph
S
Stairwell
40,000+ characters
security data processed per claude request

Stairwell, a cybersecurity company, integrated Claude into its Maleval threat detection platform to summarize complex security findings for analysts. Claude's large context window allows it to process 40,000+ character API responses in a single pass, converting dense technical data into clear, actionable insights with minimal prompt engineering.

CybersecurityTechnologyCClaude
BL
Bank Leumi
-60%
log detection and analysis time

Bank Leumi, Israel’s leading bank with more than 7,000 employees and $195 billion in assets, replaced its aging SIEM with Elastic Security to gain unified visibility across a cloud-and-on-premises infrastructure generating vast volumes of semi-structured data. By deploying Elastic Security alongside Kibana dashboards and MITRE ATT&CK-aligned detection rules, the bank cut log detection and analysis time by 60%, reduced security incident resolution time by 50%, and lowered total cost of ownership by 40%.

Financial ServicesESElastic SecurityEElasticsearch
L
Lusha
300%
increase in outbound leads

Lusha is a B2B sales intelligence platform with 1.5 million users and a database of over 200 million business contacts. By deploying Elasticsearch as both a full-text search engine and a vector database for AI-powered lead recommendations, Lusha helps customers generate 300% more leads, achieve conversion rates up to 10x higher, and realize return on investment of up to 1,000%.

TechnologyEElasticsearch
V
Vectorize.io
~2 hours
time to deploy ai solution for new client

Vectorize.io is a US-based software company that builds agentic and generative AI infrastructure, helping organizations in law, insurance, and finance make vast volumes of unstructured data usable by large language models. By integrating Elastic’s hybrid search and Elastic Cloud Serverless with Amazon Bedrock, Vectorize deploys production-ready AI solutions for clients in hours rather than weeks. One client whose developer community grew by a million users in a year relied on Vectorize’s real-time learning agent—built on Elasticsearch—to answer support queries and instantly index new answers for future use.

ABAmazon BedrockEElasticsearch
TV
Tinexta Visura
1 hour to 2 full days
legal research time saved per task

Tinexta Visura is an Italian digital trust and technology company that built Lextel AI, a legal research platform for Italian law firms and corporate legal teams. Powered by Elasticsearch, Google Gemini, and retrieval-augmented generation across a repository of 4.8 million legal documents, the platform enables attorneys to locate relevant case law and automatically generate traceable legal opinions. The system reduces attorney research and drafting time by one hour to two full working days per task, depending on complexity.

Legal ServicesGCGoogle CloudEElasticsearch
WE
WP Engine
~5 milliseconds
search query response time

WP Engine, the leading WordPress hosting platform serving more than 1.5 million users across 200,000 websites in 150+ countries, deployed Elastic’s Search AI Platform alongside Google Cloud Vertex AI and Gemini to build Smart Search AI and enable retrieval-augmented generation (RAG) capabilities for its customers. The integration allows WP Engine to deliver natural language search, context-aware product recommendations, and AI-powered chatbots to website owners without requiring them to stitch together multiple vendors. Response times dropped to as low as five milliseconds, and the platform handled traffic spikes from hundreds of thousands to tens of millions of queries per minute with zero downtime.

TechnologyEElasticsearchGVGoogle Vertex AI