Guía de entrevistas técnicas de Bases de Datos

Lista de Preguntas


¿Qué es el teorema CAP?

El Teorema CAP, también conocido como Teorema de Brewer, es un principio en el diseño de sistemas distribuidos que establece que es imposible para un sistema de datos distribuido garantizar simultáneamente las tres propiedades siguientes:

  • Consistencia (Consistency): Todos los nodos en el sistema ven los mismos datos al mismo tiempo. En otras palabras, la consistencia garantiza que una operación de lectura devuelve el valor más reciente de una escritura.
     

  • Disponibilidad (Availability): Cada solicitud de lectura o escritura en el sistema recibe una respuesta sin garantía de que contenga el valor más reciente. En este contexto, la disponibilidad significa que cada nodo que recibe una solicitud puede dar una respuesta, ya sea que esté completamente actualizado o no.
     

  • Tolerancia a particiones (Partition Tolerance): El sistema sigue siendo operativo incluso cuando las comunicaciones entre los nodos se ven afectadas o se produce la partición de la red. Esto significa que el sistema puede seguir funcionando aunque algunos nodos no puedan comunicarse entre sí.

El teorema CAP fue propuesto por Eric Brewer en una conferencia en 2000 y tiene implicaciones importantes para el diseño de sistemas distribuidos. Brewer argumenta que, en un entorno distribuido, es posible garantizar cualquier combinación de dos de las tres propiedades mencionadas, pero no las tres simultáneamente.

Cuando un sistema enfrenta una partición de red (es decir, no puede garantizar tolerancia a particiones), debe elegir entre consistencia y disponibilidad. Esta elección se vuelve crucial en situaciones en las que la red puede dividirse en segmentos y los nodos en esos segmentos necesitan tomar decisiones sobre la consistencia y la disponibilidad.

Este teorema ha influido en la arquitectura y diseño de sistemas distribuidos, y muchas soluciones y bases de datos distribuidas están diseñadas tomando en cuenta las implicaciones del Teorema CAP. 

Algunos sistemas pueden priorizar la consistencia, mientras que otros pueden priorizar la disponibilidad, dependiendo de los requisitos específicos de la aplicación. 

Ejemplos de bases de datos distribuidas que abordan estas consideraciones son Apache Cassandra (que prioriza disponibilidad y tolerancia a particiones) y MongoDB (que prioriza la consistencia y la tolerancia a particiones).

 

Whatsapp Mentores Tech