Validación automatizada y auditable de expedientes del Examen Único
Lo que hoy toma semanas de revisión manual se procesa en horas, y cada decisión queda asentada en un registro que no se puede alterar.
Presentación directiva · Colegio de Bachilleres
El proceso hoy
Cada aspirante entrega un expediente: identificación oficial (INE), certificado de estudios y fotografía.
Hoy, una persona revisa cada documento: que esté completo, que se lea bien y que los datos coincidan entre sí.
El volumen llega en olas: miles de expedientes concentrados en unas cuantas semanas, varias veces al año.
Consecuencias del proceso manual
El criterio cambia de un revisor a otro, y hasta dentro de la misma jornada: el cansancio pesa.
No queda evidencia de por qué se aceptó o se rechazó cada expediente.
La gente más experimentada se va en los casos sencillos, en lugar de dedicarse a los difíciles.
Expediente completo, legible y con datos consistentes.
Algo requiere criterio humano: se turna a un revisor con la evidencia ya organizada.
Solo por fallas objetivas y demostrables: falta un documento, no se puede leer, o los datos son inválidos.
Motor de validación. Pasa cada expediente por verificaciones sucesivas y emite un veredicto con su evidencia.
Consola de revisión. Aplicación web donde el equipo ve resultados por periodo, filtra los casos en revisión humana y registra su dictamen final.
Registro de auditoría. Cada decisión, tanto de la máquina como del humano, queda sellada criptográficamente y no puede alterarse después.
Todo opera en la nube de Google (GCP), dentro de la infraestructura del proyecto: los documentos no salen a servicios de terceros.
Puerta de entrada Sin IA
¿Están los tres documentos? ¿Son archivos válidos y legibles?
Extracción con IA de visión IA · solo lectura
Un modelo de visión (Gemini, en Google Cloud) lee los documentos una sola vez y extrae los datos: nombre, CURP, folio, institución, fechas.
Verificaciones con reglas fijas Sin IA
Reglas escritas en código comparan y validan: formato de CURP y folio, que los nombres coincidan entre documentos, vigencias y señales de la fotografía.
Veredicto + registro de auditoría sellado
Cada resultado queda documentado con su evidencia.
El mismo expediente da siempre el mismo veredicto.
Carga. Los expedientes del periodo se suben a la plataforma (carga masiva).
Procesamiento. Vera procesa el periodo completo en la nube, sin que nadie tenga que intervenir.
Resolución automática. La mayoría de los expedientes quedan resueltos: aprobados, o rechazados con causa objetiva.
Revisión enfocada. Los casos marcados para revisión humana aparecen en la consola, con los datos extraídos y la evidencia de cada verificación ya organizada.
Dictamen final. El revisor confirma o corrige; su decisión se registra como un nuevo asiento sellado. El veredicto original nunca se sobrescribe.
Decisiones predecibles
Las reglas de validación son código, no criterio de un modelo: el mismo expediente, procesado dos veces, da exactamente el mismo resultado.
Cientos de pruebas automáticas verifican cada regla cada vez que algo cambia en el sistema.
La extracción con IA de visión es el único componente probabilístico, y está aislado detrás de una interfaz: si mañana existe un modelo mejor, se reemplaza sin tocar las reglas de decisión.
Filosofía conservadora
Vera valida que el expediente esté completo, legible y consistente. No juzga autenticidad: cuando algo es ambiguo, el caso va a revisión humana, nunca a rechazo automático.
El rechazo automático se reserva para fallas objetivas y demostrables: falta un documento, el archivo no se puede leer o los datos son inválidos de origen.
Las señales complementarias, como la comparación facial o el QR del certificado, solo informan al revisor; no vetan a nadie.
Nadie es rechazado por una corazonada de un algoritmo.
Auditoría inmutable
Todo veredicto se guarda con un sello criptográfico (HMAC-SHA256): cualquier modificación posterior al registro es detectable.
En el registro solo se escribe, nunca se borra: los dictámenes humanos se agregan como asientos nuevos y el veredicto original queda intacto.
Cada registro contiene: qué documentos se recibieron, qué datos se extrajeron, qué verificaciones corrieron, qué resultado dio cada una, y quién dictaminó al final.
| Dimensión | Revisión manual | Con Vera |
|---|---|---|
| Velocidad | Semanas por periodo | Horas de procesamiento por lote |
| Consistencia | Varía por revisor, hora y fatiga | El mismo criterio, aplicado idéntico a cada expediente |
| Trazabilidad | Notas dispersas, si existen | Registro sellado e inalterable por cada decisión |
| Escalabilidad | Contratar y capacitar más gente en cada pico | El mismo sistema absorbe el pico; costo marginal mínimo por expediente |
| Uso del talento | Expertos revisando casos triviales | Expertos enfocados solo en los casos que requieren criterio |
| Errores por fatiga | Inevitables en jornadas largas | Inexistentes: el software no se cansa |
| Defensa ante controversias | Palabra del revisor | Evidencia criptográficamente verificable |
Con Vera, revisar deja de ser trabajo de línea de producción y vuelve a ser trabajo de criterio.
Cada caso escalado llega con
Los tres documentos a la vista.
Los datos extraídos de cada uno, lado a lado.
El detalle de cada verificación: cuáles pasaron, cuáles generaron la duda y por qué.
Un flujo de dictamen de un clic, que queda registrado y sellado.
El revisor ya no busca la discrepancia: la discrepancia le llega señalada. Su tiempo se dedica a decidir, no a detectar.
La lectura con IA ocurre dentro de la misma nube (Vertex AI); nada pasa por servicios de terceros.
La consola exige identidad verificada (Google Sign-In) y solo dominios de correo autorizados entran; todo lo demás se rechaza.
Los datos extraídos (CURP, nombres) son visibles solo para los revisores autorizados, dentro de una herramienta interna.
Llaves y credenciales viven en Secret Manager, no en archivos ni en código.
Dónde estamos
El sistema completo ya opera en un ambiente de pruebas en la nube: motor de validación, consola de revisión y registro de auditoría, procesando expedientes reales.
El motor ya pasó varias rondas de pruebas con expedientes reales, además de revisiones de código dedicadas a encontrarle fallas.
Qué sigue antes de operar un periodo oficial
Calibrar las señales consultivas, como la comparación facial, con datos del propio Colbach.
Verificar los certificados directamente contra los portales estatales; hoy el QR es una señal local complementaria.
Definir juntos los umbrales operativos y el protocolo de revisión humana.
Se procesa un periodo (o una muestra) con Vera en paralelo a la revisión manual vigente.
Se comparan resultados: dónde coinciden, dónde difieren y por qué.
Con esa evidencia, se calibran umbrales y se define el modelo operativo: qué decide la máquina, qué decide siempre una persona.
Adopción gradual: primero como asistente del revisor, después como filtro de primera línea.
Cierre
La pregunta no es si automatizar la revisión. Es si cada decisión sobre un aspirante quedará documentada, será consistente y podrá defenderse.
Vera: más rápido que un equipo de revisores, más consistente que cualquier persona, y con memoria perfecta de cada decisión.
Material de respaldo
Láminas de respaldo para preguntas de perfil técnico.
Nube. Google Cloud Platform, región us-central1.
API. Servicio en Cloud Run: contenedores administrados, escala a cero.
Procesamiento por lotes. Cloud Run Job: un trabajo por periodo, ejecutado bajo demanda.
Base de datos. Cloud SQL (PostgreSQL) es la única fuente de verdad; la consola lee de la API, nunca de archivos estáticos.
Consola. SPA (React) servida por Firebase Hosting, con la API bajo el mismo origen.
Extracción de visión. Gemini vía Vertex AI, dentro del perímetro de GCP.
Infraestructura como código. Terraform; despliegue continuo vía GitHub Actions con identidad federada, sin llaves persistentes en el repositorio.
| Capa | Qué hace | Tecnología |
|---|---|---|
| 0a · Intake | Valida estructura del expediente: presencia de los 3 documentos, integridad de archivos, manejo de PDF. | Python puro, sin IA |
| 0b · Extracción | Una sola lectura de visión por expediente: extrae campos de INE, certificado y foto. | Gemini (Vertex AI), con reintentos ante errores transitorios |
| 1–4 · Verificaciones | Formato y validez de CURP/folio, consistencia de nombres entre documentos (con tolerancia a variaciones tipográficas), vigencias, señales de foto y QR. | Python puro, determinista, cubierto por pruebas |
Sello. HMAC-SHA256 con llave gestionada en Secret Manager; el sello se calcula al escribir y se verifica al leer.
Append-only. No existen rutas de UPDATE/DELETE sobre registros de auditoría; los dictámenes humanos son filas nuevas selladas.
Contenido. Documentos recibidos, campos extraídos, resultado de cada verificación con su evidencia, veredicto, marca de tiempo, identidad del dictaminador.
Cualquier alteración posterior del registro invalida el sello y es detectable de inmediato.
Pruebas automatizadas. Batería extensa del motor que corre en cada cambio (integración continua sobre múltiples versiones de Python).
Análisis estático. Tipado verificado (mypy) y linting (ruff) como compuertas obligatorias.
Escaneo de secretos en cada push (gitleaks).
Contrato de API congelado (OpenAPI): la consola se genera contra el contrato; imposible desalinearse silenciosamente.
Diseño por puertos. El motor no depende de librerías pesadas de IA; cada integración (visión, base de datos, nube) es un adaptador reemplazable.
Revisiones adversariales de arquitectura y código, orientadas a encontrar fallas antes de que lleguen a operación.
Implicaciones de diseño
Las discrepancias de identidad (CURP o nombre) van siempre a revisión humana, nunca a rechazo automático.
La comparación facial es una señal consultiva, jamás un veto.
El QR del certificado es una señal local complementaria; la verificación autoritativa contra portales oficiales es un paso futuro explícito.
Este modelo acota la responsabilidad del sistema a lo verificable y deja el juicio donde debe estar: en la institución.