# Análisis de Plantillas y Formatos de Recetas Médicas en el Perú

Este documento proporciona un análisis estructural y visual detallado de las plantillas y formatos estándar de recetas médicas utilizadas en el Perú. El objetivo es identificar las regiones de interés (ROI), campos obligatorios, variables de diseño y desafíos caligráficos clave que un modelo de Reconocimiento Óptico de Caracteres (OCR) debe resolver para lograr una digitalización precisa.

---

## 1. Estructura de la Receta Única Estandarizada (RUE)

La **Receta Única Estandarizada (RUE)**, regulada por el Ministerio de Salud (MINSA) [1] y la Dirección General de Medicamentos, Insumos y Drogas (DIGEMID) [2], es el formato obligatorio para todas las instituciones del sector público (MINSA, EsSalud, SISOL, Sanidad de las Fuerzas Armadas y Policía Nacional) y sirve como base para muchas clínicas privadas.

Visualmente, la RUE se divide en dos secciones principales dispuestas horizontalmente (formato autocopiativo): **Cuerpo de la Prescripción** (izquierda, retenido por la farmacia) e **Indicaciones** (derecha, entregado al paciente).

```
+--------------------------------------------------+--------------------------------------------------+
|               ESTABLECIMIENTO DE SALUD           |               ESTABLECIMIENTO DE SALUD           |
|            RECETA ÚNICA ESTANDARIZADA            |            RECETA ÚNICA ESTANDARIZADA            |
|                  (PRESCRIPCIÓN)                  |                 (INDICACIONES)                   |
+--------------------------------------------------+--------------------------------------------------+
|  [1. Datos del Paciente e Institución]           |  [1. Datos del Paciente e Institución]           |
|  Nombre, Edad, DNI, H.C., Fecha, Diagnóstico     |  Nombre, Edad, DNI, H.C., Fecha, Diagnóstico     |
+--------------------------------------------------+--------------------------------------------------+
|  [2. Tabla de Prescripción (Rp.)]                |  [3. Tabla de Indicaciones (Sig.)]               |
|  - Medicamento (DCI Obligatorio)                 |  - Medicamento (DCI)                             |
|  - Concentración y Forma Farmacéutica            |  - Dosis, Vía de Administración                  |
|  - Cantidad Total Prescrita                      |  - Frecuencia y Duración                         |
+--------------------------------------------------+--------------------------------------------------+
|  [4. Firma y Sello del Prescriptor]              |  [4. Firma y Sello del Prescriptor]              |
|  Firma manual, Sello con CMP/RNE, Fecha de Venc. |  Firma manual, Sello con CMP/RNE, Próxima Cita   |
+--------------------------------------------------+--------------------------------------------------+
```

---

## 2. Análisis de Campos Clave y Regiones de Interés (ROI)

Para el entrenamiento de un modelo de OCR basado en detección de objetos y reconocimiento de texto, se definen las siguientes Regiones de Interés (ROI) críticas en los formatos peruanos:

### ROI 1: Cabecera y Datos del Paciente
*   **Campos**: Nombre de la IPRESS (Institución Prestadora de Servicios de Salud), Nombre y Apellidos del Paciente, Edad, Sexo, Documento de Identidad (DNI/CE), Número de Historia Clínica (H.C.), y Fecha de Emisión.
*   **Desafíos OCR**: En formatos impresos, los datos del paciente suelen rellenarse a mano con bolígrafo azul o negro. La alineación del texto manuscrito con las líneas guía preimpresas suele ser deficiente (el texto flota o se superpone con las etiquetas preimpresas).

### ROI 2: Diagnóstico y Código CIE-10
*   **Campos**: Descripción del diagnóstico (manuscrito o impreso) y casillas específicas para el código alfanumérico **CIE-10** (generalmente 3 o 4 caracteres en cuadrículas individuales, ej. `| I | 1 | 0 |`).
*   **Desafíos OCR**: Las cuadrículas del CIE-10 son pequeñas. El texto manuscrito dentro de estas casillas suele presentar caracteres conectados, salirse de los bordes o ser omitido por el médico, escribiendo solo el diagnóstico en texto libre.

### ROI 3: Cuerpo de Prescripción (Rp.)
*   **Campos**: Columnas de Medicamento (Denominación Común Internacional - DCI obligatoria por ley [3]), Concentración (ej. *500 mg*), Forma Farmacéutica (ej. *Tableta*), y Cantidad (escrita en números arábigos o romanos, ej. *N° 15* o *XV*).
*   **Desafíos OCR**: Es la zona más densa y crítica. La caligrafía médica manuscrita aquí presenta el mayor desafío de legibilidad del proyecto. Los nombres de marcas comerciales a veces se escriben entre paréntesis debajo del genérico (ej. *Amoxicilina (Amoxil)*).

### ROI 4: Firma, Sello y Colegiatura del Médico
*   **Campos**: Firma manuscrita del profesional y la impresión del sello de tinta. El sello es de vital importancia porque contiene:
    1.  Nombre completo del médico.
    2.  Número de **Colegio Médico del Perú (CMP)** (5 o 6 dígitos).
    3.  Número de **Registro Nacional de Especialista (RNE)** (si aplica).
*   **Desafíos OCR**: El sello de tinta suele superponerse con la firma manuscrita y con las líneas preimpresas del pie de página. La tinta puede estar corrida, incompleta o desvaída. Extraer el número de CMP del sello es un requisito legal clave para validar la receta en la farmacia.

---

## 3. Comparativa de Formatos por Institución

Los diferentes proveedores de salud en el Perú presentan variaciones significativas en el diseño y la calidad de sus recetas, lo que impacta directamente en la estrategia de procesamiento de imágenes.

| Tipo de Formato | Institución | Nivel de Estructura | Tipo de Relleno Común | Calidad de Imagen Típica | Principales Desafíos para OCR |
|---|---|---|---|---|---|
| **RUE Oficial** | MINSA / Hospitales Regionales | Alta (Tablas y casillas estrictas) | Manuscrito o Híbrido | Media (Fotos de celular arrugadas o con sombras) | Contraste bajo por papel autocopiativo (hojas amarillas/rosas), caligrafía deficiente. |
| **RUE EsSalud** | Seguro Social (EsSalud) | Muy Alta (Formato A4 vertical completo) | Totalmente Impreso (Fully printed) | Alta (PDFs nativos o capturas de pantalla) | Ruido de fondo por marcas de agua, códigos de barras o códigos QR que se superponen con el texto. |
| **RUE SISOL** | Hospital de la Solidaridad | Alta (Formato compacto) | Híbrido o Impreso | Alta/Media (Fotos de mostrador de farmacia) | El logo azul de SISOL puede interferir con la segmentación de texto en la cabecera. |
| **Recetario Privado** | Clínicas Principales (San Pablo, La Luz, etc.) | Media/Alta | Híbrido o Impreso | Alta (Scans limpios o fotos bien iluminadas) | Gran diversidad de logotipos y diseños de cabecera; uso de marcas comerciales en lugar de genéricos DCI. |
| **Pad Particular** | Consultorios Independientes | Baja (Solo líneas guía o blanco) | Enteramente Manuscrito | Variable (Fotos de celular con ángulos y sombras) | Ausencia total de estructura de tabla; caligrafía cursiva extrema; falta de campos estándar como CIE-10. |

---

## 4. Desafíos Caligráficos y de Calidad de Imagen para OCR

Para lograr un sistema de OCR robusto en farmacias peruanas, el modelo de machine learning debe estar entrenado para mitigar los siguientes factores observados en el dataset recopilado:

### 1. Caligrafía Médica Extrema (Handwriting)
*   **Descripción**: La "letra de médico" es un problema universal pero crítico en recetas manuscritas de pads particulares y hospitales del MINSA [4].
*   **Mitigación OCR**: El modelo no debe depender únicamente del reconocimiento de caracteres individuales (character-level OCR), sino integrar modelos de lenguaje (N-gramas o Transformers como RoBERTa/mBERT) adaptados al vocabulario médico peruano (ver `peru_rx_vocabulary.md`) para realizar corrección contextual de palabras completas.

### 2. Papel Autocopiativo de Baja Calidad
*   **Descripción**: Las recetas del MINSA suelen ser copias de carbón (hojas amarillas, verdes o rosadas). El texto transferido suele ser tenue, borroso o presentar doble trazo si la hoja se movió durante la escritura.
*   **Mitigación OCR**: Aplicar técnicas de preprocesamiento de imágenes como binarización adaptativa (Otsu binarization), eliminación de canales de color de fondo (para aislar la tinta azul/negra) y normalización de contraste antes de alimentar el motor de OCR.

### 3. Condiciones de Captura en Farmacias (Phone Photos)
*   **Descripción**: En el mundo real, las recetas son fotografiadas por los dependientes de farmacia en el mostrador bajo condiciones de iluminación deficientes (luces fluorescentes que causan reflejos en el papel brillante, sombras de las manos o del teléfono, ángulos de inclinación severos y desenfoque por movimiento).
*   **Mitigación OCR**: Incorporar en el pipeline de datos una red de rectificación de perspectiva (como Spatial Transformer Networks) para enderezar la imagen y corregir la distorsión trapezoidal antes del análisis estructural.

---

## Referencias

[1] Ministerio de Salud del Perú (MINSA). (2022). *Directiva Administrativa N° 323-MINSA-DIGEMID-2022: Estándar de transacción electrónica de la receta electrónica*. [https://www.digemid.minsa.gob.pe/Archivos/Normatividad/2022/ANEXO_RM_079-2022-MINSA.pdf](https://www.digemid.minsa.gob.pe/Archivos/Normatividad/2022/ANEXO_RM_079-2022-MINSA.pdf)

[2] Dirección General de Medicamentos, Insumos y Drogas (DIGEMID). (2026). *Formatos y Trámites - Modelo de Receta Única Estandarizada*. [https://www.digemid.minsa.gob.pe/webDigemid/tramites-persona-natural/](https://www.digemid.minsa.gob.pe/webDigemid/tramites-persona-natural/)

[3] Congreso de la República del Perú. (2024). *Ley N° 32033: Ley que garantiza el acceso a medicamentos genéricos en Denominación Común Internacional (DCI)*. El Peruano. [https://www.digemid.minsa.gob.pe/webDigemid/acceso-y-uso/listado-de-medicamentos-esenciales-genericos/](https://www.digemid.minsa.gob.pe/webDigemid/acceso-y-uso/listado-de-medicamentos-esenciales-genericos/)

[4] América Televisión. (2023). *¿Por qué la letra del médico puede poner en riesgo la salud del paciente? Campañas de receta legible en el Perú*. [https://www.americatv.com.pe/letra-medico-paciente](https://www.americatv.com.pe/letra-medico-paciente)
