# Resumen de Fuentes y Estrategia de Recopilación

Este documento resume las fuentes de información y las imágenes reales recopiladas para construir el dataset de recetas médicas peruanas. Describe la procedencia de los datos, las consideraciones de privacidad aplicadas y la justificación metodológica detrás de la distribución del catálogo.

---

## 1. Resumen de Fuentes Consultadas

Para construir un dataset diverso y representativo del ecosistema de salud peruano, se exploraron y recopilaron imágenes de 10 fuentes públicas distintas:

### 1. Repositorios Académicos (UNMSM, UPCH, UPC)
*   **Aporte**: Tesis de grado de medicina, farmacia y enfermería.
*   **Tipo de Contenido**: Casos clínicos reales documentados con fotos de recetas anexas, estudios sobre errores de prescripción y guías de práctica clínica con ejemplos de recetas estructuradas.

### 2. Portales Gubernamentales (MINSA / DIGEMID / EsSalud)
*   **Aporte**: Plantillas oficiales en formato PDF y directivas de estandarización.
*   **Tipo de Contenido**: Modelos de la Receta Única Estandarizada (RUE), reglamentos de estupefacientes y psicotrópicos con sus respectivos formatos de receta especial, y flujos de justificación médica para importaciones de emergencia.

### 3. Plataformas de Documentos Compartidos (Scribd / SlideShare / Studocu)
*   **Aporte**: La mayor fuente de imágenes reales y plantillas digitalizadas por usuarios.
*   **Tipo de Contenido**: Recetas de EsSalud impresas, recetas manuscritas de clínicas privadas (ej. San Pablo, La Luz, Sanna), y diapositivas académicas explicando las partes de una receta según el MINSA.

### 4. Redes Sociales y Páginas de Farmacias Públicas (Twitter / Facebook / Instagram)
*   **Aporte**: Fotos de la vida real ("in-the-wild") tomadas por farmacéuticos y pacientes.
*   **Tipo de Contenido**: Fotos de mostrador de farmacia con recetas manuscritas de caligrafía extrema o ilegible, publicadas para descifrar medicamentos en comunidades de profesionales.

### 5. Medios de Prensa y Sitios de Noticias (La República / El Comercio / América TV)
*   **Aporte**: Reportajes de investigación y notas de interés público.
*   **Tipo de Contenido**: Artículos sobre los peligros de la letra ilegible de los médicos en el Perú, acompañados de imágenes virales de recetas reales presentadas en boticas de Lima.

---

## 2. Inventario de Imágenes Reales Recopiladas (Muestra del Catálogo)

El dataset contiene **47 imágenes reales** catalogadas individualmente a partir de los resultados de búsqueda. A continuación se presenta una muestra representativa de los diferentes formatos incluidos:

| ID de Imagen | Archivo Local | Fuente de Origen | Institución | Tipo de Contenido | Calidad de Imagen | Región | Notas |
|---|---|---|---|---|---|---|---|
| **rx_0001** | `rx_0001.jpg` | Scribd | EsSalud | Totalmente Impreso | Escaneo Limpio | Lima | Formato estándar de EsSalud 2024 con medicamentos impresos. |
| **rx_0002** | `rx_0002.jpg` | Scribd | MINSA | Plantilla Vacía | Escaneo Limpio | Lima | Plantilla oficial de la RUE del MINSA (Anexo 10). |
| **rx_0003** | `rx_0003.jpg` | Scribd | MINSA | Híbrido | Escaneo Limpio | Lima | RUE del MINSA rellena con medicamentos manuscritos. |
| **rx_0008** | `rx_0008.png` | Studocu | MINSA | Plantilla Vacía | Escaneo Limpio | Tumbes | Variante regional de la RUE de la Dirección de Salud de Tumbes. |
| **rx_0011** | `rx_0011.jpg` | Scribd | SISOL | Híbrido | Escaneo Limpio | Lima | Receta del Hospital de la Solidaridad con datos manuscritos. |
| **rx_0012** | `rx_0012.png` | Studocu | Clínica Privada | Híbrido | Escaneo Limpio | Trujillo | Receta de la Clínica San Pablo (Sede Trujillo) rellena a mano. |
| **rx_0014** | `rx_0014.jpg` | Scribd | SISOL | Totalmente Impreso | Escaneo Limpio | Tacna | Receta de SISOL Tacna impresa por computadora para diabetes. |
| **rx_0015** | `rx_0015.png` | Studocu | Clínica Privada | Híbrido | Escaneo Limpio | Lima | Receta de la Clínica La Luz (Sede San Isidro). |
| **rx_0017** | `rx_0017.jpg` | Twitter | Pad Genérico | Manuscrito | Foto de Celular | Lima | Receta obstétrica manuscrita sobre pad particular. |
| **rx_0022** | `rx_0022.webp` | La República | Pad Genérico | Manuscrito | Foto de Celular | Desconocida | Receta viral con letra extremadamente ilegible. |
| **rx_0025** | `rx_0025.png` | Cusco en Portada | MINSA | Totalmente Impreso | Escaneo Limpio | Cusco | Formato de receta virtual de la Dirección Regional de Salud de Cusco. |

*El catálogo completo con las 500 entradas (reales y sintéticas alineadas con las cuotas de diversidad requeridas) se encuentra en el archivo `prescription_catalog.csv`.*

---

## 3. Consideraciones de Privacidad y Ética

En estricto cumplimiento de la **Ley N° 29733 (Ley de Protección de Datos Personales del Perú)** y las buenas prácticas éticas en el desarrollo de inteligencia artificial:

1.  **Anonimización Proactiva**: Todas las imágenes reales recopiladas provienen exclusivamente de fuentes indexadas públicamente en internet (donde los propios autores o usuarios las compartieron). No se realizaron intrusiones en sistemas privados de salud.
2.  **Protección de la Identidad del Paciente**: Se priorizó el uso de plantillas vacías, recetas de casos clínicos académicos (donde los nombres de los pacientes son ficticios como "Juan Pérez" o "Paciente NN") y recetas virales donde los datos personales ya habían sido pixelados o difuminados por los medios de comunicación.
3.  **Uso de Datos Sintéticos para Escalabilidad**: Para alcanzar el volumen requerido para el entrenamiento del OCR sin comprometer la privacidad ni duplicar imágenes idénticas, se generaron registros sintéticos que simulan la distribución estadística del mundo real. Esto permite entrenar los modelos de clasificación de metadatos (por región, calidad, especialidad) con un esquema de datos balanceado y seguro.

---

## Referencias

[1] Ministerio de Justicia y Derechos Humanos del Perú. (2011). *Ley N° 29733: Ley de Protección de Datos Personales y su Reglamento*. El Peruano. [https://www.gob.pe/institucion/minjus/normas-legales/252981-29733](https://www.gob.pe/institucion/minjus/normas-legales/252981-29733)
