SciELO - Scientific Electronic Library Online

 
vol.1 número1Identificación de grupos estratégicos en Bancos Argentinos utilizando información de Estados FinancierosProyección de Estados Financieros sin Cuentas de Cuadre (Plugs) índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Escritos Contables y de Administración

versión On-line ISSN 1853-2055

Escr. contab. adm. v.1 n.1 Bahía Blanca  2010

 

Planificación Sanitaria Utilizando Herramientas OLAP

Health Planning Using OLAP Tools

Marisa A. Sáncheza, José Natalinib, Pablo Acroglianoc

a Departamento de Ciencias de la Administración, Universidad Nacional del Sur. E-mail: mas@uns.edu.ar.
b Globant Argentina. E-mail: jnatalini@gmail.com.
c Universidad de Buenos Aires. E-mail: pablo.acrogliano@gmail.com

Fecha de recepción: 19/06/2009
Fecha de aceptación: 20/02/2010

Resumen
La tuberculosis es una infección bacteriana que ocasiona más muertes en el mundo que cualquier otra enfermedad infecciosa. El estándar internacional para el control de la tuberculosis es la estrategia Tratamiento Directamente Observado de la Organización Mundial de la Salud que tiene como objetivo reducir la transmisión de la infección gracias a un diagnóstico oportuno y un tratamiento efectivo. El tratamiento se basa en una supervisión estricta de la toma de medicamentos. La supervisión es posible gracias a la disponibilidad de un sistema de información que registra datos de pacientes. Estos datos pueden utilizarse a nivel de puesto sanitario para monitorear el resultado de los tratamientos, a nivel de distrito para identificar problemas, y a nivel provincial o nacional para asegurar el control consistente y de alta calidad en todas las áreas geográficas (World Health Organization, 2007b). En Argentina, el Ministerio de Salud registra datos DOTS desde 1996. El análisis de datos es vital para la toma de decisiones. En este trabajo, presentamos un desarrollo completo de un data warehouse y herramientas de generación de reportes relacionados con el tratamiento de la tuberculosis.

Palabras clave: Administración de empresas; Gestión de TI; Salud

Abstract
Tuberculosis is a bacterial infection that causes more deaths worldwide than any other infectious disease. The international standard for tuberculosis control is the World Health Organization's DOT (Direct Observation of Therapy) strategy aimed at reducing the transmission of the infection through prompt diagnosis and effective treatment. The treatment is based on the strict supervision of medicines intake. This is made possible thanks to the availability of an information system that records patient data. These data can be used at a health post level to monitor treatment outcomes, at a district level to identify local problems as they arise, and at a provincial or national level to ensure consistent high-quality tuberculosis control across geographical areas (World Health Organization, 2007b). In Argentina, the Ministry of Health has been gathering DOTS data since 1996. Data analysis is vital for decision making. In this work, we provide a complete description of a data warehouse and reporting tools for decision support related to tuberculosis treatment.

Keywords: Business administration; IT management; Health

JEL: M15, I1.

Introducción

Las actividades directivas pueden dividirse en tres grupos principales: las correspondientes a las relaciones interpersonales, las que tratan la transmisión de información, y las dedicadas a la toma de decisiones (Mintzbeg, 1991). Los sistemas de información de hace unos años daban apoyo únicamente a las tareas informativas. En los últimos años, los sistemas de información han evolucionado al punto de ser herramientas fundamentales en la toma de decisiones. Se observan grandes cambios en la forma en que los gerentes utilizan los sistemas de información, y los sistemas de Inteligencia de Negocios se convierten en un recurso compartido en toda la organización. Los data warehouses y sus herramientas analíticas mejoran sustancialmente la creación y acceso al conocimiento en toda la organización.

La Inteligencia de Negocios es un conjunto de conceptos, métodos, y tecnologías diseñados para transformar los datos distribuidos en una organización en información útil y, eventualmente, en conocimiento (Hancock, 2006). La mayoría de las organizaciones disponen de varios sistemas de información conocidos como OLTP (por sus siglas en inglés de On-Line Transaction Processing) que dan soporte a los procesos centrales y rutinarios. Si bien estos sistemas son capaces de procesar miles de transacciones individuales, cualquier consulta interesante involucra la unión de varias fuentes de datos. Esto requiere una gran capacidad de procesamiento y que las diferentes fuentes estén integradas en un único sistema transaccional, lo que difícilmente se logra. La solución a este problema es la utilización de un sistema específicamente diseñado para proveer inteligencia de negocios. OLAP (por sus siglas en inglés de On-Line Analytical Processing) es un tipo de tecnología de base de datos diseñada específicamente para inteligencia de negocios y para acceder y analizar los datos en un data warehouse.

Un data warehouse es el lugar donde se logra una vista consistente de todos los datos de una organización. El data warehouse se alimenta de datos provenientes de diferentes fuentes. El modelo conceptual que se utiliza para diseñar una base de datos optimizada para realizar inteligencia de negocios es el modelo multidimensional. La tecnología OLAP constituye el soporte front-end para que los usuarios puedan utilizar los datos, por lo que la funcionalidad de estas herramientas tiene un gran impacto en su trabajo. En particular, en este escrito, para demostrar el impacto que tiene este tipo de tecnologías en la toma de decisiones, consideramos un data warehouse que registra datos de pacientes con tuberculosis.

La tuberculosis es una de las enfermedades que genera mayor mortalidad en los últimos años. El estándar internacional para el control de la tuberculosis es la estrategia World Health Organization's DOT (Direct Observation of Therapy) cuyo objetivo es reducir la transmisión de la infección a través de un diagnóstico rápido y un tratamiento efectivo de pacientes sintomáticos que se presentan en unidades sanitarias. El tratamiento está basado en la supervisión estricta de la toma de medicamentos. La supervisión es posible gracias a la disponibilidad de un sistema de información que registra datos individuales de los pacientes. Estos datos pueden utilizarse para monitorear el resultado de los tratamientos, a un nivel local para identificar problemas locales, regionales o nacionales para asegurar un control de la tuberculosis a través de las áreas geográficas (World Health Organization, 2007b). En Argentina, el Ministerio de Salud registra datos DOTS desde 1996.

Con el objetivo de evaluar el desarrollo de programas de tratamiento, resulta necesario analizar en forma sistemática grandes volúmenes de datos. Los datos registrados por el programa TAES/DOTS siguen la estructura propuesta por la OMS. Se ingresan datos específicos a este tratamiento pero no se incluyen otros datos socio-demográficos, o factores de riesgo que permitan realizar un análisis más completo. Por lo tanto, debemos considerar que los reportes de salud requieren la inclusión de estudios epidemiológicos descriptivos para evaluar los datos.

Esta situación motiva nuestro interés por proveer un sistema de software de apoyo al registro de casos de tuberculosis y a la gestión de un repositorio de datos que pueda ser utilizado para realizar estudios epidemiológicos. A tal efecto, desarrollamos un data warehouse con las facilidades para realizar consultas ad hoc y generar reportes con indicadores predefinidos. Una de las principales características del data warehouse es que facilita la interpretación de los datos señalando si los valores calculados para los indicadores están dentro de los rangos aceptables o reflejan una situación de alerta.

En la siguiente sección presentamos nuestro desarrollo del data warehouse TBC. En la sección 2 resumimos las principales resultados y conclusiones.

2. Proyecto de Inteligencia de Negocios/Data Warehouse

La piedra fundacional para la construcción de un sistema DW/IN (Data Warehouse/Inteligencia de Negocios) es la especificación de los requerimientos organizacionales. Los requerimientos de los usuarios de la salud constituyen la guía para la toma de decisiones tales como la elección de la plataforma de desarrollo, el diseño multidimensional, o cómo presentar los indicadores clave.

La Figura 1 muestra el ciclo de vida para nuestro proyecto de DW/IN que planificamos siguiendo las etapas propuestas por Mundy (2006). El primer eslabón del proceso implica la toma de decisiones sobre el uso de la tecnología: se trata de planificar qué componentes de tecnología Microsoft® se utilizarán y cómo se instalarán y configurarán. El segundo se relaciona con la manipulación de los datos: diseño del modelo multidimensional y desarrollo del sistema ETL para poblarlo. Y el último se vincula con las aplicaciones de inteligencia de negocios para los usuarios finales.

Figura 1: Ciclo de Vida del Proyecto DW/IN
Fuente: Adaptado de Mundy (2006)

2.1. Definición de Requerimientos de la Organización

Uno de los requerimientos críticos para una herramienta que dé apoyo al monitoreo e investigación de los casos de tuberculosis es orientar al usuario en la interpretación de los valores asociados a los indicadores. Ante una consulta, el sistema debe ofrecer los valores calculados y los medios para determinar si esos valores están reflejando un problema. La asistencia para interpretar valores está inspirada en el método Comprehensive Assessment for Tracking Community Health (CATCH) para proveer datos sanitarios completos y objetivos para propósitos de planificación sanitaria (Berndt, 2000; Berndt, 2001), desarrollado en el Center for Health Outcomes Research de la Universidad de South Florida. Una característica distintiva del método CATCH es que utiliza alrededor de 250 indicadores organizados en diez categorías, y utiliza valores de referencia y criterios para filtrar y generar una lista de prioridades sanitarias.

A continuación, describimos los indicadores (Ahmad, 2001; Swaroop, 1964) específicos determinados para nuestro proyecto, y luego, mostramos el soporte para su interpretación.

2.1.1. Definición de Indicadores Anuales

Los indicadores para todas las localidades se calculan en una base anual. La denominación "Población" se refiere a la población de pacientes de tuberculosis, y "Habitantes" a toda la población (sanos y pacientes). Los datos para calcular los indicadores son generados por un sistema transaccional para el Registro de las Fichas DOTS.

Tabla 1: Indicadores por Localidad por Año
Fuente: Elaboración propia

2.1.2. Definición de Dominios e Indicadores para las Localidades

La evaluación de los indicadores específicos para cada localidad puede evaluarse con respecto a los valores correspondientes a las medias de la región, y a un valor que representa un objetivo. Este valor objetivo es un dato que aporta el usuario del sistema y está vinculado con objetivos sanitarios. Utilizamos dos métodos básicos para evaluar la situación relativa de una localidad que describimos a continuación.

La evaluación de las localidades se realiza considerando diferentes dominios; cada uno de éstos, definido por un conjunto de indicadores. En la Tabla 2 incluimos la definición de los dominios e indicadores presentes en el data warehouse.

Tabla 2: Definición de Dominios e Indicadores
Fuente: Elaboración propia

Para cada localidad, consideramos cada dominio y comparamos el valor de los indicadores asociados con respecto a la media de referencia. Se identifican las diferencias superiores a una magnitud d. Para comparar dominios utilizamos las categorías y reglas de decisión incluidas en la Tabla 3.

Tabla 3: Reglas de Decisión para Comparar Dominios
Fuente: Studniki, 2001

2.2. Modelado Multidimensional

El modelo multidimensional constituye una estructura efectiva para organizar las componentes de un data warehouse. En un modelo multidimensional, los datos se almacenan como hechos y dimensiones. Un hecho representa el tema o evento que debe analizarse, y tiene indicadores asociados. Las dimensiones dan contexto a los hechos. Por ejemplo, una venta es un hecho y los indicadores pueden ser la cantidad y el precio; el tiempo y el tipo de productos constituyen dimensiones o perspectivas a partir de las cuales se pueden analizar las ventas. El esquema conceptual utiliza una o más tablas de hechos y otras tablas que representan las dimensiones. Una tabla de hechos es generalmente grande y altamente desnormalizada (Bischoff, 1997).

En este trabajo, el data warehouse está conformado por dos hechos principales: (a) el que agrupa a todos los indicadores (atributos) que representan a un registro (caso) de un paciente con tuberculosis; y (b) el que contiene la información sobre el paciente. A estos hechos, se puede acceder por varias dimensiones: tiempo, tipo de tuberculosis, tipo de paciente, resultado del tratamiento, localidad, resultado de los tests, sexo, ocupación, edad, nacionalidad.

Cambios en las dimensiones

En general, los atributos en las dimensiones no cambian en el tiempo. Por ejemplo, en una dimensión de paciente, la fecha de nacimiento no debiera cambiar en el tiempo (excepto por una corrección de un error). Pero existen otros atributos, tales como el domicilio de un paciente que pueden cambiar durante el transcurso del tratamiento. Muchos de estos cambios son críticos para entender la dinámica de la evolución de la enfermedad. La capacidad para hacer un seguimiento de estos cambios en el tiempo constituye una razón fundamental para la existencia de un sistema DW/IN. Las dimensiones que tienen atributos cambiantes se conocen como slowly changing dimensions (SCD) (Mundy, 2006). Una técnica conocida para administrar esta situación es clasificar a los cambios como de Tipo 1 o 2. Incluso, Microsoft Integration Services®, tiene las técnicas predefinidas. Una SCD de Tipo 1, sobrescribe el valor del atributo con el nuevo valor. Se utiliza si no es necesario hacer un seguimiento histórico de los cambios en el atributo. Caso contrario, hay que utilizar una SCD de Tipo 2. Cuando ocurre un cambio en un atributo Tipo 2, el proceso ETL crea una nueva fila en la tabla de dimensiones para capturar el nuevo valor del atributo. Los atributos de la nueva fila representan la fecha en que ocurre el cambio.

2.3. Diseño de la Arquitectura Técnica y Selección de Implementación

Los productos involucrados en el desarrollo pertenecen al paquete de soluciones DW/IN de Microsoft Corporation®:
- Sql Server 2005. Si bien los datos pueden recuperarse de una variedad de almacenes (Oracle, DB2, etc.), una instalación de Sql Server es conveniente para integrar varias de las herramientas que son parte de una solución de Inteligencia de Negocios.
- Sequel Server Analysis Services 2005 (SSAS): este es el servidor central para la solución de Inteligencia de Negocios. SSAS provee el almacenamiento para los datos almacenados en cubos para el data warehouse.
- Sql Server 2005 Inegration Services (SSIS): este conjunto de herramientas son claves en la mayoría de las soluciones de Inteligencia de Negocios porque se utilizan para importar, limpiar y validar los datos antes de que estén disponibles en el Analysis Services®, es decir, para desarrollar las tareas de extracción, transformación y carga de datos (o actividades ETL por las siglas en inglés de Extract, Transform, and Load).
- Excel 2003 ó 2007: esta es una componente de la solución de Inteligencia de Negocios. Se utiliza como cliente y resulta atractiva por su bajo costo y baja curva de entrenamiento.

La Figura 2 ilustra las tecnologías Microsoft® utilizadas en las diferentes etapas del proyecto DW/IN.

Figura 2: Tecnologías Microsoft® en el Proyecto DW/IN
Fuente: Adaptado de Mundy (2006)

Las características más relevantes que justifican la decisión son las siguientes:
a) Completitud. Se puede construir una solución de IN utilizando únicamente software Microsoft® dado que se cuenta con herramientas que van desde el sistema operativo, el motor de base de datos, el ambiente de desarrollo hasta aplicaciones de escritorio como Excel. Se puede esperar que todas las componentes funcionen mejor juntas.
b) Licencia. Existe un acuerdo académico para utilizar componentes Microsoft® con fines académicos.

2.4. Diseño Físico

La configuración física básica es mínima debido a que el tamaño global del sistema es pequeño atendiendo a los siguientes factores: rango de configuraciones: 32 o 64 bits; volumen de datos (menos de 1M de filas de hechos); complejidad del uso (simple porque las consultas y reportes están predefinidos); número de usuarios (no se requieren usuarios simultáneos); disponibilidad (es aceptable tener varias horas de downtime diarias).

2.5 Diseño y Desarrollo ETL

Una vez que completamos el diseño OLAP debemos mapear los datos desde el sistema origen al modelo OLAP. El origen de datos es un sistema transaccional especialmente diseñado para registrar información de pacientes de tuberculosis. ETL, en el contexto de un proyecto de Inteligencia de Negocios, es el proceso de preparar todas las fuentes de datos para utilizar en un cubo OLAP. Existen numerosas referencias que indican que el 75% del trabajo inicial de un proyecto de inteligencia de negocios consiste del diseño, ejecución y debugging de la etapa de ETL. Este proyecto no ha sido la excepción a esta regla, y si bien los datos provienen de un único sistema, la curva de aprendizaje para dominar SSIS fue considerable.

Los paquetes SSIS son la unidad básica de los procesos ETL. Un paquete contiene cuatro partes fundamentales: flujo de control, flujo de datos, manejadores de errores y configuraciones.

Figura 3: Diagrama de datos ETL
Fuente: Elaboración propia

2.6. Construcción de Cubos Utilizando BIDS

Una vez que tenemos una base dimensional poblada de datos, la utilizamos como origen de datos para definir un cubo. Desde el ambiente BIDS se crea un proyecto Analysis Sevices® y se puede utilizar el Cube Wizard para construir y refinar un cubo.

Una vez que el cubo está procesado se puede visualizar desde una perspectiva de usuario final en una interface de tabla dinámica. La Figura 4 muestra la métrica población con la jerarquía año en las filas de la tabla, la jerarquía sexo en el eje de columnas, y el filtro definido para la población cuya edad es mayor a 15 años.

Figura 4: Navegación en un cubo utilizando BIDS, se puede ver el cubo desde una perspectiva de usuario final
Fuente: Elaboración propia

2.7. Especificación y Desarrollo de la Aplicación de IN

El fin primordial de un data warehouse es ofrecer la infraestructura para que el decisor pueda realizar una exploración ad hoc de grandes volúmenes de datos. El usuario debe tener la capacidad de investigar utilizando herramientas de navegación sin depender en programadores para construir consultas. La Inteligencia de Negocios no es útil si no se ofrece en un formato y ambiente en los cuales el usuario se sienta cómodo.

La mayoría de los usuarios finales de aplicaciones de software se sienten muy cómodos con las aplicaciones del paquete de Microsoft Office®. Las planillas de cálculo constituyen una de las primeras herramientas utilizadas para realizar análisis y reportes ad hoc. En la mayoría de las organizaciones, los decisores dependen de las planillas como repositorios de datos y herramientas de análisis. Por lo tanto, parafraseando a Larson (2006), por qué no permitir incorporar la información de Inteligencia de Negocios en este ambiente amigable y ubicuo.

Excel® permite crear una conexión a un cubo de Sql Server Analysis Services® e importar los datos del cubo a Excel® en una tabla o reporte dinámicos. Creamos un Libro de Trabajo TBC organizado en varias hojas que incluyen "Indicadores Básicos", una hoja para cada uno de los dominios de análisis, una hoja de "Control", y otras para que el usuario ingrese datos sobre metas sanitarias y de población. La Figura 5 ilustra cómo el usuario puede seleccionar años y/o localidades y automáticamente se muestran los valores. Estos valores se recuperan utilizando el cubo como origen de datos. Para cada dominio incluimos una hoja con gráficos predefinidos pero que refrescan sus datos si el usuario cambia la selección de las categorías o series.

Figura 5: Libro de Trabajo TBC - Hoja Indicadores Básicos
Fuente: Elaboración propia

La hoja más elaborada es la hoja "Control", que permite analizar las fortalezas y debilidades de los dominios. A modo de ilustración analicemos el dominio "Enfermedades Infecciosas" visible en la Figura 6. Los datos corresponden a los valores del año 2006 para la ciudad de Bahía Blanca. Los valores de la columna "Metas Sanitarias" se recuperan de la hoja "Metas Sanitarias" (estos son ingresados por el usuario). La columna "Estado" refleja el estado de los valores de la localidad con respecto a la meta sanitaria (ver símbolos y categorías en la Figura 6). El usuario puede seleccionar diferentes años y/o localidades y los datos y estado se actualizan automáticamente. Además, se pueden configurar las reglas que computan el estado cambiando el valor del desvío.

Figura 6: Libro de Trabajo TBC - Hoja Control
Fuente: Elaboración propia

3. Conclusiones

Los resultados sobre los beneficios de la utilización de esta tecnología son preliminares porque la utilización no está completamente integrada a los procesos de decisión. Esto requiere más tiempo. Sin embargo, el desarrollo de este proyecto nos permitió reafirmar nuestra convicción de que para la realización de investigaciones en salud es indispensable el apoyo de sistemas de información adecuados. El registro de casos de tuberculosis y la posibilidad de efectuar consultas ad hoc es de gran asistencia. Pero estas funciones pueden mejorarse para estimular el monitoreo constante de indicadores, la asistencia para identificar problemas y para efectuar una investigación epidemiológica metódica. La visión detrás del desarrollo del data warehouse es crear una herramienta sólida y flexible para incorporar fácilmente nuevos criterios para clasificar los indicadores de salud. A partir de este desarrollo se espera que se agreguen nuevos indicadores y dominios al data warehouse.

Los beneficios derivados del uso de tecnología de información son difíciles de cuantificar debido a que la mayoría son intangibles. Este hecho agregado a la disponibilidad de recursos muy limitados puede atentar contra la continuidad de estos proyectos en el futuro. En este sentido, el reporting basado en Excel® pretende que el diseño de consultas no dependa de personal especializado en informática. De todos modos, el mantenimiento de un data warehouse actualizado requiere de soporte técnico que puede exceder los presupuestos disponibles en organizaciones públicas.

Referencias bibliográficas
1. Ahmad OB (2001). Age standardization of rates: a new WHO standard. Geneve, World Health Organization, (GPE Discussion Paper Series N° 31). Disponible en http://www.who.int/healthinfo/paper31.pdf, accedido el 26 de septiembre de 2008.
2. Berndt D., Hevner, A., y Studnicki, J. (2000). Community Health Assessments: A Data Warehousing Approach. Proc. of the Eight European Conference on Information Systems.
3. Berndt D., Fisher J., Hevner, A., y Studnicki, J. (2001). "Healthcare Data Warehousing and Quality Assurance". IEEE Computer, 34 (12), 56-65.
4. Bischoff J. (1997). Physical design en Data Warehouse: Practical Advice from the Experts. Editores Joyce Bischoff y Ted Alexander. Upper Saddle River, New Jersey: Prentice Hall.
5. Hancock J., Toren R. (2006). Practical Business Intelligence with SQL Server 2005. Addison Wesley Professional, USA.
6. Larson B. (2006). Delivering Business Intelligence with Microsoft SQL Server 2005. USA:Mc Graw Hill/Osborne.
7. Mintzberg H. (1991). La Naturaleza del Trabajo Directivo. Barcelona: Editorial Ariel, S.A.
8. Mundy J., Thornthwaite W. (2006). The Microsoft Data Warehouse Toolkit. Wiley Publishing, Inc.
9. Studnicki J., Hevner A., Berndt D., Luther S. (2001). "Rating the Health Status of U.S. Communities". Managed Care Interface, November, 43-51.
10. Swaroop S. (1964). Estadística Sanitaria. Fondo de Cultura Económica, México.
11. VIGI+A (2002). Programa Nacional de Control de la Tuberculosis. Normas Técnicas 2002. Ministerio de Salud. Programa VIGI+A. República Argentina.
12. World Health Organization (2006). Revised TB recording and reporting forms and registers-version 2006. WHO document WHO/HTM/TB/2006.373.
13. World Health Organization (2007b). Global tuberculosis control: surveillance, planning, financing. Geneve: WHO. WHO document WHO/HTM/TB/2007.376.