CARACTERIZAÇÃO DAS INTERNAÇÕES POR INFARTO AGUDO DO
MIOCÁRDIO NO ESTADO DO RIO DE JANEIRO POR MEIO DE ANÁLISE DE
CORRESPONDÊNCIA MÚLTIPLA E DISTÂNCIA DE TOLERÂNCIA
Felipe Machado Huguenin
Dissertação
de
Mestrado
apresentada
ao
Programa de Pós-graduação em Engenharia
Biomédica, COPPE, da Universidade Federal do
Rio de Janeiro, como parte dos requisitos
necessários à obtenção do título de Mestre em
Engenharia Biomédica.
Orientadores: Antonio
Fernando
Catelli
Infantosi.
Renan Moritz Varnier Rodrigues
de Almeida.
Rio de Janeiro
Outubro de 2011
CARACTERIZAÇÃO DAS INTERNAÇÕES POR INFARTO AGUDO DO
MIOCÁRDIO NO ESTADO DO RIO DE JANEIRO POR MEIO DE ANÁLISE DE
CORRESPONDÊNCIA MÚLTIPLA E DISTÂNCIA DE TOLERÂNCIA
Felipe Machado Huguenin
DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO
LUIZ COIMBRA DE PÓS-GRADUAÇÃO E PESQUISA DE ENGENHARIA
(COPPE) DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE
DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE
EM CIÊNCIAS EM ENGENHARIA BIOMÉDICA.
Examinada por:
________________________________________________
Prof. Antonio Fernando Catelli Infantosi, Ph.D.
________________________________________________
Prof. Roberto Macoto Ichinose, D.Sc.
________________________________________________
Profa. Rejane Sobrino Pinheiro, D.Sc
________________________________________________
Profa. Maria Stella de Castro Lobo, D.Sc.
RIO DE JANEIRO, RJ - BRASIL
OUTUBRO DE 2011
Huguenin, Felipe Machado
Caracterização das internações por infarto agudo do
miocárdio no Estado do Rio de Janeiro por meio de
Análise de Correspondência Múltipla e Distância de
Tolerância / Felipe Machado Huguenin – Rio de Janeiro:
UFRJ/COPPE, 2011.
XII, 73 p.: il.; 29,7 cm.
Orientadores: Antonio Fernando Catelli Infantosi.
Renan Moritz Varnier Rodrigues de
Almeida.
Dissertação (mestrado) – UFRJ/ COPPE/ Programa
de Engenharia Biomédica, 2011.
Referências Bibliográficas: p. 65-71.
1. Acessibilidade em saúde. 2. Infarto Agudo do
Miocárdio 3. Análise de Correspondência. 4. Distância de
Tolerância I. Infantosi, Antônio Fernando Catelli et al.. II.
Universidade Federal do Rio de Janeiro, COPPE,
Programa de Engenharia Biomédica. III. Título.
iii
Este trabalho é dedicado aos meus pais,
Miguel e Maria Teresa, minhas jóias raras.
Dedicado, ainda, à minha irmã, Érica, ao
meu cunhado, Raphael e a minha tão
amada sobrinha, Maria Clara.
iv
Agradecimentos:
À Deus em sua Trindade Santa, acima de tudo, pelo dom da vida, sempre
presente em todos os momentos da minha existência, cujo amor, bondade e
compreensão tornaram tudo possível.
Aos meus orientadores, Professor Dr. Renan Moritz Varnier Rodrigues de
Almeida e Professor Dr. Antonio Fernando Catelli Infantosi, que me estimularam desde
o início quando tudo parecia muito mais difícil, e que se tornaram mais do que simples
professores, mas incentivadores na busca por novos conhecimentos. Agradeço pelos
ensinamentos e pela experiência passada, que transcenderam os limites acadêmicos, mas
formaram para a vida.
Às professoras Rosimary Almeida e Rejane Pinheiro. Esta por disponibilizar o
banco de dados fruto de suas pesquisas no Instituto de Estudos em Saúde Coletiva
(UFRJ), que serviu de base para este trabalho e pelos conhecimentos passados. Aquela
por cumprir com maestria a sua função de mestre, mostrando-me como ser um professor
melhor, e acima de tudo por estar sempre com a mão amiga estendida para auxiliar.
A todos os professores do Programa de Engenharia Biomédica da COPPE/UFRJ,
pelos conhecimentos repassados e pela dedicação, o que mantém o curso como um dos
melhores do Brasil.
Aos integrantes do Laboratório de Engenharia de Sistemas de Saúde (LESS) e
dos demais laboratórios do PEB, que, com certeza, oportunizaram a conclusão deste
trabalho. Em especial a Aline Nascimento e ao João Carlos Gama, que por meio das
conversas, possibilitaram o surgimento e o aprimoramento de idéias, e a Nárrima,
Fernanda , Bruno e Francisco, pelas conversas e conselhos, meu sincero muito obrigado.
Aos funcionários administrativos, eficientes nas suas tarefas, mas acima de tudo
pessoas amigas com paciência inesgotável para resolverem nossos problemas.
v
Aos meus familiares e amigos, pelo apoio, incentivo e exemplos de vida.
Aos amigos do Centro Educacional de Santíssimo, do Centro de Estudos de
Jovens e Adultos da Secretaria de Estado de Educação do Rio de Janeiro e do
Laboratório de Biomecânica e Comportamento Motor da Universidade do Estado do
Rio de Janeiro, sempre compreensivos e interessados nos meus estudos.
Finalmente, citando-os mais uma vez, agradeço aos meus pais, pela
compreensão, apoio e carinho, que tornam a caminhada da vida mais tranquila e feliz. À
minha irmã, Érica e ao meu cunhado, Raphael, pela amizade e companheirismo.
vi
Resumo da Dissertação apresentada à COPPE/UFRJ como parte dos requisitos
necessários para a obtenção do grau de Mestre em Ciências (M.Sc.)
CARACTERIZAÇÃO DAS INTERNAÇÕES POR INFARTO AGUDO DO
MIOCÁRDIO NO ESTADO DO RIO DE JANEIRO POR MEIO DE ANÁLISE DE
CORRESPONDÊNCIA MÚLTIPLA E DISTÂNCIA DE TOLERÂNCIA
Felipe Machado Huguenin
Outubro/2011
Orientadores: Antonio Fernando Catelli Infantosi.
Renan Moritz Varnier Rodrigues de Almeida.
Programa: Engenharia Biomédica
Doenças coronarianas, como o Infarto Agudo do Miocárdio (IAM), têm um grande impacto
financeiro sobre o sistema de saúde, constituindo-se em cerca de 5% dos gastos com internação. O
presente trabalho tem como objetivo caracterizar as internações dos pacientes do Sistema Único de
Saúde por IAM, no Estado do Rio de Janeiro, por meio da identificação de agrupamentos sugeridos
por uma Análise de Agrupamentos tradicional e por uma Análise de Correspondência Múltipla
(ACM) associada a um índice heurístico de proximidade (Distância de Tolerância), e tendo como
variável de maior interesse o gasto hospitalar. Investigou-se a existência de associação entre as
categorias das variáveis, e, como decorrência, pôde-se associar maiores gastos com a utilização de
CTI e com o uso de tecnologias de moderada complexidade, e menores com uso de tecnologias de
baixa complexidade e não utilização de CTI. Por outro lado, a utilização de tecnologias de alta
complexidade apresentou-se isolada, sem associação aparente com CTI ou com as demais variáveis.
Também foi detectada associação entre a categoria “menores gastos” e as seguintes categorias: nãodeslocamento do paciente, sexo feminino, idade entre 56 e 75 anos, óbito até trinta dias e óbito até
um ano. A metodologia proposta mostrou-se uma ferramenta útil para caracterizar as internações,
podendo contribuir para o processo de tomada de decisão por parte dos gestores em saúde e
ratificando a importância da utilização de técnicas exploratórias para avaliação de serviços de saúde
e análise de dados epidemiológicos.
vii
Abstract of Dissertation presented to COPPE/UFRJ as a partial fulfillment of the
requirements for the degree of Master of Science (M.Sc.)
CHARACTERIZATION OF ADMISSIONS FOR ACUTE MYOCARDIAL
INFARCTION IN RIO DE JANEIRO STATE USING MULTIPLE
CORRESPONDENCE ANALYSIS AND TOLERANCE DISTANCE
Felipe Machado Huguenin
October/2011
Advisors:
Antonio Fernando Catelli Infantosi.
Renan Moritz Varnier Rodrigues de Almeida.
Program: Biomedical Engineering
Coronary heart diseases, like Acute Myocardial Infarction (AMI) have a large financial
impact on the Brazilian Unified Health System (SUS), constituting about 5% of hospital admissions.
This study aims to characterize the admissions of Brazilian Health System patients with AMI in Rio
de Janeiro State, through the identification of clusters suggested by a traditional grouping analysis
and a Multiple Correspondence Analysis (MCA) associated with a heurist index for similar
categories (Tolerance Distance); the variable of greatest interest is “hospital spending”. Concerning
the association between variable categories, “higher costs” are associated with “use of ICU
(Intensive Care Unit)” and “use of technologies of moderate complexity”, and “lower costs” were
also associated with “use of technologies of low complexity” and “not using ICU”. On the other
hand, cases of “use of technologies of high complexity” were non-clustered, with no apparent
association with “use of ICU” or other categories. Other identified associations were “lower costs”
and “no patient travelling”, “female”, “age between 56 and 75 years”, “death within thirty days” and
“death within one year”. The proposed methodology proved to be a useful tool to characterize the
hospital admissions profile and may contribute to decision making by managers and professionals
inside the Brazilian Health System, confirming the importance of the use of exploratory techniques
for evaluation of health services and epidemiological data analysis.
viii
SUMÁRIO
1
2
3
Introdução .................................................................................................................... 1
1.1
Objetivo ............................................................................................................... 3
1.2
Estrutura do trabalho ............................................................................................ 3
Infarto Agudo do Miocárdio ......................................................................................... 5
2.1
Epidemiologia ...................................................................................................... 5
2.2
Fisiopatologia ..................................................................................................... 12
2.3
Diagnóstico, condição de acesso e uso de tecnologias ......................................... 15
Técnicas Multivariadas e aplicações ao IAM .............................................................. 17
3.1
Análise de Correspondência Múltipla ................................................................. 18
3.1.1
4
Distância de Tolerância............................................................................... 28
3.2
Cluster Hierárquico ............................................................................................ 30
3.3
Aplicação de Técnicas Multivariadas ao IAM ..................................................... 31
Materiais e Métodos ................................................................................................... 39
4.1
Base de Dados do IAM ....................................................................................... 39
4.1.1
4.2
Seleção das variáveis .................................................................................. 39
Aplicação da ACM ............................................................................................. 45
5
Resultados.................................................................................................................. 47
6
Discussão ................................................................................................................... 55
7
Conclusão .................................................................................................................. 63
8
Referências Bibliográficas.......................................................................................... 65
9
Anexo I ...................................................................................................................... 72
ix
LISTA DE FIGURAS
Figura 2.1 – Evolução da mortalidade proporcional segundo causas, Brasil.
7
Figura 2. 2 – Mortalidade proporcional segundo causas selecionadas, Brasil.
7
Figura 2. 3 – Volume de internações e óbitos por IAM, 1998 e 2008, RJ.
11
Figura 2. 4 – Gastos em reais com internações por IAM, 1998 e 2008, RJ.
11
Figura 2.5 – Diagrama do coração humano.
12
Figura 2.6 – Irrigação sanguínea do coração – circulação coronariana.
13
Figura 3.1 – Mapa de Correspondência gerado pelo programa R 2.11.1.
24
Figura 3.2 – Matriz indicadora ou Matriz disjunta.
25
Figura 3.3 – Matriz padronizada G.
26
Figura 4.1 – Fluxograma da seleção das variáveis.
41
Figura 5.1 – Mapa de Correspondência gerado por meio da ACM.
48
Figura 5.2 – Ampliação do Mapa de Correspondência.
49
Figura 5.3 – Gráfico de barras mostrando as associações encontradas.
52
Figura 5.4 – Dendrograma.
53
Figura 5.5 – Gráfico de análise do comportamento do nível de fusão.
54
x
LISTA DE TABELAS
Tabela 2.1 – Óbitos segundo o capítulo CID 10, Brasil, 1998 e 2008.
8
Tabela 3.1 – Tabela de contingência.
19
Tabela 3.2 – Probabilidades marginais de linhas e colunas.
19
Tabela 3.3 – Valores esperados em cada casela.
20
Tabela 3.4 – Perfis de linha.
21
Tabela 3.5 – Perfis de coluna.
21
Tabela 3.6 – Frequências relativas.
22
Tabela 4.1 – Frequências absolutas e relativas das variáveis.
44
Tabela 5.1 – Associações encontradas para a variável desfecho.
51
xi
LISTA DE ABREVIATURAS E SIGLAS
AC
Análise de Correspondência
ACM
Análise de Correspondência Múltipla
AIH
Autorizações de Internação Hospitalar
AnC
Angioplastia Coronariana
BBS
Bulletin Board System
BVS
Biblioteca Virtual em Saúde
CEP
Comitê de Ética e Pesquisa
COPPE
Instituto Alberto Luiz Coimbra de Pós-graduação e Pesquisa de Engenharia
CTI
Centro de Tratamento Intensivo
DCNT
Doenças Crônicas Não-Transmissíveis
DIC
Doenças Isquêmicas do Coração
DIM
Dimensão
DIP
Doenças Infecto-parasitárias
DVS
Decomposição em Valores Singulares
EEAN
Escola de Enfermagem Anna Nery
IAM
Infarto Agudo do Miocárdio
IC
Intervalo de Confiança
InC
Insuficiência Coronariana
OMS
Organização Mundial de Saúde
OR
Odds Ratio
PEB
Programa de Engenharia Biomédica
ROC
Receiver Operator Characteristic
RVM
Revascularização Miocárdica
SIH
Sistema de Informações Hospitalares
SIM
Sistema de Informações sobre Mortalidade
SUS
Sistema Único de Saúde
UFRJ
Universidade Federal do Rio de Janeiro
xii
1 INTRODUÇÃO
A partir da década de 1960, o cenário epidemiológico mundial revela uma
diminuição das doenças infecto-parasitárias (DIP) e um crescimento das Doenças
Crônicas Não-Transmissíveis (DCNT), das quais as doenças do aparelho circulatório
merecem destaque devido à sua grande magnitude (OMS, 2011). Em 2004, segundo
estimativas da Organização Mundial da Saúde (OMS), 17,1 milhões de indivíduos
morreram devido a doenças cardiovasculares, sendo, aproximadamente, 7,2 milhões por
doença cardíaca coronariana. Atualmente, estima-se que cerca de 20 milhões de
indivíduos sofram de doenças do aparelho cardiovascular em todo mundo, dos quais,
aproximadamente, 12 milhões são vítimas fatais de Infarto Agudo do Miocárdio (IAM)
(OMS, 2011).
De modo similar ao que vem ocorrendo mundialmente, o Brasil tem revelado
uma alteração no perfil de morbi-mortalidade da sua população. Enquanto em 1930 as
doenças do aparelho circulatório representavam somente 12% das mortes da população,
em 2003 já respondiam por cerca de 31% dos óbitos (MALTA et al., 2006). Mais
recentemente (2008), houve 318 mil mortes (152 mil mulheres e 166 mil homens) por
doenças do aparelho circulatório no país, das quais quase 75 mil por ocorrência de IAM
(MINISTÉRIO DA SAÚDE, 2011).
Também em 2008 foram registradas cerca de um milhão e cem mil internações
devido a estas doenças, com gastos totais em torno de um bilhão e seiscentos milhões de
reais (MINISTÉRIO DA SAÚDE, 2011). Assim, as doenças coronarianas têm um
grande impacto financeiro sobre o sistema de saúde, constituindo-se em cerca de 5%
dos gastos com internação (OLIVEIRA et al., 2006). Dado esse alto custo, é de especial
importância identificar variáveis que possam caracterizar ou prever esses gastos.
1
Ao mesmo tempo, a facilidade de acesso aos bancos de dados de utilização de
serviços de saúde e a necessidade de justificar o uso crescente de recursos, como
sempre, escassos, têm promovido um aumento no número de estudos sobre alocação de
recursos em saúde no Brasil (RAMIARINA et al., 2006). A melhor distribuição destes
recursos permitiria atender às premissas do Sistema Único de Saúde (SUS):
universalidade (saúde é direito de todos), equidade (diminuição das desigualdades
sociais) e integralidade (as ações de saúde devem ser combinadas e voltadas para a
prevenção, promoção e reabilitação dos pacientes).
Neste contexto, várias técnicas estatísticas têm sido propostas para análise de
dados e auxílio à tomada de decisão na área de saúde (ESCOSTEGUY et al., 2002;
MELO et al., 2004; ESCOSTEGUY et al., 2005). Uma destas, a Análise de
Correspondência Múltipla (ACM), que consiste basicamente na representação da
posição relativa de variáveis em um Espaço Euclidiano, possui grande potencial para
esse tipo de análise, no entanto, sua utilização ainda não é tão empregada. Esta técnica
possibilita a visualização de relações entre as categorias de variáveis, sugerindo
associações com base na distância entre elas (quanto mais próximas, maior a
probabilidade de estarem associadas), sem necessidade de suposições como de
gaussianidade e linearidade dos dados (LE ROUX e ROUANET, 2004; GREENACRE,
2007). Assim, a ACM pode ser empregada não somente como técnica exploratória, mas
também com vistas a sugerir associações entre categorias de variáveis.
No entanto, como a avaliação de proximidade entre as categorias no “mapa de
correspondência” (o espaço Euclidiano onde as variáveis são representadas), é, em
geral, subjetiva, é necessário o desenvolvimento de índices que permitam uma avaliação
mais objetiva das associações na ACM. Um exemplo é o índice heurístico de
proximidade, baseado em uma distância Euclidiana ponderada, denominado Distância
2
de Tolerância (COSTA et al., 2008; ALMEIDA et al., 2009), o qual demanda ainda
validação e investigação adicional, de forma a garantir e estender a sua aplicabilidade.
1.1 Objetivo
Caracterizar as internações dos pacientes do SUS por IAM, em municípios do
Estado do Rio de Janeiro, por meio da identificação de agrupamentos sugeridos pela
ACM e por um índice heurístico de proximidade – a Distância de Tolerância. Deste
modo, espera-se obter informação que venha a contribuir com o uso mais eficiente dos
recursos relativos às doenças do aparelho circulatório, principalmente do IAM, bem
como auxiliar na tomada de decisão por parte dos gestores em saúde.
O trabalho possui como objetivos específicos:
1. Averiguar e identificar, por meio da metodologia proposta, as possíveis
categorias de variáveis em associação, utilizando-se como variável
desfecho: gastos com paciente internado por IAM;
2. Comparar os resultados do método da Distância de Tolerância (COSTA
et al., 2008; ALMEIDA et al., 2009) com os obtidos por meio da técnica
de Cluster Hierárquico;
3. Desenvolver e validar, por meio da técnica de bootstrap, o método da
Distância de Tolerância (COSTA et al., 2008; ALMEIDA et al., 2009),
proposto para facilitar a identificação de associações entre as categorias
de variáveis estudadas.
1.2 Estrutura do trabalho
O presente trabalho é descrito em tópicos, com a introdução ao IAM no Capítulo
2, ressaltando a sua epidemiologia, fisiopatologia e diagnóstico. A introdução às
técnicas de análise multivariadas é abordada no Capítulo 3, tanto em relação à Análise
3
de Correspondência (Simples e Múltipla) quanto à Distância de Tolerância e quanto a
Análise de Agrupamento (Cluster Hierárquico). O Capítulo 4 apresenta a descrição
completa dos dados (critérios de inclusão e exclusão e pré-processamento) e os
procedimentos utilizados para o desenvolvimento da pesquisa, além da descrição do
programa utilizado para as análises estatísticas. No Capítulo 5 são apresentados os
resultados da Análise de Correspondência Múltipla em conjunto com a Distância de
Tolerância e da Análise de Agrupamentos Hierárquicos. O Capítulo 6 apresenta a
discussão dos resultados, comparando-os aos estudos expostos no Capítulo 3. Além
disto, são apresentadas as conclusões e sugestões para os futuros trabalhos nesta linha
de pesquisa.
4
2 INFARTO AGUDO DO MIOCÁRDIO
Este capítulo aborda o Infarto Agudo do Miocárdio. De início, é exposto o
processo de transição epidemiológica (a modificação do perfil de morbi-mortalidade de
uma população), apresentando o cenário epidemiológico relacionado ao IAM, tanto no
mundo, quanto no Brasil e, em especial, no Estado do Rio de Janeiro. A seguir, serão
apresentados os principais conceitos fisiopatológicos e de diagnóstico de infarto. Além
disso, a condição de acesso e o uso de tecnologias relacionadas a esta doença também
serão abordadas.
2.1 Epidemiologia
Em termos epidemiológicos, a partir da década de 1960 observam-se dois
processos de transição que produziram importantes mudanças no perfil das doenças da
população mundial. Um processo é denominado “transição demográfica”, com uma
significativa diminuição das taxas de fecundidade, natalidade e aumento progressivo na
expectativa de vida, caracterizando um crescente aumento do quantitativo de idosos em
relação aos demais grupos etários; enquanto que o segundo, denominado “transição
epidemiológica”, é representado pelo perfil de morbi-mortalidade da população, que
vem sofrendo alterações (MINISTERIO DA SAÚDE, 2005).
O cenário epidemiológico mundial revela uma diminuição das DIP e um
crescimento das DCNT. Estas são doenças multifatoriais, com interação entre vários
fatores, caracterizadas por: “história natural prolongada, longo curso sem sintomas e
período clínico lento, prolongado e permanente; manifestação clínica com períodos de
remissão ou exacerbação; lesões celulares irreversíveis; e evolução para graus variados
de incapacidade ou morte” (ROUQUAYROL & ALMEIDA FILHO, 2003).
5
Neste contexto, entre as DCNT, as doenças do aparelho circulatório têm a maior
magnitude (OMS, 2011). Atualmente, estima-se que cerca de 20 milhões de indivíduos
sofram de doenças do aparelho cardiovascular em todo mundo, dos quais,
aproximadamente, 12 milhões são vítimas fatais de IAM (OMS, 2011). Baseado nos
atuais padrões, a OMS estima cerca de 23 milhões de óbitos por doenças
cardiovasculares em 2030 (OMS, 2011).
Seguindo a tendência mundial, o cenário epidemiológico brasileiro revela uma
diminuição das DIP e um crescimento das DCNT, representado, principalmente, pelo
aumento das doenças do aparelho circulatório. A Figura 2.1 apresenta a evolução da
mortalidade segundo causas no Brasil de 1930 a 2003 e a Tabela 2.1 mostra o panorama
dos óbitos, em números absolutos, segundo o capítulo CID-10 no Brasil nos anos de
1998 e 2008 (MINISTÉRIO DA SAÚDE, 2011).
Assim, pode-se dizer que as doenças cardiovasculares representam quase um
terço das mortes no Brasil (Figura 2.2) (MINISTÉRIO DA SAÚDE, 2004). No entanto,
o processo de transição epidemiológica brasileiro não pode ser visto de forma
homogênea, como se ocorresse da mesma forma em todas as regiões (SCHRAMM et
al., 2004). Devido às diferenças culturais, históricas e sociais, as situações
epidemiológicas de diferentes regiões tornam-se contrastantes, apresentando um modelo
polarizado, com fases de transição distintas no mesmo país. Regiões de menor
desenvolvimento socioeconômico podem experimentar a convivência com doenças
infecto-parasitárias (DIP), enquanto regiões mais desenvolvidas podem apresentar um
aumento das doenças crônicas não-transmissíveis (DCNT).
6
Fonte: Sistema de Informações sobre Mortalidade (SIM) – Ministério da Saúde – 2004.
Figura 2.1 – Evolução da mortalidade proporcional segundo causas, Brasil.
Fonte: Sistema de Informações sobre Mortalidade (SIM) – Ministério da Saúde – 2004.
Figura 2.2 – Mortalidade proporcional segundo causas selecionadas – Brasil 2003.
7
Tabela 2.1 – Óbitos segundo o capítulo CID-10 – Brasil 1998 e 2008.
Capítulo CID-10
1998
2008
I. Algumas doenças infecciosas e parasitárias
48.792
47.295
II. Neoplasias (tumores)
110.799
167.677
III. Doenças do sangue
4.173
5.825
IV. Doenças endócrinas; nutricionais e metabólicas
39.841
64.631
V. Transtornos mentais e comportamentais
5.478
11.852
VI. Doenças do sistema nervoso
10.872
21.609
VII. Doenças do olho e anexos
21
39
VIII. Doenças do ouvido e da apófise mastóide
117
125
IX. Doenças do aparelho circulatório
256.511
317.797
X. Doenças do aparelho respiratório
91.983
104.989
XI. Doenças do aparelho digestivo
40.739
55.272
XII. Doenças da pele e do tecido subcutâneo
1.447
2.642
XIII. Doenças do sistema osteomuscular e tecido conjuntivo
2.076
4.094
XIV. Doenças do aparelho geniturinário
12.878
19.790
XV. Gravidez, parto e puerpério
1.997
1.691
XVI. Algumas afec. originadas no período perinatal
36.221
26.080
XVII. Malformação congênita; anomalias cromossômicas
9.331
10.502
XVIII. Sint. sinais e achad. anorm. Ex. clín. e laborat.
140.929
79.161
XX. Causas externas de morbidade e mortalidade
117.690
135.936
Fonte: Sistema de Informações sobre Mortalidade (SIM) – Ministério da Saúde – 2011.
8
Segundo o MINISTÉRIO DA SAÚDE (2011), registraram-se cerca de 255 mil
óbitos ocasionados por doenças cardiovasculares em 1998. Uma década depois, em
2008, ocorreram, aproximadamente, 318 mil mortes (152 mil mulheres e 166 mil
homens), por doenças do aparelho circulatório, das quais, aproximadamente, 75 mil por
ocorrência de infarto. Este aumento mostra-se proporcional ao crescimento
demográfico, revelando uma possível estabilização do processo, provavelmente com a
ajuda dos conhecimentos acumulados nos últimos anos, não só na terapêutica como
também na prevenção da doença.
Ao mesmo passo que os óbitos aumentaram, as internações hospitalares por
doenças do aparelho circulatório também cresceram. Em 1998 foram registradas um
pouco mais de um milhão de internações devido a estas doenças, enquanto que, em
2008, este quantitativo ampliou para cerca de um milhão e cem mil internações. Estimase que o total de gastos que era de aproximadamente 575 milhões de reais em 1998
elevou-se para cerca de 1 bilhão e 600 milhões de reais em 2008 (MINISTÉRIO DA
SAÚDE/SIH/SUS, 2011). Crescimento ainda maior foi registrado com relação às
internações por IAM. Em 1998, ocorreram quase 35 mil internações (5.717 óbitos),
enquanto que, em 2008, perto de 62 mil foram registradas (8.510 óbitos). Os gastos,
neste período, passaram de, aproximadamente, 27 milhões de reais para 150 milhões de
reais (MINISTÉRIO DA SAÚDE/SIH/SUS, 2011). Esse acréscimo nos gastos talvez
não decorra somente do aumento no número de internações, mas sim também da
incorporação de novas tecnologias na terapêutica cardiovascular, as quais são em geral
mais dispendiosas e complexas (RIBEIRO et al., 2005).
No Estado do Rio de Janeiro, o panorama epidemiológico não difere do
nacional. Segundo o MINISTÉRIO DA SAÚDE (2011), em 1998 ocorreram 34.314
9
óbitos por doenças do aparelho circulatório, e, em 2008, este quantitativo ampliou-se
para 37.080 óbitos. Ao mesmo tempo em que os óbitos totais cresceram no Estado, as
internações diminuíram e os gastos aumentaram. Em 1998, foram registradas pouco
mais de 90 mil internações (9.808 óbitos), enquanto que em 2008, perto de 76 mil
internações foram notificadas (6.608 óbitos). Os gastos passaram de, aproximadamente,
54 milhões de reais para 115 milhões de reais (MINISTÉRIO DA SAÚDE/SIH/SUS,
2011).
Ao passo que as internações por doenças do aparelho circulatório diminuíram no
Estado do Rio de Janeiro, especificamente nos casos de internação por IAM, esse
quantitativo aumentou. Em 1998, ocorreram 3.888 internações, sendo que 678 pacientes
foram a óbito, enquanto que, em 2008, 4.759 internações foram registradas, das quais
683 óbitos. Juntamente com este aumento, ampliaram-se também os gastos hospitalares,
que passaram de, aproximadamente, 3,2 milhões de reais para 6,6 milhões de reais, no
mesmo período de tempo (MINISTÉRIO DA SAÚDE/SIH/SUS, 2011). Observa-se, a
partir destes dados, que os aumentos no número de pacientes internados e nos gastos
não foram proporcionais. Enquanto as internações cresceram cerca de 22%, o aumento
dos gastos está em torno de 100%. Isto indica que esse aumento não deve estar somente
relacionado ao crescimento quantitativo das internações, mas também à incorporação de
novas tecnologias. A Figura 2.3 mostra o volume de internações e óbitos por IAM e a
Figura 2.4 apresenta os gastos em reais com internações por IAM, ambas relacionadas
ao Estado do Rio de Janeiro nos anos de 1998 e 2008.
10
5000
4500
4000
3500
3000
Internação
2500
Óbito
2000
1500
1000
500
0
1998
2008
Fonte: Adaptado de Ministério da Saúde – Sistema de Informações Hospitalares do SUS, 2011.
Figura 2.3 – Volume de internações e óbitos por IAM nos anos de 1998 e 2008, RJ.
Gastos em R$
R$ 7.000.000,00
R$ 6.000.000,00
R$ 5.000.000,00
R$ 4.000.000,00
Gastos em R$
R$ 3.000.000,00
R$ 2.000.000,00
R$ 1.000.000,00
R$ 0,00
1998
2008
Fonte: Adaptado de Ministério da Saúde – Sistema de Informações Hospitalares do SUS, 2011.
Figura 2.4 – Gastos em reais com internações por IAM nos anos de 1998 e 2008.
11
2.2 Fisiopatologia
A cardiopatia isquêmica é a causa de morte mais comum na sociedade ocidental
(Guyton e Hall 2006). Parte destas mortes ocorre abruptamente, como consequência da
oclusão coronária aguda ou da fibrilação do coração, enquanto outras ocorrem
lentamente, ao longo do período de semanas ou anos, em consequência do
enfraquecimento progressivo do mecanismo de propulsão do sangue. A figura 2.5
apresenta de forma esquemática o coração humano.
Fonte: Wikicommons – Wikimedia.org – 2011.
Figura 2.5 – Diagrama esquemático do coração humano. A circulação sanguínea pode
ser dividida em dois grandes circuitos: circulação pulmonar, o sangue sai do ventrículo
direito, passa pela artéria pulmonar, chega aos pulmões, retorna pelas veias pulmonares
e chega ao átrio esquerdo; circulação sistêmica, o sangue sai do ventrículo esquerdo,
passa pela artéria aorta, chega aos outros sistemas fisiológicos, retorna pelas veias cavas
e chega ao átrio direito.
12
A insuficiência coronária aguda ocorre quando o miocárdio fica privado de
oxigênio por um extenso período e consegue restabelecer oxigenação. No entanto,
quando o músculo cardíaco fica em isquemia intensa e contínua, causando lesões
irreversíveis das células miocárdicas, apresenta-se o quadro clínico de IAM. Lesões
teciduais irreversíveis originadas ao miocárdio ocorrem quando uma artéria coronária
principal ou um de seus ramos sofre oclusão (Figura 2.6), que pode ser desencadeada
por um coágulo sanguíneo, ou por lesões ateroscleróticas, ou, ainda, por uma partícula
da placa ateromatosa que se desprende do seu local de origem e bloqueia uma
ramificação.
Fonte: MSDONLINE – Manual Merck saúde para família, 2011.
Figura 2.5 – Irrigação sanguínea do coração – circulação coronariana.
13
Com a prática de exercícios extenuantes ou quando se é acometido por uma
anemia profunda e súbita, o miocárdio necessita de uma maior quantidade de oxigênio
para manter as suas funções fisiológicas. Caso o aporte de oxigênio ao miocárdio fique
acentuadamente comprometido, mesmo com as artérias coronárias preservadas, ou seja,
com funcionamento fisiológico normal, pode ocorrer o infarto.
Com o IAM, três áreas do tecido lesado tornam-se aparentes, sendo bem
distintas umas das outras. A primeira é a área da necrose, na qual as células do
miocárdio encontram-se irreversivelmente lesadas. Ao redor destas células, encontra-se
a área de tecido não-funcional, devido à incapacidade de contração e de condução de
impulso nervoso, mas que pode ser recuperada se a oxigenação for adequadamente
restabelecida. Mais ao redor, encontra-se a terceira área, que ainda mantém contração,
porém fracamente, na qual a recuperação do tecido isquêmico é mais fácil (GUYTON e
HALL, 2006)
Quanto à espessura do IAM, pode-se classificá-lo em: transmural, quando a
lesão ocorre em todas as camadas do músculo cardíaco, possivelmente afetando a
função propulsora do coração; ou, subendocárdico, quando só atinge as camadas
internas do miocárdio, não comprometendo os movimentos cardíacos.
Além destas classificações, o IAM pode ser classificado quanto à localização da
lesão. Denomina-se: infarto anterior, quando a obstrução encontra-se na artéria
descendente anterior; infarto anterolateral, quando ocorre a obstrução da artéria
diagonal; infarto inferior, quando a obstrução ocorre na coronária direita ou nos ramos
da artéria circunflexa.
Quanto à sintomatologia, nem todos os pacientes têm dor no peito de forma
intensa e aguda. Os sintomas do infarto podem variar de pessoa para pessoa, e entre os
sintomas mais comuns, pode-se citar: angina peitoral ou desconforto torácico, dor
14
concentrada diretamente abaixo do esterno, com características de pressão ou aperto,
que pode ser irradiada para o braço e para o pescoço; e sensação de desconforto nos
ombros, costas, mandíbula ou no estômago. A dor pode ser acompanhada por náuseas,
vômitos, sudorese excessiva, tonturas e desmaios. Palidez da pele, inquietação,
palpitações e dispnéias também podem ocorrer (WERF et al., 2003; BERTRAND et al.,
2002).
2.3 Diagnóstico, condição de acesso e uso de tecnologias
Um tempo considerável pode decorrer do início da dor até a procura por socorro
(primeiro momento), e, posteriormente, da procura por socorro até o deslocamento ao
hospital mais próximo (segundo momento). Essa demora é nociva, pois a maioria das
mortes relacionadas ao IAM ocorrem nas primeiras horas de manifestação da doença
(TIMERMAN e FEITOSA, 2003). O primeiro momento encontra-se associado ao
reconhecimento da dor e à procura imediata pelos serviços de emergência. O segundo
está diretamente relacionado à assistência de saúde, que deve ser acessível e rápida,
além de contar com recursos tecnológicos e humanos treinados para o diagnóstico do
infarto.
Até o ano de 2000, seguindo recomendação da OMS, o IAM era diagnosticado
com base na tríade: quadro clínico, alterações eletrocardiográficas e dosagem
enzimática. No entanto, com o desenvolvimento de marcadores mais específicos para a
detecção da lesão do músculo cardíaco, ocorreu a revisão dos critérios para diagnóstico
do
infarto
(MYOCARDIAL
INFARCTION
REDEFINED,
2000).
Entre
as
modificações, a utilização das troponinas como marcadores de necrose tecidual foi a
mais significativa (NEWBY et al., 2002).
Entretanto, mesmo com os novos critérios de diagnóstico, nem sempre o
paciente pode ser prontamente diagnosticado e internado. O acesso aos serviços de
15
saúde, juntamente com a assistência ao paciente tem papel de destaque neste contexto,
pois, como dito, o tempo decorrido entre o início dos sintomas e o atendimento ao
individuo é fundamental para sua sobrevida (MELO, 2007).
Contudo, sendo o IAM um evento agudo que sempre requer internação
hospitalar, a caracterização das internações dos pacientes enfartados, obtendo-se o perfil
das internações e os fatores associados, depende de um grande número de variáveis.
Desta forma, torna-se necessária a utilização de métodos estatísticos que analisem
simultaneamente múltiplas medidas (Análise Multivariada), permitindo assim uma
visão global das variáveis analisadas, e, consequentemente uma visualização ampla do
fenômeno.
16
3 TÉCNICAS MULTIVARIADAS E APLICAÇÕES AO
IAM
Com a complexidade crescente dos problemas tratados pela ciência, muitas são
as dificuldades em transformar dados em informações úteis. Cada vez mais, se faz
necessária a utilização de ferramentas estatísticas que traduzam dados em informação.
Entre estas ferramentas destaca-se a mencionada Análise Multivariada, que,
diferentemente das ferramentas que analisam as variáveis de maneira isolada (estatística
univariada) refere-se a métodos que utilizam simultaneamente variáveis para explicar
um fenômeno (MOITA NETO, 2004; 2006). Assim, pode-se definir a Análise
Multivariada como o conjunto de métodos e técnicas estatísticas que possibilitam
analisar ao mesmo tempo várias dimensões (multidimensional) das variáveis em estudo,
visando a estabelecer relações entre as mesmas (HAIR et al., 2009).
Algumas técnicas de análise multivariada se destacam pela importância em
apoiar o processo de decisão na área de saúde, tanto para um pesquisador quanto para
um gestor. Neste capítulo buscou-se descrever os conceitos teóricos fundamentais ao
desenvolvimento do estudo. O primeiro tópico apresenta a técnica de Análise de
Correspondência Múltipla, principal técnica utilizada, sua origem histórica, conceitos e
interpretações. Além disso, a Distância de Tolerância (índice heurístico de proximidade)
é definida e explicada. O segundo tópico aborda um breve relato da técnica de Análise
de Agrupamento (Cluster Hierárquico), a qual é, posteriormente, comparada com a
ACM + Distância de Tolerância, para auxiliar no desenvolvimento desta. No terceiro
tópico são expostos trabalhos na área de Saúde que utilizaram alguma das técnicas
Multivariadas com aplicação ao IAM (Estado da Arte).
17
3.1 Análise de Correspondência Múltipla
A Análise de Correspondência Simples (AC), ao que tudo indica, tem sua
origem na década de 30, com o trabalho de Hirschfield intitulado “A Conection Between
Correlation and Contingency”, no qual a relação entre linhas e colunas de uma tabela de
contingência é formulada algebricamente. No entanto, sua estruturação como análise de
dados sistemática iniciou-se somente na década de 60, a partir dos estudos de um grupo
de franceses liderados por Jean Paul Benzécri. A princípio a técnica foi denominada
“Analyse Factorielle des Correspondances”, com o intuito de exprimir o sistema de
associações entre os elementos de dois conjuntos. Posteriormente, o nome da técnica foi
reduzido para “Analyse des Correspondances”, empregado atualmente (GREENACRE
e HASTIE, 1987; LE ROUX e ROUANET, 2004; GREENACRE e NENADIC, 2007).
Na AC ocorre a conversão de uma matriz de dados não-negativos em uma
representação gráfica, na qual linhas e colunas da matriz são expressas em um número
menor de dimensões. Dessa maneira, a AC permite visualizar as relações e semelhanças
existentes entre o conjunto de linhas e entre o conjunto de colunas de uma tabela de
contingência. Para isso, as categorias das variáveis analisadas são representadas por
meio de pontos em um diagrama de espalhamento, em um plano Euclidiano, de tal
forma que suas posições relativas indicam níveis de similaridade ou associação. Sendo
assim, a AC permite maior facilidade na apresentação dos resultados numéricos,
facilitando a interpretação dos dados e gerando hipóteses que podem ser,
posteriormente, testadas (GREENACRE, 1992).
Para facilitar a compreensão do método da AC, os dados utilizados por
GREENACRE e HASTIE (1987) serão apresentados abaixo. A Tabela 3.1 mostra uma
tabela de contingência I (linhas) x J (colunas), com as variáveis: grupos educacionais, 5
18
categorias, do menor grau de instrução para o maior, nas linhas; e leitura predileta, 3
categorias nas colunas. O total de indivíduos é de 312.
Um conceito fundamental para o cálculo do valor esperado é o da probabilidade
marginal, assim designada por estar à margem da tabela de contingência. Esta
probabilidade é calculada pelo valor total da linha ou da coluna dividido pelo total de
indivíduos (N). Assim, a probabilidade marginal associada à primeira linha, ou seja, ao
grupo educacional E1, é 14/312=0,0449. A Tabela 3.2 mostra as probabilidades
marginais de linhas e colunas.
Tabela 3.1 – Tabela de contingência (Greenacre & Hastie, 1987). Grupos
educacionais (E1, E2, E3, E4 e E5) e tipo predileto de leitura (C1, C2 e C3).
C1
C2
C3
Total
E1
5
7
2
14
E2
18
46
20
84
E3
19
29
39
87
E4
12
40
49
101
E5
3
7
16
26
Total
57
129
126
N=312
Tabela 3.2 – Tabela com as probabilidades marginais de linhas e colunas.
C1
C2
C3
Total
E1
5
7
2
14/312=0,0449
E2
18
46
20
0,2692
E3
19
29
39
0,2788
E4
12
4
49
0,3237
E5
3
7
16
0,0833
Total
0,1827
0,4135
0,4038
N=312
19
Com as probabilidades marginais de linhas e colunas, pode-se calcular o valor
esperado para cada casela, dado pelo produto das probabilidades marginais associadas à
célula e o total de indivíduos. Estes valores estão na Tabela 3.3.
Tabela 3.3 – Tabela com os valores esperados em cada casela.
C1
C2
C3
Total
E1
0,0449.0,1827.312 = 2,6
5,8
5,7
14
E2
15,3
34,7
33,9
84
E3
15,9
36,0
35,1
87
E4
18,5
41,8
40,8
101
E5
4,8
10,8
10,5
26
Total
57
129
126
N=312
Uma das formas de averiguar a dependência entre as variáveis é pela análise dos
resíduos padronizados, denominados Resíduos de Pearson (3.1), dados por:
(O − E )
ij
ij
resíduos = ∑
E
ij
(3.1)
onde O e E são os valores observado e esperado, respectivamente.
Dessa forma, cada célula ij da tabela possui um resíduo padronizado, e, quanto
mais ele se afasta do seu valor esperado, formado por duas categorias de variáveis
distintas, mais a célula contribui para a independência entre as variáveis.
Mais do que analisar a dependência entre as variáveis, a AC tem a finalidade de
decompor os dados e analisar as interrelações entre as categorias das variáveis. A partir
da transformação dos valores observados em Perfis de Linha e Perfis de Coluna
20
(Tabelas 3.4 e 3.5, respectivamente), apresentam-se graficamente as categorias que
possuem maior ou menor prevalência, ou seja, as categorias que mais ou menos
contribuem para a representação.
Tabela 3.4 – Perfis de Linha.
C1
C2
C3
Total
E1
0,3571
0,5000
0,1429
1
E2
0,2143
0,5476
0,2381
1
E3
0,2184
0,3333
0,4483
1
E4
0,1188
0,3960
0,4851
1
E5
0,1154
0,2692
0,6154
1
Média
0,1827
0,4135
0,4038
C1
C2
C3
Média
E1
0,0877
0,0543
0,0159
0,0449
E2
0,3158
0,3566
0,1587
0,2692
E3
0,3333
0,2248
0,3095
0,2788
E4
0,2105
0,3101
0,3889
0,3237
E5
0,0526
0,0543
0,1270
0,0833
Total
1
1
1
Tabela 3.5 – Perfis de Coluna.
A proporção de E1 na população, denominada Massa do Ponto, é
14/312=0,0449, o que representa o peso de E1 nesta população, ou seja, a medida de
importância entre cada categoria de variável. A coluna Média da Tabela 3.5 apresenta
as demais massas das categorias da variável grupo educacional. Estes valores são
entendidos como um ponto no espaço Euclidiano multidimensional, dado pelas
coordenadas do vetor l=[0,0449; 0,2692; 0,2788; 0,3237; 0,0833]. Analogamente, em
21
relação à leitura favorita existe o vetor c=[0,1827; 0,4135; 0,4038]. O vetor l representa
o Centróide de Linha e o vetor c o Centróide de Coluna. O Centróide é a média das
distâncias dos pontos ponderada pelas massas associadas a estes. Também chamado de
centro de gravidade, funciona como se fosse o ponto de equilíbrio da matriz de dados.
Assim, quanto mais a massa se aproxima da unidade, maior será a sua importância e
mais próxima do centróide estará a categoria correspondente à variável.
Outra forma de obter-se estas informações é por meio da tabela de frequências
relativas, com a qual obtém-se a proporção de cada combinação das categorias de
variáveis e também do total das categorias em relação ao total de unidades classificadas.
Para isto, todas as células foram divididas pelo total de indivíduos, neste caso, 312. A
Tabela 3.6 apresenta as frequências relativas.
Tabela 3.6 – Frequências relativas.
C1
C2
C3
Totais
E1
0,0160
0,0224
0,0064
0,0449
E2
0,0577
0,1474
0,0641
0,2692
E3
0,0609
0,0929
0,1250
0,2788
E4
0,0385
0,1282
0,1571
0,3237
E5
0,0096
0,0224
0,0513
0,0833
Totais
0,1827
0,4135
0,4038
1
Finalmente, para se obter as coordenadas das categorias das duas variáveis,
utiliza-se o algoritmo da Decomposição em Valores Singulares (DVS). Este, aplicado a
uma matriz retangular (Matriz de dados), a decompõe em três matrizes: vetores
singulares relativos às linhas (matriz U), vetores singulares relativos às colunas (matriz
22
V) e matriz diagonal e quadrada, composta pelos valores singulares associados às linhas
e colunas (matriz D), dadas por (2) (GREENACRE, 1992).
Matriz de dados = U .D.V T
(3.2)
Aplicando-se o algoritmo da DVS à matriz de dados do exemplo utilizado
(Tabela 3.6), obtêm-se as matrizes U, D e V, conforme exposto posteriormente:
0,0160
0,0577

0,0609

0,0385
0,0096
0,0224
0,0064 
0,1474 0,0641 

0,0929 0,1250 

0,1282 0,1571 
0,0224 0,0513 
 − 0,076 0,183
 − 0,512 0,818

 − 0,528 − 0, 271

 − 0,652 − 0,368
 − 0,167 − 0, 298
0,312
 0

 0
 − 0,287
 − 0,682

 − 0,672
0
0,072
0
0,234
0,631
− 0,740
0, 255 
− 0,070 

0,761 

− 0,592 
0,004 
0 
0 

0,026 
0,929 
− 0,370 

− 0,021 
(Matriz de dados)
(Matriz U)
(Matriz D)
(Matriz V)
Dessa forma, a partir de uma tabela de contingência padronizada como uma
matriz de I linhas e J colunas, a Matriz U representa as coordenadas das observações no
mapa de correspondência, a Matriz D é composta pelos autovalores da Matriz de dados
23
e a Matriz V representa os autovetores desta mesma matriz. Com isto, é possível
representar geometricamente os dados no Espaço Euclidiano, tornando mais fácil
estabelecer as relações existentes entre as variáveis estudadas ao observar a
visualização. A Figura 3.1 representa o mapa de correspondência do exemplo utilizado.
Figura 3.1 – Mapa de Correspondência gerado pelo Programa R 2.11.1 com os dados
de GREENACRE e HASTIE (1987).
O percentual total da variação explicada pelo mapa de correspondência é uma
medida de acurácia da solução obtida, e corresponde ao percentual entre parênteses das
dimensões 1 e 2 da Figura 3.1. A variação explicada, mais conhecida com Inércia, é a
24
quantificação da variação total de cada nuvem de pontos. A dimensão 1 (Dim 1) contém
a maior inércia, ou seja, é responsável pelo maior percentual da variação explicada. A
dimensão 2 (Dim 2) é o vetor perpendicular ao primeiro eixo (Dim 1), também tendo a
maior inércia possível.
A ACM é a aplicação da Análise de Correspondência Simples a uma base de
dados categóricos multidimensional, os quais são dispostos em uma matriz disjunta,
denominada Matriz Indicadora, e não mais em uma tabela de contingência. Neste caso,
os pacientes ou indivíduos são representados nas linhas (n), e as categorias das variáveis
nas colunas (p) (GREENACRE, 2007). A Figura 3.2 mostra uma Matriz Indicadora
simplificada, ou seja, com a quantidade de colunas reduzida, a partir dos dados desta
dissertação.
Variáveis
Gastos
(GAST)
Pacientes
Tipo de hospital
(HOSP)
inferiores a superiores a
R$ 905,00 R$ 905,00
Deslocamento
(DESL)
Contratado
Próprio
Sem
Com
Total
1
1
0
1
0
1
0
3
2
0
1
0
1
1
0
3
...
...
...
...
...
...
...
...
4435
0
1
1
0
0
1
3
Total
3212
1223
1276
3159
3781
654
13305
Figura 3.2 – Matriz indicadora ou Matriz disjunta.
Por meio da padronização de cada elemento desta matriz (zij) e pelos
correspondentes perfis de linha (ri) e coluna (cj), relativos às respectivas massas, obtém-
25
se a matriz padronizada G (Figura 3.3), por meio da expressão posterior (3.3):
z
g
ij
=
ij
para 0 ≤ i ≤ n e 0 ≤ j ≤ p.
r ⋅c
i j
(3.3)
Variáveis
Gastos
(GAST)
Pacientes
Tipo de hospital
(HOSP)
inferiores a superiores a
Contratado
R$ 905,00 R$ 905,00
Deslocamento
(DESL)
Próprio
Sem
Com
1
0,01019
0,00000
0,01616
0,00000
0,00939
0,00000
2
0,00000
0,01651
0,00000
0,01027
0,00939
0,00000
...
...
...
...
...
...
...
4435
0,00000
0,01651
0,00000
0,01027
0,00000
0,02258
Total
1
1
1
1
1
1
Figura 3.3 – Matriz padronizada G.
A partir da fatoração da matriz G por meio do algoritmo da Decomposição por
Valores Singulares (DVS), descrito no tópico sobre AC, obtém-se (3.4):
G = U .D.V T
(3.4)
onde U e V são matrizes de vetores singulares, o primeiro relativo às linhas, e o
segundo, às colunas. D é a matriz diagonal e quadrada, composta pelos valores
singulares associados a cada uma das linhas e colunas. Desta forma, as coordenadas
26
principais das linhas e colunas são calculadas pelo produto das coordenadas padrões e
seus respectivos valores singulares (GREENACRE, 1992).
Como na ACM os valores singulares das categorias-pontos não exprimem a
variância, ou seja, a inércia. Com vistas a garantir que a inércia calculada pela DVS seja
compatível com a variabilidade dos dados, Benzécri sugeriu um ajuste (GREENACRE,
2007), expresso por (3.5):
~2
2
 Q  
1
 . λ 2 − 
λ j = 
j Q
Q
−
1

 

2
(3.5)
onde Q é o número de variáveis ativas, λ j os valores singulares referentes à Matriz
~
Indicadora e λ j o valor ajustado.
Os passos para a obtenção do mapa de correspondência a partir de uma Matriz
Indicadora, com 1< i < n categorias nas linhas e 1 < j < p categorias nas colunas, são os
seguintes:
1. Obtenção dos vetores r e c, relativos aos perfis das linhas e colunas,
respectivamente, dados por:
p
n
j =1
i =1
ri = ∑ z ij e c j = ∑ z ij ;
2. Padronização da Matriz Indicadora em seus valores relativos, ou seja,
obtenção
g ij =
da
zij
ri ⋅ c j
matriz
padronizada
G,
por
meio
da
expressão:
para 0 ≤ i ≤ n e 0 ≤ j ≤ p. ;
27
3. Fatoração da Matriz G por meio do algoritmo da Decomposição em
Valores Singulares (DVS):
G = U .D.V T ;
4. Ajuste da inércia, para garantir que esta seja compatível com a
variabilidade dos dados, utilizando a fórmula sugerida por Benzécri:
~2
2
2
 Q   2 1
λ j = 
 . λ j − Q  ;
 Q −1 

5. Obtenção do Mapa de Correspondência;
3.1.1 Distância de Tolerância
Como mencionado, a interpretação usual do Mapa de Correspondência,
resultante da ACM, baseia-se na proximidade espacial entre as categorias das diferentes
variáveis. No entanto, esta proximidade depende, entre outras, da inércia das dimensões
consideradas, da escala do gráfico e, mesmo, da experiência do usuário. Uma alternativa
para a avaliação da associação entre as categorias é a utilização de um índice heurístico
de associação, denominado Distância de Tolerância, expresso por (3.6) (COSTA et al,
2008; ALMEIDA et al, 2009):
Distância de tolerância = ( X − Y ).Λ.( X − Y )T
onde X e Y são as coordenadas principais das categorias;
(3.6)
X = ( x1 , x 2 ,..., x s ) ,
Y = ( y1 , y 2 ,..., y s ) , sendo que s é a máxima dimensão obtida, ou por meio de um scree plot
ou pré-determinada com base na variação explicada pelos eixos. Λ é a matriz diagonal,
28
cujos elementos α j são dados por (3.7), e, logo, a distância de tolerância é uma
distância Euclidiana ponderada, na qual os pesos são dados pela razão entre as inércias
ajustadas e a inércia da primeira dimensão.
~
λ 2j
α j = ~ para 0 ≤ j ≤ p.
λ12
(3.7)
Quando existe necessidade de estabelecimento de associações entre variáveis
explicativas e a variável resposta, como em uma regressão, a variável resposta pode ser
inserida no gráfico da análise de correspondência como variável suplementar, por meio
de fórmulas de transição (GREENACRE, 2007). Deste modo, esta variável não
influencia os cálculos das coordenadas principais e nem na variabilidade. A distância de
tolerância fornece uma interpretação intuitiva de proximidade entre as categorias,
possibilitando inferências posteriores sobre as relações entre as variáveis. Quando
comparada com as distâncias Euclidianas normal e estatística, apresenta um menor
limiar para associação.
3.1.1.1 O método Bootstrap
O bootstrap, terminologia introduzida por Efron em 1979, é basicamente uma
técnica de reamostragem (amostragem com reposição), que permite, a partir da amostra
observada, fazer suposições sobre a população em estudo (DAVINSON e HINKLEY,
1997). A amostragem é feita, com reposição, da distribuição da qual os dados são
obtidos, se esta é conhecida (bootstrap paramétrico) ou da amostra original (bootstrap
não-paramétrico).
Na técnica bootstrap as observações são escolhidas de forma aleatória e as
estimativas recalculadas. Normalmente, essa metodologia é utilizada para calcular o
29
intervalo de confiança de parâmetros e calcular os valores-p, determinando assim
regiões de confiança (LEBART, 2007). No entanto, no presente trabalho, o mesmo será
empregado para determinar distâncias de tolerância “espelhadas” no espaço Euclidiano
original. Desta forma, as associações encontradas no espaço original poderão ser
comparadas com aquelas dadas pelos “espaços espelhados”.
Como em toda análise estatística, a verificação da robustez quanto ao resultado
encontrado é desejável, principalmente ao ser introduzido um novo método. Assim, a
técnica bootstrap será empregada para a validação dos resultados sugeridos pela
metodologia da Distância de Tolerância.
3.2 Cluster Hierárquico
A análise de agrupamentos (cluster analysis) é um conjunto de técnicas
estatísticas multivariadas, cujo objetivo principal é classificar indivíduos ou categorias
de variáveis (objetos) em grupos com base nas características que eles possuem. Esta
análise reúne os objetos em relação a um conjunto de características selecionadas, de
modo que cada um deles é considerado similar a outros no agrupamento. Os grupos
resultantes devem ter elevada homogeneidade interna (dentro do grupo) e elevada
heterogeneidade externa (entre os grupos) (MINGOTI, 2005).
O Cluster Hierárquico tem sido há muito tempo a metodologia mais popular de
agrupamento, envolvendo uma série de n –1 decisões (n número de observações) que
combinam observações em uma estrutura hierárquica ou tipo árvore. Existem dois tipos
de procedimentos hierárquicos: aglomerativo, com o qual cada objeto começa como seu
próprio agrupamento; e, divisivo, com o qual todas as observações iniciam em um
agregado e são sucessivamente divididas até que cada uma forma um agregado unitário
(HAIR et al., 2009).
30
O procedimento para a escolha do número de grupos para definir a partição do
conjunto de dados analisados tem grande importância. Uma das formas de avaliar isto é
por meio da análise do comportamento do “nível de fusão”. À medida que a
similaridade entre os grupos agregados vai decrescendo e, portanto, a distância entre os
agrupamentos aumentando, pode-se apresentar um gráfico do número de grupos versus
o nível de distância do agrupamento (fusão) em cada estágio do processo. A ocorrência
de “pontos de salto” indica o momento ideal de parada do algoritmo, ou seja, o número
de grupos final. Quando o segmento de reta no gráfico se estabiliza, não apresentando
variações significativas, obtém-se a partição ótima (MINGOTI, 2005). Depois de
estabelecido o número de agrupamentos, a forma gráfica mais utilizada para representar
o resultado final dos diversos agrupamentos é o dendrograma, no qual a escala vertical
indica o nível de similaridade entre os objetos e no eixo horizontal são marcados os
objetos utilizados.
3.3 Aplicação de Técnicas Multivariadas ao IAM
OLIVEIRA et al. (2006) publicaram um artigo sobre a letalidade das Doenças
Isquêmicas do Coração (DIC) no estado do Rio de Janeiro no período entre 1999 e
2003. Utilizaram dados derivados das AIH pagas pelo SUS, tendo como objetivo
estimar as taxas de letalidade por DIC aguda e crônica e por revascularização
miocárdica (RVM) e angioplastia coronariana (AnC) no estado do Rio de Janeiro. Os
autores lembram que as AIH, embora tenham sido criadas como mecanismo de
pagamento da assistência hospitalar prestada, mostraram-se instrumentos adequados
para avaliar os dados relacionados às internações nas unidades de saúde, servindo como
fonte de informação útil para a tomada de decisões gerenciais.
O estudo constatou que, do total de 68.375 internações ocorridas por DIC no
período estudado, 34% dos pacientes tiveram o diagnóstico de IAM, dos quais 1,4%
31
foram revascularizados cirurgicamente e 3,4% foram submetidos à angioplastia
coronariana. As letalidades por angina, IAM, outras DIC agudas e DIC crônicas foram
de 2,8%, 16,2%, 2,9% e 3,9%, respectivamente. Mesmo sem identificar os hospitais,
observou-se que existem diferenças entre as unidades prestadoras de serviços ao SUS,
por meio das informações de letalidade. De modo geral, concluiu-se que a RVM e AnC
no tratamento das DIC no estado do Rio de Janeiro vêm aumentando progressivamente
e que as taxas de letalidade foram elevadas tanto nos Procedimentos de Alta
Complexidade como no tratamento clínico de IAM, esta, por sua vez, semelhante à
existente quando não se utilizam trombolíticos (16,7%).
Três estudos tiveram como objetivo analisar a pertinência do uso do Sistema de
Informações Hospitalares (SIH) do SUS, porém cada um deles se propôs a fazer isto
com objetivos específicos bem distintos. O primeiro, realizado por ESCOSTEGUY et
al. (2002), analisou 1936 formulários de AIH do SIH/SUS registrados com diagnóstico
principal de IAM na cidade do Rio de Janeiro em 1997, e também uma amostra
aleatória de 391 prontuários médicos estratificada por hospitais. Após estes dois passos,
analisou-se a concordância entre o diagnóstico principal registrado na AIH e o registro
do prontuário médico, por meio do coeficiente de correlação intraclasse Kappa. O
estudo constatou que a qualidade do registro de IAM notificado na AIH foi satisfatória,
tendo, segundo critérios estabelecidos pela literatura específica, um percentual de
confirmação alta (cerca de 91,7%, IC95% = 88,3-94,2). De modo geral, a precisão das
variáveis, tanto demográficas (sexo, faixa etária), de processo (procedimentos,
intervenções) e de resultado (óbito, motivo da saída) foi satisfatória. A maior limitação
enfrentada foi o elevado sub-registro do diagnósticos secundários na AIH. Assim,
considerando-se a ampla disponibilidade da base de dados; disponível pelo DATASUS
via internet e em CD-ROM, concluiu-se que a utilização do SIH, como instrumento
32
auxiliar, é pertinente na avaliação da qualidade da assistência ao infarto, ao menos no
município do Rio de Janeiro.
No segundo estudo, MELO et al. (2004) tinham como objetivo específico avaliar
a qualidade da informação sobre óbito por IAM utilizando o SIH/SUS e o Sistema de
Informações sobre Mortalidade (SIM). Em uma primeira etapa, foram analisados os
dados sobre mortalidade hospitalar por IAM no município do Rio de Janeiro no ano de
2000 referentes a essas bases de dados. Na segunda etapa, ocorreu o levantamento dos
dados dos prontuários médicos de dois hospitais do SUS da cidade do Rio de Janeiro.
Neste caso também foi analisada a concordância entre os dados das declarações de óbito
e da AIH, com base nos registros dos prontuários médicos, pelo Kappa de Cohen e pelo
coeficiente de correlação intraclasse. O estudo verificou que o total de óbitos
hospitalares por IAM registrados no SIM/SUS era expressivamente maior que no
SIH/SUS. O SIM registrou 4007 óbitos em que o infarto foi a causa básica, dos quais,
2405 ocorreram em hospital. Em contra-partida, o SIH/SUS registrou 2896 internações
com diagnóstico principal de IAM, sendo notificados 438 óbitos. Esta discrepância foi
explicada a partir de três fontes: ausência na emissão de AIHs, notificação de outro
diagnóstico principal no SIH/SUS e sub-notificação do óbito na AIH.
Nesse segundo estudo, a proporção de confirmação do diagnóstico de IAM na
AIH foi mais baixa do que a observada por ESCOSTEGUY et al. (2002) no município
do Rio de Janeiro, em 1997. No entanto, se fossem considerados apenas os casos de
óbito, as proporções seriam similares. Além disto, os dois estudos confirmaram o
elevado sub-registro do diagnóstico secundário na AIH. Contudo, Melo et al.
concluíram que em relação à validade, verificou-se um alto grau de sensibilidade no
SIH/SUS e no SIM e uma confiabilidade satisfatória para grande parte das variáveis
analisadas, corroborando os resultados de ESCOSTEGUY et al. (2002). Entretanto,
33
acrescentaram que é necessário implementar medidas voltadas para a melhoria da
qualidade do SIH/SUS, tais como a padronização de critérios para emissão de AIH e o
treinamento das equipes responsáveis pelos registros.
O terceiro artigo (ESCOSTEGUY et al., 2005), desenvolvido pela mesma
equipe do primeiro, teve como objetivo avaliar o banco AIH em relação ao prontuário
médico na análise de fatores associados à variação do risco de óbito hospitalar no IAM,
no município do Rio de Janeiro, em 1997. O universo do estudo foi definido com base
no diagnóstico principal encontrado na AIH, sendo utilizados 1936 registros. A partir
destes registros, realizou-se um estudo seccional de uma amostra aleatória de 391
prontuários médicos, estratificada por hospitais. Os fatores associados com o óbito
hospitalar por infarto foram estudados por meio de modelagem logística. Os modelos
foram obtidos diretamente a partir das AIH e dos prontuários médicos. Ao final, foram
construídas curvas ROC (Receiver Operator Characteristic) para os modelos estudados,
permitindo sua comparação.
O estudo encontrou uma confirmação diagnóstica do IAM igual a 91,7%. O
modelo logístico derivado dos prontuários médicos teve um melhor ajuste, obtendo uma
concordância de 90,1%. Embora o modelo desenvolvido com as AIH não tivesse um
ajuste tão bom quando comparado ao dos prontuários, com concordância de 70,6%, o
seu desempenho não foi modificado significativamente. Além disto, a confirmação do
diagnóstico de IAM e a precisão das variáveis da AIH foram satisfatórias, o que
também foi concluído nos dois artigos anteriores. Os autores destacam que um melhor
preeenchimento das autorizações poderia melhorar ainda mais o ajuste do modelo final.
Como visto, o infarto é uma patologia que acomete um número elevado de
indivíduos, sendo estudado em todo o mundo. Na Espanha, o estudo realizado por
SENDRA et al. (2005) analisou a mortalidade hospitalar por IAM e os fatores
34
associados a ela, tendo em vista que as enfermidades cardiovasculares (e, dentro deste
grupo, as doenças esquêmicas do coração) são a primeira causa de morte na Espanha.
A mortalidade hospitalar por episódios de IAM foi estudada por meio da base de
dados da comunidade de Madri no ano de 2001, baseando-se em variáveis sóciodemográficas e hospitalares, envolvendo procedimentos realizados, fatores de risco e
co-morbidades associadas. As técnicas estatísticas descritivas e a regressão logística
foram utilizadas para analisar os dados. Constatou-se que dos 5306 registros de infarto
do estudo, 71% são homens e a idade média dos pacientes é de 68 anos. 29% dos
pacientes fizeram revascularização com colocação de stent coronariano. A mortalidade
averiguada foi de 10,8%. Na análise multivariada, o aumento da idade, a presença de
arritmias, a insuficiência cardíaca e a insuficiência renal são associados a uma maior
mortalidade.
Esse estudo concluiu que a mortalidade hospitalar por IAM, considerando-se
uma base de dados administrativa, é similar à detectada por estudos clínicos. Isto
confirma o que OLIVEIRA et al. (2006) apontou, no Brasil, sobre bases
administrativas, ou seja, elas servem como fonte de informação útil para a tomada de
decisões gerenciais. O trabalho também afirma que a mortalidade é associada a
variáveis mencionadas na literatura, mas que novos estudos são necessários para
confirmar a associação com outras variáveis.
No Brasil, o estudo realizado por EVANGELISTA et al. (2008) se propôs a
investigar os fatores associados ao óbito hospitalar nas internações por IAM e
insuficiência coronariana (InC), e se a via de internação pela Central de Internação da
Secretaria Municipal de Saúde de belo Horizonte estava associada ao óbito hospitalar
após ajuste por fatores relevantes. Os dados foram obtidos das AIH e dos laudos da
35
última internação realizada com hipótese diagnóstica de IAM ou InC. Para identificar
fatores de risco para o óbito hospitalar realizou-se uma análise multivariada.
O estudo detectou que não houve associação entre a via de acesso à internação e
risco de óbito hospitalar por essas causas. Por outro lado, a análise multivariada
demonstrou maior risco de óbito para pacientes com sessenta anos de idade ou mais
(odds ratio – OR = 2,9), hipóteses diagnóstica de IAM (OR = 3,0), uso de Unidade de
Terapia Intensiva (UTI) (OR = 1,6), sexo feminino (OR=1,4), especialidade cirúrgica
(OR = 1,9) e hospital público (OR = 3,5). Um ponto de destaque foi, nas internações por
IAM, o maior risco de morte de pacientes internados no fim de semana (OR = 1,7).
Concluiu-se que, para avaliar a assistência prestada, são necessárias investigações que
levem em consideração mais fatores relacionados aos hospitais, aos pacientes e ao
processo da assistência, subsidiando assim propostas que garantam maior equidade e
qualidade da assiatência pública.
Entre os artigos utilizados na revisão, o que mais se aproxima da presente
dissertação é o produzido por SOARES et al. (2006), devido à utilização de dados do
mesmo ano e retirados do mesmo sistema de informação. Esse estudo avaliou a
influência dos principais fatores prognósticos disponíveis no SIH/SUS na sobrevida dos
pacientes internados por IAM nos serviços de saúde do SUS, no estado do Rio de
Janeiro, no ano de 2002. Foi realizado o relacionamento probabilístico de bases de
dados das AIH de 2002 e das declarações de óbitos de 2002 e 2003. Entre os óbitos,
56,7% eram homens, porém a letalidade foi maior entre as mulheres, 27,7%, em todas
as idades. Mais de 50% das internações concentraram-se na região metropolitana,
enquanto as internações das demais regiões dividiram-se homogeneamente. A
reinternação por IAM foi de 4,1%. A permanência hospitalar média foi de 9,5 dias.
Cerca de 29,1% dos pacientes fizeram uso da UTI, com maior utilização entre homens
36
(65,3%) do que entre mulheres (34,7%) e em indivíduos mais idosos. Não houve efeito
estatisticamente significativo em relação à utilização de UTI e prevenção do óbito. A
AnC e a RVM foram realizadas em 2,8% e 1,3% dos pacientes, respectivamente, com
proporção menor entre as mulheres. A letalidade em trinta dias foi de 13,6% e a
letalidade em um ano foi de 21,1%, com pior evolução em mulheres nos dois períodos e
em indivíduos mais idosos. Cerca de 50% dos pacientes que foram a óbito em um ano
morreram em até 9 dias a partir da data de internação. Apenas 25% dos pacientes
sobreviveram até 68,5 dias, o que demonstrou que a maioria dos óbitos ocorreu
precocemente. O estudo concluiu que a letalidade foi maior em indivíduos mais idosos,
em ambos os sexos. A proporção de casos de IAM foi maior entre o sexo masculino,
porém a letalidade foi maior entre as mulheres. A utilização de UTI, em ambos os
sexos, encontrou-se muito abaixo do preconizado e foi identificada uma baixa
realização de AnC e RVM principalmente entre as mulheres. Além disto, o tempo
médio de permanência e a mortalidade hospitalar em 30 dias puderam sugerir a prática
de altas precoces e baixa qualidade de assistência, evidenciadas pelo alto número de
óbitos hospitalares pouco tempo após a internação por IAM.
Tomando-se como base os artigos supracitados, pode-se observar que a
utilização das AIH, fornecidas por meio do Sistema de Informações Hospitalares do
SUS (SIH/SUS), é frequente para avaliar os dados relacionados às internações nas
unidades de saúde. Embora criadas como forma de pagamento de serviços prestados,
elas servem como fonte de informação útil, tanto para tomada de decisão quanto para o
cálculo de diversas estimativas. No entanto, alguns estudos chamam a atenção para o
precário preenchimento das autorizações, o que prejudica a utilização dos dados. Ainda
que a confirmação diagnóstica seja alta perante os prontuários médicos, os registros das
AIH ainda contam com possíveis erros de digitação e as falhas de informação.
37
Relativamente aos trabalhos internacionais, mesmo com a utilização de bases
secundárias pode-se perceber uma diferença grande entre os cuidados aos pacientes
enfartados no Brasil e em outros países. Por exemplo, um dos estudos mostra que em
Madri na Espanha, 29% dos pacientes internados por IAM realizaram revascularização
e que a mortalidade foi, aproximadamente, igual a 10,8% (SENDRA et al., 2005).
Entretanto, no Estado do Rio de Janeiro, apenas 1,3% dos pacientes internados
realizaram revascularização e o percentual de óbito hospitalar foi de, aproximadamente,
28% (SOARES et al., 2006).
Relativamente aos métodos empregados, um estudo utilizou as taxas de
letalidade por DIC aguda e crônica e por revascularização miocárdica e angioplastia
coronariana, para observar as diferenças entre as unidades prestadoras de serviços ao
SUS (OLIVEIRA et al., 2006). Dois artigos utilizaram o coeficiente de correlação
intraclasse Kappa para comparar, principalmente, as informações da base de dados das
AIH do SIH/SUS e os prontuários médicos (ESCOSTEGUY et al., 2002; MELO et al.,
2004). Com o mesmo objetivo dos dois artigos anteriores, ESCOSTEGUY et al. (2005)
fizeram uso da modelagem logística, com posterior construção de curvas ROC,
permitindo a comparação dos modelos. Dois estudos utilizaram a análise multivariada,
apresentando os fatores associados ao IAM (SENDRA et al., 2005; EVANGELISTA et
al., 2008), e, finalmente, SOARES et al. (2006) empregaram o relacionamento
probabilístico de base de dados para avaliar a influência dos principais fatores
prognósticos na sobrevida dos pacientes internados por IAM.
38
4 MATERIAIS E MÉTODOS
4.1 Base de Dados do IAM
O presente trabalho utilizou dados que se encontram disponíveis por meio de
uma colaboração entre o Programa de Engenharia Biomédica do Instituto Alberto Luiz
Coimbra de Pós-graduação e Pesquisa de Engenharia da Universidade Federal do Rio de
Janeiro (PEB/COPPE/UFRJ) e o Instituto de Estudos em Saúde Coletiva da mesma
Universidade (IESC/UFRJ).
Primeiramente, foram selecionados, do SIH-SUS as internações com o
diagnóstico principal de IAM (Classificação Internacional de Doenças 10ª Revisão: I21
ou I22), realizadas em hospitais vinculados ao SUS, no Estado do Rio de Janeiro, no
ano de 2002. Os registros duplicados e de menores de dezoito anos foram excluídos. A
seguir, os registros de internação restantes foram relacionados aos do Sistema de
Informação sobre Mortalidade (SIM) dos anos de 2002 e 2003, utilizando-se o software
RecLink e metodologia proposta por COELI e CAMARGO Jr. (2002).
Desta forma, o estudo tem base populacional e desenho transversal, e sua
população é constituída de indivíduos adultos de ambos os sexos, com idades entre 18 e
100 anos. Assim, a partir das AIH, a base de dados original possui 4435 registros com
48 variáveis (ANEXO I).
4.1.1 Seleção das variáveis
Tendo em vista que as variáveis registradas são formadas por meio de um banco
de dados administrativo (AIH), foi realizada uma seleção das variáveis para a formação
da base de dados do estudo, sendo que inicialmente foram excluídas as variáveis de
identificação, tanto do paciente quanto dos hospitais e suas dependências (exclusão de
12 variáveis). Deste modo, as variáveis relacionadas aos pacientes não permitem
39
identificá-los, garantindo sua privacidade. Desta forma, o estudo teve aprovação do
Comitê de Ética e Pesquisa (CEP) da Escola de Enfermagem Anna Nery da
Universidade Federal do Rio de Janeiro (EEAN/UFRJ).
Como o banco de dados original possui uma seção somente relacionada às
pacientes do sexo feminino, na qual encontram-se variáveis referentes à maternidade e
afins (tais como: número de filhos e realização de cirurgia de laqueadura), foram
excluídas seis variáveis por não serem de interesse para o estudo. Além destas, foram
retiradas as variáveis relacionadas às datas (sete variáveis) e as sem relevância para o
estudo, tais como: IP-descritivo e cobrança (quatro variáveis). As variáveis local de
atendimento e origem do paciente foram aglutinadas formando uma variável,
denominada de Deslocamento intermunicipal (duas variáveis tornaram-se uma).
Similarmente, as variáveis Revascularização, Angioplastia, Transplantes, Órteses e
Próteses, Diagnoses e Terapias, Transfusão de sangue, Tomografia e Ressonância
foram aglutinadas, formando a variável Utilização de tecnologias (sete variáveis
formaram uma). Após estes procedimentos, apenas as variáveis que possuíam categorias
com percentual maior que 5% de variabilidade foram mantidas, resultando em 10
variáveis. A Figura 4.1 sumariza o procedimento de seleção das variáveis.
Todos os registros de internação por IAM no ano de 2002 foram armazenados e
as variáveis selecionadas, conforme descrito, foram categorizadas da seguinte forma:
1) Tipo de hospital: hospital contratado ou hospital próprio. O hospital
contratado refere-se às instituições que prestam serviços ao SUS
(filantrópicas ou não). Por outro lado, o hospital próprio faz menção aos
institutos que são administrados diretamente por órgãos públicos, tanto em
âmbito Federal, Estadual ou Municipal, fazendo parte também os Hospitais
Universitários, independente da esfera administrativa.
40
Variáveis do Banco de
Dados original
N = 48
- 12
Exclusão das variáveis de
IDENTIFICAÇÃO
N = 36
-6
Exclusão das variáveis
relacionadas às pacientes
do sexo feminino (maternidade)
N = 30
-7
Exclusão da variáveis
relacionadas as
DATAS
N = 23
-4
Exclusão das variáveis
SEM RELEVÂNCIA
N = 19
-9
+2
AGLUTINAÇÕES:
Deslocamento e
Utilização de tecnologias
N = 12
-2
Exclusão das variáveis
com uma das categorias
com menos de 5%
N = 10
Figura 4.1 – Fluxograma da seleção das variáveis.
41
2)
Deslocamento intermunicipal: sem deslocamento ou com deslocamento.
Utilizaram-se duas variáveis para compor a variável deslocamento
intermunicipal: município de origem, local onde reside o paciente; e,
município de atendimento do paciente, local onde os primeiros socorros
foram prestados;
3)
Região
de
atendimento:
metropolitana
ou
não-metropolitana.
Originalmente, o banco contava com o registro das sete regiões
administrativas do Estado do Rio de Janeiro. Estas foram aglutinadas,
formando apenas duas regiões. A região metropolitana refere-se ao
município do Rio de Janeiro, capital do Estado, e a não-metropolitana
corresponde aos demais municípios do Rio de Janeiro.
4)
Idade: 15 a 55 anos; 56 a 75 anos ou maior de 76 anos (inclusive) Variável
originalmente contínua, foi categorizada de acordo com a literatura científica
brasileira (SOARES et al., 2006), formando três categorias.
5)
Sexo: masculino ou feminino. Variável binária, relacionada ao gênero do
paciente.
6)
Utilização de tecnologias: alta; moderada ou baixa complexidade. Esta
variável foi construída a partir de sete variáveis contidas no banco de dados:
revascularização; angioplastia; transplantes; órteses e próteses; diagnoses e
terapias; transfusões de sangue; tomografia e ressonância. Considerou-se a
utilização de tecnologias de alta complexidade os casos em que os pacientes
passaram por uma revascularização, angioplastia e/ou por um transplante, e a
utilização de tecnologias de moderada complexidade os casos em que os
paciente foram submetidos à colocação de órtese ou prótese e/ou submetidos
a transfusões de sangue. A utilização de tecnologias de baixa complexidade
42
incluiu os pacientes submetidos a diagnoses e terapias e/ou tomografias e
ressonâncias.
7)
Tempo de internação: até 7 dias; de 8 a 30 dias ou mais de trinta dias.
Variável originalmente contínua, foi categorizada de acordo com a literatura
científica brasileira, formando três categorias (ESCOSTEGUY, 2005).
8)
Utilização de CTI: não ou sim. Esta variável indica a utilização do Centro de
Tratamento Intensivo.
9)
Óbito: não; até 30 dias ou em 1 ano. Variável originalmente contínua, foi
categorizada de acordo com a literatura científica brasileira, formando 3
categorias (ESCOSTEGUY, 2005).
10) Gastos: inferiores a R$ 905,00 (inclusive) ou superiores a R$ 905,00. O
valor foi obtido a partir do Sistema de Informações Hospitalares (SIH/SUS),
e representa a média de gastos por pacientes infartados no Estado do Rio de
Janeiro no ano de 2002.
Para a estruturação da Matriz Indicadora, foram utilizadas 10 variáveis. O
percentual de óbitos identificado na população estudada foi de aproximadamente 29%,
ou seja, dos 4435 registros de pacientes internados por IAM, 1272 foram a óbito. Os
demais percentuais das variáveis com suas respectivas categorias no conjunto amostral
são mostrados na Tabela 4.1. Os números encontrados após cada categoria (0, 1 ou 2)
são utilizados como codificação para adequá-las à aplicação das técnicas multivariadas.
43
Tabela 4.1 – Frequências absolutas e relativas das variáveis.
Variáveis / Categorias
Tipo de hospital (HOSP)
Deslocamento intermunicipal (DESL)
Região de atendimento (REG)
Idade (ID)
Sexo (SEXO)
Utilização de tecnologias (TEC)
Tempo de internação (INT)
Utilização de CTI (CTI)
Óbito (OB)
Gastos (GAST)
Frequência Frequência
absoluta
Relativa (%)
Contratado (0)
1276
29
Próprio (1)
3159
71
Sem deslocamento (0)
3781
85
Com deslocamento (1)
654
15
Não-metropolitana (0)
1374
31
Metropolitana (1)
3061
69
15 a 55 anos (0)
1591
36
56 a 75 anos (1)
2256
51
maior de 76 anos (2)
588
13
Feminino (0)
1669
38
Masculino (1)
2766
62
Baixa complexidade (0)
3025
68
Moderada complexidade (1)
1219
27
Alta complexidade (2)
191
5
Até 7 dias (0)
2393
54
8 a 30 dias (1)
1864
42
Mais de 30 dias (2)
178
4
Não (0)
3145
71
Sim (1)
1290
29
Não (0)
3163
71
Até 30 dias (1)
722
16
Em um ano (2)
550
13
Inferiores a R$ 905,00 (0)
3212
72
Superiores a R$ 905,00 (1)
1223
28
44
4.2 Aplicação da ACM
Na aplicação da ACM utilizou-se como variável desfecho o gasto hospitalar com
o paciente internado por IAM (saída da ACM), sendo as demais consideradas entradas,
ou seja, possivelmente associadas a este gasto. Primeiramente, ocorreu a padronização
da Matriz Indicadora (4435 linhas, na qual se encontram os pacientes enfartados; 25
colunas, nas quais estão as variáveis, com suas respectivas categorias) em valores
relativos (equação 3.3) obtendo-se a Matriz Padronizada G (análoga à exemplificada
pela Figura 3.2).
Com a utilização do algoritmo da Decomposição em Valores Singulares
(equação 3.4) realizou-se a fatoração da Matriz G, formando-se três novas matrizes
(Matriz U, que representa as coordenadas das observações no mapa de correspondência;
Matriz D, composta pelos autovalores da Matriz de dados e Matriz V, que representa os
autovetores desta mesma matriz). Posteriormente, a inércia foi ajustada de acordo com a
equação 3.5, a fim de garantir que a mesma seja compatível com a variabilidade dos
dados.
Desta forma, foi possível representar geometricamente os dados no Espaço
Euclidiano por meio do Mapa de Correspondência, tendo sido a máxima dimensão s
escolhida por meio de um critério gráfico muito utilizado na Análise Fatorial (scree
plot) para a variação explicada pelos eixos (COSTA at al., 2008). Posteriormente, a
Distância de Tolerância foi calculada (equação 3.6), de modo que o quinto percentil
(5%) de todas as distâncias calculadas foi considerado como o limiar de associação
entre as categorias das variáveis, as quais foram agrupadas duas-a-duas. Duas categorias
foram consideradas associadas quando suas distâncias encontravam-se abaixo desse
limiar.
45
O método de simulação bootstrap (construção de distribuições amostrais por
reamostragem, tendo por base a idéia de tratar a amostra como se fosse a população que
deu origem aos dados), foi utilizado para verificar se as associações encontradas por
intermédio da Distância de Tolerância eram estáveis. Assim, aproximadamente, metade
dos registros foi selecionada aleatoriamente (n=2200), repetindo-se a ACM e o cálculo
da Distância de Tolerância. Este procedimento foi repetido 1000 vezes, e a quantidade
de agrupamentos comuns foi registrada, sendo aqueles que apresentaram mais de 75%
das ocorrências considerados estáveis.
A partir da Análise de Agrupamento (Cluster Hierárquico) construiu-se um
dendrograma, representando o agrupamento de variáveis semelhantes. Para tal, no eixo
horizontal são colocadas as amostras, e, no eixo vertical, o índice de similaridade. O
número de agrupamentos foi determinado com base na análise do comportamento de
fusão (seção 3.2). Ao final, os agrupamentos formados por cada metodologia foram
comparados.
Para todo o tratamento estatístico do banco de dados foi utilizado o Programa
estatístico R, versão 2.11.1 (R DEVELOPMENT CORE TEAM, 2004), com a
utilização do pacote ca. Este programa é fruto de uma colaboração internacional, sendo
de distribuição gratuita e proporcionando análises estatísticas abrangentes e de fácil
utilização.
46
5 RESULTADOS
A aplicação da ACM na amostra resultou no Mapa de Correspondência da
Figura 5.1. A Dimensão 1 explica, aproximadamente, 61,8% da variabilidade dos dados
e está mais relacionada à estrutura do atendimento hospitalar. Por outro lado, a
Dimensão 2 explica, aproximadamente, 27,1% da variabilidade e encontra-se mais
associada aos processos aplicados aos pacientes enfartados. Assim, a inércia total da
ACM,
levando-se
em
consideração
as
duas
primeiras
dimensões,
foi
de
aproximadamente 0,89.
Com vistas a facilitar a visualização das categorias das variáveis, a região
próxima ao centróide é mostrada ampliada na Figura 5.2. Tomando-se como referência
a variável desfecho, o Mapa de Correspondência sugere associação entre o gasto
inferior a R$ 905,00 (GAST0) e óbito até 30 dias (OB1), utilização de tecnologias de
baixa complexidade (TEC0), não utilização de CTI (CTI0), idade maior que 76 anos
(ID2) e sexo feminino (SEXO0). No entanto, em relação ao gasto superior a R$ 905,00
o Mapa sugere associação com: utilização de CTI (CTI1) e utilização de tecnologias de
moderada complexidade (TEC1).
Considerando-se a Distância de Tolerância de 0,024 (calculada até a segunda
dimensão) e os nove grupos formados dois-a-dois que incluem a variável desfecho,
obteve-se sete associações entre categorias de variáveis com gasto inferior a R$905,00,
a saber, sem deslocamento (DESL0), idade entre 56 e 75 anos (ID2), sexo feminino
(SEXO0), utilização de tecnologias de baixa complexidade (TEC0), óbito em até 30
dias (OB1), óbito em um ano (OB2) e não utilização de CTI (CTI0). Duas outras
associações, porém com gasto superior a R$ 905,00 foram identificadas: utilização de
tecnologias de moderada complexidade (TEC1) e utilização de CTI (CTI1).
47
Mapa de correspondência
0 .1 5
0.20
TEC2
REG0
HOSP0
CTI1
0.10
DESL1
0 .0 5
D im 2 (27,1% )
GAST1 TEC1
INT2
0 .0 0
OB0
ID0
SEXO1
-0 .0 5
SEXO0
GAST0
OB1 TEC0
-0.2
INT1
ID1
DESL0
INT0
-0.1
CTI0
ID2
OB2
HOSP1
REG1
0.0
0.1
0.2
0.3
Dim1 (61,8%)
Figura 5.1 – Mapa de Correspondência gerado por meio da ACM. A área retangular demarcada pela linha tracejada corresponde a Figura 5.2.
0 .0 5
Mapa de correspondência
SEXO1OB0
0 .0 0
ID0
D im 2 (27,1% )
ID1
DESL0
-0 .0 5
SEXO0
OB2
GAST0
OB1
ID2
CTI0
-0 .1 0
TEC0
-0.10
-0.05
Dim1 (61,8%)
Figura 5.2 – Ampliação do Mapa de Correspondência apresentado na Figura 5.1.
0.00
Após a validação (método Bootstrap), somente sete associações puderam ser
consideradas estáveis, das quais duas incluíam a variável desfecho. Conforme mostra a
Figura 5.3, nas associações encontradas pela ACM juntamente com a Distância de
Tolerância as barras representam o número de ocorrências encontrado pela validação,
enquanto a linha mostra o limite definido de 75% para estabilidade. A Tabela 5.2 mostra
as categorias associadas com a variável desfecho.
Tabela 5.1 – Associações para a variável desfecho (gastos hospitalares com
internação) detectadas pela Análise de Correspondência Múltipla, 4435 pacientes
internados em hospitais SUS, Rio de Janeiro, 2002. Associações estáveis por uma
análise bootstrap indicadas por um asterisco.
Categorias
Gastos
Inferiores a R$ 905,00 (GAST0)
Sem deslocamento (DESL0)
Idade entre 56 e 75 anos (ID2)
Sexo feminino (SEXO0)
Utilização de tecnologias de baixa complexidade (TEC0)*
Óbito em até 30 dias (OB1)
Óbito em um ano (OB2)
Não utilização de CTI (CTI0)*
Superiores a R$ 905,00 (GAST1)
Utilização de tecnologias de moderada complexidade (TEC1)
Utilização de CTI (CTI1)
51
1000
800
600
400
200
0
Figura 5.3 – Gráfico de barras mostrando as associações encontradas pela ACM juntamente com a Distância de Tolerância.
reg0 hos p0
reg1 hos p1
des l1 des l0
id0 des l0
id1 des l0
id2 des l0
s ex 0 des l0
s ex 1 des l0
c ti0 des l0
ob0 des l0
ob2 des l0
gas t.0 des l0
id0 des l1
id1 des l1
s ex 1 des l1
ob0 des l1
ob2 reg1
id1 id0
id2 id0
s ex 0 id0
s ex 1 id0
ob0 id0
ob2 id0
id2 id1
s ex 0 id1
s ex 1 id1
ob0 id1
ob2 id1
s ex 0 id2
tec 0 id2
c ti0 id2
ob1 id2
ob2 id2
gas t.0 id2
s ex 1 s ex 0
tec 0 s ex 0
c ti0 s ex 0
ob0 s ex 0
ob2 s ex 0
gas t.0 s ex 0
ob0 s ex 1
ob2 s ex 1
int0 tec 0
c ti0 tec 0
ob1 tec 0
gas t.0 tec 0
c ti1 tec 1
gas t.1 tec 1
ob1 int0
ob1 c ti0
ob2 c ti0
gas t.0 c ti0
gas t.1 c ti1
ob2 ob0
gas t.0 ob1
gas t.0 ob2
A análise de agrupamentos (Cluster Hierárquico) possibilitou a construção do
Dendrograma apresentado na Figura 5.4, o qual apresenta na sua parte inferior os
agrupamentos sugeridos por esta metodologia. Associados ao gasto inferior a R$905,00
encontram-se: não utilização de CTI (CTI0), utilização de tecnologias de baixa
complexidade (TEC0), até 7 dias de internação (INT0), até 30 dias para o óbito (OB1)
e maior de 76 anos de idade (ID2). Quatro associações com gasto superior a R$ 905,00
foram sugeridas: utilização de CTI (CTI1), utilização de tecnologias de moderada
complexidade (TEC1), mais de 30 dias de internação (INT2) e utilização de tecnologias
de alta complexidade (TEC2). O critério utilizado na determinação do número de
agrupamentos foi a análise de comportamento de fusão (Figura 5.5). O gráfico do
critério mostra o número de agrupamentos em função do nível de ligação dos grupos em
cada estágio do procedimento e permite indicar o número final destes (vide seção 3.2).
0 .6
0 .4
G A S T .0
C T I0
IN T 0
TEC 0
OB1
ID 2
R EG0
OB2
HOSP0
SEXO0
ID 1
D E SL0
OB0
ID 0
SEXO1
D ESL1
REG1
HOSP1
IN T 1
C T I1
G A S T .1
IN T 2
TEC 1
TEC 2
0 .2
0 .0
Ín d ic e d e s im ila rid a d e
0 .8
1 .0
1 .2
Dendrograma
Categorias das variáveis utilizadas
hclust (*, "ward")
Figura 5.4 – Dendrograma apresentado a partir dos dados utilizados.
53
0 .8
0 .6
0 .0
0 .2
0 .4
N ív e l d e lig a ç ã o
1 .0
1 .2
Comportamento do nível de fusão
5
10
15
20
Número de grupos
Figura 5.5 – Gráfico da análise do comportamento do nível de fusão. A seta indica o
número de agrupamentos utilizado para a formação do dendrograma.
54
6 DISCUSSÃO
O IAM é um evento agudo, que, como discutido, sempre requer atendimento
emergencial seguido de internação. Por sua magnitude, impacto na mortalidade,
letalidade, volume de internações e sensibilidade a tecnologias médicas, ele tem sido
especialmente apontado como um agravo importante no desenvolvimento de padrões e
indicadores para o monitoramento da assistência médica (ESCOSTEGUY et al., 2002;
MELO et al., 2007). A proposta principal do presente estudo foi analisar o perfil das
internações dos pacientes do SUS por IAM no Estado do Rio de Janeiro, verificando as
associações entre as categorias das variáveis escolhidas como relevantes para sua
caracterização. “Gastos” foi escolhida como variável desfecho por se tratar de uma
variável importante sobre a utilização dos recursos relativos às doenças do aparelho
circulatório, principalmente do infarto, visto que, atualmente, as doenças coronarianas
têm um grande impacto financeiro sobre o sistema de saúde, constituindo cerca de 5%
dos gastos com internação (OLIVEIRA et al., 2006).
Uma característica importante do presente trabalho é a representatividade da
amostra utilizada, que contém todos os dados das internações registradas no SUS com
diagnóstico de IAM no ano de 2002, no Estado do Rio de Janeiro. Por outro lado, isso
implicou em uma grande quantidade de informação, dificultando a avaliação e análise
da assistência aos pacientes com IAM. Assim, o banco de dados possuía originalmente
um elevado número de variáveis (48), algumas das quais, apesar de terem importância
para o estudo (como Reinternação ou Diagnóstico secundário), não puderam ser
aproveitadas, devido às subnotificações. As variáveis revascularização miocárdica e
angioplastia coronariana representam, normalmente, procedimentos bastante utilizados
em pacientes enfartados. Como ambas tinham limitada variabilidade no banco de dados,
preferiu-se seu uso na formação de uma nova variável, “utilização de tecnologias”,
55
criada pela combinação destas com as variáveis: transplantes, órteses e próteses,
diagnoses e terapias, transfusões de sangue, tomografia e ressonância. Assim, esta
variável foi criada, permitindo uma melhor caracterização do perfil de internações.
Após as exclusões e aglutinações, das 48 variáveis que formavam o banco de dados
original, apenas 10 foram utilizadas para a análise final.
Os estudos com pacientes internados por IAM, baseados nos prontuários
médicos ou em dados secundários (da própria AIH) em geral utilizam metodologia
multivariada, tal como a modelagem logística reportado por ESCOSTEGUY et al.
(2005). Esse estudo tinha como objetivo avaliar o desempenho do banco da AIH em
relação ao prontuário médico na análise de fatores associados ao risco de óbito
hospitalar por IAM. Para tal, os autores desenvolveram dois modelos, um a partir das
AIH e outro baseado nos prontuários médicos, sendo o melhor ajuste obtido para o
modelo derivado dos prontuários. Embora o modelo proveniente das AIH não tivesse
um ajuste tão bom, não foram observadas modificações significativas entre os modelos.
No entanto, os autores ressaltaram que um melhor ajuste no modelo das AIH poderia ser
conseguido caso as mesmas fossem preenchidas de forma mais adequada.
Outra metodologia já utilizada para a análise do IAM a partir dos dados das AIH
e dos prontuários é o coeficiente de correlação intraclasse Kappa (ESCOSTEGUY et
al., 2002; MELO et al., 2004). Os dois estudos tinham o objetivo de analisar a
concordância entre o diagnóstico principal registrado na AIH e o registro do prontuário
médico, e ambos constataram que a qualidade do registro de IAM notificado na AIH foi
satisfatória.
Um aspecto especialmente importante ao lidar-se com bancos de dados
desenvolvidos por razões administrativas é o relacionamento probabilístico realizado a
partir das bases de dados existentes (SOARES et al., 2006). Esse procedimento consiste
56
em relacionar duas bases de dados, sendo utilizado para identificar indivíduos presentes
em ambas. A idéia básica é utilizar a frequência de uma característica para calcular um
score para cada par hipotético, de forma a caracterizar sua probabilidade de correção.
Em SOARES et al. (2006), a metodologia foi utilizada para averiguar os óbitos
registrados nas AIH de 2002 e os encontrados nas declarações de óbito de 2002 e 2003.
No Brasil, outros trabalhos que se utilizaram dessa metodologia ESCOSTEGUY et al.
(2002; 2005) e MELO et al. (2004).
Esses trabalhos, no entanto, não se utilizaram da metodologia da ACM ou de
outras metodologias de agrupamento de dados, como o Cluster Hierárquico. A
utilização da ACM mostrou-se adequada por permitir a análise de um grande número de
variáveis de forma visual e simplificada, além de também permitir a análise das
associações de variáveis em termos de suas categorias. Isso permitiu estabelecer o perfil
das internações por IAM no Estado do Estado do Rio de Janeiro, detectando e
representando estruturas subjacentes do banco de dados, por meio da redução da sua
dimensionalidade. Como discutido, nessa técnica as associações entre categorias de
variáveis são representadas graficamente, como “mapas”, de forma diferente das
metodologias multivariadas mais clássicas. Assim, o uso da ACM tem pertinência por
facilitar a interpretação da estrutura do banco de dados, vista a grande quantidade de
informações do mesmo.
O mapa de correspondência gerado a partir da ACM apresentou uma inércia
total, considerando-se as duas primeiras dimensões, de 0,89, com a dimensão 1
explicando cerca de 61,8% da variabilidade dos dados e a dimensão 2,
aproximadamente, 27,1%. A dimensão 1 pode ser interpretada com representando de
forma mais direta a estrutura do atendimento hospitalar, destacando-se as variáveis Tipo
de hospital e Região de atendimento. Por outro lado, a dimensão 2 pode ser
57
considerada como mais relacionada aos procedimentos adotados no atendimento aos
pacientes enfartados, destacando-se a variável Utilização de tecnologias. Assim, a partir
das variáveis analisadas, que não incluíam informações clínicas detalhadas sobre o
paciente, mas sim concentravam-se nas características da prestação do serviço,
constatou-se que a estrutura do atendimento hospitalar (tipo de hospital; região de
atendimento) possui um maior percentual de explicação da variabilidade dos casos.
A ACM, em conjunto com a Distância de Tolerância, sugeriu 56 associações,
das quais nove se referem à variável desfecho; sete associadas a gastos inferiores a R$
905,00, sendo elas: sem deslocamento, idade entre 56 e 75 anos, sexo feminino,
utilização de tecnologias de baixa complexidade, óbito em até trinta dias, óbito em um
ano e não utilização de CTI; e, duas relacionadas a gastos superiores a R$ 905,00:
utilização de tecnologias de moderada complexidade e utilização de CTI. Entre as sete,
duas foram consideradas estáveis pelo método de validação empregado (Bootstrap).
Estas associam o gasto inferior a R$ 905,00 (GAST0) à utilização de tecnologias de
baixa complexidade (TEC0) e à não utilização de CTI (CTI0).
Como mencionado, o IAM é um evento agudo que sempre requer atendimento
emergencial seguido de internação. O Mapa de correspondência, juntamente com a
Distância de Tolerância, mostrou que, como esperado, os casos que utilizam tecnologias
de baixa complexidade encontram-se associados com a não utilização de CTI, e que
ambos associam-se a menores gastos. Em contrapartida, os maiores gastos estão mais
associados à utilização de tecnologias de moderada complexidade e à utilização de
unidade altamente especializada (CTI). Embora a utilização de CTIs envolva o
tratamento de alta complexidade, com emprego de equipamentos e tecnologias
onerosas, os casos de utilização de tecnologias de alta complexidade (categoria TEC2
na Figura 5.1), encontravam-se “isolados”, sem associação com utilização de CTI
58
(apesar de localizados no mesmo quadrante da categoria utilização de tecnologias de
moderada complexidade). Este achado sugere que as facilidades disponíveis na CTI não
devem estar sendo adequadamente utilizadas no atendimento destes pacientes e,
consequentemente, em desfecho negativo, o que se refletiria nos mapas de
correspondência em indicar menor associação entre esses casos e a utilização de
tecnologias.
A metodologia também sugeriu associação entre os casos que utilizam
tecnologias de menor complexidade e os pacientes com idade entre 56 e 75 anos. Os
indivíduos nesta faixa etária já possuem circulação colateral (arteriogênese)
(McARDLE, 2006), a qual abranda a intensidade do infarto, tornando o IAM menos
grave, não necessitando de intervenções de alta complexidade. Por outro lado, pessoas
mais novas, por não possuírem um mecanismo auxiliar que auxilie quando da oclusão
total ou parcial de um vaso; e as pessoas mais idosas, debilitadas e com a musculatura
cardíaca enfraquecida, são, normalmente, vítimas de infartos mais graves, de média e
alta complexidade. Todavia, a associação dos casos que utilizam tecnologias de menor
complexidade com o óbito em até 30 dias ou em um ano e com a não utilização de CTI,
apesar de pouco elucidativa, pode estar captando diferenças entre diagnósticos
(influenciando diretamente no tipo de tratamento, devido à real gravidade do caso) e
possíveis casos de altas precoces.
A metodologia da ACM + Distância de Tolerância não apresentou diferenças
significativas relativamente ao método de Cluster Hierárquico. Os agrupamentos
representados pelo Dendrograma (Figura 5.4), elaborados a partir da análise do “nível
de fusão”, que utilizou, posteriormente, quatro grupos (Figura 5.5), são semelhantes aos
achados da metodologia da Distância de Tolerância. Nota-se, porém, que os grupos
formados pela metodologia de agrupamentos hierárquicos englobam categorias que
59
aparentemente encontram-se mais distantes. Essas associações não foram detectadas
pela Distância de Tolerância, a qual é mais rigorosa, formalizada e sistemática na
definição de associações. Além disto, a Distância de Tolerância permite posteriormente
processos de validação, como a análise de estabilidade, procedimento que outras
metodologias não permitem. Desta forma, a Distância de Tolerância pode ser adotada
como um índice objetivo de proximidade entre as categorias das variáveis.
O percentual de óbitos por IAM no estudo é semelhante ao percentual estimado
pelo MINISTÉRIO DA SAÚDE (2011) por meio dos dados obtidos do SIM para óbitos
hospitalares. Em termos gerais, o perfil de gastos segue o padrão nacional, estando os
menores gastos relacionados aos casos que utilizam tecnologias de baixa complexidade
e à não utilização de CTI, e vice-versa. Duas questões, porém, merecem destaque: a
primeira está relacionada à utilização do CTI, que em ambos os sexos (29%), encontrase muito abaixo do observado em países desenvolvidos, como a Espanha (SENDRA et
al., 2005; ESCOSTEGUY et al., 2006). Essa baixa utilização pode ajudar a explicar,
também, a mencionada falta de associação entre os casos de utilização de tecnologias de
alta complexidade e a utilização de CTI, observada neste estudo. A segunda refere-se ao
fato de que, no mapa de correspondência, a categoria sexo masculino (SEXO1)
encontra-se próxima da não óbito, e que a categoria sexo feminino (SEXO0) está
próxima das categorias óbito em até trinta dias (OB1) e óbito em um ano (OB2).
Somente com a visualização do mapa, seria possível que ocorresse a sugestão da
associação do gênero como óbito. No entanto, uma análise mais detalhada (Tabela 5.1),
mostra que a proporção de casos de IAM foi maior entre os homens (sexo masculino –
SEXO1), porém a letalidade foi maior entre as mulheres (sexo feminino – SEXO0), o
que ocasiona a proximidade entre o não óbito e o sexo masculino e o óbito e o sexo
feminino, relações que vem sendo observadas na literatura científica nos últimos anos
60
(ANDERSON e PEPINE, 2007). O mapa de correspondência indica ainda o bem
conhecido fato de que hospitais públicos encontram-se, em sua maioria, na região
metropolitana, e que os hospitais contratados encontram-se principalmente nas regiões
não-metropolitanas. Esse modelo de atenção hospitalar acentua a centralização dos
serviços nos grandes centros urbanos, com grande poder político historicamente
determinado.
A ACM é uma técnica ainda não utilizada para a obtenção do perfil das
internações por IAM e sua relação com o uso dos recursos financeiros. Sendo assim,
algumas limitações deste estudo devem ser consideradas. A utilização de um banco de
dados secundário, ou seja, o uso de informações existentes para investigar outras
questões, para as quais o banco não foi originalmente concebido, pode provocar
problemas, causados, por exemplo, por subnotificações, por falhas metodológicas, ou
até mesmo por erros no preenchimento. No entanto, a consolidação dos dados das AIH
dos pacientes enfartados a partir dos dados provenientes do SIM/SUS (COELI e
CAMARGO Jr., 2002), permitiu que tais dificuldades fossem minimizadas. Além disto,
as bases de dados primárias utilizadas para a formação da base secundária possuem
confiabilidade satisfatória (ESCOSTEGUY et al., 2002; 2005; MELO et al., 2004),
principalmente no que se refere à utilização desse tipo de banco de dados na avaliação
da assistência ao infarto.
Adicionalmente, uma importante limitação no banco das AIH refere-se à
insuficiência de dados para distinguir pacientes com níveis de gravidade distintos,
impedindo aprofundamento na análise. A utilização dos registros de internações apenas
do ano de 2002 e dos registros de mortalidade dos anos de 2002 e 2003 consiste em
outro limite do estudo. Além disto, outro obstáculo reside no fato de que informações
não investigadas podem ter participação no perfil das internações, como por exemplo:
61
intervalo de tempo desde o surgimento dos sintomas até a admissão hospitalar, tamanho
do infarto e situação hemodinâmica no momento da avaliação inicial. Devido à falta de
registros destas variáveis relacionadas aos pacientes enfartados, torna-se difícil chegarse a conclusões mais específicas e detalhadas acerca dos possíveis desfechos clínicos.
Independentemente das limitações encontradas, o estudo possui relevância
científica devido à investigação e utilização de uma metodologia ainda não utilizada
para caracterizar as internações por IAM, além de contribuir para o desenvolvimento
metodológico da discutida Distância de Tolerância. No âmbito social, a relevância
encontra-se no fato do estudo ter gerado informações úteis quanto aos perfis de
internação dos pacientes enfartados, permitindo o uso mais eficiente dos recursos
relativos à saúde, com o objetivo de melhorar a oferta da assistência, e,
consequentemente, melhorar o atendimento aos pacientes. Em termos de pesquisas
futuras, seria interessante a realização de estudos contemplando a utilização de bases de
dados que tenham, originalmente, em sua estrutura, registros sobre o paciente, ou seja,
variáveis relacionadas aos aspectos clínicos e físicos dos indivíduos. Também seria
importante a utilização destas bases por um período de tempo maior do que o utilizado,
o que possibilitaria a obtenção de informações mais precisas, permitindo a utilização
mais eficiente dos recursos financeiros pelos gestores.
62
7 CONCLUSÃO
O IAM é uma patologia multicausal, que atinge todos os extratos da sociedade,
sendo especialmente preocupante devido à dificuldade ou falta de acesso à assistência
da população do país, além da falta de medidas preventivas e de acesso à informação.
Logo, é importante caracterizar as internações por esta patologia, verificando as
associações entre as categorias das variáveis envolvidas, para que se obtenha uma visão
do panorama geral dentro da realidade do país.
A metodologia empregada, Análise de Correspondência Múltipla juntamente
com a Distância de Tolerância, indicou que os menores gastos encontram-se mais
associados à não utilização do CTI e com os casos de utilização de tecnologias de baixa
complexidade. Em contrapartida, os maiores gastos encontram-se mais associados à
utilização dos CTI e com a utilização de tecnologias de moderada complexidade, sendo
este efeito não constatado para casos de utilização de tecnologias de alta complexidade.
Este último aspecto, sugere que as facilidades tecnológicas disponíveis no CTI não
estariam sendo adequadamente empregadas no atendimento dos pacientes internados,
não impedindo, assim, que estes fossem a óbito. Tal interpretação baseia-se em estudos
relatados na literatura que constataram ser a utilização do CTI muito abaixo do
observado em países desenvolvidos.
A ACM e a Distância de Tolerância mostraram-se úteis, com potencial para
contribuir com o processo de tomada de decisão por parte dos gestores em saúde, no que
concerne à utilização mais racional dos recursos. Embora os resultados com esta
metodologia proposta não difiram substancialmente daqueles obtidos com método de
Cluster Hierárquico, a ACM em conjunto com Distância de Tolerância se mostrou mais
robusta, conforme demonstrado pela aplicação do boostrap.
63
Além disto, o estudo ratifica a importância da utilização de técnicas
exploratórias para a análise de bancos de dados utilizados em estudos epidemiológicos
ou na caracterização de serviços de saúde. Assim, a partir da aplicação de técnicas como
a ACM e a Distância de Tolerância, espera-se melhor entender possíveis associações
entre variáveis e, deste modo, visualizar relações em grandes bancos de dados, como
comum na área de saúde.
64
8 REFERÊNCIAS BIBLIOGRÁFICAS
ALMEIDA, R. M. V. R., INFANTOSI, A. F. C., SUASSUNA, J. H. R.,
COSTA, J. C. G. D., 2009, “Multiple Correspondence Analysis in predictive logistic
modelling: application to a living-donor kidney transplantation data”, Computer
Methods and Programs in Biomedicine, v. 95, n. 2 (Ago), pp. 116-128.
ANDERSON, R. D., PEPINE, C. J., 2007, “Gender differences in the treatment
for Acute Myocardial Infarction: Bias or Biology?”, Circulation, v. 115, n. 7 (Fev), pp.
823-826.
BERTRAND, M. E., SIMOONS, M. L., FOX, K. A., WALLENTIN, L. C.,
HAMM, C. W., McFADDEN, E., DE FEYTER, P. J., SPECCHIA, G., RUZYLLO, W.,
2002, “Management of acute coronary syndromes in patient presenting without
persistent ST-segment elevation”, European Heart Journal, v. 23, n. 23 (Dez), pp.
1809-1840.
COELI, C. M., CAMARGO Jr., K. R., 2002, “Avaliação de diferentes
estratégias de blocagem no relacionamento probabilístico de registros”, Revista
Brasileira de Epidemiologia, v. 5, pp. 185-196.
COSTA, J. C. G. D., ALMEIDA, R. M. V. R., INFANTOSI, A. F. C.,
SUASSUNA, J. H. R., 2008, “A heuristic index for selecting similar categories in
Multiple Correspondence Analysis applied to living donor kidney transplantation”,
Computer Methods and Programs in Biomedicine, v. 90, n. 3, pp. 217-229.
65
DAVISON, A. C., HINKLEY, D. V., 1997, Bootstrap Methods and Their
Application, 1 ed. Cambridge, Cambridge University Press.
ESCOSTEGUY, C. C., PORTELA, M. C., MEDRONHO, R. D. A., DE
VASCONCELOS, M. T. L., 2002, “The Brazilian hospital information system and the
acute myocardial infarction care”, Revista de Saúde Pública, v. 36, pp. 491-499.
ESCOSTEGUY, C. C., PORTELA, M. C., MEDRONHO, R. D. A., DE
VASCONCELOS, M. T. L., 2005, “Hospital admissions forms versus medical records
to asses risk of in-hospital death from acute myocardial infarction in Rio de Janeiro,
Brazil”, Cadernos de Saúde Pública, v. 21, n. 4 (Jul-Ago), pp. 1065-1076.
EVANGELISTA, P. A., BARRETO, S. M., GUERRA, H. L., 2008, “Hospital
admissions and hospital death associated to ischemic heart diseases at the National
Health System (SUS)”, Arquivos Brasileiros de Cardiologia, v. 90, n. 2, pp. 130-138.
GREENACRE, M. J., 1992, “Correspondence Analysis in medical research”,
Statistical Methods in Medical Research, v. 1, pp. 97-117.
GREENACRE, M. J., HASTIE, T., 1987, “The geometric interpretation of
correspondence analysis”, Journal of American Statistical Association, v. 82, pp. 437447.
GREENACRE, M., 2007, Correspondence Analysis in practice. 2 ed. Barcelona,
Chapman & Hall
66
GREENACRE, M. J., NENADIC, O., 2007, “Correspondence Analysis in R,
with two and three-dimensional graphics: the ca package”, Journal of Statistical
Software, v. 20, n. 3.
GUYTON, A. C., HALL, J. E., 2006, Tratado de Fisiologia Médica. 11 ed. Rio
de Janeiro, Elsevier.
HAIR, J. R., HAIR, J. F., ANDERSON, R. E., TATHAM, R., BLACK, W.,
2009, Análise multivariada de dados. 6 ed. São Paulo, Bookman.
LEBART, L., 2007, “Which Bootstrap for Principal Axes Method?”, In:
Selected Contributions in Data Analysis and Classification, Studies in Classification,
Data Analysis and Knowledge Organisation Series, Springer, pp. 581-588.
LE ROUX, B., ROUANET, H., 2004, Geometric Data Analysis, 1 ed.
Dordrecht, The Netherlands, Kluwer Academic Publishers.
MALTA, D.C., CEZÁRIO, A. C., MOURA, L., MORAIS NETO, O. L., SILVA
Jr, J. B., 2006, “A construção da vigilância e prevenção das doenças crônicas não
transmissíveis no contexto do Sistema Único de Saúde”, Epidemiologia e Serviços de
Saúde, v. 15, pp. 47-65.
McARDLE, W. D., KATCH, F. I., KATCH, V. L., 2006, Fisiologia do
exercício: energia, nutrição e desempenho humano, 2 ed. São Paulo, Manole.
67
MELO, E. C. P., TRAVASSOS, C. M. R., CARVALHO, M. S., 2004, “Quality
of data on myocardial infarction deaths, Brazil”, Revista de Saúde Pública, v. 38, n. 3,
pp. 385-391.
MELO, E. C. P., TRAVASSOS, C. M. R., CARVALHO, M. S., 2007, “Infarto
agudo do miocárdio no Município do Rio de Janeiro: qualidade dos dados, sobrevida e
distribuição espacial”, Epidemiologia e Serviços de Saúde, v. 16, pp. 121-123.
MINGOTI, S. A., 2005, Análise de dados através de métodos de estatística
multivariada: uma abordagem aplicada, 1 ed. Belo Horizonte, Editora UFMG.
MINISTÉRIO DA SAÚDE, 2004, Saúde Brasil 2004: uma análise da situação
da saúde. Secretaria de Vigilância em Saúde, Brasília.
MINISTÉRIO DA SAÚDE, 2005, A vigilância, o controle e a prevenção das
doenças crônicas não-transmissíveis: DCNT no contexto do Sistema Único de Saúde
brasileiro. Organização Pan-Americana da Saúde, Brasília.
MINISTÉRIO DA SAÚDE, 2011, Sistema Informações sobre Saúde, Disponível
em: <http://www2.datasus.gov.br/DATASUS/index.php?area=02>. Acesso em 22 mar.
2011, 10:23.
MOITA NETO, J. M., 2004, Estatística Multivariada: uma visão didáticametodológica, Disponível em: <http://criticanarede.com/cien_estatistica.html>. Acesso
em 6 ago. 2010, 15:55.
68
MOITA NETO, J. M., 2006, Estatística Multivariada, 1 ed. Piauí, Fundação de
Amparo à Pesquisa do Estado do Piauí.
MSDONLINE – Manual Merck saúde para família, 2011, Irrigação sanguínea
do coração. Disponível em: < http://mmspf.msdonline.com.br/pacientes/manual_merck/
secao_03/cap_014.html>. Acesso em: 27 out. 2011, 16:58.
MYOCARDIAL INFARCTION REDEFINED, 2000, “Myocardial infarction
redefined: a consensus document of the joint European society of cardiology/American
College of Cardiology Committee for the redefinition of myocardial infarction”,
European Heart Journal, v. 21, n. 18, pp. 1502-1513.
NEWBY, L. K., ALPERT, J. S., OHMAN, E. M., THYGESEN, K., CALIFF, R.
M., 2002, “Changing the diagnosis of acute myocardial infarction: implications for
practice and clinical investigations”, American Heart Journal, v. 144, n. 6 (Dez), pp.
957-980.
OLIVEIRA, G. M. M. D., KLEIN, C. H., SOUZA E SILVA, N. A. D.,
GODOY, P. H., FONSECA, T. M. P., 2006, “Ischemic heart disease lethalities in the
State of Rio de Janeiro between 1999 and 2003”, Arquivos Brasileiros de Cardiologia,
v. 86, pp. 131-137.
ORGANIZAÇÃO MUNDIAL DE SAÚDE (OMS), 2011, Cardiovascular
Diseases (CVDs), Fact Sheet nº.: 317. Disponível em: <http://www.who.int/media
centre/factsheets/fs317/en/index.html>. Acesso em: 01 fev. 2011, 9:45
69
RAMIARINA, R., ALMEIDA, R. M. V. R., PEREIRA, W., 2006,
“Determinação e predição do custo de internação e sua relação com as características
dos pacientes”. In: Anais do Congresso Brasileiro de Engenharia Biomédica, São
Pedro, São Paulo.
RIBEIRO, R. A., MELLO, R. G. B., MELCHIOR, R., DILL, J. C.,
HOHMANN, C. B., LUCCHESE, A. M., STEIN, R., RIBEIRO, J. P., POLANCZYK,
C. A., 2005, “Annual cost of ischemic heart disease in Brazil. Public and private
perspective”, Arquivos Brasileiros de Cardiologia, v. 85, n. 1 (Jul), pp. 3-8.
ROUQUAYROL, M. Z., ALMEIDA FILHO, N., 2003, Epidemiologia e Saúde,
6 ed. Rio de Janeiro, Editora Medsi.
R Development Core Team, R: A language for statistical computing. R
Foundation for Statistical Computing, Vienna, Austria, 2007, Disponível em
<http://www.R-project.org>.
SCHRAMM, J. M. A., OLIVEIRA, A. F., LEITE, I. C., VALENTE, J. G.,
GADELHA, A. M. J., PORTELA, M. C., CAMPOS, M. R., 2004, “Transição
epidemiológica e o estudo da carga de doença no Brasil”, Ciência e Saúde Coletiva, v.
9, n. 4, pp. 897-908.
SENDRA, J. M., SANTAMERA, A. S., IÑIGOC, J., REGIDORA, E., 2005,
“Factores asociados a la mortalidad intrahospitalaria del infarto de miocardio.
70
Resultados de un estudio observacional”, Medicina Clinica (Barc), v. 125, n. 17, pp.
641-646.
SOARES, C. C. P., PINHEIRO, R. S., ESCOSTEGUY, C. C., 2006, “Survival
after acute myocardial infarction in patients admitted in the Brazilian Health Unified
System hospitals” Cadernos de Saúde Coletiva, v. 14, pp. 411-416.
TIMERMAN, A., FEITOSA, G. A., 2003, Síndromes coronarianas agudas, 1
ed. Rio de Janeiro, Atheneu.
WERF, F. V., ARDISSINO, D., BETRIU, A., COKKINOS, D. V., FALK, E.,
FOX, K. A., JULIAN, D., LENGYEL, M., NEUMANN, F. J., RUZYLLO, W.,
THYGENSEN, C., UNDERWOOD, S. R., VAHANIAN, A., VERHEUGT, F. W.,
WIJNS, W., 2003, “Management of acute myocardial infarction in patients presenting
with ST-segment elevation. The task force on the management of acute myocardial
infarction of the European society of cardiology”, European Heart Journal, v. 24, n. 1,
pp. 28-66.
WIKICOMMONS – WIKIMEDIA.ORG, 2011, Diagram of the human heart.
Disponível em: <http://commons.wikimwdia.org/wiki/File:Diagram_of_the_human_
heart_(cropped)_pt.svg. Acesso em: 10 mar. 2011, 14:37.
71
9 ANEXO I
Variáveis
Número do paciente
Naturalidade
Número da AIH
Número do município
Número do prontuário
CGC
Nome do hospital
Número do hospital
Complemento
UF
CEP
Protocolo AIH
Processos
Exclusão das variáveis de
IDENTIFICAÇÃO
Nascimento do filho
Sexo do filho
Bairro de atendimento
CEP atendimento
Município de atendimento
Código do estabelecimento
Exclusão das variáveis relacionadas à
MATERNIDADE e AFINS
Data de internação
Data de saída
Data de nascimento
Data de óbito
Data de nascimento do filho
Data de internação (maternidade)
Data de saída (maternidade)
Exclusão das varáveis relacionadas as
DATAS
IP-descritivo
Descrição do DP
Descrição do DS
Cobrança
Exclusão das variáveis SEM
RELEVÂNCIA
72
Atendimento
Origem
Formação da variável DESLOCAMENTO
Revascularização
Angioplastia
Diagnoses e terapias
Órteses e próteses
Transfusão de sangue
Ressonância
Transplantes
Formação da variável UTILIZAÇÃO DE
TECNOLOGIAS
Reinternação
Diagnóstico secundário
Exclusão das variáveis com uma das
categorias com menos de 5%
73
Download

caracterização das internações por infarto agudo do