Modelagem Matemática utilizando Banco de Dados:
problemas de ajuste linear
Everton de Rezende
Universidade Nove de Julho - Departamento dos Cursos de Informática
01156-050, Campus Memorial, São Paulo, SP
E-mail: [email protected]
Ana Leda Silva Moraes
Claudia Courtouké
Universidade Nove de Julho - Departamento dos Cursos de Informática
01156-050, Campus Memorial, São Paulo, SP
E-mail: [email protected]
RESUMO
A utilização de modelos matemáticos teóricos para explicar fenômenos naturais se faz presente
em estudos relacionados às mais diversas áreas do conhecimento, tais como, a Física, a
Engenharia, as Ciências Sociais, Econômicas, da Saúde e Biológicas [1], [2], [3]. O uso bem
sucedido desses modelos requer o entendimento da base teórica do fenômeno, das
características matemáticas e estatísticas do modelo e os problemas práticos que podem ocorrer,
caso esses modelos sejam utilizados em situações reais.
Na prática, parte-se de um conjunto de observações que descrevem o fenômeno que se quer
estudar, ou seja, de um conjunto de dados. Deseja-se encontrar um modelo que seja capaz de
descrever a tendência existente entre os dados, ou ainda, entre as variáveis, dependente e
independente, que são usadas no modelo. Na maior parte das vezes, os dados a serem utilizados
na modelagem advêm de experimentações físicas e, como tais, estão sujeitas a erros, pequenos
desvios, que devem ser considerados no momento da escolha do modelo.
Uma vez que o modelo é escolhido o próximo passo consiste em se obter os melhores ajustes
para os parâmetros, ou seja, parâmetros que minimizam as diferenças entre o valor real e o valor
da estimativa obtida pela aplicação do modelo. Os intervalos de confiança ou as incertezas
associadas a cada parâmetro devem ser calculados, pois há a propagação dos erros, inerentes ao
processo de obtenção do conjunto de dados.
Finalmente, é necessária a aplicação de um teste estatístico capaz de avaliar a qualidade do
modelo ajustado ao conjunto de dados e, dessa forma, garantir a integridade e a confiabilidade
das estimativas calculadas.
Esse tipo de abordagem, descrita nos últimos parágrafos, está presente na maioria dos estudos
que visa ajustar dados experimentais a modelos pré-estabelecidos com posterior análise de
resultados [4]. Além disso, se aplicada em conjunto com técnicas de Cálculo Numérico [5], [6],
[7] e utilização de um banco de dados robusto, constitui uma das mais poderosas ferramentas de
análise estatística.
Como objetivo do estudo, construímos um aplicativo computacional que, a partir de uma base
de dados, é capaz de ajustar aos dados o modelo linear, estimar as incertezas associadas aos
parâmetros, aplicar um critério para verificação da qualidade do ajuste [4] e armazenar
resultados para a realização de análises comparativas.
Os dados de entrada são compostos por n (n 2) pares, tipicamente, constituídos por uma
variável independente (x) e outra dependente (y), além da introdução, se desejado, do erro
cometido na medição de y, denominado σ. Para cada conjunto de n pares de dados, o ajuste da
curva correspondente ao modelo linear é feito, numericamente, a partir do algoritmo do método
dos mínimos quadrados [5], [6], [7]. O método dos mínimos quadrados fornece as estimativas
dos parâmetros que compõem o modelo linear. Uma vez calculadas tais estimativas, são
computadas as incertezas associadas a cada uma delas e guardadas em um banco denominado
de banco de resultados. Para investigarmos a qualidade do ajuste linear ao conjunto de dados,
1013
usamos um critério baseado na estatística χ2 [4]. Inicialmente, a codificação para cumprir tal
tarefa, foi feita usando-se a linguagem C/C++, por ser robusta e capaz de operar no sistema de
ponto flutuante massivamente [8], [9]. A validação dos algoritmos, numericamente, foi
realizada a partir de problemas disponíveis em livros e cujas soluções analíticas são conhecidas
[4], [5], [6], [7].
O banco de dados que armazena os parâmetros para validação desse experimento foi
desenvolvido em SQL Server Compact 3.5. Essa é uma versão gratuita disponibilizada pela
Microsoft para utilização de pequenas empresas ou estudantes, não gerando nenhuma
necessidade de licença ou custo adicional. O aplicativo foi escrito na linguagem C# pacote
Microsoft Visual C# 2008 Express Edition, acessando o banco de dados SQL Server.
Com a utilização deste aplicativo é possível, a partir de uma base de dados, o ajuste do modelo
linear a esses dados, as estimavas das incertezas associadas a cada parâmetro do modelo, a
verificação da qualidade do ajuste linear e o armazenamento dos resultados para a realização de
análises comparativas. Além disso, o aplicativo permite a introdução dos dados via arquivo de
texto, ou ainda, digitada pelo usuário, sua interface gráfica é amigável e de fácil manipulação.
Palavras-chave: Modelos matemáticos, Ajustes de curvas, Construção de Banco de Dados.
Referências
[1] A. Grafen A, R. Hails, "Modern Statistics for the Life Sciences", Oxford: Oxford
University Press, 2002.
[2] C. Courtouké, "Identificação de tendências evolutivas de marcadores de replicação viral e
do status imunológico de pacientes vivendo com HIV: impacto da terapia anti-retroviral
inicial sobre a resposta ao tratamento", Tese de Doutorado, FMUSP, 2008.
[3] E.S.A. de Araújo, C. Courtouké, "Conceitos e utilização clínica de cinética do HCV", In:
Roberto Focaccia. (Org.). Tratado de Hepatites Virais, 2ª ed. São Paulo: Editora Atheneu,
pp. 187-194, 2007.
[4] P.R. Bevington, D.K. Robinson, "Data Reduction and Error Analysis for the Physical
Sciences", New York: McGraw-Hill, 2003.
[5] D. Sperandio, J.T. Mendes, L.H. Monken e Silva, "Cálculo Numérico: características
matemáticas e computacionais dos métodos numéricos", São Paulo: Prentice Hall, 2006.
[6] W.L. Roque, "Introdução ao Cálculo Numérico: um texto integrado com o Derive®", São
Paulo: Atlas, 2000.
[7] M.A.G. Ruggiero, V.L.R. Lopes, "Cálculo Numérico: Aspectos Teóricos Computacionais",
2ª ed. São Paulo: Pearson Education, 1996.
[8] W.H. Press, "Numerical recipes in C: the art of Scientific Computing". New York:
Cambridge University Press, 2006.
[9] B.H. Flowers, "An Introduction to Numerical Methods in C++", Oxford: Oxford University
Press, 2000.
1014
Download

Modelagem Matemática utilizando Banco de Dados: problemas de