AJUSTE DE CURVAS PELO MÉTODO DOS QUADRADOS MÍNIMOS Bruna Larissa Cecco1 Angelo Fernando Fiori2 Grazielli Vassoler3 Resumo: Em muitos ramos da ciência, dados experimentais são utilizados para deduzir uma relação matemática entre as variáveis que estão sendo medidas. A partir de estudos e apresentação de seminários semanais foi selecionado o tema a ser abordado neste trabalho: Ajuste de Curvas pelo Método dos Quadrados Mínimos e sua importância para a determinação de parâmetros de funções. Este método é utilizado para aproximar dados obtidos experimentalmente por uma função linear ou não linear. Está situado no ramo da matemática numérica e pode ser implementado em diversos softwares numéricos. Em materiais e métodos é apresentado uma revisão da bibliografia estudada e diversos conceitos, demonstrações e propriedades que serão utilizados no decorrer do trabalho. É dada maior atenção às funções não lineares, demonstram-se duas linearizações: para função exponencial e hipérbole. Nos resultados e discussões mostra-se uma aplicação para o Método dos Mínimos Quadrados: determinar a curva que melhor determina o crescimento da população de Chapecó em função do tempo, ou seja, a partir de uma tabela de dados determina-se o melhor ajuste de curvas para o crescimento da população de Chapecó em função do tempo. O diagrama de dispersão é utilizado para, inicialmente, escolher o tipo de curva que será determinada. Esta curva exponencial, depois de linearizada e com os parâmetros ajustados representa a curva que melhor se ajusta aos dados da referida tabela. Utiliza-se o software Matlab para plotar os gráficos e determinação dos parâmetros. Para as considerações aborda-se a importância da continuidade das pesquisas na área da matemática, pois os resultados obtidos nesta podem, por exemplo, fornecer uma estimativa da população de Chapecó para o ano de 2020. Palavras-chave: Função. Crescimento Populacional do Município de Chapecó. Linearização. 1. Introdução O Método dos Quadrados Mínimos é aplicado quando se tem um conjunto de pontos e pretende-se definir a curva que melhor se ajusta a este. Estudando a relação entre duas variáveis, deve-se inicialmente fazer um gráfico de dados, 1 2 Acadêmica da UNOCHAPECÓ, 5º período de Matemática. E-mail: [email protected] Co-autor, acadêmico [email protected] 3 da UNOCHAPECÓ, 5º período de Matemática. Orientadora. Docente da ACEA – UNOCHAPECÓ. E-mail: [email protected] E-mail: conhecido como diagrama de dispersão, o qual irá fornecer uma ideia de qual é a função aproximada determinada pelos pontos. Como “os valores que uma variável pode assumir estão associados, além dos erros experimentais, a outras variáveis cujos valores se alteram durante o experimento” (BARROSO, 1987, p. 323), é que o Método dos Quadrados Mínimos tem grande aplicação, pois ajusta estas funções já tabeladas a uma função que represente uma boa aproximação para os valores já conhecidos. Segundo Claudio e Marins (1989, p. 231) “a aproximação por mínimos quadrados ocorre numa variedade de aplicações sob diferentes nomes: otimização linear, análise de regressão, suavização de dados”. Este método se divide em Caso Contínuo e Caso Discreto. O Caso Discreto resolve problemas em que se têm dados tabelados e desejase a aproximação por uma função. Para o Caso Contínuo é necessário que se tenha uma função, então para esta é dada uma nova aproximação. Este trabalho visa aplicar o Caso Discreto deste método. O Caso Discreto, pode ser linear ou não linear, caso seja não linear é preciso que se faça uma linearização adequada. Então, aqui, sugerem-se diversas formas de linearizar dados tabelados. A escolha da melhor linearização depende de cada problema em estudo. Pretende-se também utilizar os conteúdos abordados e definidos aplicando o Método dos Quadrados Mínimos e seu Caso discreto para ajustar uma função que melhor determine o crescimento da população de Chapecó em função dos anos, ou seja, a partir de dados tabelados determinar uma função que melhor se aproxime destes dados. A grande vantagem ao se determinar esta função aproximada é que será possível estimar o número de habitantes de Chapecó em qualquer tempo (ano) que se desejar. Então, este trabalho se faz importante, pois apresenta uma forma de ajustar dados obtidos experimentalmente de forma que o erro seja mínimo. 2. Materiais e métodos O desenvolvimento deste trabalho deu-se a partir da formação de um grupo de estudos da matemática e apresentações semanais de seminários realizados pelos alunos. Após o estudo do tema e demonstrações de algumas propriedades pesquisou-se uma tabela com os valores referentes ao crescimento da população de Chapecó em função do tempo para apresentar uma aplicação do Método. Para plotar a solução utilizou-se o software numérico Matlab. As questões abordadas neste trabalho são: Como aproximar dados obtidos experimentalmente por uma curva (linear, exponencial, geométrica...) utilizando o Método dos Quadrados Mínimos; como este método pode ser utilizado para calcular uma função que melhor determine o crescimento da população de Chapecó. É apresentada uma aproximação que consta na literatura para demonstrar a utilização do Método dos Quadrados Mínimos. 3. Resultado e discussão 3.1. Método dos quadrados mínimos - caso discreto Neste caso, tem-se uma função a função é conhecida em definida por um conjunto discreto, isto é, pontos, que normalmente são obtidos em experimentos. Tem-se então a tabela de pontos com pertencentes a um intervalo . Devemos considerar que o número de pontos tabelados é sempre maior ou igual ao número de funções escolhidas ou o número de coeficientes a se determinar. Ruggiero e Lopes (1996) dizem que o ajuste consiste em encontrar, a curva que melhor se ajusta aos pontos , ou seja, deve- se determinar a menor distância possível entre os pontos da tabela e a curva, isto é, determinar os coeficientes tais que a função tenha a menor distância possível de Seja chamado de desvio em , ou seja, se aproxime ao máximo de a distância vertical do ponto . Onde que à curva, também seja mínimo para todo Assim, desejamos encontrar uma função que melhor se aproxime da função que , de forma seja mínimo. Ruggiero e Lopes (1996) afirmam ainda que no Método dos Quadrados Mínimos os coeficientes de são calculados de modo que seja mínima a soma dos quadrados dos desvios. Isto significa que os coeficientes minimizam a função Do Cálculo Diferencial, sabe-se que para se obter um ponto de mínimo de , deve-se inicialmente encontrar os pontos críticos, isto é, os , tais que: Calculando as derivadas parciais, Para , tem-se que: Para , tem-se que: Simplificando por 2 as derivadas parciais, e igualando-as a zero, obtém-se o sistema (2): Reorganizando (2) tem-se que: Onde são as incógnitas do sistema linear (3) com equações, as quais são chamadas de equações normais. Desta forma, o sistema linear (3) pode ser escrito na forma matricial Onde é tal que (ou seja, A é simétrica) é tal que: De acordo com Arenales e Darezzo (2008), resolvendo o sistema de equações normais (3), consequentemente a função se ajusta a função determinam-se os parâmetros e que melhor , e, de fato, minimizam a soma dos quadrados dos desvios. Logo, pode-se observar que uma vez escolhido o grau do polinômio seus coeficientes são determinados de maneira que , seja mínimo. 3.2. Casos reduzíveis ao linear Em alguns casos, obtém-se em laboratórios dados experimentais em que o ajuste linear não pode ser considerado, pois não é combinação linear dos parâmetros. “Neste caso, necessitamos de outras famílias de funções para representar adequadamente uma função representada em uma tabela” (ARENALES; DAREZZO, 2008, p. 171). Ruggiero e Lopes (1996) citam ainda que para se aplicar o Método dos Quadrados Mínimos, é necessário que se efetue uma linearização do problema através de alguma transformação conveniente, ou seja, adaptamos o caso a um ajuste linear. A seguir serão apresentados alguns ajustes de problemas não lineares. 3.2.1. Ajuste a uma curva exponencial Aos casos em que no gráfico dos dados obtidos experimentalmente, observase que a função deve ser aproximada por uma função com os parâmetros e da forma positivos, aplica-se: Definindo então que: Tem-se então que , ou seja, Assim, se a função aproxima é uma combinação linear das funções . aproxima a função , então a função e Assim, pode-se construir a Tabela 1: Tabela 1: Dados linearizados para a função exponencial Desta forma, em vez de se ajustar ajusta-se pelo Método dos Quadrados Mínimos, pelo Método dos Quadrados Mínimos, onde se tem , com e Agora, pode ser escrito o sistema (4) de equações normais: Depois de e encontrados, e lembrando que: Assim, obtém-se a função aproximada Para determinar qual é o desvio dessa função . à função , pode-se resolver a equação (5): Onde . Ruggiero e Lopes (1996) ainda observam que os parâmetros assim obtidos não são os melhores dentro do critério dos Quadrados Mínimos, isto porque se ajusta o problema linearizado pelo Método dos Quadrados Mínimos e não o problema original. 3.2.2. Ajuste por uma hipérbole Este ajuste é utilizado se no diagrama de dispersão obtido dos dados experimentais, observa-se que forma . deve ser aproximada por uma função da Se a função aproxima a função considera-se então, uma função função dada inicialmente, que também se aproxima da e tem-se agora o caso do ajuste linear, que pode ser resolvido pelo Método dos Quadrados Mínimos. Se se aproxima da função , se aproxima da função Esquematizando: Da tabela de dados, obtida experimentalmente, pode-se construir a Tabela 2: Tabela 2: Dados linearizados para a função hipérbole . ... . ... Desta forma, ao invés de se ajustar se a função por uma reta por Quadrados Mínimos, aproximapor Quadrados Mínimos, encontrando , onde e . Pode ser escrito o sistema linear (6): Depois de determinados e Tem-se a função aproximada , e lembrando que e . Da mesma forma para determinar qual é o desvio da função à função Onde , podemos fazer: . . em relação 3.2.3. Outros ajustes não lineares Segundo Ruggiero e Lopes (1996) é bastante comum de se encontrar casos em que os dados tabelados e construído o diagrama de dispersão devem ser ajustado por funções não lineares. Serão apresentados outros exemplos de como transformar os modelos não lineares em modelos linearizados, que devem ser ajustados por: a) Uma curva exponencial: b) Uma curva geométrica: Aqui se encontra o modelo linear, onde se minimiza a soma dos quadrados dos desvios nos logaritmos de , para os logaritmos de . c) Uma curva trigonométrica: Chamando , então: Neste caso, já podemos minimizar a soma dos quadrados dos desvios em . 3.2.4. Aplicação do ajuste não linear O ajuste de curvas pelo Método dos Quadrados Mínimos tem muitas aplicações. Uma dessas aplicações é apresentada neste trabalho: Determinar qual é a função que melhor expressa o crescimento populacional da cidade de Chapecó em função do tempo (em anos). A Tabela 3 foi construída a partir de dados retirados do site da Prefeitura de Chapecó e do site do IBGE e fornece a população (número de habitantes) de Chapecó desde 1960. Tabela 3: Crescimento da população de Chapecó desde 1960 Ano População 1960 52089 1970 49865 1980 83768 1991 1996 2000 2007 2010 123050 129794 146967 164803 183561 Pretende-se determinar a função que melhor se aproxima aos pontos dados na Tabela 3 utilizando a teoria apresentada. Antes disso, com os pontos expressos na Tabela 3, deve ser feito o diagrama de dispersão que pode ser observado na Figura 1. 2 x 10 5 1.8 População (milhares) 1.6 1.4 1.2 1 0.8 0.6 0.4 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010 Tempo (anos) Figura 1: Diagrama de dispersão para os Dados da Tabela 3 Observando a Figura 1, a função que melhor se aproxima dos pontos dados na Tabela 3 é uma função do tipo: Para facilitar os cálculos, Ruggiero e Lopes (1996) sugerem que se mude a escala dos anos por e optou-se também por se fazer a seguinte simplificação para população: . Estas simplificações podem ser observadas na Tabela 4, ou seja, a Tabela 3 transforma-se em: Tabela 4: Dados da Tabela 3 simplificados 6 7 8 9,1 9,6 10 10,7 11 5,2089 4,9865 8,3768 12,3050 12,9794 14,6967 16,4803 18,3561 Com os dados da Tabela 4, é possível, a construção da Figura 2 em nova escala se comparada com a Figura 1. 20 18 16 Eixo y 14 12 10 8 6 4 6 6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 Eixo x Figura 2: Diagrama de Dispersão para os Dados da Tabela 4 Como a curva vai se aproximar de uma função do tipo exponencial: Então temos que linearizar esta função, ou seja: Tem-se que , isto é, temos que combinação linear das funções e é uma . Desta forma, constrói-se a Tabela 5 com os valores aproximados da função linearizada: Tabela 5: Dados aproximados da função linearizada 6 7 8 9,1 9,6 10 10,7 11 1,6504 1,6067 2,1255 2,5100 2,5634 2,6876 2,8022 2,9100 Assim, com os valores da Tabela 5, pode-se linearizar os dados da Tabela 4 e observar esta linearização na Figura 3: 3 Eixo y 2.5 2 1.5 6 6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 Eixo x Figura 3: Linearização dos Dados da Tabela 4 Com os dados da Tabela 5, escreve-se o sistema (7) de equações normais: Para a resolução dos somatórios do sistema (7) tem-se a Tabela (6): Tabela 6: Resolução dos somatórios 6 7 8 9,1 9,6 10 10,7 11 36 49 64 82,81 92,16 100 114,49 121 1,6504 1,6067 2,1255 2,5100 2,5634 2,6876 2,8022 2,9100 9,9024 11,2469 17,004 22,841 24.60864 26,876 29,98354 32,01 Reescrevendo o sistema (7) temos: O sistema (8) foi reescrito com os valores dados pela Tabela 6, e fornecerá os valores aproximados da função. Para determinação dos valores de e com maior número de casas decimais utilizou-se o comando format long do software Matlab: Isso significa que a função linearizada é: Porém, pretende-se encontrar a função e sabe-se que: portanto: Então, a função que melhor se aproxima ao crescimento da população em função dos anos é: onde Na Figura 4 é plotada a solução exata (a partir dos dados da Tabela 4) e a solução aproximada (a partir da função (9)) para visualização dos resultados. O que pode ser observado que é a função aproximada (9) obtida pelo Método dos Quadrados Mínimos é uma boa escolha, ou seja, se aproxima muito da solução exata e pode ser utilizada para se obter aproximações para o crescimento da população de Chapecó em função do tempo, 20 Sol. Exata Sol. Aproximada 18 16 Eixo y 14 12 10 8 6 4 6 6.5 7 7.5 8 8.5 9 9.5 10 10.5 11 Eixo x Figura 4: Melhor Ajuste de Curva para os Dados da Tabela 4 4. Considerações Este trabalho apresentou o ajuste de curvas pelo Método dos Quadrados Mínimos para dados lineares e não lineares. Trouxe também uma aplicação deste método para o caso não linear, ou seja, traz como contribuição a determinação de uma função (9) que pode ser utilizada para determinação do crescimento da população da cidade de Chapecó em função dos anos. Observa-se que o ajuste de curvas pelo Método dos Quadrados Mínimos é uma boa escolha, pois minimiza a função encontrando a curva que melhor se ajusta aos dados experimentais. Assim, obtém-se como resultado que a curva que melhor se ajusta ao crescimento populacional da cidade de Chapecó é uma curva exponencial, ou seja, a população cresce exponencialmente. Com estes resultados é possível determinar estimativas para a população em diferentes períodos na cidade de Chapecó. Por exemplo, desejando determinar qual a população desta cidade no ano de 2020 utiliza-se a mudança de variável abaixo: Substituindo na função (9): Assim, se a população de Chapecó continuar crescendo exponencialmente os resultados deste trabalho mostram que em 2020 será de aproximadamente 248.540 habitantes. 5. Referências ARENALES, Selma; DAREZZO, Artur. Cálculo numérico: Aprendizagem com apoio de software. São Paulo: Thomson Learning, 2008. BARROSO, Leônidas Conceição et al. Cálculo numérico (com aplicações). 2. ed. São Paulo: Harbra, 1987. CLÁUDIO, Dalcidio Moraes; MARINS, Jussara Maria. Cálculo numérico computacional: teoria e prática. São Paulo: Atlas, 1989. IBGE. Disponível em: <http://www.ibge.gov.br/cidadesat/painel/painel.php?codmun=420420#>. Acesso em: 04 jul. 2011. LEON, Steven J. Álgebra linear com aplicações. 4. ed. Rio de Janeiro: LTC , 2008. MASSARANI, Giulio. Introdução ao cálculo numérico. Rio de Janeiro: Ao Livro Técnico, 1967. PREFEITURA DE CHAPECÓ. Chapecó, 2011. Disponível em: <http://www.chapeco.sc.gov.br/prefeitura0/index.php?pagina=chapeco_dados.html&menu=menu_nos sa_cidade. Acesso em: 04 jul. 2011. RUGGIERO, Márcia A. Gomes; LOPES, Vera Lúcia da Rocha. Cálculo numérico: aspectos teóricos e computacionais. 2. ed. São Paulo: Pearson Makron Books, 1996.