AJUSTE DE CURVAS PELO MÉTODO DOS QUADRADOS MÍNIMOS
Bruna Larissa Cecco1
Angelo Fernando Fiori2
Grazielli Vassoler3
Resumo: Em muitos ramos da ciência, dados experimentais são utilizados para deduzir uma relação
matemática entre as variáveis que estão sendo medidas. A partir de estudos e apresentação de
seminários semanais foi selecionado o tema a ser abordado neste trabalho: Ajuste de Curvas pelo
Método dos Quadrados Mínimos e sua importância para a determinação de parâmetros de funções.
Este método é utilizado para aproximar dados obtidos experimentalmente por uma função linear ou
não linear. Está situado no ramo da matemática numérica e pode ser implementado em diversos
softwares numéricos. Em materiais e métodos é apresentado uma revisão da bibliografia estudada e
diversos conceitos, demonstrações e propriedades que serão utilizados no decorrer do trabalho. É
dada maior atenção às funções não lineares, demonstram-se duas linearizações: para função
exponencial e hipérbole. Nos resultados e discussões mostra-se uma aplicação para o Método dos
Mínimos Quadrados: determinar a curva que melhor determina o crescimento da população de
Chapecó em função do tempo, ou seja, a partir de uma tabela de dados determina-se o melhor ajuste
de curvas para o crescimento da população de Chapecó em função do tempo. O diagrama de
dispersão é utilizado para, inicialmente, escolher o tipo de curva que será determinada. Esta curva
exponencial, depois de linearizada e com os parâmetros ajustados representa a curva que melhor se
ajusta aos dados da referida tabela. Utiliza-se o software Matlab para plotar os gráficos e
determinação dos parâmetros. Para as considerações aborda-se a importância da continuidade das
pesquisas na área da matemática, pois os resultados obtidos nesta podem, por exemplo, fornecer
uma estimativa da população de Chapecó para o ano de 2020.
Palavras-chave: Função. Crescimento Populacional do Município de Chapecó. Linearização.
1. Introdução
O Método dos Quadrados Mínimos é aplicado quando se tem um conjunto de
pontos e pretende-se definir a curva que melhor se ajusta a este. Estudando a
relação entre duas variáveis, deve-se inicialmente fazer um gráfico de dados,
1
2
Acadêmica da UNOCHAPECÓ, 5º período de Matemática. E-mail: [email protected]
Co-autor,
acadêmico
[email protected]
3
da
UNOCHAPECÓ,
5º
período
de
Matemática.
Orientadora. Docente da ACEA – UNOCHAPECÓ. E-mail: [email protected]
E-mail:
conhecido como diagrama de dispersão, o qual irá fornecer uma ideia de qual é a
função aproximada determinada pelos pontos.
Como “os valores que uma variável pode assumir estão associados, além dos
erros experimentais, a outras variáveis cujos valores se alteram durante o
experimento” (BARROSO, 1987, p. 323), é que o Método dos Quadrados Mínimos
tem grande aplicação, pois ajusta estas funções já tabeladas a uma função que
represente uma boa aproximação para os valores já conhecidos.
Segundo Claudio e Marins (1989, p. 231) “a aproximação por mínimos
quadrados ocorre numa variedade de aplicações sob diferentes nomes: otimização
linear, análise de regressão, suavização de dados”. Este método se divide em Caso
Contínuo e Caso Discreto.
O Caso Discreto resolve problemas em que se têm dados tabelados e desejase a aproximação por uma função. Para o Caso Contínuo é necessário que se tenha
uma função, então para esta é dada uma nova aproximação.
Este trabalho visa aplicar o Caso Discreto deste método. O Caso Discreto,
pode ser linear ou não linear, caso seja não linear é preciso que se faça uma
linearização adequada. Então, aqui, sugerem-se diversas formas de linearizar dados
tabelados. A escolha da melhor linearização depende de cada problema em estudo.
Pretende-se também utilizar os conteúdos abordados e definidos aplicando o
Método dos Quadrados Mínimos e seu Caso discreto para ajustar uma função que
melhor determine o crescimento da população de Chapecó em função dos anos, ou
seja, a partir de dados tabelados determinar uma função que melhor se aproxime
destes dados. A grande vantagem ao se determinar esta função aproximada é que
será possível estimar o número de habitantes de Chapecó em qualquer tempo (ano)
que se desejar.
Então, este trabalho se faz importante, pois apresenta uma forma de ajustar
dados obtidos experimentalmente de forma que o erro seja mínimo.
2. Materiais e métodos
O desenvolvimento deste trabalho deu-se a partir da formação de um grupo
de estudos da matemática e apresentações semanais de seminários realizados
pelos alunos. Após o estudo do tema e demonstrações de algumas propriedades
pesquisou-se uma tabela com os valores referentes ao crescimento da população de
Chapecó em função do tempo para apresentar uma aplicação do Método. Para
plotar a solução utilizou-se o software numérico Matlab.
As questões abordadas neste trabalho são: Como aproximar dados obtidos
experimentalmente por uma curva (linear, exponencial, geométrica...) utilizando o
Método dos Quadrados Mínimos; como este método pode ser utilizado para calcular
uma função que melhor determine o crescimento da população de Chapecó. É
apresentada uma aproximação que consta na literatura para demonstrar a utilização
do Método dos Quadrados Mínimos.
3. Resultado e discussão
3.1. Método dos quadrados mínimos - caso discreto
Neste caso, tem-se uma função
a função é conhecida em
definida por um conjunto discreto, isto é,
pontos, que normalmente são obtidos em experimentos.
Tem-se então a tabela de pontos
com
pertencentes a um intervalo
. Devemos considerar que o número de pontos
tabelados é sempre maior ou igual ao número de funções escolhidas ou o número
de coeficientes a se determinar.
Ruggiero e Lopes (1996) dizem que o ajuste consiste em encontrar, a curva
que melhor se ajusta aos pontos
, ou seja, deve-
se determinar a menor distância possível entre os pontos da tabela e a curva, isto é,
determinar os coeficientes
tais que a função
tenha a menor distância possível de
Seja
chamado de desvio em
, ou seja, se aproxime ao máximo de
a distância vertical do ponto
. Onde que
à curva, também
seja mínimo para todo
Assim,
desejamos encontrar uma função que melhor se aproxime da função
que
, de forma
seja mínimo.
Ruggiero e Lopes (1996) afirmam ainda que no Método dos Quadrados
Mínimos os coeficientes
de
são calculados de modo que seja mínima a soma
dos quadrados dos desvios. Isto significa que os coeficientes
minimizam a função
Do Cálculo Diferencial, sabe-se que para se obter um ponto de mínimo de
, deve-se inicialmente encontrar os pontos críticos, isto é,
os
, tais que:
Calculando as derivadas parciais,
Para
, tem-se que:
Para
, tem-se que:
Simplificando por 2 as derivadas parciais, e igualando-as a zero, obtém-se o
sistema (2):
Reorganizando (2) tem-se que:
Onde
são as
incógnitas do sistema linear (3) com
equações,
as quais são chamadas de equações normais. Desta forma, o sistema linear (3)
pode ser escrito na forma matricial
Onde
é tal que
(ou seja, A é simétrica)
é tal que:
De acordo com Arenales e Darezzo (2008), resolvendo o sistema de
equações
normais
(3),
consequentemente a função
se ajusta a função
determinam-se
os
parâmetros
e
que melhor
, e, de fato, minimizam a soma dos quadrados dos desvios.
Logo, pode-se observar que uma vez escolhido o grau do polinômio
seus coeficientes são determinados de maneira que
,
seja mínimo.
3.2. Casos reduzíveis ao linear
Em alguns casos, obtém-se em laboratórios dados experimentais em que o
ajuste linear não pode ser considerado, pois não é combinação linear dos
parâmetros. “Neste caso, necessitamos de outras famílias de funções para
representar adequadamente uma função representada em uma tabela” (ARENALES;
DAREZZO, 2008, p. 171).
Ruggiero e Lopes (1996) citam ainda que para se aplicar o Método dos
Quadrados Mínimos, é necessário que se efetue uma linearização do problema
através de alguma transformação conveniente, ou seja, adaptamos o caso a um
ajuste linear.
A seguir serão apresentados alguns ajustes de problemas não lineares.
3.2.1. Ajuste a uma curva exponencial
Aos casos em que no gráfico dos dados obtidos experimentalmente, observase que a função
deve ser aproximada por uma função
com os parâmetros
e
da forma
positivos, aplica-se:
Definindo então que:
Tem-se então que
, ou seja,
Assim, se a função
aproxima
é uma combinação linear das funções
.
aproxima a função
, então a função
e
Assim, pode-se construir a Tabela 1:
Tabela 1: Dados linearizados para a função exponencial
Desta forma, em vez de se ajustar
ajusta-se
pelo Método dos Quadrados Mínimos,
pelo Método dos Quadrados Mínimos, onde se tem
, com
e
Agora, pode ser escrito o sistema (4) de equações normais:
Depois de
e
encontrados, e lembrando que:
Assim, obtém-se a função aproximada
Para determinar qual é o desvio dessa função
.
à função
, pode-se
resolver a equação (5):
Onde
.
Ruggiero e Lopes (1996) ainda observam que os parâmetros assim obtidos
não são os melhores dentro do critério dos Quadrados Mínimos, isto porque se
ajusta o problema linearizado pelo Método dos Quadrados Mínimos e não o
problema original.
3.2.2. Ajuste por uma hipérbole
Este ajuste é utilizado se no diagrama de dispersão obtido dos dados
experimentais, observa-se que
forma
.
deve ser aproximada por uma função
da
Se a função
aproxima a função
considera-se então, uma função
função
dada inicialmente,
que também se aproxima da
e tem-se agora o caso do ajuste linear, que pode ser resolvido pelo
Método dos Quadrados Mínimos.
Se
se aproxima da função
,
se aproxima da função
Esquematizando:
Da tabela de dados, obtida experimentalmente, pode-se construir a Tabela 2:
Tabela 2: Dados linearizados para a função hipérbole
.
...
.
...
Desta forma, ao invés de se ajustar
se a função
por uma reta
por Quadrados Mínimos, aproximapor Quadrados Mínimos, encontrando
, onde
e
.
Pode ser escrito o sistema linear (6):
Depois de determinados
e
Tem-se a função aproximada
, e lembrando que
e
.
Da mesma forma para determinar qual é o desvio da função
à função
Onde
, podemos fazer:
.
.
em relação
3.2.3. Outros ajustes não lineares
Segundo Ruggiero e Lopes (1996) é bastante comum de se encontrar casos
em que os dados tabelados e construído o diagrama de dispersão devem ser
ajustado por funções não lineares. Serão apresentados outros exemplos de como
transformar os modelos não lineares em modelos linearizados, que devem ser
ajustados por:
a) Uma curva exponencial:
b) Uma curva geométrica:
Aqui se encontra o modelo linear, onde se minimiza a soma dos quadrados
dos desvios nos logaritmos de
, para os logaritmos de .
c) Uma curva trigonométrica:
Chamando
, então:
Neste caso, já podemos minimizar a soma dos quadrados dos desvios em
.
3.2.4. Aplicação do ajuste não linear
O ajuste de curvas pelo Método dos Quadrados Mínimos tem muitas
aplicações. Uma dessas aplicações é apresentada neste trabalho: Determinar qual é
a função que melhor expressa o crescimento populacional da cidade de Chapecó
em função do tempo (em anos).
A Tabela 3 foi construída a partir de dados retirados do site da Prefeitura de
Chapecó e do site do IBGE e fornece a população (número de habitantes) de
Chapecó desde 1960.
Tabela 3: Crescimento da população de Chapecó desde 1960
Ano
População
1960
52089
1970
49865
1980
83768
1991
1996
2000
2007
2010
123050 129794 146967 164803 183561
Pretende-se determinar a função que melhor se aproxima aos pontos dados
na Tabela 3 utilizando a teoria apresentada. Antes disso, com os pontos expressos
na Tabela 3, deve ser feito o diagrama de dispersão que pode ser observado na
Figura 1.
2
x 10
5
1.8
População (milhares)
1.6
1.4
1.2
1
0.8
0.6
0.4
1960
1965
1970
1975
1980
1985
1990
1995
2000
2005
2010
Tempo (anos)
Figura 1: Diagrama de dispersão para os Dados da Tabela 3
Observando a Figura 1, a função que melhor se aproxima dos pontos dados
na Tabela 3 é uma função do tipo:
Para facilitar os cálculos, Ruggiero e Lopes (1996) sugerem que se mude a
escala dos anos por
e optou-se também por se fazer a seguinte
simplificação para população:
. Estas simplificações podem ser
observadas na Tabela 4, ou seja, a Tabela 3 transforma-se em:
Tabela 4: Dados da Tabela 3 simplificados
6
7
8
9,1
9,6
10
10,7
11
5,2089 4,9865 8,3768 12,3050 12,9794 14,6967 16,4803 18,3561
Com os dados da Tabela 4, é possível, a construção da Figura 2 em nova
escala se comparada com a Figura 1.
20
18
16
Eixo y
14
12
10
8
6
4
6
6.5
7
7.5
8
8.5
9
9.5
10
10.5
11
Eixo x
Figura 2: Diagrama de Dispersão para os Dados da Tabela 4
Como a curva vai se aproximar de uma função do tipo exponencial:
Então temos que linearizar esta função, ou seja:
Tem-se que
, isto é, temos que
combinação linear das funções
e
é uma
.
Desta forma, constrói-se a Tabela 5 com os valores aproximados da função
linearizada:
Tabela 5: Dados aproximados da função linearizada
6
7
8
9,1
9,6
10
10,7
11
1,6504 1,6067 2,1255 2,5100 2,5634 2,6876 2,8022 2,9100
Assim, com os valores da Tabela 5, pode-se linearizar os dados da Tabela 4 e
observar esta linearização na Figura 3:
3
Eixo y
2.5
2
1.5
6
6.5
7
7.5
8
8.5
9
9.5
10
10.5
11
Eixo x
Figura 3: Linearização dos Dados da Tabela 4
Com os dados da Tabela 5, escreve-se o sistema (7) de equações normais:
Para a resolução dos somatórios do sistema (7) tem-se a Tabela (6):
Tabela 6: Resolução dos somatórios
6
7
8
9,1
9,6
10
10,7
11
36
49
64
82,81
92,16
100
114,49
121
1,6504
1,6067
2,1255
2,5100
2,5634
2,6876
2,8022
2,9100
9,9024
11,2469
17,004
22,841
24.60864
26,876
29,98354
32,01
Reescrevendo o sistema (7) temos:
O sistema (8) foi reescrito com os valores dados pela Tabela 6, e fornecerá os
valores aproximados da função. Para determinação dos valores de
e
com maior
número de casas decimais utilizou-se o comando format long do software Matlab:
Isso significa que a função linearizada é:
Porém, pretende-se encontrar a função
e sabe-se que:
portanto:
Então, a função que melhor se aproxima ao crescimento da população em
função dos anos é:
onde
Na Figura 4 é plotada a solução exata (a partir dos dados da Tabela 4) e a
solução aproximada (a partir da função (9)) para visualização dos resultados. O que
pode ser observado que é a função aproximada (9) obtida pelo Método dos
Quadrados Mínimos é uma boa escolha, ou seja, se aproxima muito da solução
exata e pode ser utilizada para se obter aproximações para o crescimento da
população de Chapecó em função do tempo,
20
Sol. Exata
Sol. Aproximada
18
16
Eixo y
14
12
10
8
6
4
6
6.5
7
7.5
8
8.5
9
9.5
10
10.5
11
Eixo x
Figura 4: Melhor Ajuste de Curva para os Dados da Tabela 4
4. Considerações
Este trabalho apresentou o ajuste de curvas pelo Método dos Quadrados
Mínimos para dados lineares e não lineares. Trouxe também uma aplicação deste
método para o caso não linear, ou seja, traz como contribuição a determinação de
uma função (9) que pode ser utilizada para determinação do crescimento da
população da cidade de Chapecó em função dos anos.
Observa-se que o ajuste de curvas pelo Método dos Quadrados Mínimos é
uma boa escolha, pois minimiza a função encontrando a curva que melhor se ajusta
aos dados experimentais.
Assim, obtém-se como resultado que a curva que melhor se ajusta ao
crescimento populacional da cidade de Chapecó é uma curva exponencial, ou seja,
a população cresce exponencialmente.
Com estes resultados é possível determinar estimativas para a população em
diferentes períodos na cidade de Chapecó. Por exemplo, desejando determinar qual
a população desta cidade no ano de 2020 utiliza-se a mudança de variável abaixo:
Substituindo
na função (9):
Assim, se a população de Chapecó continuar crescendo exponencialmente os
resultados deste trabalho mostram que em 2020 será de aproximadamente 248.540
habitantes.
5. Referências
ARENALES, Selma; DAREZZO, Artur. Cálculo numérico: Aprendizagem com apoio de software.
São Paulo: Thomson Learning, 2008.
BARROSO, Leônidas Conceição et al. Cálculo numérico (com aplicações). 2. ed. São Paulo:
Harbra, 1987.
CLÁUDIO, Dalcidio Moraes; MARINS, Jussara Maria. Cálculo numérico computacional: teoria e
prática. São Paulo: Atlas, 1989.
IBGE. Disponível em: <http://www.ibge.gov.br/cidadesat/painel/painel.php?codmun=420420#>.
Acesso em: 04 jul. 2011.
LEON, Steven J. Álgebra linear com aplicações. 4. ed. Rio de Janeiro: LTC , 2008.
MASSARANI, Giulio. Introdução ao cálculo numérico. Rio de Janeiro: Ao Livro Técnico, 1967.
PREFEITURA DE CHAPECÓ. Chapecó, 2011. Disponível em:
<http://www.chapeco.sc.gov.br/prefeitura0/index.php?pagina=chapeco_dados.html&menu=menu_nos
sa_cidade. Acesso em: 04 jul. 2011.
RUGGIERO, Márcia A. Gomes; LOPES, Vera Lúcia da Rocha. Cálculo numérico: aspectos teóricos
e computacionais. 2. ed. São Paulo: Pearson Makron Books, 1996.
Download

AJUSTE DE CURVAS PELO MÉTODO DOS