Previsão do consumo de energia elétrica na cidade de Salvador – BA utilizando regressão linear Helder Henri Silva e Caldas1 Dr. Walter Accioly Costa Porto2 Resumo: Este trabalho apresenta como objeto de estudo um modelo para prognóstico do consumo por energia elétrica em Salvador - BA, sob forma de função linear, a partir de dados estatísticos temporais coletados que induzem variações consideráveis na demanda. O principal objetivo é prover as empresas que atuam nas áreas de interesse, com uma ferramenta confiável de previsão do consumo, garantindo assim, o nível de excelência e dinamismo no atendimento de cargas futuras. Utilizou-se uma metodologia para a mensuração destes, que levou em conta dados relevantes que influenciam o valor da demanda por eletricidade como: A temperatura compensada média mensal, o índice pluviométrico e o número de clientes da COELBA (Companhia de Eletricidade do Estado da Bahia). Para o tratamento estatístico de dados, contou-se com a Regressão Linear Múltipla, a partir do método dos mínimos quadrados para determinação dos coeficientes de regressão, sendo analisado também seu grau de confiabilidade. Os resultados demonstram, de forma conclusiva, a montagem de uma equação linear que descreve a demanda mensal por eletricidade no município, trazendo o perfil de contribuição de cada variável, em especial a temperatura, que obteve peso maior na modelagem. Palavras Chave: Consumo, demanda, eletricidade, previsão, regressão 1 – Helder Henri Silva e Caldas - Graduando em Engenharia Industrial Elétrica no Instituto Federal de Educação, Ciência e Tecnologia da Bahia – IFBA. Tel.: 71-9300-6484 E-mail: [email protected]; 2 – Dr. Walter Accioly Costa Porto - Professor Doutor do departamento de matemática no Instituto Federal de Educação, Ciência [email protected]; e Tecnologia da Bahia – IFBA. Tel.: 71-8834-8836 E-mail: Estimation to consumption of electricity in Salvador City - BA using linear regression Abstract: This paper has as object of study a behavior of consumption for electricity in Salvador - BA, in the form of linear function, from temporal statistical data collected that induce considerable variations in demand. companies that are operating in The main objective is to provide for areas of system power, with a reliable tool of consumption forecast, thus ensuring the level of excellence and dynamism in supplying future charge in distribution system. Was used a methodology for measuring , which took into account relevant data that have influence on the value of demand for electricity as: Compensated average monthly temperature, rainfall index and number of COELBA’s customers (State Electricity Company Bahia). For the statistical treatment of data, counted with the Multiple Linear Regression from the least squares method to determine the regression coefficients also being analyzed their degree of reliability. The results evidence, in a conclusively way, the assembly of a linear equation describing the monthly demand for electricity in the city, bringing the contribution of each variable profile, especially the temperature, which obtained the highest weight in modeling. Keywords: Consumption, demand, electricity, forecast, linear regression. 1. Introdução A eletricidade é, sem dúvida, um dos bens essenciais e agente facilitador à vida moderna. Com isso, se tornou a maneira mais eficaz de obter, por meio de transformações, outras formas de energia como a luminosa (luz), térmica (calor) e motriz (força). Ela está presente em praticamente todos os momentos do nosso dia a dia, quando acendemos uma lâmpada, guardamos um alimento na geladeira para conservá-lo, ao assistirmos à TV, entre tantos outros. Há sempre um risco associado ao desequilíbrio entre oferta e demanda por energia elétrica, pois existem vários fatores externos, impossíveis de controlar como as de causas climáticas (temperatura, precipitação, umidade e frio) que alteram de forma significativa as necessidades no consumo de energia elétrica. Esses fatores fogem ao controle dos produtores de energia e nem sempre podem ser previstos, tendo como principal exemplo o atual cenário nacional, eclodindo uma crise energética por falta de chuvas nas principais regiões geradoras de eletricidade. Santos e Caldas (2012) frisa a importância de se elaborar um bom planejamento de expansão da capacidade produtiva e da infraestrutura necessária de geração, transmissão e distribuição, pois, demonstra-se vital para o desenvolvimento sólido do país. Onde se deve observar que a energia elétrica é insumo básico para a indústria, trazendo desenvolvimento e o bem estar da população, que usufrui de seus benefícios. Com isso, surge a importância de prever a demanda de energia ao longo de dias, meses ou até anos. E está intimamente ligada também à escassez e à necessidade de geração. Deve-se considerar o crescimento da demanda em Salvador, a melhoria da qualidade do serviço prestado e o pleno atendimento de forma a garantir um suprimento adequado a todos os clientes. O estudo do comportamento do mercado e o mapeamento deste perfil de consumo dos clientes permitem dimensionar as possíveis necessidades de investimentos e distribui-los nos setores mais críticos do processo. Além disso, o mapeamento do impacto causado na demanda por energia elétrica em eventuais variações em fatores externos pode permitir a identificação precisa de pontos críticos, antevendo situações para as quais seja necessária a adoção de medidas de controle. O presente trabalho visa identificar fatores importantes que contribuem para o aumento ou diminuição do consumo, como a precipitação, temperatura e o número de clientes estudando como tais variações quantitativas afetam a demanda por energia elétrica na cidade de Salvador. 2. Regressão linear Pretende-se estabelecer uma equação matemática que represente o fenômeno em questão. O comportamento pode ser apresentado de várias formas (linear, quadrático, cúbico ou logarítmico). No presente estudo será considerado o modelo linear, pois, os dados coletados estão crescendo de forma linear ao longo do tempo. Logo, pode-se considerar que a relação da resposta às variáveis de predição são funções lineares e devendo surgir uma reta estimada para o modelo final. Seguindo o modelo da equação Y ixi (1) Onde, Y = Variável Dependente; = Ponto de Interseção da Equação; xi = Variável Independente; i = Regressor Estimado; Com esta equação, nota-se que uma ou mais variáveis independentes são utilizadas para explicar o comportamento da variável dependente Y e pode ser representado graficamente de modo semelhante à figura do Chapra e Canale (2008) como segue: Figura 1 - Diagrama de Dispersão Linear Então um passo crucial é a estimativa dos parâmetros, os chamados coeficientes de regressão. Um conceito importante é a introdução de resíduos quando se ajusta o modelo à equação (1), podendo ser descritos como um erro natural ao alinhamento final. Deste modo, o conjunto dos “n” resíduos serve para qualificar a regressão. Onde, quanto maior o valor do somatório destes valores, pior será o ajuste final e caso o valor residual seja pequeno é uma clara indicação de um bom ajuste. 3. REGRESSÃO LINEAR MÚLTIPLA O modelo em questão deve levar em consideração mais de uma variável independente. Por esta razão, será utilizado um modelo de regressão múltipla. Tratando-se especificamente desta aplicação iremos considerar linear, logo, teremos uma regressão linear múltipla. Para Hair et al (2005), a regressão múltipla é uma técnica estatística que pode ser usada para analisar a relação entre uma única variável dependente (critério) e várias variáveis independentes (preditoras). O objetivo da análise de regressão linear múltipla é usar as variáveis independentes cujos valores são conhecidos para prever o valor da variável dependente selecionada pelo pesquisador. Com base nesta relação matemática, a regressão apresenta uma explicação algébrica para a modificação da variável dependente através das respectivas variações das variáveis independentes. Devendo-se formular um método para previsão ou estimativa de algo que se deseja controlar. Algumas considerações devem ser feitas para que o modelo de Regressão Linear Múltipla se verifique, sendo elas: i. O erro tem média zero e variância σ2; ii. Os erros não são correlacionados; iii. Os erros têm distribuição normal; iv. As variáveis regressoras β1... β n assumem sempre valores fixos. Caso estas suposições se verifiquem, então a variável Y tem distribuição normal com variância σ2 e média E (Y x) 1x1 2 x 2 ... nxn (2) 3.1 Testes de Hipóteses para Regressão Linear Múltipla No Método de Regressão Linear Múltipla, testes são úteis para medir a adequação do modelo de regressão e para verificação da acurácia de previsão utilizando tal método. 3.1.1 Teste de Significância Seguindo os testes de Rencher & Schaalje (2008), a significância determina a existência de uma relação linear entre a variável resposta “Y” e o conjunto de regressores β1, β 2, ..., β n .Esta análise verifica a qualidade da equação de regressão, decompondo a soma dos quadrados total em duas componentes: As somas dos quadrados da regressão e dos erros. As hipóteses são H0 nulo (3) ou H0 diferente de zero (4): H0 : α = β1= β2= ...= βk = 0 (3) Ha : βj 0 para no mínimo um regressor j. (4) A rejeição de H0 implica que a equação de regressão difere de uma constante, ou seja, pelo menos um regressor contribui significativamente para o modelo em questão. Rejeita-se H0 se o valor calculado, F0, for maior que Fα,k,n-p (F de Significância), embora isso não implica necessariamente que a relação encontrada seja um modelo adequado para previsão. Apenas informa que algum dos regressores se relaciona linearmente com a variável de resposta e assim contribui significativamente com a regressão. 3.1.2 Análise Residual Assim como no padrão de Regressão Linear Simples, na Regressão Múltipla as suposições do modelo ajustado precisam ser ratificadas para que os resultados possuam um alto nível de confiabilidade. Define-se Análise dos Resíduos como o conjunto de técnicas utilizadas para investigar a adequabilidade de um modelo de regressão com base nos resíduos. O resíduo i é dado pela diferença entre a variável resposta observada Yi e a variável resposta estimada Yˆi . Então os parâmetros a serem considerados são: i. i e j São independentes ( i j ) ; ii. Variação de i ² é constante, ou seja, há a garantia de homoscedasticidade; iii. i ~ N (0, ²) Descreve a normalidade; iv. O modelo é linear; v. Não existem pontos atípicos; Caso estes parâmetros sejam atendidos, pode-se inferir que o modelo atendeu o critério da heteroscedasticidade, ou seja, não há um padrão definido na distribuição as variâncias dos resíduos. 3.2 Resumo dos Resultados No presente estudo, foram utilizados resultados oriundos das tabelas com estatísticas de regressão geradas pelo programa Microsoft Excel® 2010. Sendo elas: • R – Múltiplo: É a correlação entre a(s) variável (is) independentes e a variável dependente. Deve apresentar o coeficiente de correlação dos intervalos do conjunto de dados entre duas ou mais variáveis explicativas, determinando o poder de relação entre essas duas propriedades; • R – Quadrado: Representa o poder de explicação que o modelo de regressão possui. Deve apresentar o quadrado do coeficiente de correlação do momento do produto de Pearson através do referido conjunto de dados; • R – Quadrado Ajustado: Tem significado semelhante ao R – Quadrado, porém é ajustado levando-se em consideração o número de variáveis independentes; • Erro Padrão: É o desvio padrão do modelo, determinado pela raiz quadrada da variância. Deve refletir a variação da precisão de acordo com o tamanho da amostra. • Valor-P: Indica o grau de influência sobre a variável dependente; • F-Significância: Determina a existência de uma relação linear entre a variável resposta e o(s) regressor(es); • Colinearidade: Define o grau de dependência entre variáveis independentes, como uma pode ser determinada em função da outra. 4. Metodologia A partir da coleta de dados nas diferentes instituições, foi utilizado o software Excel®, versão 2010, para obtenção da equação do Modelo de Regressão Linear e os parâmetros para estimação da qualidade da previsão do consumo de energia elétrica municipal. Os coeficientes das equações de previsão foram encontrados respeitando a metodologia clássica do Método dos Mínimos Quadrados, sendo testadas, ao final, para verificar um bom ajuste do modelo normal com uma dispersão mínima entre os dados reais e previsto. Foram coletados os dados mensais do consumo de energia elétrica na cidade de Salvador e seu respectivo número de clientes junto a COELBA. Os outros dados meteorológicos, índice pluviométrico mensal e a temperatura compensada média mensal, foram extraídos do INPE (Instituto Nacional de Pesquisas Espaciais). O período de coleta de dados se deu de janeiro de 2010 a dezembro de 2014, utilizando dados atuais, com uma amostra bastante significativa, 60 dados, para cada variável dita independente. Para Hair (2005), uma amostra com nível mínimo estaria em torno de cinco pra um, e o nível desejável está em torno de 20 dados para cada variável independente, confirmando que a dimensão amostral é suficiente. As primeiras variáveis explicadoras são o índice pluviométrico mensal, que mede a quantidade de chuvas, em mm, no determinado local de medição e a temperatura compensada média mensal, que faz uma média com as três medições diárias mais uma quarta que seria uma média ponderada das outras três, já que o equipamento e o operador estão em horário de repouso (horário da madrugada). Foram utilizados os dados da estação SALVADOR ONDINA - BA (OMM: 83229), colhidos em 17 de março de 2015. A terceira variável explicativa é o número de clientes que a COELBA fornece energia. É visível a dependência da quantidade de energia consumida ao universo de clientes a que se destina, porém existem classes de consumidores que demandam uma maior quantidade, e por isso mais significativos, do que outros clientes com potência instalada menor. 5. Resultados Será verificada a qualidade da Regressão Linear Múltipla com as variáveis independentes referidas anteriormente. Espera-se obter valores de coeficiente com um nível de precisão maior considerando o intercepto nulo. Logo, como resultado da regressão tem-se as tabelas abaixo extraídas do software Excel®: Tabela 1 - Estatísticas da Regressão Múltipla Sem Intercepto R múltiplo 0,999023816 R-Quadrado 0,998048586 R-quadrado ajustado 0,980436255 Erro padrão 14,19188392 Observações 60 Tabela 2 - Análise de Variação da Regressão Múltipla Sem Intercepto Fonte de Graus de Soma Média F de Variação Liberdade Quadrática Quadrática Regressão 3 5871609,136 1957203,045 9717,527584 Resíduo 57 11480,34545 201,4095693 Total 60 5883089,482 F0 significância 4,96994E-76 Tabela 3 - Coeficientes da Regressão Múltipla Sem Intercepto Erro padrão valor-P 98,0% 98,0% 0 #N/D #N/D #N/D #N/D 0,0294126 1,56223E- 0,06849035 43 05 1 0,13889149 0,0169127 0,01187719 Precipitação Total Mensal 0,02678645 (mm) Temp. Compensada Média 6,53655189 (ºC) Superior Coeficientes Interseção Número de Clientes (mil) Inferior 0,209292644 - 57 6 0,01369536 1,1787053 7,87989E- 3,71524107 48 07 3 0,067268284 9,357862724 Tabela 4 - Matriz de Correlação da Regressão Múltipla Sem Intercepto Número de Clientes (mil) Número de Clientes Precipitação Total Temp. Compensada (mil) Mensal (mm) Média (ºC) 1 Precipitação Total Mensal (mm) -0,1118324 1 -0,187661788 -0,328670993 Temp. Compensada Média (ºC) 1 Apesar de ter-se obtido um R-Quadrado muito alto, não devemos considera-lo sozinho para fins de atestado de qualidade da regressão, conforme analisa Gujatari e Porter (2008). O Coeficiente de determinação traz atualmente um sério conflito quanto a sua utilização como grau de importância e qualidade referente à Regressão. De forma empírica, não se pode avaliar a capacidade explicativa da modelagem apenas por um grau de R-Quadrado maior ou menor. A magnitude dos coeficientes deve determinar com mais clareza este fato, principalmente para regressões com intercepto nulo. No entanto, o tamanho do RQuadrado pode servir como um indicador para avaliar em que medida a relação entre as variáveis pode ser descrita por uma função linear. Para suprir esta deficiência, foram adotadas medidas complementares de verificação e validação tendo em vista que os dados foram simulados para atender a todos os pressupostos do Método dos Quadrados Ordinários, e as variáveis foram combinadas linearmente. A equação que deve representar a Regressão Linear Múltipla sem o intercepto é: Y 1x1 2 x 2 3 x3 Y 0,13889149 x1 0, 02678645 x 2 6,53655189 x3 (5) Sendo, Y = Demanda Total Consumida (Giga Watts hora); = Ponto de Interseção da equação estimado; x1 = Variável independente número de Clientes (mil); 1 = Regressor estimado referente ao número de clientes estimado; x 2 = Variável independente precipitação total mensal (mm); 2 = Regressor estimado referente à precipitação total mensal estimada; x3 = Variável independente temperatura compensada média mensal(ºC); 3 = Regressor estimado referente à temperatura compensada média mensal estimada; 5.1 Erro Padrão Tabela 5 - Erro Percentual do Modelo Média do Consumo Mensal Erro Padrão (GWh) Erro Percentual 14,19188392 4,54 % (GWh) 312,62 Como apresentado na Tabela 5, o presente modelo traz um pequeno erro percentual. Isto demonstra que os valores previstos para o consumo de energia na cidade de Salvador podem distanciar-se apenas 4,54% de seu valor real, retratando um desvio mínimo frente ao montante de fato consumido. De maneira a aumentar essa precisão, pode-se aumentar o número de observações e incluir novas variáveis que não foram consideradas. 5.2 Intervalos de Confiança A tabela 3 traz como resultado, com 98% de certeza, que as variáveis independentes estão contidas nos seus respectivos intervalos de confiança. 5.3 Teste de Significância A probabilidade de que o resultado observado seja proveniente de um possível erro amostral pode ser examinada através do teste de significância (Valor-P), onde, no referido caso, a probabilidade de que o resultado observado esteja errado é muito pequena. Considerando cada variável dita explicativa, seus Valores-P podem ser verificados como aceitáveis, comparando com o alfa=0,02 (98% de confiança), que é o nível de significância definido no problema, então, conclui-se que os Valores-P são menores que alfa para todas as variáveis analisadas, considerando a Tabela 3, portanto, tem influência relevante sobre o Consumo de Energia Elétrica na cidade de Salvador. 5.4 Teste de Linearidade O resultado estatístico F deve garantir um nível de linearidade ao problema e é calculado a partir da divisão da média dos quadrados atribuída à regressão (1957203,045) pela média dos quadrados dos resíduos (201,4095693), ambos os valores conforme a Tabela 2. O teste F de significância para esta equação pode ser definido: FSignificância F 0 4,96994 1076 9717,527584 (4) Logo, para a regressão múltipla sem o intercepto, este teste indica que há uma relação linear forte entre a variável resposta e os estimadores. Podendo ser comprovada também, conforme figura 2, retirada dos resultados provenientes da regressão pelo software Excel®. Consumo (GWh) Probabilidade Normal da Equação 400 200 0 0 20 40 60 80 100 120 Percentil da amostra Figura 2 - Tendência Linear da Regressão Múltipla sem Intercepto 5.5 Análise de Coeficientes É importante observar a correspondência entre o sinal dos coeficientes e a relação teoricamente esperada, em que medida os resultados oferecem evidências em favor das hipóteses de trabalho. As três hipóteses naturais são: Hipótese 1: β1 exerce um efeito positivo sobre o Consumo; Hipótese 2: β 2 exerce um efeito positivo sobre o Consumo; Hipótese 3: β 3 exerce um efeito positivo sobre o Consumo; A partir dos resultados apresentados na tabela 3, pode-se deduzir que as três hipóteses são atendidas visto que os três coeficientes estimados apresentam valor positivo e, com isso, exercem um efeito linear positivo sobre a variável dependente Consumo (Y). Seguindo a verificação, devem-se analisar os coeficientes associados às variáveis independentes do modelo final. A variável Número de Clientes assume valor aproximado de 0,139, significando que, com o acréscimo de mil clientes na rede da COELBA, haverá um incremento de 0,139 GWh no consumo, mantendo tudo o mais constante. A conclusão é reforçada pela estimativa do erro associada ao ponto. Novamente, trazendo o Valor-P, pode-se inferir que a probabilidade de se estar errado ao rejeitar esta variável é mínima, da ordem de 1,56223x105 . Logo, há fortes evidências sugerindo que o efeito positivo teoricamente esperado de 1 sobre Y pode ser corroborado. Já a segunda variável explicativa, Precipitação total mensal, assume valor 0,027. Neste caso, com as demais variáveis constantes, podemos dizer que o aumento de uma unidade em 2 produz um aumento de 0,027 GWh na variável dependente Y. O Valor-P neste caso é bem próximo ao valor de referência alfa=0,02 o que poderia indicar certa probabilidade de ter significância baixa ao modelo. Porém a partir das demais análises feitas, podemos considera-la como uma variável explicativa importante. Por fim, a variável Temperatura Compensada Média Mensal sugere um acréscimo de 6,536 GWh para cada variação unitária. Apresentando assim, uma forte relação com o consumo como foi esperado já que a temperatura motiva maciçamente o aumento de cargas de refrigeração no sistema elétrico, compondo papel crucial no modelo. 5.6 Teste de Resíduos Outro teste importante é a análise de resíduos, onde verifica se o modelo é apropriado. Como se trata de uma regressão múltipla, os resíduos de todas as variáveis devem ser analisados de forma separada para indicar a qualidade destes. As figuras foram extraídas dos resultados do software Excel®. Número de Clientes (mil) Resíduos 40 20 0 950,00 -20 1000,00 -40 Número de Clientes (mil) 1050,00 1100,00 Figura 3 - Resíduos do Número de Clientes da Regressão Múltipla Sem Intercepto Precipitação Total Mensal (mm) Resíduos 50 0 0,00 -50 100,00 200,00 300,00 400,00 500,00 600,00 Precipitação Total Mensal (mm) Figura 4 - Resíduos da Precipitação Total Mensal da Regressão Múltipla Sem Intercepto Temp. Compensada Média (ºC) Resíduos 50 0 0,00 -50 5,00 10,00 15,00 20,00 25,00 30,00 Temp. Compensada Média (ºC) Figura 5 - Resíduos da Temperatura Compensada Média Mensal da Regressão Múltipla Sem Intercepto Os resíduos desta regressão múltipla apresentam-se como variáveis aleatórias, onde os pontos são distribuídos em torno da reta que passa pela origem sem nenhum padrão definido, conforme é verificado através das figuras 3, 4 e 5, garantindo o critério da heteroscedasticidade. 5.7 Modelagem Final A equação de previsão da demanda por eletricidade em Salvador pode ser descrita a partir da equação abaixo, logo: Consumo(GWh) 0,13889149Clientes(mil ) 0,02678645Pluviometria(mm) 6,53655189Temperatura(º C) Este padrão reflete a tendência no consumo de energia elétrica em Salvador e apresenta a influência que cada variável explicativa tem sobre o valor final da variável dependente. Com isto, o número de clientes e o índice pluviométrico mensal tem ação menor que a temperatura na modelagem. 6. Conclusão Frente ao desafio do crescimento de demanda, a previsão de carga possui importância vital para o planejamento de todo o sistema de fornecimento de energia. Sendo necessário quantificar os limites máximos e mínimos na qual cada subestação, rede de distribuição, agentes de maior potência e equipamentos vão consumir meses e anos à frente para realizar um estudo detalhado com propósito principal de se reduzirem-se custos relativos à compra dos blocos de energia em leilões da Agência Nacional de Energia Elétrica (ANEEL). Conjecturando os resultados anteriores, podemos deduzir que estes dados são suficientes para mostrar que o modelo de Regressão Múltipla sem intercepto com três variáveis preditoras (Número de Clientes, Precipitação Total Mensal e Temperatura Compensada Média Mensal) contribui para a adequação de um ótimo modelo de previsão e demonstrando-se sólido com o que é esperado, podendo prever o consumo municipal com uma boa qualidade. Pode-se verificar também, que a equação do modelo atende todas as avaliações necessárias e assim é traduzida como um conjunto de hipóteses para a estimação da variável dependente. Então, o modelo de regressão linear múltipla fica como contribuição necessária e importante para o planejamento energético da cidade de Salvador. O principal objetivo do deste trabalho foi apresentar uma equação que pudesse mostrar o perfil de carga da cidade de Salvador em relação a aspectos que possivelmente influenciam de forma positiva o incremento no consumo municipal, bem como prever a demanda futura. Com a competição no mercado e a busca por melhores índices, devido à globalização, fica evidente que as entidades que buscam previsões através de modelos matemáticos têm um diferencial competitivo em relação a seus concorrentes que não utilizam esta importante ferramenta. Por fim, este trabalho deve contribuir significativamente para o planejamento energético municipal, oferecendo métodos matemáticos e utilizando pressupostos estatísticos para a previsão. Assim as empresas do setor elétrico podem se antever a acréscimos no consumo e dimensionar melhor as redes de distribuição para melhor atender seus respectivos clientes. 7. Referências [1] CHAPRA, STEVEN C.; CANALE, RAYMOND P.. Métodos Numéricos para Engenharia. 5ª Edição, São Paulo: McGraw-Hill, 2008. [2] GUJARATI, DAMODAR N.; PORTER, DAWN C.. Econometria Básica. 5ª Edição, São Paulo: McGraw-Hill, 2008. [3] HAIR JR., J.F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C.. Análise Multivariada de Dados. 5ª Edição – Porto Alegre: Bookman, 2005. [4] RENCHER, C.ALVIM; SCHAALJE, G. BRUCE. Linear Models in Statistics. 2ª Edição. John Wiley & Sons, Inc., 2008. [5] SANTOS, EUCYMARA F. NUNES; CALDAS, ALEXANDRE A. SILVA. Previsão do Consumo de Energia Elétrica em Petrolina – PE. Revista Brasileira de Energia, Volume 18, N. 01, p.129-141, 2012.