II - 035 o 20 CONGRESSO BRASILEIRO DE ENGENHARIA SANITÁRIA E AMBIENTAL PARAMETRIZAÇÃO DE CONSUMO DE ÁGUA POR ATIVIDADE ECONÔMICA Olga Satomi Yoshida(1) Estatística pelo IMECC-UNICAMP, mestre em Ciências Estatísticas pelo IME-USP. Doutora em Estatística delo IME-USP Pesquisadora no Laboratório de Vazão do IPT-SP. FOTOGRAFIA Jorge Gomez Sanchez NÃO Engenheiro mecânico formado pela Escola Politécnica da Universidade DISPONÍVEL de São Paulo. Pesquisador do Laboratório de Medição de Vazão do IPT, possui diversos trabalhos publicados na área de medição de fluidos, micromedição e sistemas de distribuição de água; sócio da ABES, da AWWA e da ISA. Coordena projeto IPT – SABESP de parametrização de consumidores de água na região metropolitana de São Paulo. Sandro de Almeida Mota Engenheiro mecânico pela Escola Federal de Engenharia de Itajubá - EFEI. Mestre em Ciências - Engenharia de Produção pela Escola Federal de Engenharia de Itajubá - EFEI. Pesquisador do Laboratório de Vazão do IPT. Sibele Soto Francisco Engenheira Civil pela Universidade Mackenzie. Mestrada em engenharia Civil pela Escola Politécnica da USP. Pesquisadora do Agrupamento de Instalações Prediais, Saneamento Ambiental e Segurança ao Fogo - Departamento de Engenharia Civil do IPT. Endereço(1): IPT - Instituto de Pesquisas Tecnológicas do Estado de São Paulo Laboratório de Medição de Vazão - Caixa Postal 81 - Av. Prof. Almeida Prado, 532 Cidade Universitária - CEP: 05508-901 - São Paulo - SP - Brasil - Tel.: (011) 3767-4756 e-mail: [email protected] RESUMO O presente estudo apresenta uma metodologia para identificar e caracterizar fatores que influenciam o consumo de água de acordo com a atividade econômica. O método proposto se baseia na análise estatísticas de informações cadastrais e obtidas a partir de pesquisa de campo, técnicas de ajuste de modelos de regressão, e validação do modelo selecionado. PALAVRAS-CHAVE: Consumo de Água, Parametrização, Análise de Regressão, Base de Dados. INTRODUÇÃO O estudo dos fatores que influenciam o consumo de água em uma população é um assunto que tem sido muito estudado, podendo ser encontrada uma gama muito grande de estudos sobre consumo de água, principalmente para consumidores residenciais. No caso de residências, como principais fatores associados ao uso de água são citados freqüentemente: o 20 Congresso Brasileiro de Engenharia Sanitária e Ambiental 1208 II - 035 o 20 CONGRESSO BRASILEIRO DE ENGENHARIA SANITÁRIA E AMBIENTAL 1. 2. 3. 4. Condições climáticas - temperatura do ar e índice de chuvas Características das moradias Indicadores sócio econômicos Características culturais e hábitos. HOWE e LINEWEAVER JR(1967), BILLINGS e VAUGHAN JONES (1996) e as referências bibliográficas apresentadas neste artigo, entre outros, apresentam conclusões deste tipo. Em todos esses estudos, a metodologia adotada inclui análise de regressão. A análise de regressão é uma técnica estatística que estabelece uma relação funcional entre a quantidade consumida de água e outras variáveis características do consumidor, ao mesmo tempo em que seleciona as variáveis como os fatores de maior impacto na demanda de água. Neste trabalho, propomos uma metodologia similar para a investigação de fatores (ou parâmetros) de maior impacto na demanda de água nas diferentes classes de atividades econômicas. Esta metodologia consiste em: • • • • • procedimentos de amostragem, pesquisa de campo, técnicas de ajuste de modelos, procedimentos para seleção de fatores significativos de consumo de água, validação dos parâmetros selecionados. Por último discute-se quais as utilidades dos produtos gerados por tais procedimentos para as empresas de saneamento. Esta metodologia foi desenvolvida no Laboratório de Vazão do IPT, que atualmente executa o projeto IPT-Sabesp “Parametrização do Consumo de Água na Região Metropolitana de São Paulo”. Num futuro próximo, teremos os primeiros resultados da aplicação dos métodos que expomos nas seções subsequentes. CLASSES DE ATIVIDADES ECONÔMICAS As empresas de saneamento em geral classificam seus clientes em residenciais, comerciais, industriais e públicos: Cada um destes grupos corresponde a grandes classes de atividades econômicas. Esta classificação deve ser sempre considerada como uma classificação inicial numa análise de consumo de água por uma série de motivos: 1. as empresas nacionais e estrangeiras de distribuição de água tradicionalmente trabalham com esta classificação, 2. as características do consumo de água nestas classes são diferentes principalmente nas escalas de consumo e na distribuição das freqüências dos consumos individuais dos estabelecimentos que compõem cada uma destas classes, 3. a literatura contém muitos estudos de consumo de água em função desta classificação e portanto oferecendo referências de comparação, veja SCHNEIDER e WHITLATCH(1991). o 20 Congresso Brasileiro de Engenharia Sanitária e Ambiental 1209 II - 035 o 20 CONGRESSO BRASILEIRO DE ENGENHARIA SANITÁRIA E AMBIENTAL A classe de economias residenciais é a mais homogênea de todas, no sentido de que a variabilidade no consumo de água das residências é relativamente pequena quando comparada com a variabilidade nas outras classes. Também por causa desta homogeneidade foi possível na literatura a parametrização do consumo de água residencial através de fatores climáticos e sócio-econômicos. Em regiões metropolitanas, a classe de economia comercial é a mais heterogênea, contendo desde pequenos consumidores de água como bares e padarias até grandes consumidores de água como shopping-centers e Esta heterogeneidade, além da heterogeneidade na forma do uso da água de acordo com as características da atividade do consumidor, e a quantidade de pontos de consumo dificultam a parametrização do consumo de água nesta classe. Assim, sugerimos que, inicialmente, o estudo de consumo de água se dê segundo as categorias de atividades econômicas que a compõem, por exemplo: bares, restaurantes, hotéis, cabeleireiras, pré-escolas, escolas de 1o e 2o graus, universidades, clubes, supermercados etc, sendo posteriormente expandidas em sub categorias (como padarias com lanchonete e sem, ou postos de gasolina com e sem lojas de conveniência) As indústrias também devem ser parametrizadas segundo suas atividades, por exemplo: farmacêuticas, têxteis, bebidas etc. Como o uso de água nestes casos são fortemente influenciados pelos processos produtivos e atividades da indústria, cada uma dessas atividades, antes de terem seu consumo de água parametrizado, devem ser bem caracterizadas através de estudos e investigações sobre o uso de água nos processos produtivos, de modo a poder se definir variáveis e fatores correlacionados ao consumo de água em cada atividade. DESCRIÇÃO DE ATIVIDADES ECONÔMICAS A maneira mais completa de se descrever o consumo de água de um conjunto de economias com a mesma atividade é através distribuição de freqüências das economias em faixas de consumo de água. Analisando o comportamento de várias atividades econômicas, concluímos que a distribuição de freqüências dos consumos para cada atividade econômica pode ser aproximada pelo modelo lognormal, o que pode ser reforçado por BILLINGS e JONES (1996), páginas 23 e 57. A Figura 1 apresenta uma amostra aleatória gerada de uma distribuição log-normal com parâmetros de locação igual a 4 e escala igual a 0,4. A Figura 2 apresenta a distribuição de freqüências de uma amostra aleatória de uma população log-normal com parâmetros de locação igual a 4 e escala 0,5. Nossa experiência tem nos mostrado que as distribuições de freqüências do consumo de água em padarias e restaurantes podem ser satisfatoriamente aproximadas pelas distribuições dos gráficos da Figura 1 ou 2, dependendo dos seus portes. Há uma série de medidas numéricas que indicam a forma da distribuição de freqüências dos consumos dos estabelecimentos que compõem a classe. São elas: 1. 2. 3. 4. 5. 6. Consumo médio da classe Desvio padrão dos consumos em torno do consumo médio Medidas de assimetria da distribuição de consumo na classe Medidas de achatamento da distribuição de consumo na classe Consumo mediano da classe Tamanho da classe ou número de estabelecimentos que compõem a classe o 20 Congresso Brasileiro de Engenharia Sanitária e Ambiental 1210 II - 035 o 20 CONGRESSO BRASILEIRO DE ENGENHARIA SANITÁRIA E AMBIENTAL O conhecimento a priori destas medidas numa determinada atividade econômica é fundamental para determinar o tamanho da amostra de economias necessário para se obter estimativas razoáveis na parametrização, e escolher corretamente o modelo probabilístico do consumo de água o que será fundamental na parametrização. Na prática, quando estas medidas não são conhecidas, elas são estimadas. Figura 1: Distribuição de freqüências em porcentagem dos consumos individuais de uma amostra aleatória - restaurantes de pequeno porte. % 30 20 10 0 0 100 200 300 400 500 ( m3 por mes ) Figura 2: Distribuição de freqüências em porcentagem dos consumos individuais de uma amostra aleatória - restaurantes de médio porte. % 30 20 10 0 0 100 200 300 400 500 ( m3 por mes ) Na Tabela 1 apresentamos estas medidas calculadas para cada uma das amostras log-normais. Tabela 1: Medidas que caracterizam a distribuição de freqüências nas amostras da populações log-normal, referentes às amostras apresentadas na figura 1 e 2. CARACTERISTICAS CONSUMO MÉDIO DESVIO PADRÀO MEDIDA DE ASSIMETRIA-“Skewness” MEDIDA DE ACHATAMENTO-“Kurtosis” CONSUMO MEDIANO TAMANHO DA CLASSE o Amostra fig.1 Amostra fig.2 94 m3 101 m3 3 28 m 58 m3 0,82 2,19 1,24 8,30 3 91 m 84 m 500 economias 300 economias 20 Congresso Brasileiro de Engenharia Sanitária e Ambiental 1211 II - 035 o 20 CONGRESSO BRASILEIRO DE ENGENHARIA SANITÁRIA E AMBIENTAL Uma outra característica muito importante que pode ser calculada a partir da distribuição de freqüências da Figura 1 é o Intervalo Ótimo de Confiança 95% para consumos individualizados desta classe. O cálculo destas características para todas as atividades econômicas numa cidade é também importante para estabelecer uma referência de comparação entre as atividades econômicas. Métodos estatísticos conhecidos como análise de “cluster” podem ser usados para agrupar atividades econômicas com distribuições de freqüências similares; a similaridade entre as distribuições de freqüências é calculada a partir das características das distribuições. Um exemplo simples simulando atividades econômicas em uma grande cidade baseado em apenas duas características é apresentado nas Figuras 3 e 4. Por ser uma grande cidade, os grandes comércios e as grandes indústrias foram colocados num só grupo técnica do “cluster” quando somente duas características são consideradas. Figura 3: Número de economias (%) pelo volume médio consumido (%). 90 residencias Num economias % 80 70 60 50 40 30 20 comercios pequenas industrias orgaos publicos 10 0 0 grandes consumidores 50 100 Volume médio consumido % Figura 4: Classes de economias classificadas segundo número de economias (%) e volume total consumido (%). 90 residencias Num economias % 80 70 60 50 40 30 20 comercios 10 pequenas industrias orgaos publicos 0 0 10 20 grandes consumidores 30 40 50 Volume consumido % o 20 Congresso Brasileiro de Engenharia Sanitária e Ambiental 1212 II - 035 o 20 CONGRESSO BRASILEIRO DE ENGENHARIA SANITÁRIA E AMBIENTAL PARAMETRIZAÇÃO REGRESSÃO DO CONSUMO DE ÁGUA VIA ANÁLISE DE Análise de regressão é uma ferramenta estatística que vem sendo muito usada em estudos de consumo de água. Esta técnica se baseia na utilização da relação entre variáveis quantitativas para prever uma delas a partir das outras. Por exemplo, o consumo residencial de água pode ser explicado em função das variações sazonais, mudanças climáticas e características residenciais. Neste trabalho estamos interessados em identificar variáveis que estejam correlacionadas com consumo de água de uma determinada atividade econômica. Para fazer isto precisaremos de uma amostra de economias da atividade considerada e medidas de uma série de variáveis para cada economia da amostra. A seleção das variáveis medidas na amostra deve ser feita criteriosamente, já que estas serão candidatas aos parâmetros do consumo de água. Se estas variáveis forem de fato correlacionadas, então uma equação de regressão pode ser estabelecida. As seguintes variáveis serão sempre investigadas: Q Nfunc Cenergia Área Nproduto é o consumo mensal de água da atividade econômica considerada é o número total de pessoas que trabalham no local é o consumo mensal de energia elétrica da atividade econômica é a área útil do local onde é executada a atividade econômica é a quantificação da produção mensal da atividade econômica ou outra variável indiretamente relacionada com a produção Irefeição é um indicador de presença de serviços de refeição no local ε é o erro aleatório Um modelo que pode ser ajustado é: Q = β 0 + β 1 nfunc + β 2 cenergia + β 3 area + β 4 producao + β 5 ihigiene + β 6 irefeicao + ε equação (1) Os coeficientes β são estimados e testados a cada ajuste até se chegar no modelo selecionado. DADOS PARA ANÁLISE DE REGRESSÃO Nós não conhecemos os valores dos coeficientes no modelo de regressão na equação (1), e precisamos estimá-los a partir de dados relevantes. Como nós não conhecemos a priori quais são as variáveis independentes apropriadas ao modelo e qual a forma funcional da relação da regressão (se linear ou quadrática ou outra), nós temos que nos basear nos dados (medições das variáveis na amostra selecionada) para desenvolver o modelo de regressão. Portanto, os dados para a análise de regressão deverão ser os mais informativos e completos possíveis. Observe-se aqui que dados como o consumo mensal de água e eletricidade e alguns dados físicos do consumidor podem ser obtidos dos cadastros das companhias distribuidoras de água e eletricidade e da prefeitura, mas as medições de outras variáveis terão de ser obtidas através de pesquisas de campo, após um planejamento amostral. o 20 Congresso Brasileiro de Engenharia Sanitária e Ambiental 1213 II - 035 o 20 CONGRESSO BRASILEIRO DE ENGENHARIA SANITÁRIA E AMBIENTAL CONSTRUÇÃO DE UM MODELO DE REGRESSÃO Seleção das variáveis Um modelo de regressão será tão mais útil quanto maior for a facilidade de seu manuseio. Quando ao construir modelos de regressão deve-se, portanto, escolher um número limitado e não muito grande de variáveis independentes. Um problema central na construção de modelos de regressão é o da escolha de variáveis que sejam boas para a predição do uso de água. As considerações sob as quais deve ser feita esta escolha são: • • • • A contribuição das variáveis escolhidas no sentido de diminuir a variabilidade do erro; A importância da variável como agente causador ou influente no uso de água; O grau em que observações das variáveis escolhidas podem ser obtidas com precisão, rapidez e com economia; O grau em que a variável pode ser controlada. Forma funcional da relação de regressão A escolha da forma funcional da regressão está ligada com a escolha das variáveis explicativas do modelo. A literatura tem mostrado que muitas vezes a forma funcional apropriada não é linear mas sim multiplicativa. Se a demanda de água de uma determinada atividade econômica puder ser explicada por uma distribuição log-normal, como as das Figuras 1 e 2, será conveniente que a relação funcional seja multiplicativa. Quando nenhuma relação é conhecida a priori, funções de regressão lineares ou quadráticas tem se mostrado satisfatórias como primeiras aproximações da função de regressão. VALIDAÇÃO DO PARÂMETROS SELECIONADOS O último passo no processo de parametrização do consumo de água é a validação do modelo selecionado de regressão. Uma validação de modelos usualmente envolve verificação do modelo com um outro conjunto de dados, diferente do que foi usado na construção do modelo. As três maneiras básicas para validação de um modelo de regressão são: 1. Colecionar um novo conjunto de dados para verificar o modelo e sua capacidade de predição; 2. Comparar com a teoria, evidências empíricas ou resultados de simulação; 3. Dividir o conjunto de dados em duas partes, a primeira para construir o modelo, e a segunda para verificar o modelo. COMENTÁRIOS FINAIS O produto final da parametrização do consumo de água via análise de regressão tem pelo menos três utilidades: o 20 Congresso Brasileiro de Engenharia Sanitária e Ambiental 1214 II - 035 o 20 CONGRESSO BRASILEIRO DE ENGENHARIA SANITÁRIA E AMBIENTAL 1. Descrição - a relação entre o uso de água e os fatores (parâmetros) selecionados pode ser usado para explicar o fenômeno que gera a forma de uso de água pela atividade econômica considerada. 2. Controle administrativo – a partir de relações estatísticas corretas entre consumo e os fatores selecionados, é possível estabelecer padrões de consumo de água para cada combinação de níveis dos fatores selecionados. 3. Previsão de consumo de água. Devemos aqui salientar que a existência de uma forte relação estatística entre fator selecionado e consumo de água não é suficiente para concluirmos numa relação de causa e efeito entre eles. Independentemente da técnica usada, a parametrização do consumo de água requer uma profunda compreensão do uso da água. A técnica de regressão, embora sofisticada, não deve substituir o conhecimento e experiência acumulada que se tem do fenômeno. Outra questão importante é que a qualidade na aplicação de técnicas estatísticas como a de regressão depende fortemente da base de dados onde esta análise se apoia. Em outras palavras, a base de qualquer estudo e caracterização de consumidores passa por informações cadastrais confiáveis, inclusive obtidas de outras companhias que trabalham com segmentos similares (por exemplo companhias distribuidoras de eletricidade e gás) e pesquisas de campo. O conhecimento empírico (“experiência”) embora muito útil na análise final dos resultados, deve ser filtrado com cuidado pois muitas vezes tende a gerar visões pré definidas e nem sempre espelhadas na realidade. REFERÊNCIAS BIBLIOGRÁFICAS 1. Billings, R. B., Jones, C. V. Forecasting Urban Water Demand . American Water Works Association, Denver-Colorado, 1996. Chesnutt, T.W., McSpadden, C.N. A Model-Based Evaluation of the Westchester Water Conservation Program. Tchnical Report, A&N Technical Services Inc., Santa Monica,CA , 81p,1990 Hollman, K. W., Boyet, W. E. AnEmpirical Analysis of Water-Price Determinants in Small Municipalities. Journal American Water Works Association, v.67, n.5, p. 274-277, may 1975. HOWE, C.W., LINEWEAVER JR, F.P. The Impact of Residential Water Demand and Its Relation to System Design and Price Structure. Water Resources Research, 3(1):13-32, 1967 Maidment, D. R., Parzen, E. Time Patterns of Water Use in Six Texas Cities. Journal of Water Resources Planning and Management, v.110, n.1, p.90-106, jan. 1984. Maimone, M., Labiak, M. A Linear Regression Analysis of Nassau County’s Water Conservation Program. In 1994 ANNUAL CONFERENCE PROCEEDINGS; AMERICAN WATER WORKS ASSOCIATION; WATER RESOURCES, 1994, New York-NY. Proceedings...1994. p 569-581 SCHNEIDER, M. L. Projections of Water Usage and Demand in Columbus, Ohio: Implications for Demand Management. Master of Science Thesis, Department os Civil Engineering, Ohio State University, Columbus, xiv 273 p, 1982. SCHNEIDER, M. L., WHITLATCH, E.E. User-Specific Water Demand Elasticities. Journal of Water Resources Planning and Management, v.117, n.1, p. 52-73, jan./feb. 1991. Waters, L.L., Young, R. A. Economic Factors Affectng residential Water Demand in Colorado. Technical Report, vii 100p, 1994. 2. 3. 4. 5. 6. 7. 8. 9. o 20 Congresso Brasileiro de Engenharia Sanitária e Ambiental 1215