previsÃo do consumo de energia elÉtrica na … · tabela 2 - análise de variação da regressão...
Post on 14-Dec-2018
217 Views
Preview:
TRANSCRIPT
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
PREVISÃO DO CONSUMO DE ENERGIA ELÉTRICA NA CIDADE DE
SALVADOR – BA UTILIZANDO REGRESSÃO LINEAR
Helder Henri Silva e Caldas1, Dr. Walter Accioly Costa Porto2
1 Instituto Federal de Educação, Ciência e Tecnologia da Bahia – IFBA, R. Emídio dos Santos, s/n - Barbalho, Salvador - BA, CEP: 40301-015
2 Instituto Federal de Educação, Ciência e Tecnologia da Bahia – IFBA, R. Emídio dos Santos, s/n - Barbalho, Salvador - BA, CEP: 40301-015
Helder_henri@hotmail.com
Resumo
Este trabalho apresenta como objeto de estudo um modelo para prognóstico do consumo
por energia elétrica em Salvador - BA, sob forma de função linear, a partir de dados
estatísticos temporais coletados que induzem variações consideráveis na demanda. O
principal objetivo é prover as empresas que atuam nas áreas de interesse, com uma
ferramenta confiável de previsão do consumo, garantindo assim, o nível de excelência e
dinamismo no atendimento de cargas futuras. Utilizou-se uma metodologia para a
mensuração destes, que levou em conta dados relevantes que influenciam o valor da
demanda por eletricidade como: A temperatura compensada média mensal, o índice
pluviométrico e o número de clientes da COELBA (Companhia de Eletricidade do Estado da
Bahia). Para o tratamento estatístico de dados, contou-se com a Regressão Linear Múltipla,
a partir do método dos mínimos quadrados para determinação dos coeficientes de
regressão, sendo analisado também seu grau de confiabilidade. Os resultados demonstram,
de forma conclusiva, a montagem de uma equação linear que descreve a demanda mensal
por eletricidade no município, trazendo o perfil de contribuição de cada variável, em especial
a temperatura, que obteve peso maior na modelagem.
Palavras-chave: Consumo, demanda, eletricidade, previsão, regressão.
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
Abstract
This paper has as object of study a behavior of consumption for electricity in Salvador - BA,
in the form of linear function, from temporal statistical data collected that induce considerable
variations in demand. The main objective is to provide for companies that are operating in
areas of system power, with a reliable tool of consumption forecast, thus ensuring the level of
excellence and dynamism in supplying future charge in distribution system. Was used a
methodology for measuring , which took into account relevant data that have influence on the
value of demand for electricity as: Compensated average monthly temperature, rainfall index
and number of COELBA’s customers (State Electricity Company Bahia). For the statistical
treatment of data, counted with the Multiple Linear Regression from the least squares
method to determine the regression coefficients also being analyzed their degree of
reliability. The results evidence, in a conclusively way, the assembly of a linear equation
describing the monthly demand for electricity in the city, bringing the contribution of each
variable profile, especially the temperature, which obtained the highest weight in modeling.
Keywords: Consumption, demand, electricity, forecast, linear regression.
1. INTRODUÇÃO
A eletricidade é, sem dúvida, um dos bens essenciais e agente facilitador à vida
moderna. Com isso, se tornou a maneira mais eficaz de obter, por meio de transformações,
outras formas de energia como a luminosa (luz), térmica (calor) e motriz (força). Ela está
presente em praticamente todos os momentos do nosso dia a dia, quando acendemos uma
lâmpada ou guardamos um alimento na geladeira para conservá-lo, entre tantos outros.
Há sempre um risco associado ao desequilíbrio entre oferta e demanda por energia
elétrica, pois existem vários fatores externos, impossíveis de controlar como as de causas
climáticas (temperatura, precipitação, umidade e frio) que alteram de forma significativa as
necessidades no consumo de energia elétrica.
Santos e Caldas (2012) frisa a importância de se elaborar um bom planejamento de
expansão da capacidade produtiva e da infraestrutura necessária de geração, transmissão e
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
distribuição, pois, demonstra-se vital para o desenvolvimento sólido do país. E está
intimamente ligada também à escassez e à necessidade de geração.
O presente trabalho visa identificar fatores importantes que contribuem para o
aumento ou diminuição do consumo, como a precipitação, temperatura e o número de
clientes, estudando como tais variações quantitativas afetam a demanda por energia
elétrica.
2. REGRESSÃO LINEAR
Pretende-se estabelecer uma equação matemática que represente o fenômeno em
questão. O comportamento pode ser apresentado de várias formas (linear, quadrático,
cúbico ou logarítmico). No presente estudo será considerado o modelo linear, pois é o mais
simples, e foi capaz, de maneira significativa, de justificar a relação entre as variáveis
envolvidas. Logo, pode-se considerar que a relação da resposta às variáveis de predição
são funções lineares e devendo surgir uma reta estimada para o modelo final. Então um
passo crucial é a estimativa dos parâmetros, os chamados coeficientes de regressão.
3. REGRESSÃO LINEAR MÚLTIPLA
O modelo em questão deve levar em consideração mais de uma variável
independente. Por esta razão, será utilizado um modelo de regressão múltipla. Tratando-se
especificamente desta aplicação iremos considerar linear, logo, teremos uma regressão
linear múltipla.
Para Hair et al (2005), a regressão múltipla é uma técnica estatística que pode ser
usada para analisar a relação entre uma única variável dependente (critério) e várias
variáveis independentes (preditoras). O objetivo da análise de regressão linear múltipla é
usar as variáveis independentes cujos valores são conhecidos para prever o valor da
variável dependente selecionada pelo pesquisador.
Com base nesta relação matemática, a regressão apresenta uma explicação algébrica
para a modificação da variável dependente através das respectivas variações das variáveis
independentes. Devendo-se formular um método para previsão de algo que se deseja
controlar.
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
3.1 Resumo dos Resultados
No presente estudo, foram utilizados resultados oriundos das tabelas com
estatísticas de regressão geradas pelo programa Microsoft Excel® 2010. Conforme traz
Rencher e Schaalje (2005), são elas:
• R – Múltiplo: Deve apresentar o coeficiente de correlação dos intervalos do conjunto
de dados entre duas ou mais variáveis explicativas, determinando o poder de relação
entre essas duas propriedades;
• R – Quadrado: Deve apresentar o quadrado do coeficiente de correlação do
momento do produto de Pearson através do referido conjunto de dados;
• R – Quadrado Ajustado: Tem significado semelhante ao R – Quadrado, porém é
ajustado levando-se em consideração o número de variáveis independentes;
• Erro Padrão: É o desvio padrão do modelo, determinado pela raiz quadrada da
variância. Deve refletir a variação da precisão de acordo com o tamanho da amostra.
• Valor-P: Indica o grau de influência sobre a variável dependente;
• F-Significância: Determina a existência de uma relação linear entre a variável
resposta e o(s) regressor(es);
• Colinearidade: Define o grau de dependência entre variáveis independentes, como
uma pode ser determinada em função da outra.
4. METODOLOGIA
A partir da coleta de dados, foi utilizado o software Excel®, versão 2010, para
obtenção da equação do Modelo de Regressão Linear e os parâmetros para estimação da
qualidade da previsão do consumo de energia elétrica municipal.
Foram coletados os dados mensais do consumo de energia elétrica na cidade de
Salvador e seu respectivo número de clientes junto a COELBA. Os outros dados
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
meteorológicos, índice pluviométrico mensal e a temperatura compensada média mensal,
foram extraídos do INPE (Instituto Nacional de Pesquisas Espaciais).
O período de coleta de dados se deu de janeiro de 2010 a dezembro de 2014,
utilizando dados atuais, com uma amostra bastante significativa, 60 dados, para cada
variável dita independente. Para Hair et al (2005), uma amostra com nível mínimo estaria
em torno de cinco pra um, e o nível desejável está em torno de 20 dados para cada variável
independente, confirmando que a dimensão amostral é suficiente.
As primeiras variáveis explicadoras são o índice pluviométrico mensal no determinado
local de medição e a temperatura compensada média mensal. Foram utilizados os dados da
estação SALVADOR ONDINA - BA (OMM: 83229), colhidos em 17 de março de 2015.
A terceira variável explicativa é o número de clientes que a COELBA fornece energia.
É visível a dependência da quantidade de energia consumida ao universo de clientes a que
se destina, porém existem classes de consumidores que demandam uma maior quantidade,
e por isso mais significativos, do que outros clientes com potência instalada menor.
5. RESULTADOS
Foi verificada a qualidade da Regressão Linear Múltipla com as variáveis
independentes referidas anteriormente. Espera-se obter valores de coeficiente com um nível
de precisão maior considerando o intercepto nulo. Logo, como resultado da regressão tem-
se as tabelas abaixo extraídas do software Excel®:
Tabela 1 - Estatísticas da Regressão Múltipla Sem Intercepto
R múltiplo 0,999023816
R-Quadrado 0,998048586
R-quadrado
ajustado 0,980436255
Erro padrão 14,19188392
Observações 60
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
Tabela 2 - Análise de Variação da Regressão Múltipla Sem Intercepto
Fonte de Variação
Graus de
Liberdade
Soma
Quadrática
Média
Quadrática F0 F de significância
Regressão 3 5871609,136 1957203 9717,52 4,96994x10-76
Resíduo 57 11480,34545 201,4095
Total 60 5883089,482
Tabela 3 - Coeficientes da Regressão Múltipla Sem Intercepto
Coeficientes Erro padrão valor-P
Inferior
98,0% Superior 98,0%
Interseção 0 #N/D #N/D #N/D #N/D
Número de Clientes
(mil) 0,1388914 0,0294126 1,56 x10-05
0,068490 0,209292644
Precipitação Total
Mensal (mm) 0,0267864 0,0169127 0,01187 -0,013695 0,067268284
Temp. Compensada
Média (ºC) 6,5365518 1,1787053 7,87x10-7
3,715241 9,357862724
Tabela 4 - Matriz de Correlação da Regressão Múltipla Sem Intercepto
Número de
Clientes (mil)
Precipitação Total
Mensal (mm)
Temp. Compensada
Média (ºC)
Número de Clientes (mil) 1
Precipitação Total Mensal
(mm) -0,1118324 1
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
Temp. Compensada Média
Mensal (ºC) -0,187661788 -0,328670993 1
Apesar de ter-se obtido um R-Quadrado muito alto, não devemos considera-lo sozinho
para fins de atestado de qualidade da regressão, conforme analisa Gujatari e Porter (2008).
De forma empírica, não se pode avaliar a capacidade explicativa da modelagem apenas por
um grau de R-Quadrado maior ou menor. No entanto, o tamanho do R-Quadrado pode
servir como um indicador para avaliar em que medida a relação entre as variáveis pode ser
descrita por uma função linear. Para suprir esta deficiência, foram adotadas medidas
complementares de verificação e validação tendo em vista que os dados foram simulados
para atender a todos os pressupostos do Método dos Quadrados Ordinários.
A equação que deve representar a Regressão Linear Múltipla sem o intercepto é:
1 1 2 2 3 3
1 2 30,13889149 0,02678645 6,53655189 (1)
Y x x x
Y x x x
Sendo,
Y = Demanda Total Consumida (Giga Watts hora);
= Ponto de Interseção da equação estimado;
1x = Variável independente número de Clientes (mil);
1 = Regressor estimado referente ao número de clientes estimado;
2x = Variável independente precipitação total mensal (mm);
2 = Regressor estimado referente à precipitação total mensal estimada;
3x = Variável independente temperatura compensada média mensal (ºC);
3 = Regressor estimado referente à temperatura compensada média mensal estimada;
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
E a equação de previsão da demanda por eletricidade em Salvador pode ser descrita
a partir da equação abaixo:
( ) 0,13889149 ( ) 0,02678645 ( ) 6,53655189 (º )Consumo GWh Clientes mil Pluviometria mm Temperatura C
5.1 Erro Padrão
Tabela 5 - Erro Percentual do Modelo
Média do Consumo Mensal
(GWh)
Erro Padrão (GWh) Erro Percentual
312,62 14,19188392 4,54 %
Como apresentado na Tabela 5, o presente modelo traz um pequeno erro percentual.
Isto demonstra que os valores previstos para o consumo de energia na cidade de Salvador
podem distanciar-se apenas 4,54% de seu valor real, retratando um desvio mínimo frente ao
montante de fato consumido.
5.2 Intervalos de Confiança
A tabela 3 traz como resultado, com 98% de certeza, que as variáveis independentes estão
contidas nos seus respectivos intervalos de confiança.
5.3 Teste de Significância
Considerando cada variável dita explicativa, seus Valores-P podem ser verificados
como aceitáveis, comparando com o alfa=0,02 (98% de confiança), que é o nível de
significância definido no problema, então, conclui-se que os Valores-P são menores que alfa
para todas as variáveis analisadas, considerando a Tabela 3, portanto, tem influência
relevante sobre o Consumo de Energia Elétrica na cidade de Salvador.
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
5.4 Teste de Linearidade
O resultado estatístico F deve garantir um nível de linearidade ao problema, conforme
a Tabela 2. O teste F de significância para esta equação pode ser definido:
0
764,96994 9717,52 (210 )
SignificânciaF F
Logo, para a regressão múltipla, este teste indica que há uma relação linear forte entre
a variável resposta e os estimadores. Podendo ser comprovada também, conforme figura 1,
retirada dos resultados provenientes da regressão pelo software Excel®.
Figura 1 - Tendência Linear da Regressão Múltipla
5.5 Análise de Coeficientes
É importante observar a correspondência entre o sinal dos coeficientes e a relação
teoricamente esperada, em que medida os resultados oferecem evidências em favor das
hipóteses de trabalho. As hipóteses naturais são os coeficientes β1, β2 e β3, exercerem um
efeito positivo sobre o consumo.
A variável Número de Clientes assume valor aproximado de 0,139, significando que,
com o acréscimo de mil clientes na rede da COELBA, haverá um incremento de 0,139 GWh
no consumo, mantendo tudo o mais constante. A conclusão é reforçada pela estimativa do
0
200
400
0 20 40 60 80 100 120Co
nsu
mo
(GW
h)
Percentil da amostra
Probabilidade Normal da Equação
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
erro associada ao ponto. Novamente, trazendo o Valor-P, pode-se inferir que a
probabilidade de se estar errado ao rejeitar esta variável é mínima, da ordem de 51,56 10x .
Logo, há fortes evidências sugerindo que o efeito positivo teoricamente esperado de 1
sobre Y pode ser corroborado.
Já a segunda variável explicativa, Precipitação total mensal, assume valor 0,027.
Neste caso, com as demais variáveis constantes, podemos dizer que o aumento de uma
unidade em 2 produz um aumento de 0,027 GWh na variável dependente Y. O Valor-P
neste caso, (0,01187), é bem próximo ao valor de referência alfa=0,02 o que poderia indicar
certa probabilidade de ter significância baixa ao modelo. Porém a partir das demais análises
feitas, pode-se considera-la como uma variável explicativa importante.
Por fim, a variável Temperatura Compensada Média Mensal sugere um acréscimo de
6,536 GWh para cada variação unitária. Apresentando assim, uma forte relação com o
consumo como foi esperado já que a temperatura motiva maciçamente o aumento de cargas
de refrigeração no sistema elétrico, compondo papel crucial no modelo.
5.6 Teste de Resíduos
A análise de resíduos verifica se o modelo é apropriado. Como se trata de uma
regressão múltipla, os resíduos das variáveis devem ser analisados de forma separada para
indicar a qualidade. As figuras foram extraídas dos resultados do software Excel®.
Figura 2 - Resíduos do Número de Clientes da Regressão Múltipla
-50
0
50
950,00 1000,00 1050,00 1100,00Re
síd
uo
s
Número de Clientes (mil)
Número de Clientes (mil)
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
Figura 3 - Resíduos da Precipitação Total Mensal da Regressão Múltipla
Figura 4 - Resíduos da Temperatura Compensada Média Mensal da Regressão Múltipla
Os resíduos desta regressão apresentam-se como variáveis aleatórias, onde os
pontos são distribuídos em torno da reta que passa pela origem sem nenhum padrão
definido, conforme as figuras 2, 3 e 4, garantindo o critério da heteroscedasticidade.
6. CONCLUSÃO
Conjecturando os resultados anteriores, podemos deduzir que estes dados são
suficientes para mostrar que o modelo de Regressão Múltipla sem intercepto com três
variáveis preditoras contribui para a adequação de um ótimo modelo de previsão e
demonstrando-se sólido com o que é esperado, podendo prever o consumo municipal com
uma boa qualidade.
-100
0
100
0,00 200,00 400,00 600,00Re
síd
uo
s
Precipitação Total Mensal (mm)
Precipitação Total Mensal (mm)
-100
0
100
0,00 10,00 20,00 30,00Res
ídu
os
Temp. Compensada Média (ºC)
Temp. Compensada Média (ºC)
AGRENER GD 2015
10º Congresso sobre Geração Distribuída e Energia no Meio Rural
11 a 13 de novembro de 2015
Universidade de São Paulo – USP – São Paulo
Pode-se verificar também, que a equação do modelo atende todas as avaliações
necessárias e assim é traduzida como um conjunto de hipóteses para a estimação da
variável dependente. Então, o modelo de regressão linear múltipla fica como contribuição
necessária e importante para o planejamento energético da cidade de Salvador.
Por fim, este trabalho deve contribuir significativamente para o planejamento
energético municipal, oferecendo métodos matemáticos e utilizando pressupostos
estatísticos para a previsão. Assim as empresas do setor elétrico podem se antever a
acréscimos no consumo e dimensionar melhor as redes de distribuição para melhor atender
seus respectivos clientes.
7. REFERÊNCIAS BIBLIOGRÁFICAS
GUJARATI, DAMODAR N.; PORTER, DAWN C.. Econometria Básica. 5ª Edição, São
Paulo: McGraw-Hill, 2008.
HAIR JR., J.F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C.. Análise
Multivariada de Dados. 5ª Edição – Porto Alegre: Bookman, 2005.
RENCHER, C.ALVIM; SCHAALJE, G. BRUCE. Linear Models in Statistics. 2ª Edição.
John Wiley & Sons, Inc., 2008.
SANTOS, EUCYMARA F. NUNES; CALDAS, ALEXANDRE A. SILVA. Previsão do
Consumo de Energia Elétrica em Petrolina – PE. Revista Brasileira de Energia, Volume 18,
N. 01, p.129-141, 2012.
top related