SER-301: ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOS
Bárbara Maria Giaccom Ribeiro
RELATÓRIO DE ATIVIDADES LABORATÓRIO Nº 1: ANÁLISE DE PADRÕES DE PONTOS
INPE São José dos Campos
2008
1
1 INTRODUÇÃO
O Laboratório 1 teve como objetivo ilustrar as várias formas de analisar padrão de
pontos, a partir de alguns conjuntos de dados. As ferramentas de análise disponíveis no
SPRING são: o Interpolador Kernel, o Método do Vizinho Mais Próximo e a Função K.
A análise de dados espaciais consiste na observação de dados disponíveis no
espaço e na descrição e explicação do comportamento do processo espacial e de suas
relações com algum outro fenômeno espacial.
No caso da análise de "padrões pontuais" os dados são pontos relacionados a algum
evento, como por exemplo, ocorrência de mortes (por homicídio, acidente de trânsito, etc).
Em análise de padrões de pontos, somente a localização dos pontos é considerada, ao
contrário da geoestatística, onde os atributos relacionados à amostra, ponto, são
importantes.
O objetivo básico da análise de padrões pontuais é verificar se os eventos
observados em uma dada região de estudo apresentam comportamento sistemático,
como por exemplo, agrupamento, regularidade ou aleatoriedade.
2 DADOS
Os dados disponíveis dividiam-se em dois bancos de dados distintos:
• Bairros de São Paulo: percentual de idosos (mais que 70 anos) na cidade de São
Paulo, agregados por bairros.
• Porto Alegre – RS: violência por homicídios, acidentes de transporte e suicídios,
na cidade de Porto Alegre – RS.
3 DESENVOLVIMENTO
O Laboratório 1 foi dividido em duas etapas: na primeira, o Estimador de Densidade por
Kernel foi aplicado nos dados dos dois bancos (Porto Alegre e São Paulo); na segunda,
foi realizada uma Análise Univariada de Pontos somente nos dados de Porto Alegre.
A. Estimador de Densidade por Kernel
A-1. aplicação do Kernel para os dados de Porto Alegre (eventos)
A-2. aplicação do Kernel para os dados de São Paulo (área)
2
B. Análise Univariada de Pontos aplicado aos dados de Porto Alegre
B-1. análise do vizinho mais próximo
B-2. análise do vizinho mais próximo com simulação
B-3. análise da função L
B-4. análise da função L com simulação
A. Estimador de Densidade por Kernel
A-1. Porto Alegre – dados de eventos (mortalidade)
A interpolação – geração uma grade numérica de superfície a partir de dados
pontuais – da intensidade de eventos de mortalidade no município de Porto Alegre foi
realizada por meio da aplicação da estimativa Kernel. O estimador de Kernel é uma
medida de um suavizador de pontos (número de eventos por unidade de área), conforme
definido abaixo:
(1)
onde : hi é a distância do ponto s e a localização si ; τ é a largura da banda, sendo que
quanto menor esta for, menos suave é o efeito.
Nesta fase do laboratório, foi utilizado o banco de dados Porto Alegre, e o projeto
de mesmo nome, com projeção UTM/SAD69, determinado pelas seguintes coordenadas:
62º 23’ 9,93” O e 75º 2’ 28,18” S; 61º 15’ 22,20” O e 74º 37’ 46,09” S.
Figura A1 – ativação do banco de dados
Porto Alegre. Figura A2 – ativação do projeto Porto Alegre dentro
do banco de dados Porto Alegre.
Inicialmente ativou-se o Banco de Dados e o Projeto com os respectivos dados. Os
dados pontuais correspondentes aos eventos de homicídios, suicídios e acidentes de trânsito
puderam ser visualizados, e então se procedeu a fase da aplicação do método de Kernel.
3
Figura A3 – visualização dos PIs: Limites (categoria: Recorte) e Município (categoria: Eventos_Mortalidade).
No menu “Análise” acessou-se “Estatística Espacial” e posteriormente “Estimador
de Densidade por Kernel”. Na interface apresentada, seleciona-se o tipo de dado (neste
caso, ponto – associado ao PI “Eventos_Mortalidade”), define-se a largura da banda (τ =
2500) e seleciona-se a categoria e o PI de saída (o qual será MNT / PI Numérico).
Figura A4 – Análise >> Estatística Espacial >> Estimador de Densidade por Kernel >> tela de configuração
dos parâmetros para realização do Kernel.
4
Figura A5 – grade numérica resultante da realização do Kernel.
Para melhor visualização e interpretação do resultado, é mais comum a utilização da
imagem (superfície) gerada a partir da grade numérica. Isto pode ser realizado, fazendo-
se uma transformação do tipo Grade → Imagem (Figura A6).
Figura A6 – MNT >> Geração de Imagem >> Geração de Imagem MNT.
5
Figura A7 – imagem gerada a partir da grade numérica resultante da realização do Kernel.
Para uma melhor apresentação visual do resultado obtido, pode-se efetuar o
recorte na imagem gerada. Isto é realizado através de um programa escrito em linguagem
LEGAL:
Figura 8 – Análise >> LEGAL >> Editor de Modelos: programa em LEGAL utilizado para recorte da imagem
(Im_Kernel_2500) segundo os limites do município de Porto Alegre (Categoria: Recorte, PI: Limites).
6
Figura A9 – imagem recortada relativa à superfície da grade numérica resultante da realização do Kernel.
Em seguida, a grade gerada a partir do método de Kernel foi fatiada em cinco
classes (por meio de programa em LEGAL): baixa, baixa-média, média, média-alta e alta,
considerando um intervalo fixo determinado a partir da diferença entre a cota mínima e a
cota máxima, em ambos os valores da banda do Kernel. A figura A11 demonstra as
diferenças após o fatiamento da grade.
Figura A10 – Análise >> LEGAL >> Editor de Modelos: programa em LEGAL utilizado para fatiamento da
grade numérica (Kernel_2500) em cinco classes.
7
Figura A11 – fatiamento da grade numérica resultante da realização do Kernel.
Novamente, para uma melhor apresentação visual da imagem fatiada, foi realizado
um recorte segundo os limites do município de Porto Alegre (figura A13).
Figura A12 – Análise >> LEGAL >> Editor de Modelos: programa em LEGAL utilizado para recorte da
imagem fatiada (Fat_Kernel_2500) segundo os limites do município de Porto Alegre.
8
Figura A13 – imagem fatiada da grade numérica (Kernel, τ = 2500) recortada segundo limites do município.
Para efeito de comparação foram realizadas outras três interpolações Kernel
utilizando diferentes larguras de bandas (τ), 500, 1500, e 5000 metros, de modo a verificar
seus efeitos e resultados. As etapas desenvolvidas anteriormente, para geração da
imagem final relativa ao Kernel τ = 2500 foram repetidas para cada um dos três casos. Os
resultados são mostrados a seguir:
Figura A14 – imagem fatiada de grades numéricas produzidas a partir da aplicação do
Estimador de Densidade por Kernel, com as seguintes larguras de banda,
respectivamente: τ = 500m, τ = 1500m, τ = 2500m e τ = 5000m.
Por meio da figura A14, com os resultados de cada interpolação, é possível
verificar o crescente efeito de suavização, não só das bordas entre as classes, como da
τ = 500 τ = 1500 τ = 2500 τ = 5000
9
intensidade de eventos de mortalidade, com o aumento da largura de banda de 500 a
5000 metros. Isso ocorre porque para o cálculo da intensidade em cada ponto da
superfície a largura da banda ao quadrado entra na equação como um fator de divisão.
A-2. São Paulo – dados de atributos (idosos)
O segundo exercício abordou a aplicação do Kernel considerando o valor do
atributo e foi realizado utilizando o banco de dados Bairros_SP. Os dados contidos neste
banco referem-se somente aos bairros da região central e leste da cidade de São Paulo.
O atributo a ser analisado é o percentual de idosos (pessoas com mais que 70 anos).
Diferente do exemplo anterior, agora o Kernel refere-se à medida da quantidade total do
atributo por unidade de área (ver fórmula 2). O tipo de dado de que se está tratando agora é
do tipo área; isto é, o PI Mapa_Bairros é cadastral e possui polígonos (áreas) associados.
(2)
Para realizar este cálculo, o estimador assume que cada observação de área yi
deve ser associado a um evento sj, como por exemplo, o centróide dessa área. Assim, a
estimativa para um novo ponto s considera o número de si presentes conforme a largura
da banda (τ). O mesmo raciocínio de suavização para bandas mais largas é válido
também nesse exercício. Pode-se perceber, na figura A23, que a estimativa Kernel é mais
suave quando se utiliza bandas mais largas.
O banco de dados utilizado foi o Bairros_SP, e o projeto de mesmo nome, com
projeção UTM/SAD69, determinado pelas seguintes coordenadas: 46º 47’ 37,90”O, 23º
37’ 50,10”S; 46º 21’ 38,54”O e 23º 26’ 11,77”S.
Figura A15 – ativação do banco de dados
Bairros_SP. Figura A16 – ativação do projeto Bairros_SP dentro
do banco de dados Bairros_SP.
10
Figura A17 – visualização dos PIs: Limites (categoria: Recorte) e Mapa_Bairros (categoria: Mapa_Cadastral),
com a tabela de atributos relativa a cada objeto (bairro)
Figura A18 – Análise >> Estatística Espacial >> Estimador de Densidade por Kernel >> tela de configuração
dos parâmetros para realização do Kernel.
11
No menu “Análise” acessou-se “Estatística Espacial” e posteriormente “Estimador
de Densidade por Kernel”. Na interface apresentada, seleciona-se o tipo de dado (neste
caso, área – associado ao atributo “PERIDOSO”), define-se a largura da banda (τ = 3500)
e seleciona-se a categoria e o PI de saída (o qual será MNT / PI Numérico) (figura A18).
As figuras A19 e A20 mostram o resultado do Kernel aplicado aos bairros da cidade
de São Paulo e relativo ao atributo PERIDOSO (Percentual de Idosos / Bairro), em grade
numérica e em imagem (relativa à grade numérica) recortada conforme os limites da área
de estudo.
Figura A19 – grade numérica resultante da realização do Kernel.
Figura A20 – imagem recortada relativa à superfície da grade numérica resultante da realização do Kernel.
12
O fatiamento da grade oriunda do Kernel e o recorte da imagem temática são
realizados utilizando um programa em LEGAL (figura A21). O resultado do fatiamento é
exibido na figura A22:
Figura A21 – Análise >> LEGAL >> Editor de Modelos: programa em LEGAL utilizado para fatiamento da
grade numérica (Kernel_Peridoso_3500)e recorte da imagem (Im_Kernel_Peridoso_3500) segundo os limites
da área de estudo (Categoria: Recorte, PI: Limites).
Figura A22 – imagem fatiada da grade numérica (Kernel, τ = 3500) recortada segundo limites da área de estudo.
Para efeito de comparação foram realizadas outras três interpolações Kernel
utilizando diferentes larguras de bandas (τ), 1500, 2500, e 5000 metros, de modo a
13
verificar seus efeitos e resultados. As etapas desenvolvidas anteriormente, para geração
da imagem final relativa ao Kernel τ = 3500 foram repetidas para cada um dos três casos.
Os resultados são mostrados a seguir:
Figura A23 – imagem fatiada de grades numéricas produzidas a partir da aplicação do
Estimador de Densidade por Kernel, com as seguintes larguras de banda, respectivamente:
τ = 1500m, τ = 2500m, τ = 3500m e τ = 5000m.
A análise do método de Kernel de acordo com o valor do atributo considerando
amostras de áreas apresenta resultados semelhantes ao exercício anterior. Por meio da
figura A23, que exibe os resultados de cada interpolação, é possível verificar o crescente
efeito de suavização, não só das bordas entre as classes, como da intensidade de
eventos de mortalidade, com o aumento da largura de banda de 1500 a 5000 metros. Isso
ocorre porque, quanto menor a largura da banda utilizada, mais detalhado é o resultado
final. No entanto, a banda com maior largura apresenta uma suavização maior dos dados,
generalizando as superfícies de áreas estudadas.
τ = 1500 τ = 2500
τ = 3500 τ = 5000
14
B. Análise Univariada de Pontos aplicado aos dados de Porto Alegre
Na etapa B do Laboratório 1, foi retomado o banco da cidade de Porto Alegre com
dados relativos à mortalidade. A partir dos resultados gerados na etapa A, prosseguiu-se
a análise dos resultados obtidos pela aplicação do Estimador de Densidade por Kernel,
realizando-a de quatro maneiras:
B-1. análise do vizinho mais próximo
B-2. análise do vizinho mais próximo com simulação
B-3. análise da função L (derivada da Função K)
B-4. análise da função L com simulação
Análises espaciais de dados envolvem métodos que podem ser divididos entre os
relacionados à visualização dos dados (métodos exploratórios) e aqueles centralizados na
especificação do modelo estatístico e na estimativa de parâmetros.
O SPRING apresenta dois procedimentos para a análise de padrões pontuais
univariados: o método da Distância ao Vizinho Mais Próximo e o da Função L. Os dois
métodos analisam propriedades dos dados, conhecidas como de segunda ordem ou
dependência espacial. A componente de segunda ordem é responsável pelos desvios
estocásticos em relação à média e, ao invés de assumir esses desvios espacialmente
independentes, considera uma estrutura de covariância espacial ou dependência espacial
no processo. Essa componente de segunda ordem é modelada como um processo
espacial estacionário e isotrópico.
Um processo espacial {Y(s), s∈R} é estacionário ou homogêneo se suas
propriedades estatísticas, média e variância, são constantes na região R e, portanto, não
dependem da localização, s. A estacionaridade também sugere que a matriz de
covariância, entre valores de quaisquer dois lugares si e sj, depende exclusivamente da
direção e distância entre eles e não de seus valores absolutos. Se, além disso, a matriz
de covariância do processo for independente da direção, então tem-se um processo
estacionário isotrópico. Em um processo isotrópico, existe uma relação estreita entre a
distribuição das distâncias entre eventos e as propriedades de segunda ordem.
A distância ao vizinho mais próximo é uma medida que leva em consideração
propriedades de segunda ordem. O grau de dependência espacial em um padrão de
pontos pode ser verificado observando-se o comportamento da distribuição acumulada
dessas distâncias.
15
B-1. Análise do Vizinho Mais Próximo
O método do Vizinho Mais Próximo considera a estimativa de G(w), como a distribuição
acumulada da distância entre qualquer evento escolhido aleatoriamente e o evento
vizinho mais próximo. Para a análise univariada, a estimativa do vizinho mais próximo é
reduzida a:
n
wwwG i )(#
)(ˆ ≤= (3)
onde: n é o número de eventos, wi são as faixas de distâncias (distância medida entre
eventos) e w, a distância de análise (distância de comparação escolhida pelo usuário).
A técnica de análise pelo método do Vizinho Mais Próximo produz um gráfico da
freqüência acumulada da distância de cada ponto (evento) ao seu vizinho mais próximo:
Figura B1 – gráfico típico resultante da aplicação do método Vizinho Mais Próximo.
Os gráficos dos resultados empíricos de G(w) versus w podem ser utilizados como
método para inferir se há alguma evidência de interação entre os eventos. Se o gráfico
mostra uma função com brusca elevação no início, pode sugerir um agrupamento na
escala considerada. Por outro lado, se a elevação ocorre a intervalos de distâncias
maiores, mais para o final da curva, sugere-se repulsão ou regularidade entre os eventos.
Caso essa elevação seja constante, com inclinação próxima a 45º, sugere-se
aleatoriedade.
O exercício foi iniciado reativando-se o banco de dados e o projeto referente aos
dados de eventos da cidade de Porto Alegre. Para realização desta análise, no menu
“Análise” selecionou-se “Estatística Espacial” e logo, “Análise Univariada de Pontos”. Na
interface apresentada, a análise escolhida foi a do “Vizinho Mais Próximo”, e foram
inseridos os seguintes parâmetros: distância mínima = 0, número de intervalos = 10 e
distância máxima = 2500 (figura B3).
w
wi
1
0 w
)(ˆ wG
16
Figura B2 – Análise >> Estatística Espacial >> Análise Univariada de Pontos >> tela de configuração dos
parâmetros para realização da análise pelo método do Vizinho Mais Próximo. Gráfico resultante da aplicação do método Vizinho Mais Próximo (distância máxima = 2500m).
Para efeito de comparação, a operação foi realizada mais três vezes, tendo sido
modificada somente as distâncias máximas para os valores de: 500m, 1500m e 5000m.
Na figura B3 podem ser observados os gráficos resultantes de cada uma das análises.
Figura B3 – gráficos resultantes da aplicação do método Vizinho Mais Próximo, para as distâncias máximas
de 500m, 1500m, 2500m e 5000m, respectivamente.
No primeiro caso utilizou-se uma distância máxima de 500m, e o gráfico obtido
apresentou uma curva mais suave, com uma elevação menos brusca em relação aos
demais. Esse caso define, segundo a interpretação do gráfico, uma elevação próxima a
17
ser constante (45°), indicando aleatoriedade dos da dos.
O segundo e o terceiro resultados são intermediários entre o primeiro e o último
gráfico. Há evidências mais consistentes da existência de clusters para a escala de
distancia de 2500 que para a de 1500. Porém, para as duas distâncias pode-se assumir a
existência de agrupamentos, pois a elevação da curva supera o ângulo de 45º e com
brusca elevação no início.
O gráfico resultante da distância máxima de 5000m mostra uma elevação brusca,
sugerindo uma forte evidência de agrupamentos. Desta forma, é possível dizer que,
quanto maior a distância considerada entre os eventos, maior é a evidência de
agrupamento dos dados na escala que foi considerada.
Para este exercício, as distâncias máximas foram estabelecidas segundo aquelas
determinadas para a realização do exercício de aplicação do Estimador de Densidade por
Kernel (etapa A). A definição da distância a ser adotada é estabelecida de acordo com o
objetivo e geometria dos dados, além da escala de trabalho. Percebe-se que este tipo de
análise tem o resultado fortemente dependente da escala.
B-2. Análise do Vizinho Mais Próximo com Simulação
O Vizinho Mais Próximo pode ser usado como método formal para comparação
estatística da distribuição observada dos eventos, com o que seria esperado sob a
hipótese de Aleatoriedade Espacial Completa (CSR - Complete Spatial Randomness).
Este caso corresponde à opção de Vizinho Mais Próximo com Simulação.
O modelo espacial padrão para Aleatoriedade Espacial Completa é aquele em que
os eventos seguem um processo homogêneo de Poisson na região de estudo. Isto
significa que no processo espacial pontual descrito, considera-se Y(Ai) e Y(Aj) variáveis
aleatórias independentes para qualquer escolha de Ai e Aj e que a distribuição de
probabilidade de Y(A) obedece à distribuição de Poisson com média λA, onde A é a área
de A e λ, o número médio de eventos por unidade de área. Além disso, considerando o
número total de eventos em R, eventos são independentes e uniformemente distribuídos
em R. Isto significa que qualquer evento tem a mesma probabilidade de ocorrer em
qualquer posição e que a posição de qualquer evento é independente da posição do
outro, não havendo interação entre eventos. Pode-se então simular n eventos com
distribuição uniforme dentro da região, e formular a hipótese para testar se os padrões
observados estão agrupados, aleatórios ou regulares.
18
Esse método permite a comparação da função acumulada das amostras com a de
dados gerados aleatoriamente (envelopes de simulação superior e inferior).
Envelope Superior: (m é número de simulações).
Envelope Inferior:
O método consiste em simular "envelopes" para a distribuição CSR para avaliar a
significância dos dados de saída. A simulação estimada para G(w) sob a hipótese CSR é:
m
wG
wG
m
ii∑
== 1
)(ˆ
)( (4)
onde Ĝi (w), i=1,...n são as funções distribuição estimadas sem correção de borda. Cada
uma das n funções estimadas corresponde a uma simulação e para cada simulação são
gerados m eventos independentes com distribuição uniforme.
Figura B4 – gráficos típicos resultantes da análise pelo método Vizinho Mais Próximo com Simulação.
Se os dados são compatíveis com CSR (se as amostras estiverem distribuídas
aleatoriamente), o resultado a ser obtido ao se plotar a função simulada (w) versus a
função acumulada adquirida a partir das observações, Ĝ(w), deverá ser uma função
próxima de uma linear a 45º. Se existir agrupamento, a função observada Ĝ(w) deverá estar
acima da reta de 45º; na presença de regularidade, Ĝ(w) ficará abaixo da reta (figura B4).
Para realização desta análise, no menu “Análise” selecionou-se “Estatística
Espacial” e logo, “Análise Univariada de Pontos”. Na interface apresentada, a análise
escolhida foi a do “Vizinho Mais Próximo com Simulação”, e foram inseridos os seguintes
parâmetros: distância mínima = 0, número de intervalos = 10, distância máxima = 2500 e
número de simulações = 10 (figura B5).
miwGwU i ,...,3,2,1)},(ˆmax{)( ==
miwGwI i ,...,3,2,1)},(ˆmin{)( ==
Inferior
Superior
Ĝ(w)
G (w)
Estimada
Inferior Superior
Ĝ(w)
G (w)
Estimada
G
19
Figura B5 – Análise >> Estatística Espacial >> Análise Univariada de Pontos >> tela de configuração dos
parâmetros para realização da análise pelo método do Vizinho Mais Próximo com Simulação. Gráfico resultante da aplicação do método VMP com Simulação (distância máxima = 2500m).
Para efeito de comparação, a operação foi realizada mais três vezes, tendo sido
modificada somente as distâncias máximas para os valores de: 1500m, 5000m e 10000m.
Na figura B6 podem ser observados os gráficos resultantes de cada uma das análises.
Figura B6 – gráficos resultantes da aplicação do método Vizinho Mais Próximo com Simulação, para as
distâncias máximas de 1500m, 2500m, 5000m e 10000m, respectivamente.
(1500) (2500)
(5000) (10.000)
20
Nos três primeiros gráficos da figura B6, cujas distâncias máximas adotadas foram,
respectivamente, 1500m, 2500m e 5000m, a função se destacou acima de uma reta de
45°, demonstrando o agrupamento dos dados de acordo com a escala. No último gráfico
(distância máxima = 10.000m), a função obtida está próxima de uma linear a 45º, o que
indica que as amostras podem estar distribuídas aleatoriamente.
B-3. Análise da Função L (derivada da Função K)
O método do Vizinho Mais Próximo baseia-se em distâncias aos eventos mais
próximos e, portanto, consideram as escalas menores do padrão. Para obter informações
mais efetivas de um padrão espacial abrangendo grandes intervalos de escala, o melhor
método é a Função L, que proporciona uma descrição mais efetiva da dependência
espacial em um intervalo mais largo de escalas e está relacionada com propriedades de
segunda ordem de um processo isotrópico.
O gráfico da Função K não é tão intuitivo quanto ao gráfico do Vizinho Mais
Próximo. Portanto utiliza-se uma função auxiliar L, para facilitar a interpretação. O
estimador da Função L é:
hhK
hL −=π
)(ˆ)(ˆ (5)
No gráfico de )(ˆ hL contra h, picos positivos indicam atração espacial ou
agrupamento e picos negativos indicam repulsão ou regularidade.
Figura B7 – gráfico típico resultante da análise pelo método Função L. h
0
extremos positivos
agregação espacial
em torno de zero: aleatório
extremos negativos
ordenação regular
)(ˆ hL
21
No gráfico da Função L, os extremos positivos correspondem às distâncias (h) onde há
evidências de agregação na distribuição espacial dos eventos; em torno de zero, diz-se
que os eventos apresentam um tipo de distribuição espacial aleatória; nos extremos
negativos, há evidências de ordenação regular na distribuição espacial dos eventos.
O método da Função L tem, portanto, vantagens em relação à abordagem do
Vizinho Mais Próximo: apresenta informação em diversas escalas de padrões, envolve o
uso da localização precisa do evento e inclui todas as distâncias evento-evento. Outro
motivo para seu uso é que a forma teórica de K(h) é conhecida para vários modelos de
pontos. Portanto, )(ˆ hK não é utilizado apenas para explorar a dependência espacial, mas
na sugestão de modelos que representem essa dependência e na estimativa de
parâmetros do modelo.
Para realização desta análise por Função L, no menu “Análise” selecionou-se
“Estatística Espacial” e logo, “Análise Univariada de Pontos”. Na interface apresentada, a
análise escolhida foi a da “Função L”, e foram inseridos os seguintes parâmetros:
distância mínima = 0, número de intervalos = 10, distância máxima = 2500 (figura B8).
Figura B8 – Análise >> Estatística Espacial >> Análise Univariada de Pontos >> tela de configuração dos
parâmetros para realização da análise pelo método do Função L. Gráfico resultante da aplicação do método Função L (distância máxima = 2500m).
Para efeito de comparação, a operação foi realizada mais oito vezes, tendo sido
modificada somente as distâncias máximas para os valores de: 100, 500, 1500, 5000,
8000, 10.000, 15.000 e 20.000. Na figura B9 podem ser observados os gráficos
resultantes de cada uma das análises.
22
Figura B9 – gráficos resultantes da aplicação do método Função L, para as distâncias máximas de 100, 500,
1500, 2500, 5000, 8000, 10.000, 15.000 e 20.000, respectivamente.
Os resultados sugerem haver agrupamento na distribuição dos pontos analisados
utilizando as distâncias máximas de 8000, 10.000 e 15.000. A análise destes gráficos,
juntamente com o relativo à distância máxima de 20.000, sugere que o agrupamento está
em torno dos 7.500m, distância esta maior do que as que retornaram evidência de
agrupamento no método por Vizinho Mais Próximo (2500 e 5000m).
No caso do último gráfico, observa-se que os dados com distancia de 20.000m
possuem evidências de ordenação regular na distribuição espacial dos eventos (pois este
trecho da curva caminha em direção a seu extremo negativo).
Embora as curvas dos gráficos relativos às distâncias de 500, 1500, 2500 e 5000
não “atinjam” o pico, pode-se dizer que esses resultados sugerem agregação dos dados
espacialmente, uma vez que essas curvas tendem aos extremos positivos.
Dessa forma, verifica-se que o método da Função L é mais adequado para escalas
geográficas menores.
(100) (500) (1500)
(2500) (5000) (8000)
(10.000) (15.000) (20.000)
23
B-4. Análise da Função L com Simulação
No caso da Função L com Simulação, assim como no caso Vizinho Mais Próximo
com Simulação, são construídos envelopes superiores e inferiores para m simulações de n
eventos na região, sob hipótese de Aleatoriedade Espacial Completa, CSR, e as
estimativas associadas de )(ˆ hL . Os envelopes são incluídos no gráfico da Função L
versus h.
Por meio desta abordagem, pode se estimar a significância dos desvios da
distribuição )(ˆ hL em relação à aleatoriedade (CSR - Complete Spatial Randomness). São
realizadas simulações CSR sobre a região R e computam-se os envelopes superior e
inferior.
Figura B10 – gráfico típico resultante da análise pelo método Função L com Simulação.
No gráfico da Função Estimada L e envelopes versus distância são verificados
valores positivos para )(ˆ hL , localizados acima dos envelopes, o que caracteriza
agrupamento nesta escala de distância. O agrupamento é mais forte para as distâncias
que correspondem aos extremos da curva de )(ˆ hL . Extremos negativos, abaixo dos
envelopes, representam regularidade para as respectivas distâncias.
Para realização desta análise, no menu “Análise” selecionou-se “Estatística
Espacial” e logo, “Análise Univariada de Pontos”. Na interface apresentada, a análise
escolhida foi a da “Função L com Simulação”, e foram inseridos os seguintes parâmetros:
distância mínima = 0, número de intervalos = 50, distância máxima = 10.000 e número de
simulações = 10 (figura B11).
mihLhUpper i ,...,3,2,1)},(ˆ{max)( ==
mihLhLower i ,...,3,2,1)},(ˆ{min)( ==
Upper (h)
Lower (h)
aleatório
)(ˆ hL
h
Estimada
24
Figura B11 – Análise >> Estatística Espacial >> Análise Univariada de Pontos >> tela de configuração dos
parâmetros para realização da análise pelo método do Função L com Simulação. Gráfico resultante da aplicação do método Função L com Simulação (distância máxima = 10.000m).
Para efeito de comparação, a operação foi realizada mais três vezes, tendo sido
modificada somente as distâncias máximas para os valores de: 5000, 15.000 e 20.000.
Na figura B12 podem ser observados os gráficos resultantes de cada uma das análises.
Figura B12 – gráficos resultantes da aplicação do método Função L com Simulação, para as distâncias
máximas de 5000, 10.000, 15.000 e 20.000, respectivamente.
Os resultados exibidos por meio dos gráficos da figura B12 indicam que, para todas
distâncias máximas testadas, há indicação de agrupamento entre as amostras. Isto é, os
valores estimados foram superiores ao envelope de aleatoriedade da distribuição dos
(15.000) (20.000)
(5.000) (10.000)
25
pontos. De modo semelhante aos resultados obtidos com a aplicação do método da
Função L, a curva estimada possui seu pico em torno de 7.500m, evidência de maior
agregação dos dados.
4 CONCLUSÃO
Por meio deste Laboratório 1, foi possível obter conhecimentos de análise estatística
espacial, aplicando-os no software SPRING e analisando os seus resultados a partir das
imagens e gráficos gerados.