visualização de busca - marilia.unesp.br · 03/05/2017 1 visualização de resultados de busca...
TRANSCRIPT
11/09/2018
3
Introdução
� A busca por informação é um processo impreciso;
� O usuário de um sistema de recuperação de informação geralmente possui apenas uma vaga noção de como recuperar a informação (documentos) que necessita;
� A interface pode ajudar o usuário na tarefa de expressar a sua necessidade de informação, entender os resultados da busca e selecionar os documentos relevantes.
Introdução
� A qualidade de um sistema, na maioria das vezes, é avaliado pela sua interface;
� Se bem concebidos, os sistemas eficazes geram sentimentos positivos em seus usuários.
� Quando um sistema é bem projetado, a interface quase desaparece, permitindo que os usuários se concentrar em seu trabalho, realizando-o de maneira prazerosa.
11/09/2018
4
Introdução
� A representação visual pode comunicar certos tipos de informação muito mais rapidamente do que qualquer outro método;
� Porém, a visualização de informações abstratas é inerentemente difícil;
◦ a língua é o principal meio de comunicação de ideias abstratas;
Visualização de Informação
11/09/2018
5
Visualização de Informação
� Área da ciência que tem por objetivo o estudo das principais formas de representações gráficas para apresentação de informações, a fim de contribuir para o melhor entendimento delas, bem como ajudar a percepção do usuário na dedução de novos conhecimentos baseado no que está sendo apresentado (FREITAS et al., 2001).
� Para que seja possível a construção de representações visuais, a Visualização de Informação trabalha em parceria com as ferramentas computacionais, que se configuram como facilitadoras dos processos de visualização.
� Mazza (2009) explica que embora a visualização não dependa necessariamente de computadores para cumprir seu papel, as ferramentas computacionais potencializam o uso de visualizações.
Modelos de visualização de informação
11/09/2018
6
Modelos de visualização de informação
� Bifocal Display
◦ Itens informacionais são colocados em três áreas diferentes, sendo a central a que apresenta a informação em destaque, enquanto as outras informações do contexto geral são figuradas nas laterais da região focal.
� Perspective Wall
◦ o espaço de informação é colocado em uma "parede", com os “muros” laterais contendo a informação não destacada no momento (contexto).
Modelos de visualização de informação
11/09/2018
7
Modelos de visualização de informação
Bifocal Display Concept: video from 1982
https://www.google.com/culturalinstitute/exhibit/QQ-RRh0A
11/09/2018
8
Modelos de visualização de informação
� ConeTree
◦ Utiliza uma representação de informações hierárquica na qual o nó raiz de uma árvore é localizado no ápice e suas ramificações são apresentadas logo abaixo.
◦ O objetivo é apresentar uma estrutura na qual uma hierarquia inteira (ou um grande parte dela) seja visível sem necessidade de scrolling, e permita a supressão ou exibição de nós durante a navegação.
◦ Com recursos de rotação, animação e zoom, a representação oferece acesso rápido às informações com boa orientação para visualização.
11/09/2018
9
Esquema básico da técnica cone tree, com as ramificações dispostas na basede um cone, com nodo principal no topo.
11/09/2018
10
3D conetree
3D conetree horizontal
Modelos de visualização de informação
� Treemaps
◦ A estrutura representada em subdivisões sucessivas. Cada uma dessas subdivisões representa um diretório, e que por sua vez, também possui outras subdivisões.
◦ Essa técnica, também conhecida como space-filling, foi o pioneiro de diversas outras abordagens similares (CushionTreeMaps, Information Slices e a interface do Sunburst).
Esquema básico da técnica treemaps.
11/09/2018
11
À esquerda um example de representação em árvore, onde um número é associado a cada folha;
Os nós internos representam a soma dos valores dos nós-filho;
À direita a representação da árvore utilizando treemap;
(MAZZA, 2009, p.84)
Treemap da preferência de refrigerantes (soft drink) em um pequeno grupo de pessoas.
11/09/2018
13
Treemap dos votos por município e estado nas eleições presidenciais norte-americanas de 2012
https://www.treemap.com/datasets/uselections
Bilionários do mundo (Forbes) https://www.treemap.com/datasets/billionaires/
11/09/2018
14
Modelos de visualização de informação
� HyperbolicTree
◦ Apresenta hierarquias através de uma visualização radial disposta em um plano hiperbólico.
◦ Apresenta ainda aspectos de construção conhecidos como espinha de peixe através da indicação de um nodo de interesse, que é exibido no centro da interface enquanto o contexto é mantido no restante do diagrama.
Esquema básico da técnica hyperbolic tree
11/09/2018
16
Modelos de visualização de informação
� Representação Hierárquica◦ Os elementos se apresentam em diferentes níveis, ramificações
ou agrupamentos, que descendem de um nó raiz – é uma representação comum de dados que tem em sua própria natureza uma visualização hierárquica, como por exemplo, uma visualização de estruturas complexas de diretórios de arquivos de um HD.
◦ No caso da visualização de dados multidimensionais, onde não estão definidas de forma explícita as relações hierárquicas, as representações hierárquicas se utilizam de aplicações de técnicas de agrupamento.
◦ Este é o caso de técnicas estatísticas de clustering que através de um processo interativo são agrupados diferentes elementos em função de sua similaridade, formando assim grupos em diferentes níveis hierárquicos.
11/09/2018
17
Modelos de visualização de informação
� Representação em Rede◦ Diferentes elementos (documentos, termos, etc.) são
apresentados em forma de nós ou vértices, de maneira que a estrutura se encontra definida pelas relações ou arcos de proximidade de cada nó em forma de teia, não possuindo uma relação de hierarquia.
◦ O problema ao representar dados multidimensionais desta forma é que o número de nós e vértices pode chegar a tal tamanho que seria incompreensível o grafo resultante.
◦ É necessário, portanto, o emprego de técnicas de redução de relações a fim de que a interface final seja compreensível e útil para a visualização, sem perder ou distorcer a realidade estrutural da rede. Uma destas técnicas de redução é o método de escalonamento de rede Pathfinder, apresentando redes denominadas Pathfinder ou PFNETs.
Representação em Pathfinder
11/09/2018
19
Modelos de visualização de informação
� Diagrama de Dispersão◦ Agrupamento de pontos e sua dispersão;
◦ Estes pontos estariam distribuídos em um espaço visual bi ou tridimensional, e distanciados um dos outros através das dissimilaridades e distâncias especificadas em uma matriz de similaridade.
◦ Observando o padrão de disposição dos pontos é possível concluir relação entre as variáveis envolvidas no problema
11/09/2018
20
Modelos de visualização de informação
� Mapas◦ Se fundamentam na ideia de utilizar da metáfora de mapas
geográficos para a visualização de espaços de informação;
◦ O objetivo da utilização de qualquer tipo de metáfora visual em um desenho de interface é fazer visível para o usuário a estrutura e relação de um determinado conjunto de dados.
◦ A utilização deste tipo de metáfora para visualização de espaços de informação complexos e abstratos permite uma visão diferente do conjunto de dados que na maioria dos casos enriquecerá a imagem mental prévia que o usuário possua.
◦ Dentre todas as técnicas possíveis para gerar este tipo de mapa, vale ressaltar o modelo de mapas auto-organizáveis ou SOM (Self-Organizing Map) (KOHONEN, 1989). O SOM são aplicações de Redes Neurais Artificiais (RNA) para organização e classificação automática da informação.
Modelos de visualização de informação
� Cartografia temática
◦ Proporciona uma visão global dos assuntos tratados em uma coleção de documentos e evidencia relações entre esses assuntos, possui uma navegação simples, possibilitando a localização de informações.
◦ É um método para organizar automaticamente coleções de documentos textuais e gerar mapas visuais dos assuntos tratados a fim de facilitar a mineração de conhecimento e recuperação da informação.
◦ Os documentos estão agrupados em pontos do mapa, de acordo com a similaridade de conteúdo. Os documentos agrupados em cada ponto são listados, e o seu conteúdo pode ser consultado clicando nos pontos visíveis no nível de menor zoom do mapa.
11/09/2018
21
Análise de co-ocorrência baseado no WebSOM
http://users.ics.aalto.fi/krista/papers/lagus99aire.pdf
Cartografia Temática
A cor indica a densidade ou a tendência de agrupamento dos documentos,• o amarelo indica maior densidade de
documentos. • As áreas em vermelho indicam as áreas de
menor densidade. • As palavras no mapa representam os tópicos
ou assuntos e indicam o contexto dos grupos de documentos.
Essa visualização é efetiva para o usuário que deseja explorar a coleção de documentos, conhecer os tópicos mais discutidos, tópicos relacionados e os documentos que tratam de cada tópico.
Ao clicar em uma palavra serão obtidos os documentos localizados na região selecionada.
Visão geral Primeiro zoom Segundo zoom
O WEBSOM é aplicável a qualquer tipo de coleção de documentos textuais.
É especialmente adequado para tarefas de exploração nas quais os usuários não conhecem
muito bem o domínio ou têm apenas uma ideia limitada do conteúdo do banco de dados de texto completo que está sendo examinado.
Com o WEBSOM, os documentos são organizados de acordo com seu conteúdo. Os mapas ajudam na exploração, fornecendo uma visão geral do espaço de informações.
LAGUS et al, 1999
11/09/2018
22
Níveis da interface WEBSOM:(1) o mapa inteiro(2) o mapa ampliado(3) o nó do mapa (4) a visão do documento
A movimentação entre os níveis ou áreas vizinhas no mesmo nível é feito por cliques do mouse nas imagens ou nos links do documento.
Uma vez que uma área interessante no mapa tenha sido encontrada, explorar os documentos relacionados nas áreas vizinhas é simples.
Modelos de visualização de informação
� Distorção Visual
Aplicação da visão olho de peixe (FisheyeView) com a ferramenta “aiSee”
11/09/2018
23
Modelos de visualização de informação
� Nuvem de tags (tag clouds)
� http://www.exocortex.org/netviz/
� http://moebio.com/research/lifeuniverse/?utm_source=buffer&utm_campaign=Buffer&utm_content=buffer97813&utm_medium=twitter
� http://philogb.github.io/page/temperature-anomalies
11/09/2018
25
Visualização de Resultados de Busca
� A interface utilizada em sistema de recuperação de informação mudou muito pouco desde a década de 1950, apesar de existir muitas interfaces alternativas sendo propostas e desenvolvidas por vários pesquisadores.
� Os usuários fornecem uma lista de palavras-chave e é apresentada lista de páginas que contêm as palavras-chave;
� Os usuário se veem diante da tarefa de verificar cada um dos documentos (links) para obter as informações que procuram.
Visualização de Resultados de Busca
� As desvantagens das interfaces (textuais) baseadas em uma lista de (links a) documentos são:◦ O usuário precisa verificar sequencialmente uma longa lista de
resultados;
◦ O usuário não é informado o motivo pelo qual um determinado documento foi recuperado;
◦ Da mesma forma, o usuário não é informado da relação entre um determinado documento com a sua busca;
◦ Não são apresentadas similaridades entre documentos;
◦ São apresentados aos usuários apenas um pequeno fragmento do documento.
(HOBBS; PFITZNER;POWERS, ?)
11/09/2018
26
Visualização de Resultados de Busca
SearchMe
Visualização de Resultados de busca
� Clustering (Grokker)
◦ Executava as buscas nas principais ferramentas de busca e agrupa seus resultados, apresentando os grupos de forma visual.
◦ A empresa Groxis, desenvolvedora do sistema, enfatizava que é o Grokker uma ferramenta que facilita uma abordagem holística para entender informações complexas e desconectadas, permitindo a descoberta de relações inicialmente não conhecidas.
◦ Embora tenha recebido diversos prêmios de indústria dos Estados Unidos, a Groxis, fundada em 2001, encerrou suas atividades em março de 2009.
◦ Grokker foi projetado ser um meta-buscador que apresenta os resultados de busca de uma forma visual e intuitiva.
11/09/2018
27
Visualização de Resultados de busca
� Clustering (Grokker)
Visualização de Resultados de busca
� Clustering (Grokker)
11/09/2018
29
Visualização de Resultados de busca
� Ontologia como interface
VOWL
documentoTermos de Indexação
tétanoclostidium
tetanidoença
bacterianavacinação
doença infecciosa
doc1 0,6 0,3 0,5 0,8 -doc2 0,3 0,8 0,3 - 0,3doc3 0,9 0,2 - 0,8 -doc4 0,2 - 0,6 - 0,8
11/09/2018
30
Referências
Referências
FREITAS, C. M. D. S.; CHUBACHI, O. M.; LUZZARDI, P. R. G.; CAVA R. A. Introdução à Visualização de Informações. RITA – Revista de Informática Teórica e Aplicada, Instituto de Informática, v. 8, p.143-158, 2001.
HOBBS, V.; PFITZNER, D.; POWERS, D. A Survey of InformationRetrieval Interfaces. 2002.
LAGUS, K; HONKELA, T; KASKI, S; KOHONEN, T. WEBSOM for Textual Data Mining. Artificial Intelligence Review, n.13, 1999.
MAZZA, R. Introduction to information visualization. New York, NY: Springer, 2009.
SHAW, Debora. The Human-computer Interface for Information Retrieval. Annual Review of Information Science andTechnology, n.26, 1991.
SHNEIDERMAN, B.; PLAISANT, C.; COHEN, M.; JACOBS, S.; ELMQVIST, N.; DIAKOPOULOS, N. Designing the User Interface: Strategies for Effective Human-Computer Interaction. 6a. ed, Person, 2016.