MAURO CONTI PEREIRA
SISTEMA DE SUBSTITUIÇÃO SENSORIAL PARA
AUXÍLIO A DEFICIENTES VISUAIS VIA TÉCNICAS DE
PROCESSAMENTO DE IMAGENS E ESTIMULAÇÃO
CUTÂNEA
Tese apresentada à Escola
Politécnica da Universidade de São
Paulo para obtenção do Título de
Doutor em Engenharia
São Paulo
2006
MAURO CONTI PEREIRA
SISTEMA DE SUBSTITUIÇÃO SENSORIAL PARA
AUXÍLIO A DEFICIENTES VISUAIS VIA TÉCNICAS DE
PROCESSAMENTO DE IMAGENS E ESTIMULAÇÃO
CUTÂNEA
Tese apresentada à Escola
Politécnica da Universidade de São
Paulo para obtenção do Título de
Doutor em Engenharia
Área de Concentração:
Engenharia de Sistemas
Orientador:
Fuad Kassab Jr
Co-orientador:
Alberto Cliquet Jr
São Paulo
2006
Aos meus filhos Ana Luiza e Bruno, e à minha irmã Siumara, com muitas saudades. Obrigado por tudo. Você faz falta.
AAGGRRAADDEECCIIMMEENNTTOOSS
Agradeço a Deus por tudo que consegui até hoje, principalmente
pelas amizades que fiz no caminho, pois acredito que o importante na vida é
a impressão que deixamos nas pessoas e vice-versa. Agradeço de coração
às pessoas que me possibilitaram chegar hoje à conclusão deste trabalho.
À minha família: minha esposa Cíntia pelos bons momentos, pela
paciência, especialmente nestas épocas em que tive de ser mais ausente do
que de costume, e por me proporcionar meus dois filhos maravilhosos, Ana
Luiza e Bruno, que nasceram no meio desta epopéia. Ao meu irmão Milton
que me ajudou a ir fazer o mestrado há muito tempo atrás, e à minha irmã
Siumara por ter me ajudado tanto em momentos de indecisão durante a
graduação. Aos meus pais Milton e Maria Gecilda pela formação e valores
que me passaram durante a formação do meu caráter. À minha avó Maria e
às tias Landa, Carmen e Marlene, pelo apoio constante, especialmente
durante minha graduação.
Obrigado à direção da Universidade Católica Dom Bosco por acreditar
em meu potencial e conceder meu afastamento durante este período de
estudos, em especial à professora Conceição.
Para a conclusão de tese tenho de agradecer ao apoio constante e
amizade de meu orientador, professor Fuad, e ao meu co-orientador,
professor Cliquet, pela sugestão de tema que deu origem ao trabalho.
Às pessoas maravilhosas da Fundação Dorina Nowill, obrigado por
sempre estarem à disposição, e pelo tanto que ajudaram no esclarecimento
de duvidas e na escolha o foco do trabalho, e por serem tão solícitos
inclusive para participar de testes do equipamento. Especialmente ao Minoru
e Maria Cristina Felippe. Obrigado também pela ajuda do pessoal de outra
instituição exemplar no auxílio aos cegos, Laramara, especialmente à Vera e
ao João Felippe e ao Robert Mortimer da Laratech. E obrigado ao pessoal
do ISMAC (Instituto Sul Matogrossense para Cegos Florisvaldo Vargas), que
conheci mais tarde no desenvolvimento deste projeto, mas que foram
cruciais nos testes com usuários.
Existem diversas pessoas sem as quais o presente trabalho teria sido
praticamente impossível de ser concluído. Especialmente aos professores
Kaiser e Wilson, do PEA, e amigos como Renato e Edson, de Rudge
Ramos, e Eduardo Rocha e Dimas Ramalho. Essencial foi o empréstimo do
kit de microcontrolador feito pelo Edmur, da CNZ, e apoio do Emilio Konishi,
da MDL, Membrana Digital Ltda, que fabricou os circuitos flexíveis da matriz
de eletrodos que projetei.
Agradeço ainda aos amigos Graça, Píer, Arnaldo, Giancarlo, Núncio,
Luiz Humberto, Fransérgio e Luis Carlos e ao Nicolau da Tecnotrafo, por
tantas trocas de idéias e colaborações, assim como aos professores
Ricardo, Jaime e Cláudio do LAC, André Khon do LEB e Roseli e Emílio do
LSI. E aos amigos Flávio e José Ramalho pelo agradável tempo em que
trabalhamos juntos em redes neurais. E aos amigos de Campo Grande,
Wanderlei, Edson e Tony, que por vezes me ajudaram quando não pude
cumprir alguma tarefa de coordenação de curso, bem como na troca de
idéias para o segundo protótipo. E aos professores Albert e Sandra, e
acadêmicos da UCDB Daniel e Vanessa, Anderson, Jonathan, e Bruno
Benante e Bruno Machado, que tanto ajudaram na parte de testes.
Para chegar até aqui, tive que completar graduação e mestrado,
obviamente. Aproveito para destacar a importância que tiveram alguns
amigos da FEI, como Irineu, Ronaldo, Paulo Takahashi, Luiz Humberto,
Fernando, Fabrizio, Dimas e tantos outros. Ao Fabrizio em especial obrigado
por me apresentar pessoas tão especiais como os professores do
Laboratório de Automação e Controle, a quem tanto devo também. E
obrigado aos amigos da época do mestrado em Atlanta, principalmente o
Jerônimo Travelho, Ronaldo L. D’Avila e Alejandro Hernandes, pelo apoio
mútuo durante um período difícil. E aos meus chefes e colegas da
BNR/Nortel, de Dallas e Montreal, com quem tanto aprendi, especialmente
Doug Millar, Matt Vea e Daniel Kornitzer.
RREESSUUMMOO
Este trabalho visou desenvolver e integrar técnicas, algoritmos e
equipamentos para o auxílio a deficientes visuais em sua familiarização para
orientação e mobilidade, permitindo uma maior autonomia de locomoção e,
em uma segunda etapa, a leitura de cartazes e sinais. Para tal, foi proposta
a substituição sensorial da visão pelo tato, permitindo que imagens sejam
capturadas, tratadas digitalmente para detecção de bordas, com
simplificação da imagem e diminuição de sua resolução. Estas imagens
simplificadas são posteriormente transmitidas ao usuário por meio de eletro-
estimulação cutânea no abdome. Foi desenvolvido um protótipo de
hardware, firmware para comandá-lo e software em um microcomputador
para tratar a imagem capturada, além de uma matriz de eletrodos e
estimação de distância por ultra-som, para compensar a falta de
estereoscopia. Este protótipo foi projetado para ser o mais flexível possível
para permitir o teste de diferentes maneiras de estímulo. Foram realizados
testes preliminares comprovando a viabilidade do conceito, e um segundo
protótipo maior foi então projetado e construído. Este sistema provou ser útil
também como equipamento para pesquisas em psicologia experimental, na
área de cognição e aprendizagem.
AABBSSTTRRAACCTT
This work intended to develop and integrate techniques, algorithms
and equipments to aid visually handicapped people with the familiarization of
unknown environments, as involved in orientation and mobility techniques,
making locomotion an easier task. In a second phase, it allowed the blind
user to receive signals corresponding to signs with letters, allowing them to
“read” these signs. In order to do that, it was proposed the sensory
substitution of vision by touch. Images were captured, processed digitally to
be simplified, have their edges detected (contours of objects) and have their
resolution reduced. This reduced image was then passed to the user by
cutaneous electro-stimulation on the abdomen. A hardware prototype was
developed, as well as firmware to control it, software to digitally process the
image, a flexible matrix of electrodes, and an ultrasonic distance estimation
system, to compensate for the lack of stereoscopy. The system was
designed to be as flexible as possible to allow several stimuli tests.
Preliminary tests were conducted that proved the feasibility of this concept. A
second prototype, larger, was then designed and built. This device proved
valuable also as a tool for research in experimental psychology, in cognition
and learning.
SSUUMMÁÁRRIIOO
1 INTRODUÇÃO....................................................................................... 1 1.1 OBJETIVOS ........................................................................................ 2 1.2 DESCRIÇÃO DO PROJETO .................................................................... 3 1.3 ORGANIZAÇÃO DO TRABALHO .............................................................. 7
2 ESTIMULAÇÃO TÁCTIL..................................................................... 12 2.1 SISTEMA NERVOSO ........................................................................... 13
2.1.1 Neurônio ................................................................................. 13 2.1.2 Potencial de ação ................................................................... 14 2.1.3 Cérebro................................................................................... 15 2.1.4 Plasticidade cerebral............................................................... 18
2.2 FISIOLOGIA DA PELE.......................................................................... 18 2.2.1 Tipos de receptores nervosos................................................. 19
2.3 ESTIMULAÇÃO ELETROTÁCTIL ............................................................ 24 2.3.1 Resposta sensorial ................................................................. 24 2.3.2 Mascaramento, lateralidade, adaptação................................. 27 2.3.3 Treinamento............................................................................ 28 2.3.4 Efeitos lesivos......................................................................... 28 2.3.5 Parâmetros do estímulo elétrico ............................................. 29 2.3.6 Fenômeno Saltatório............................................................... 30 2.3.7 Fenômeno Phi Visual e Táctil ................................................. 31 2.3.8 Fenômeno de sensação fantasma.......................................... 31
2.4 ESTIMULAÇÃO VIBROTÁCTIL............................................................... 31
3 VISÃO.................................................................................................. 33 3.1 ACUIDADE VISUAL............................................................................. 34 3.2 VISÃO SUBNORMAL X CEGUEIRA......................................................... 36 3.3 DADOS ESTATISTICOS SOBRE DEFICIÊNCIA VISUAL............................... 37 3.4 ASPECTOS PSICOLÓGICOS DA CEGUEIRA ............................................ 38 3.5 NOÇÕES DE ORIENTAÇÃO E MOBILIDADE (OM) .................................... 42
3.5.1 Proteção inferior e superior..................................................... 43 3.5.2 Rastreamento ......................................................................... 43 3.5.3 Enquadramento e a tomada de direção.................................. 43 3.5.4 Localização de objetos ........................................................... 44 3.5.5 Trincos e semelhantes............................................................ 44 3.5.6 Familiarização......................................................................... 44 3.5.7 Atividades da Vida diária (AVD).............................................. 46
4 EQUIPAMENTOS DE AUXÍLIO EXISTENTES ................................... 47 4.1 AUXÍLIOS USUAIS .............................................................................. 48 4.2 SOLUÇÕES TECNOLÓGICAS NÃO INVASIVAS......................................... 50 4.3 SOLUÇÕES QUE ENVOLVEM CIRURGIAS............................................... 59
5 PROCESSAMENTO DE IMAGENS .................................................... 60 5.1 PRINCÍPIOS GERAIS........................................................................... 60 5.2 CAPTURA......................................................................................... 62 5.3 DETECÇÃO DE BORDA ....................................................................... 64 5.4 DIFUSÃO ANISOTRÓPICA ROBUSTA .................................................... 67
5.5 TÉCNICAS DE SEQÜÊNCIA DE ELEMENTOS DE IMAGEM .......................... 68 5.6 DIMINUIÇÃO DE RESOLUÇÃO .............................................................. 68 5.7 SEGMENTAÇÃO PARA ENCONTRAR LETREIROS .................................... 69 5.8 RECONHECIMENTO DE CARACTERES .................................................. 70
6 PROJETO............................................................................................ 72 6.1 DESCRIÇÃO DOS EQUIPAMENTOS E PROGRAMAS ................................. 75 6.2 CAPTURA DE IMAGEM........................................................................ 76 6.3 MICROCONTROLADOR ....................................................................... 76 6.4 ELETRO-ESTIMULADOR ..................................................................... 77
6.4.1 Circuito de endereçamento..................................................... 79 6.4.2 Circuito de amplificação do sinal e chaveamento ................... 80 6.4.3 Alimentação ............................................................................ 82 6.4.4 Amplificação............................................................................ 83 6.4.5 Chaveamento.......................................................................... 85
6.5 MATRIZ DE ELETRODOS..................................................................... 86 6.6 PROGRAMA DE CONTROLE................................................................. 88 6.7 PROGRAMAS DE PROCESSAMENTO DE IMAGENS .................................. 91
6.7.1 Binarização ............................................................................. 91 6.7.2 Diminuição da resolução......................................................... 92 6.7.3 Simplificação........................................................................... 93 6.7.4 Letreiros.................................................................................. 93 6.7.5 Reconhecimento de caracteres .............................................. 95 6.7.6 Estimativa de Tempo de Processamento do protótipo 1......... 96 6.7.7 Processador escolhido............................................................ 98
6.8 PROTÓTIPO 2................................................................................... 99 6.8.1 Sensor de Imagem................................................................ 101 6.8.2 Chaveamento de potência.................................................... 103 6.8.3 Matriz de eletrodos ............................................................... 104 6.8.4 Estimativa de tempos para o protótipo 2............................... 107 6.8.5 Estimativa da distância por ultra-som ................................... 108
7 TESTES............................................................................................. 110 7.1 OBJETIVOS DOS TESTES.................................................................. 110
7.1.1 Testes de ajustes:................................................................. 110 7.1.2 Testes de treinamento .......................................................... 111 7.1.3 Questões para futuros testes:............................................... 111
7.2 TESTES PRELIMINARES PARA AJUSTE ............................................... 111 7.3 TESTES PARA TREINAMENTO DE USUÁRIOS ....................................... 113
7.3.1 Metodologia das sessões de treinamento............................. 114 7.4 TESTES COM IMAGENS GENÉRICAS................................................... 115
8 RESULTADOS .................................................................................. 116 8.1 SENSAÇÃO OBTIDA VERSUS AJUSTES INICIAIS.................................... 116 8.2 RESULTADOS DOS TESTES DE TREINAMENTO .................................... 119 8.3 RESULTADOS PARA IMAGENS CONTROLADAS..................................... 124 8.4 CONSUMO DE ENERGIA ................................................................... 124
9 CONCLUSÕES E TRABALHOS FUTUROS..................................... 126 9.1 SUGESTÕES PARA TRABALHOS FUTUROS .......................................... 130
9.1.1 Melhorias de Hardware......................................................... 130 9.1.2 Melhorias de Software .......................................................... 132 9.1.3 Possíveis testes futuros ........................................................ 134
LISTA DE REFERÊNCIAS ........................................................................ 136
APÊNDICES .............................................................................................. 147 A1. FORMULÁRIOS DE TESTES ................................................................... 148
1.Teste preliminar: ............................................................................. 148 2.Teste de treinamento de usuários:.................................................. 149 3.Análise de resultados: Totalização/consolidação e gráficos ........... 150
A2. TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO ............................... 151 A3 ALGUMAS INSTITUIÇÕES DE AUXÍLIO AO DEFICIENTE VISUAL E SEUS LINKS. 154 A4 GRUPOS DE PESQUISA DE SUBSTITUIÇÃO SENSORIAL ............................. 156 A5.CIRCUITO ELÉTRICO DO PROTOTIPO 1 ................................................... 159 A6.JUMPERS DE CONFIGURAÇÃO DA PLACA DE POTÊNCIA ............................ 160 A7.PLACA DE MEDIÇÃO DE CORRENTE E SIMULADOR DE PELE ....................... 163 A8. PROTÓTIPO 2: PLACAS DE ESTÍMULO DE 20 ELETRODOS, CPU, FONTE E PLACA-MÃE .............................................................................................. 164 A9.PLACA DE TESTES PARA GERAÇÃO DE TENSÃO OU CORRENTE DE ESTIMULAÇÃO........................................................................................... 170 A10.EVOLUÇÃO DO PROJETO .................................................................... 172
Captura e processamento de imagens .............................................. 172 Circuito de geração............................................................................ 173 Endereçamento dos eletrodos ........................................................... 174 Chaveamento da potência................................................................. 174 Alimentação e amplificação ............................................................... 179 Matriz de eletrodos ............................................................................ 182
A11.PRODUÇÃO GERADA A PARTIR DA TESE ............................................... 184 ARTIGOS EM CONGRESSOS........................................................................ 184 PRÊMIOS ................................................................................................. 184 PATENTE REQUERIDA................................................................................ 184 NOVOS PROJETOS .................................................................................... 184
LLIISSTTAA DDEE FFIIGGUURRAASS Fig.1. Visão geral do protótipo 1 do sistema ........................................... 4 Fig.2. Protótipo 2, com sensores conectados ao módulo processador,
dispensando o PC. ........................................................................ 7 Fig.3. Esquema do neurônio [BEAR, 02]............................................... 13 Fig.4. Esquema da propagação com e sem a capa de mielina
[BEAR,02].................................................................................... 15 Fig.5. Homúnculo de Penfield [BEAR, 02]............................................. 16 Fig.6. Localização das áreas do cérebro [BEAR,02]. ............................ 17 Fig.7. Vista em corte da pele, destacando seus receptores [BEAR,02].20 Fig.8. Os sistemas sensoriais codificam 4 atributos do estímulo:
modalidade, local, intensidade e temporização, manifestos na sensação [KANDEL,91]............................................................... 21
Fig.9. A base estrutural do campo receptivo dos receptores do sentido do tato [KANDEL,91] ................................................................... 23
Fig.10. Limiar de discriminação entre dois pontos (TPDT) em função da região do corpo [KANDEL,91]. .................................................... 25
Fig.11. Trem de pulsos com tempo morto: exemplo de BFM usando pulsos bipolares DC [NOHAMA,97]............................................. 30
Fig.12. Display Braille convencional: (a) uma celula Braille composta de 8 pontos, (b) display complleto formado por uma arranjo linear de células da Pulse Data International Ltd [PULSE,05].................... 32
Fig.13. Testes de Snellen mostrando a percepção do portador de acuidade visual de 20/20, 20/30, 20/50 e 20/80 [UMBAUGH, 97]..................................................................................................... 35
Fig.14. Bengala longa rastreando [FELIPPE,01]..................................... 43 Fig.15. Método de Localização [FELIPPE,01]. ........................................ 44 Fig.16. Métodos do perímetro e do cruzamento para familiarização
[FELIPPE,01]............................................................................... 45 Fig.17. Início da familiarização com guia vidente e com bengala longa
[FELIPPE,01]............................................................................... 45 Fig.18. Reglete importado com caneta correspondente .......................... 50 Fig.19. Optacon sendo utilizado [ONCE,00]............................................ 54 Fig.20. Demonstração da bengala laser e seu raio de ação [NURION,06]
.................................................................................................... 54 Fig.21. Matriz de eletrodos para estimular a língua, da Wicab................ 56 Fig.22. Modelo do Sonic PathFinder ....................................................... 57 Fig.23. Fotos do NavBelt e GuideCane, e seus esquemáticos
[BORENSTEIN,96]. ..................................................................... 58 Fig.24. Representação digital de uma imagem [CARVALHO,03]............ 61 Fig.25. Cores primarias aditivas e subtrativas [GONZALEZ,92].............. 62 Fig.26. Efeito da quantização dos níveis de cinza: imagem de 240x320
pixels, com níveis de cinza indo de 256 níveis a 2 níveis (imagem binária) ........................................................................................ 62
Fig.27. Mosaico de cores ou padrão Bayer de distribuição padrão de distribuição de cores dos sensores de imagem.[TEXAS,03]......... 63
Fig.28. Exemplos de detectores de bordas mais comuns ....................... 65
Fig.29. Equações de implementação do gradiente para filtro de Roberts [RUSS,02]. .................................................................................. 66
Fig.30. Exemplo de simplificação da imagem por difusão anisotrópica robusta [KIM,01] .......................................................................... 67
Fig.31. Padrões de vizinhança: 4 em cruz; 3x3 quadrado; 5x5 octogonal com 21 pixels; 5x5 com 25 pontos; 7x7 com 37 pontos; [RUSS,02]. .................................................................................. 68
Fig.32. Exemplo de imagem a ser usada, baixando de 240x320 original da Webcam até 15x20 da matriz de eletrodos ............................ 69
Fig.33. Visão geral do protótipo 1 do sistema ......................................... 73 Fig.34. Trem de pulsos antes da etapa de amplificação ......................... 78 Fig.35. Trem de pulsos antes da amplificação ........................................ 78 Fig.36. Trem de pulsos após a amplificação, com distorção devido à
saturação do núcleo do transformador de pulso. ........................ 78 Fig.37. Esquema de cada placa de estimulação do prototipo1 ............... 81 Fig.38. Placa para estimulação de cada coluna de eletrodos; os leds
ficam no topo, formando a imagem quando várias placas estão na vertical e em paralelo na placa-mãe............................................ 82
Fig.39. Montagem das 5 placas, faixa abdominal para fixação e matriz de eletrodos do protótipo1................................................................ 82
Fig.40. Etapa de amplificação com TIP e transformador de pulso .......... 83 Fig.41. Circuito de chaveamento do sinal de alta tensão ........................ 85 Fig.42. Circuito da matriz de eletrodos feita em fibra .............................. 87 Fig.43. Foto da placa da matriz de eletrodos em fibra ............................ 87 Fig.44. Placa de eletrodos em fibra, com a faixa de fixação, e instalada.88 Fig.45. Comparação da binarização tradicional, limiar global médio, com
limiar 0,3 e 0,6, e por Niblack (limiar regional) ........................... 92 Fig.46. Imagem simplificada por difusão anisotrópica com k = 0.02, ? =
0.25, 60 iterações, com k = 0.02, ? = 0.25, 60 iterações. ............ 93 Fig.47. exemplo`s de imagem processada para encontrar letreiro, usando
binarização por Niblack, segmentação do letreiro por desvio padrão de run length coding, e resultado da segmentação........ 95
Fig.48. Desvio padrão por linha da imagem da figura anterior: os menores indicam a linha com caracteres. .................................................. 95
Fig.49. Sensor serial C328, de fator de forma compacto (13 x 14 10 mm)................................................................................................... 103
Fig.50. Sensor montado sobre óculos para minimizar o impacto estético.................................................................................................. 103
Fig.51. Circuito de teste de interface do sensor de imagem a microcontrolador........................................................................ 103
Fig.52. Conectores de crimpagem para circuitos flexíveis, da Nicomatic................................................................................................... 105
Fig.53. Exemplos de conectores: Nicomatic (preto) e Berg/Dupont (azul);.................................................................................................. 105
Fig.54. Desenho de 2 colunas da matriz encomendada, com as camadas superpostas, e exemplo de uma linha da matriz final................ 106
Fig.55. Exemplo de matriz encomendada 7x7, com 3 camadas: anel externo de retorno por placa, anel central de estimulação e isolante do meio. (cerca de 10 x 10 cm) .................................... 106
Fig.56. Desenho da matriz final flexível, de 300 eletrodos, com suas diversas camadas para eletrodo central e retorno comum a cada linha........................................................................................... 106
Fig.57. Matriz flexível de 15x20 eletrodos, do tamanho aproximado de uma folha A4. ............................................................................ 107
Fig.58. Esquema de medição por ultra-som.......................................... 108 Fig.59. Sensor de ultra-som, motores excêntricos, e sistema de estimativa
de distância, e Sensor Max EZ1, de dimensões reduzidas (20 x 22 x 16.4 mm). ............................................................................... 109
Fig.60. Quadrado pequeno desenhado por diversos métodos: a.como carimbo (primeiro quadro), b.por coluna individual (quadros 2 a 4), c.por coluna mantendo a anterior (quadros 5 a 7), d.taxel a taxel (quadros de baixo) – em cinza são os taxels estimulados e depois apagados................................................................................... 112
Fig.61. Trem de pulsos com tempo morto: exemplo de BFM usando pulsos bipolares DC [NOHAMA,97]........................................... 112
Fig.62. Gráfico de %acerto e latência, média para grupo de videntes. . 121 Fig.63. Gráfico de %acerto e latência, média para grupo de cegos
adquiridos.................................................................................. 121 Fig.64. Gráfico de %acerto e latência, média para grupo de cegos
congênitos. ................................................................................ 122 Fig.65. Gráfico de %acerto e latência, comparando os 3 grupos. ......... 122 Fig.66. Esquema da placa de cada coluna, com oscilador, amplificação,
endereçamento e potência........................................................ 159 Fig.67. Foto da placa de medição de corrente RMS conectada ao
simulador de pele ...................................................................... 163 Fig.68. Layout da nova placa de estimulação, de 20 eletrodos............. 164 Fig.69. Foto da placa de microcontrolador incluída no prototipo2 ......... 164 Fig.70. Foto da placa de geração de alta tensão do protótipo 2............ 165 Fig.71. Fotos da placa-mãe e dela com as placas de estímulos, de fonte e
de micrcontrolador montadas .................................................... 165 Fig.72. Esquema da nova placa de estímulos, que aciona 20 eletrodos
(taxels)....................................................................................... 166 Fig.73. Esquema da placa de microcontrolador incluída no
prototipo2A10.Protótipo 2: placa FONTE .................................. 167 Fig.74. Fsquema elétrico da placa de geração de alta tensão do
prototipo2 .................................................................................. 168 Fig.75. Esquema elétrico da placa-mãe do prototipo2 .......................... 169 Fig.76. Foto do circuito de testes para configuração da estimulação por
corrente ou por tensão constante, depois simplificado.............. 170 Fig.77. Circuito de testes para configuração da estimulação ................ 171 Fig.78. Circuito de chaveamento do sinal de alta tensão ...................... 177 Fig.79. Etapa de potência típica do circuito estimulador de Antonino
[ANTONINO,93]......................................................................... 180 Fig.80. Etapa de amplificação com TIP e transformador de pulso ........ 181
LLIISSTTAA DDEE TTAABBEELLAASS Tabela 1. Comparação dos principais corpúsculos mecanoreceptores
[BEAR,02].................................................................................... 21 Tabela 2. Sumário de propriedades dos mecanoreceptores
[PASQUERO,03] ......................................................................... 23 Tabela 3. Valores de TPDT para diferentes locais do corpo [NOHAMA,97].
.................................................................................................... 26 Tabela 4. Pesquisas em estimulação eletrotáctil [NOHAMA,97]. ................ 27 Tabela 5. Resumo de definições de cegueira e visão subnormal ............... 37 Tabela 6. Lista não exaustiva de diferentes sistemas de SS (adaptada de
[Lenay,00].) ................................................................................. 51 Tabela 7. Características principais dos formatos analógicos..................... 64 Tabela 8. Resoluções comuns de imagem [TEXAS,03]. ............................. 64 Tabela 9. Configurações que resultaram sensação vibratória mais agradável
.................................................................................................. 117 Tabela 10. Evolução da latência e acerto%, por grupo e padrão
geométrico estimulado .............................................................. 123 Tabela 11. Sumário da evolução de cada grupo, media de todos os
padrões estimulados ................................................................. 123 Tabela 12.Configuração atual e de possíveis alterações futuras
.................................................................................................. 128
LLIISSTTAA DDEE AABBRREEVVIIAATTUURRAASS
AA tamanho padrão de pilha, de cerca de 1 cm de diâmetro e 4 cm de
comprimento
AC alternate current, ou corrente alternada
A/D analógico para digital (conversor)
ADC analog digital converter
ANN artificial neural networks
AP ar sob pressão
BPS bits por segundo (em comunicação serial)
CI circuito integrado
CIF circuito impresso flexível
CCD charge coupled device image sensor
CMOS complementary metal oxide semiconductor
CMY cyan, magenta, yellow
CONEP Comissão Nacional de Ética em Pesquisa
CPA central telefônica por programa armazenado, i.e., digital
CPU central processing unit
D/A digital para analógico (conversor)
DAC digital analog converter
DC direct current, ou corrente contínua
TPDT two point discrimination threshold, limiar de discriminação
DSP digital signal processing, processamento digital de sinais
ECG eletrocardiograma
EEG eletroencefalograma
EKG eletrocardiograma (sigla em inglês)
EENM eletro estimulação neuro muscular
EM eletromagnético
EMBS Engineering in Medicine and Biology Society, da IEEE
EPUSP Escola Politécnica da USP
ET electrotáctil
ETA “Electronic Travel Aid", sistema de ajuda eletrônica de locomoção.
FES functional electrical stimulation
FLOPS floating point operations per second, milhões de instruções de ponto
flutuante por segundo
FPAA (Field Programmable Analog Array)
FPGA (Field Programmable Gate Array)
fMRI functional magnetic ressonace imaging
GPS global positioning system
HSV hue, saturation, value (matiz, saturacao e intensidade)
IEEE Institute of Electrical and Electronical Engineers
IFESS International Functional Electrical Stimulation Society
IO input/output (entrada/saída)
JMF Java Multimídia Framework
LAC Laboratório de Automação e Controle, do PTC-EPUSP
LCD liquid cristal display
LD limiar de dor
LEB Laboratório de Engenharia biomédica do PTC-EPUSP
LED Ligth emitting diode
LS limiar de sensação
LSI Laboratório de sistemas Integráveis, do PSI-EPUSP
mA mili Ampere, unidade de corrente elétrica
MIPS milhões de instruções de ponto fixo por segundo, para instruções
MLP-BP rede neural tipo multi-layer perceptron, com treino por back-
propagation
MOS metal oxide semiconductor
NiCd níquel cádmio
NiMH níquel metal hidreto
NMES neuro muscular electrical stimulation
OCR Optical Character Recognition
OE output enable
OM orientação e mobilidade
PCB printed circuit board
PCI placa de circuito impresso
PDA personnal digital assistant
PE piezo-elétrico
PEA Poli Energia e Automação, departamento da EPUSP
PET positron emition tomography
Pixel picture element, elemento de imagem
PPD pessoas portadoras de deficiências
PPDV pessoa portadora de deficiência visual
PSI Poli Sistemas Eletrônicos
PTC Poli Telecomunicações e Controle
RGB red,green, blue (vermelho, verde, azul)
RMS root mean square (valor eficaz)
RNA redes neurais artificiais
RSD retinal scanning display
SG strain gage
SKI Smith Kettlewel Institute
SMA shape memory alloy (liga metálica com memória de forma)
SNC sistema nervoso central
SNP sistema nervoso periférico
SS susbstituição sensorial
SSS Sensory Substitution System, sistema de substituição sensorial.
Tactor tactile actuator, atuador táctil
Taxel tactile element, elemento da imagem desenhada por estimulação táctil
TPDT two point discrimination threshold
TVSS tactile vision substitution system, sistema tactil de substituição de
visão
USB universal serial bus
V volts, unidade de tensão elétrica
11 IINNTTRROODDUUÇÇÃÃOO
“Nós não enxergamos com os olhos,
enxergamos com o cérebro”
Paul Bach-Y-Rita, 1972
Técnicas de Substituição Sensorial (SS) são usadas em diversas
aplicações, destacando-se os usos de interfaces hápticas, em propriocepção
artificial para uso em telecirurgia e por lesados medulares, e em especial o
uso para auxílio na reposição de um ou mais sentidos humanos que tenham
sofrido alguma diminuição ou perda total.
A rigor, pode-se dizer que ocorre substituição sensorial até mesmo
quando um deficiente auditivo realiza leitura labial ou quando um cego lê a
escrita Braille, ao passar os dedos sobre o papel em alto relevo que a
contém. Esta substituição pode também ser feita por meios externos,
artificiais, como no caso de algumas pesquisas destacadas no capítulo 4,
sendo também o caso deste trabalho, em que se busca fornecer
informações visuais a deficientes visuais por meio de estimulação táctil.
Nesta tentativa de melhorar a vida diária de deficientes visuais
existem atualmente muitos grupos no mundo, citados no capítulo 4. Entre
eles podem ser citados projetos tais como desenvolver próteses visuais que
visam criar uma retina artificial [CHOW,01], [CHEN01], estimular diretamente
o córtex cerebral [DOBELLE,00], e outros grupos trabalhando com
equipamentos de SS, usando o tato [BACH-Y-RITA,70], [BACH-Y-RITA,72],
[SCHIFF,82], [BURDEA,96], [LENAY,00], [SHIRAI,03], [YARMUSH,01] ou
audição [MEIJER,92], e também sistemas para auxílio a deficientes auditivos
usando o tato [SUMMERS,92].
Apesar das técnicas de retina artificial e estimulação do córtex terem
objetivos em longo prazo mais ambiciosos, para auxílio a deficientes as
vantagens de um sistema de substituição sensorial (SS) táctil externo são
diversas, podendo-se destacar:
2
• Risco zero de infecção (ao contrário de implantes);
• Aplicação em pacientes com visão subnormal e cegueira por
qualquer origem, sem limitação (ao contrário da retina artificial e
estimulação direta do córtex), desde que se mantenha a
sensibilidade táctil em alguma área do corpo;
• Menor custo e facilidade de implantação, resultando em uma maior
acessibilidade.
No Brasil um sistema mais barato, acessível e de implantação e
treinamento rápidos seria mais apropriado às condições econômicas locais.
1.1 OBJETIVOS
Não se visou com este trabalho recuperação ou substituição completa
da visão perdida, mas sim criar um sistema auxiliar que melhore as
condições de vida do deficiente, resolvendo problemas práticos da sua vida
diária, com resultados que possam ser obtidos mais rapidamente.
Após diversos contatos com a Fundação Dorina Nowill de São Paulo,
antiga Fundação do Livro do Cego, foram levantados problemas reais
cotidianos do deficiente visual que poderiam ser solucionados no tempo
disponível, tornando-se o foco deste trabalho. O primeiro problema
solucionável por esta tecnologia proposta foi a familiarização em novos
ambientes, uma das técnicas usadas em Orientação e Mobilidade (OM)
[FELIPPE,97].
Na segunda etapa do trabalho, foi implementada uma versão
preliminar para realizar uma leitura de sinais e letreiros, por meio de
algoritmos de segmentação e no futuro há a possibilidade de se usar
reconhecimento de caracteres. Os funcionários e usuários da Fundação
Dorina foram sempre muito solícitos e colaboradores, tendo inclusive se
prontificado a ajudar nos testes com usuários. Isto acabou não se
concretizando devido à volta do autor para sua universidade de origem,
tendo então sido contatado o Instituto Sul-Matogrossense para Cegos
3
Florisvaldo Vargas, ISMAC, para a realização dos testes com deficientes
visuais.
Entre os objetivos específicos deste trabalho destaca-se a criação de
um equipamento de custo acessível que possa ser usado para resolver os
problemas citados, mas também que permita experimentos somestésicos de
psicologia experimental.
Procurou-se também criar um equipamento versátil que possibilitasse
a execução de testes para definir a melhor forma de estimulação elétrica,
sua forma de onda, seus parâmetros temporais e intensidade, bem como o
tempo mínimo que o usuário usa para reconhecer uma imagem simples.
1.2 DESCRIÇÃO DO PROJETO
Dois sistemas foram propostos e implementados. O primeiro consiste
de uma câmera, microcomputador, equipamento para eletro-estimulação e
matriz de eletrodos, e um sistema complementar de ultra-som e vibrador
para indicar a distância dos objetos, conforme representado na Fig.1.
O segundo é semelhante, apresentando maior resolução, mas com
interfaceamento direto do sensor de imagem ao processador do sistema,
dispensando o uso do computador e webcam.
O sistema da Fig.1 captura imagens por meio de uma webcam
conectada a um microcomputador PC compatível, tratando estas imagens
por software para transformar o original de 240 x 320 pixels (picture element)
coloridos em uma imagem simplificada binária (preto e branco apenas) de 15
colunas de 20 taxels (tactile element) cada, totalizando uma cadeia
seqüencial de 300 bits.
4
Fig.1. Visão geral do protótipo 1 do sistema
Legenda:
1.sensor de ultra-som – para definir distância 2.câmera – para capturar imagens 3.microcomputador – para processar a imagem 4.Kit de microcontrolador: controla quais eletrodos ativar 5.circuitos de estimulação:
placa-mãe com fonte e configuração placas de chaveamento e estimulação por coluna placa de conversão do sinal de ultra-som para emitir vibração
6.Matriz de eletrodos 7. Vibrador
Para tratar as imagens, foram usadas técnicas de processamento de
imagens encontradas em [GONZALEZ,87], [GONZALEZ,92], [BANON,94],
[KIM,01], [LINDERBERG,97]. Basicamente são feitas as seguintes etapas:
2
5
3
7
6
1 4
5
• converter em tons de cinza e binarizar a imagem,
• diminuir detalhes,
• detectar bordas,
• diminuir resolução,
• encontrar a seqüência de pixels da imagem e formar a seqüência de bytes correspondentes a serem enviados para estimulação, correspondentes aos 300 bits da imagem de 15x20.
Este conjunto de bits representando a imagem é enviado serialmente
a um microcontrolador para acionar o sistema de estimulação, composto por
diversas placas que acionam uma matriz de eletrodos posicionada sobre o
abdome, acionando apenas os eletrodos correspondentes aos pixels ativos
na imagem tratada. Cada eletrodo será doravante denominado de taxel, para
não confundir o elemento da imagem original com a imagem sendo
estimulada na pele do usuário. Não se podem ter níveis intermediários de
tons de cinza, pois o eletrodo atualmente permite apenas ser ativado ou não,
não há níveis intermediários. O hardware e matriz de eletrodos foram
baseados em princípios encontrados em [WEBSTER,98], [KACZMAREK,91],
[EMILIANI,86], [KINDERMANN,00], [GEDDES,02] obedecendo a restrições
das normas da Associação Brasileira de Normas Técnicas [ABNT,97].
Vale salientar que durante todo o desenvolvimento uma restrição de
projeto foi a otimização do custo do produto final, sempre procurando a
solução de hardware/software mais econômica e eficiente.
O protótipo final contém 15 colunas de 20 eletrodos (taxels), mas para
testar os princípios foi desenvolvido um protótipo reduzido, de 5 colunas de 7
eletrodos cada. Assim, foi possível fazer os primeiros testes e posterior
treinamento para reconhecimento de padrões geométricos simples, com
sujeitos divididos em grupos de videntes, cegos congênitos e cegos
adquiridos. O software de comunicação envia as imagens tratadas em
tamanho menor para o protótipo. Em uma etapa seguinte, o protótipo 2 e a
matriz de eletrodos correspondente foram construídos, possibilitando o uso
de imagens maiores. Vale lembrar que ainda assim, com apenas 300
6
pontos, as imagens transmitidas são simplificadas, “desenhando” apenas
contornos dos objetos.
O principal uso do sistema é em Orientação e Mobilidade, na etapa de
familiarização em ambientes desconhecidos, para agilizar a montagem do
mapa mental do ambiente. Como o usuário demora um tempo, da ordem de
minutos, para reconhecer uma imagem, e como não vai ser necessário um
envio contínuo de imagens, para diminuir consumo de baterias ele deverá
acionar o sistema apenas quando quiser, como se estivesse tirando uma
fotografia. O usuário só acionaria o sistema para criar um mapa mental de
um ambiente desconhecido ou procurar uma determinada mensagem, como
em um ponto de ônibus ou em um corredor procurando uma determinada
sala.
O equipamento final, mostrado na Fig.2 conta ainda com sensor de
distância por ultra-som para compensar a falta de estereoscopia pelo uso de
uma única câmera. Também foi desenvolvido um programa no PC para
segmentar a imagem já capturada e encontrar nela letreiros, aproximando a
imagem nesta região da imagem com caracteres. Apesar de terem sido
feitos estudos para uso de OCR (optical character recognition, ou
reconhecimento óptico de caracteres), inclusive usando redes neurais
artificiais [RAMALHO,03], em um primeiro momento conta-se com o
reconhecimento feito pelo próprio usuário após realizar treinamentos
previstos no capítulo 7.
Além disso, a intenção é diminuir o tamanho do sistema
posteriormente, tornando-o mais portátil e com maior autonomia de baterias.
Para efeitos de ilustração, na Fig.2 foi desenhada uma matriz de eletrodos
com apenas 5 colunas de 7 eletrodos cada, mas foi projetado e
implementado com 15 colunas de 20 eletrodos cada. Maiores detalhes são
mencionados no decorrer do trabalho.
7
Fig.2. Protótipo 2, com sensores conectados ao módulo processador, dispensando o PC.
1.3 ORGANIZAÇÃO DO TRABALHO
É interessante salientar a multi-disciplinaridade deste projeto, pois foi
necessário o estudo de diversas áreas do conhecimento para implementá-lo,
bem como diversas tecnologias de automação. Foram necessárias noções
de conhecimentos biológicos para definir as características que o
equipamento deveria possuir, decidir os parâmetros de estimulação, formas
de onda, de eletrodos e afins. Entre elas destaca-se a necessidade de se
conhecer um pouco de visão, fisiologia da pele e receptores nervosos,
condução nervosa, cognição e processos de aprendizagem do cego,
técnicas de orientação e mobilidade a deficientes visuais.
Para projetar e testar o equipamento foram necessários
conhecimentos de eletrônica analógica e de potência e transformadores para
o estimulador, bem como eletrônica digital e microprocessadores usados na
8
seleção dos eletrodos a serem ativados. Conhecimento de circuitos flexíveis
foi necessário para a confecção da matriz de eletrodos.
Para tratar a imagem capturada é preciso conhecer algoritmos de
processamento de imagem, que foram implementados em MATLAB, C e
Java, e conhecer informações sobre captura de vídeo e seus padrões.
Ainda foram necessários conhecimentos de comunicação de dados
via serial, e possível uso de lógica reconfigurável (FPGAs), sensores de
imagem (CCD e MOS) e processadores DSP para determinar projetos
futuros e dimensionamento do poder computacional para projetar o segundo
protótipo, feito para diminuir seu tamanho e torná-lo totalmente portátil.
E tudo isso teve de ser feito seguindo normas técnicas e de
segurança de aparelhos eletromédicos [ABNT,97].
Também foram estudadas técnicas de reconhecimento de padrões e
redes neurais artificiais para reconhecimento de caracteres de letreiros. A
implementação envolveu também o estudo de programas para layout de
placa, corrosão, seleção de componentes, contato com fornecedores e
montagem e depuração do hardware. A matriz de eletrodos teve de ser
desenhada com a ferramenta Corel Draw, exigência dos fornecedores de
circuitos flexíveis.
O planejamento dos experimentos com usuários exigiu
conhecimentos da área estatística, para evitar a necessidade de se fazer 2n
experimentos para determinar quais das n variáveis era preponderante. Esta
quantidade exponencial fornece todas as possibilidades de combinações
entre n variáveis que possam assumir dois valores diferentes. Devido ao
trabalho com seres humanos foi também necessário inteirar-se das regras
da Resolução 196 do CONEP (Comissão Nacional de Ética em Pesquisa) do
Ministério da Saúde e submeter projeto detalhado a um comitê de ética,
incluindo no apêndice 2 o Termo de Consentimento Livre e Esclarecido.
Por isto é que foi decidido simplificar depois de um estudo preliminar e
trabalhar apenas com estimuladores elétricos e não vibradores mecânicos,
9
pois seria necessário um estudo de miniaturização mecânica que não seria
factível no tempo disponível para execução de um programa de doutorado.
Assim, alguns tópicos que não são normalmente conhecidos de
engenheiros eletrônicos foram introduzidos em capítulos com o intuito de
fazer uma breve introdução aos assuntos e principalmente, normalizar a
nomenclatura.
No capítulo 1 o projeto é mostrado em linhas gerais. Como o trabalho
envolve várias áreas do conhecimento, algumas noções de outras áreas
foram incluídas.
Este trabalho se dispõe a desenvolver um equipamento para auxílio à
mobilidade de deficientes visuais, transferindo informações por meio de
estimulação táctil. Assim, é necessário ter uma compreensão mínima do
funcionamento do tato e estimuladores tácteis, da visão e possíveis
patologias, do processo cognitivo do deficiente visual e deve ser comparado
com outras opções disponíveis. Mas para tal, primeiramente é necessário
fazer-se uma breve revisão a respeito de neurônios, sistema nervoso e de
plasticidade cerebral.
Assim, o capítulo 2 cobre a estimulação táctil, iniciando por uma visão
breve do sistema nervoso e funcionamento de neurônios e propagação de
sinais elétricos, descreve brevemente o cérebro e define plasticidade
cerebral. A seguir, são mostrados os tipos de receptores tácteis, e tipos de
estimulação elétrica e vibratória. São mencionados ainda alguns fenômenos
de integração que no futuro podem ser aproveitados para aumentar a
resolução do sistema.
O capítulo 3 comenta em linhas gerais a visão humana, definição de
cegueira legal, estatísticas sobre cegueira, os aspectos psicológicos da
cegueira e as técnicas de orientação e mobilidade usadas pelo deficiente
visual. A motivação para estes estudos vem da necessidade de se projetar o
equipamento que substitui a visão pelo tato, bem como o treinamento de
voluntários para usá-lo. É preciso conhecer as limitações do tato em relação
à visão para projetar programas de pré-processamento que compensem
10
pelo menos parcialmente estas limitações. Além disso, é importante que se
saibam quais as principais patologias e quando se pode ou não usar uma
determinada solução ou equipamento de auxílio. O entendimento de como o
cego monta o mapa mental de ambientes desconhecidos ajudou a projetar
os modos de estímulo e os treinamentos e testes aplicados.
Em seguida, o capítulo 4 mostra equipamentos de auxílio existentes,
tanto comercialmente como em pesquisa, para possíveis colaborações
futuras.
A idéia básica deste projeto é usar estimulação táctil para transferir
informações visuais. Como o sistema somestésico humano tem uma
resolução muito baixa comparada à resolução do sistema visual, o projeto
prevê uma matriz de estimulador de apenas 300 eletrodos, divididos em 15
colunas de 20 eletrodos cada. Além disso, o sistema de visão humana
possui uma filtragem de bordas embutida. Assim, é necessário que o
sistema faça um pré-processamento dessas imagens para tentar contornar a
falta de um sistema semelhante no tato, requerendo que faça uma
diminuição da resolução da imagem e detecção de contornos das imagens.
Portanto, uma noção de processamento de imagens é inserida no capítulo 5,
apresentando algumas das técnicas estudadas e implementadas,
especialmente na detecção de bordas e segmentação e simplificação de
imagens, e noções básicas sobre reconhecimento de caracteres.
Finalmente, no capítulo 6 é descrito com detalhes o projeto, e como
os circuitos e programas atendem aos requerimentos de projeto. No
apêndice 10 são mostradas e discutidas as idéias que não foram
aproveitadas e as decisões tomadas, o que pode facilitar a reprodução e
continuidade deste trabalho por outros pesquisadores.
O capítulo 7 descreve os testes para ajuste de equipamento,
treinamento de usuários por padrões geométricos, aplicação do testes, e
finalmente estimulação das imagens capturadas e tratadas.
No capítulo 8 encontra-se um resumo dos dados coletados e alguns
gráficos que ajudam na obtenção de algumas conclusões.
11
O capítulo 9 contém as conclusões obtidas e também sugestões para
continuação do trabalho.
O trabalho é completado então com a lista de referências
bibliográficas e apêndices contendo material de apoio e alguma
documentação de circuitos e documentos necessários aos testes.
Como esta pesquisa envolveu seres humanos, foi necessário seguir a
resolução 196/96 do CNS (Conselho Nacional de Saúde) para experimentos
com seres humanos. Assim, nos apêndices encontram-se também
formulários de testes aplicados e termo de consentimento livre e esclarecido
que faziam parte do projeto para o comitê de Ética a que foi submetido o
projeto, da UFMS, Universidade Federal de Mato Grosso do Sul, pois os
testes foram aplicados após o autor voltar à cidade de Campo Grande em
que leciona.
Foram incluídos ainda dois apêndices com breve lista de instituições
de auxílio ao deficiente visual, no Brasil e exterior, e de grupos de
pesquisadores da área de substituição sensorial para possíveis
colaborações.
12
22 EESSTTIIMMUULLAAÇÇÃÃOO TTÁÁCCTTIILL
O sistema somatosensorial humano serve de canal de entrada para
informações sobre os acontecimentos na superfície e interior do corpo,
compondo-se pelos sentidos do tato (sentido cutâneo), cinestésico e
orgânico. É ele que percebe sensações, possibilitando identificar e localizar
no corpo a ocorrência de estímulos, bem como sua intensidade.
O sentido do tato envolve mecanoreceptores sob a pele, enquanto o
sistema cinestésico abrange informações de posição e movimento do corpo,
devido a sensores em articulações, tendões e músculos, originando o que se
chama de propriocepção, ou seja, a percepção de posicionamento mesmo
sem receber estímulos externos. O sistema orgânico fornece sensações
como dores de estômago ou de cabeça [BEAR,02].
O foco neste trabalho é a substituição do sentido da visão pelo tato,
portanto uma breve revisão é conveniente para entender-se o funcionamento
básico e como se pode estimulá-lo.
Para permitir o entendimento de alguns aspectos de fenômenos
tácteis e também da visão em capítulos posteriores, foi incluída uma breve
revisão do sistema nervoso, sem a pretensão de ser completa, incluída com
o objetivo maior de estabelecer a nomenclatura envolvida.
Posteriormente, uma introdução aos principais receptores nervosos
da pele é fornecida, para que se possa entender a que estímulos reagem e
de que forma.
Finalmente, são cobertos dois tipos de estimulação, eletrotáctil e
vibrotáctil. Acredita-se que a eletrotáctil atue diretamente sobre as fibras
nervosas aferentes, enquanto a vibrotáctil aja sobre os receptores tácteis da
pele [CASTRO,00], [KACZMAREK,91].
13
2.1 SISTEMA NERVOSO
O sistema nervoso é responsável pelo processamento das
informações e controle do corpo todo, sendo composto de sistema nervoso
central (SNC) e periférico (SNP).
O SNC é formado pela medula espinhal e encéfalo, este composto
por cérebro (com 2 hemisférios), cerebelo e tronco encefálico. O cérebro
pode ter suas regiões divididas em lobo frontal, parietal, occipital, temporal, e
sulcos central e lateral.
O SNP é composto pelas demais células nervosas do corpo, incluindo
os receptores e nervos aferentes e eferentes, que levam informação aos
SNC e trazem as respostas deste [BEAR, 02].
2.1.1 Neurônio
Neurônio é a célula nervosa que compõe todo tecido nervoso, sendo
formada pelo corpo celular ou soma, dendritos e um axônio, por onde envia
o sinal ao neurônio seguinte, como observado na Fig.3. A região em que o
axônio de um neurônio se conecta ao dendrito do neurônio seguinte é
denominada sinapse.
A propagação do sinal é elétrica dentro do axônio, e ao chegar à
região sináptica, a informação é levada por neurotransmissores químicos ao
próximo neurônio. Se houver problemas com estes neurotransmissores
podem ser desenvolvidas diversas patologias, por exemplo, miastenia
gravis, cujo sintoma é uma debilidade motora autoimune crônica.
Fig.3. Esquema do neurônio [BEAR, 02].
14
2.1.2 Potencial de ação
Potencial de ação é o processo interno na célula nervosa que
transporta sinal elétrico, baseando-se no funcionamento da bomba de Sódio
Potássio (NaK) que regula a porosidade das membranas celulares. Deve-se
destacar que um neurônio transmite sinais na forma tudo ou nada, ou seja,
conduz ou não conduz. Para estímulos de maior intensidade, maior é a
freqüência do potencial de ação. E deve-se notar que os potenciais de ação
viajam ao longo do neurônio, de seus dendritos para seu corpo celular e
axônio [GOLDBERG,97].
Verifica-se ainda que devido a uma capa de mielina que envolve o
axônio, o sinal elétrico se propaga aos saltos, entre pontos em que falham
esta capa, chamados Nodos de Ranvier, como visto na Fig.4. Isto agiliza o
sinal elétrico, e se esta capa contiver falhas, a propagação será mais lenta e
falha, podendo gerar problemas na sinapse. Um exemplo disto ocorre na
Esclerose Múltipla, em que o paciente vai perdendo o controle motor devido
à maior dificuldade de transmissão dos sinais nervosos.
É importante destacar que um neurônio tem um tempo mínimo de
espera entre um potencial de ação e o seguinte, não podendo ser disparado
seguidamente. Isto limita a freqüência de disparo de um mesmo neurônio em
cerca de 500 Hz a 1kHz [BEAR,02].
15
Fig.4. Esquema da propagação com e sem a capa de mielina [BEAR,02].
2.1.3 Cérebro
É no cérebro que ocorre a maioria do processamento de informações
coletadas pelo corpo todo, destacando-se como exemplo os dos processos
cognitivos e de memória.
Na Fig.5 e na Fig.6 observam-se as localizações de funções de
diferentes regiões do cérebro, notando-se a divisão do córtex
somatosensorial, em que foi levantada para cada região do corpo a sua área
correspondente no córtex. É chamado de mapa somatotópico ou Homúnculo
de Penfield, que de uma maneira simplificada, indica quais diferentes áreas
do corpo têm mais células nervosas no cérebro dedicadas ao
processamento dos estímulos vindos destas áreas.
16
Fig.5. Homúnculo de Penfield [BEAR, 02].
17
Fig.6. Localização das áreas do cérebro [BEAR,02].
18
2.1.4 Plasticidade cerebral
No início das pesquisas sobre o cérebro, acreditava-se que ele
tivesse suas funções localizadas e fixas, porém em décadas mais recentes,
resultados de alguns pesquisadores pouco a pouco mostraram que o
cérebro tem capacidade de moldar-se, adaptar-se e reorganizar-se [BACH-
Y-RITA,95]. Ficou claro que ele não ficava com áreas “desocupadas”, como
mostrado em experimentos como o de Merzenich, que inicialmente mapeou
os dedos da mão de um macaco coruja na região S1 do córtex. Ao remover
um dedo observou-se que com o transcorrer do tempo o córtex
reorganizava-se de modo que as áreas corticais dos dedos vizinhos se
expandiram. Os dedos mais distantes daquele que foi removido, se
estimulados, também tiveram suas áreas corticais expandidas [BEAR,02].
Pesquisas também mostraram a reorganização de córtex visual e
auditivo, por exemplo, Calvert comprovou por meio de imagens de
ressonância magnética funcional (functional magnetic ressonance imaging,
fMRI) que a leitura labial praticada por deficientes auditivos estimulava o
córtex auditivo, da mesma maneira que faria uma pessoa com audição
normal [CALVERT,97]. Também foi mostrado por Wanet-Defalque em
imagens PET (tomografia por emissão de pósitrons) que o córtex visual de
cegos congênitos era estimulado quando submetidos a estímulos auditivos
ou tácteis [WANET-DEFALQUE,88]. Em 2000, pesquisadores alemães da
University of Magdeburg Medical School liderados por Bernard Sabel
conseguiram disparar percepções visuais em cegos usando estímulos
magnéticos [TALAN,2000]. E pesquisadores de Heildeberg usando fMRI
mostraram a ativação de córtex visual quando usuários cegos usavam um
sistema de estimulação táctil pneumático [MAUCHER,00].
2.2 FISIOLOGIA DA PELE
Funcionando como uma capa de proteção aos órgãos internos, a pele
é composta de epiderme, derme e hipoderme. A epiderme é a camada mais
externa, formada por células mortas ou prestes a morrer. A derme,
imediatamente abaixo da epiderme, contém a raiz dos pelos, terminações
19
nervosas, vasos sangüíneos, e colágeno, que confere a elasticidade à pele.
A hipoderme é a região mais profunda, que apresenta as gorduras, veias e
músculos [BEAR,02].
Repleta de receptores nervosos, a pele é o maior órgão sensorial do
corpo humano. Extensa em área, altamente enervada e capaz de
discriminação precisa, a pele torna-se excelente superfície sensorial para
receber a saída de um receptor artificial [BACH-Y-RITA,72].
Faz-se necessário um entendimento básico dos seis principais
receptores tácteis (mecanoreceptores), e a que tipos de estímulos
respondem, reconhecendo intensidade, duração, posição e algumas vezes
direção [BEAR,02], [SUMMERS,92], [HELLER,91].
Por outro lado, o sistema nervoso central (SNC) interpreta a atividade
na rede de receptores e gera percepções coerentes. Sendo assim, um
estímulo na pele é convertido em sinal neural e encaminhado ao encéfalo
para processamento.
2.2.1 Tipos de receptores nervosos
Os mecanoreceptores divergem em suas características, de acordo
com afinidade pela variação do estímulo (freqüência, pressão, tamanho e
tipo do campo receptivo), com os principais destacados na Fig.7, em que se
pode observar que os receptores encontrados em pele glabra (sem pelos,
como a planta dos pés e palma das mãos) diferem dos encontrados nas
diversas partes do corpo.
20
Fig.7. Vista em corte da pele, destacando seus receptores [BEAR,02].
O corpúsculo de Pacini é o de maior tamanho, localiza-se mais
profundamente, e tem campo receptivo grande. Os superficiais são os
corpúsculos Meissner, conectados a fibras eferentes mielinizadas,
amplamente direcionada a estímulos mecânicos transitórios [GUYTON,89],
[SZETO,90], [NOHAMA97].
Os discos de Merkel são compostos por um terminal nervoso e uma
célula epitelial não-neural achatada, possibilitando por meio de uma união
sináptica com o terminal nervoso, um sistema mecanicamente sensível
[BEAR,02].
Os receptores de Ruffini, assim como o corpúsculo de Meissner e as
ramificações dos axônios em torno dos folículos pilosos, são
mecanoreceptores de pressão e tato.
Situado em regiões de conexão da pele com membranas mucosas
estão os bulbos terminais de Krause, como na boca e em órgãos genitais
[BEAR,02].
Por fim, há terminações nervosas livres encontradas em todos os
tecidos do corpo [SZETO,82].
Os receptores também variam com relação ao tempo de resposta e a
adaptação do estímulo, sendo sumarizados na Tabela 1. A Fig.8 resume a
21
localização, tamanho do campo receptivo e formato do estímulo dos 4
principais mecanoreceptores da pele. Existem também outros receptores,
para dor (nocireceptores) e para sensação térmica, que não são objeto deste
estudo.
Tabela 1. Comparação dos principais corpúsculos mecanoreceptores [BEAR,02] Tamanho do campo receptivo
Pequeno grande
Adaptação rápida Meissner Pacini
Adaptação lenta Merkel Ruffini
Fig.8. Os sistemas sensoriais codificam 4 atributos do estímulo: modalidade, local, intensidade e temporização, manifestos na sensação [KANDEL,91].
Os sistemas sensoriais codificam quatro atributos de estímulos:
modalidade, localização, intensidade e temporização, que se manifestam na
sensação, mostrados na Fig.8, e descritos a seguir: [KANDEL,91]
22
• A: na mão humana as sub-modalidades do tato são sentidas pelos
4 tipos de mecanoreceptores. Sensações tácteis específicas
ocorrem quando tipos distintos de receptores são ativados.
Disparando todos os quatro produz a sensação de contato com um
objeto. Ativação seletiva das células de Merkel e terminações de
Ruffini produz sensação de pressão constante na pele acima do
receptor. Quando os mesmos padrões de disparo ocorrem apenas
nos corpúsculos de Meissner e Pacini, uma sensação de
formigamento e vibração é percebida [KANDEL,91].
• B: Localização e outras propriedades espaciais dos estímulos são
codificadas na população de receptores ativados. Cada receptor
dispara potenciais de ação apenas quando a pele próxima aos
terminais sensoriais é tocada, ou seja, quando um estímulo atinge
o campo receptivo do receptor, que é a área marcada em
vermelho na ponta do dedo, diferindo em tamanho e resposta ao
toque. Corpúsculos de Merkel e Meissner fornecem a localização
mais precisa ao toque, já que possuem os menores campos
receptivos e são também mais sensíveis a pressão aplicada por
uma pequena ponta de prova [KANDEL,91].
• C: a intensidade do estímulo é sinalizada pela taxa de disparo dos
receptores individuais, e a duração da estimulação é sinalizada
pela evolução do tempo dos disparos. Trens de picos abaixo de
cada dedo indicam os potenciais de ação evocados pela pressão
de uma pequena ponta de prova no centro do campo receptivo. Os
corpúsculos de Meissner e Pacini se adaptam rapidamente à
estimulação constante, enquanto os demais adaptam-se
lentamente [KANDEL,91].
23
Tabela 2. Sumário de propriedades dos mecanoreceptores [PASQUERO,03] Mecanoreceptor Tipo Estímulo mais
importante Tipo de resposta
Funções principais
Corpúsculo de Meissner
AR 1 Vibração de baixa freqüência (toques)
Transitória Detectar movimentos de baixa freqüência e discriminar localização espacial
Corpúsculo de Pacini
AR 2 Vibração de alta freqüência
Transitória Detectar movimentos de alta freqüência e detectar deslocamento de vibrações mecânicas
Disco de Merkel AL 1 Indentação perpendicular (pressão)
Sustentada Distinguir magnitude de pressões e taxa de variação de pressões
Terminação de Ruffini
AL 2 Deslocamento tangencial (atrito e estiramento)
Sustentada Perceper estiramento da pele e discriminar localização espacial
Fig.9. A base estrutural do campo receptivo dos receptores do sentido do tato [KANDEL,91]
O campo receptivo do neurônio sensível ao toque na pele inclui
aparatos de tradução de sensação nos terminais nervosos e na pele ao
redor da qual os terminais estão localizados. Um trecho de pele contém
vários campos receptivos sobrepostos enervados por fibras nervosas
sensoriais individuais. Quando uma região é tocada, picos são iniciados no
nodo de Ranvier mais próximo da terminal nervoso na pele. Eles são
conduzidos através do corpo celular, localizada na gânglio raiz dorsal, até os
terminais sinápticos na medula.
24
2.3 ESTIMULAÇÃO ELETROTÁCTIL
Para estimular a sensação táctil é necessário que os picos de
corrente atravessem a epiderme, chegando aos receptores nervosos
descritos anteriormente, que são sensíveis a estímulos de diferentes
freqüências e intensidades.
Também são vistos alguns fenômenos que podem ser aproveitados
para tentar integração de receptores e tentar melhorar a resolução do
sistema proposto.
2.3.1 Resposta sensorial
Dos sistemas sensoriais, costuma-se dizer que a audição é
predominantemente temporal, a visão predominantemente espacial, ao
passo que o tato pode substituir a ambos, apesar de ter menor densidade de
receptores. O estímulo varia principalmente quanto à intensidade, duração e
localização [GELDARD,75].
A partir da estimulação elétrica, a sensação percebida varia muito
dependendo da intensidade, freqüência, forma de onda, incluindo se trem de
pulsos (rajadas) e largura de cada pulso, e se tem nível médio nulo ou não.
Os trens de pulso com presença ou ausência de nível médio são conhecidos
na literatura da área de eletro-estimulação como onda monofásica ou
bifásica, apesar de a terminologia não ser adequada do ponto de vista de
engenharia elétrica, pois é apenas um sinal, não dois diferentes com fases
diferentes. Estas características estão sumarizadas na Tabela 4.
Diferentes pesquisadores têm obtido grande variação de resultados, e
a descrição varia entre leve toque, roque firme, pressão profunda quando a
intensidade aumenta. O aumento da freqüência gera toques mais freqüentes
até atingir vibração por volta de 30 Hz. Para freqüências acima de KHz, pode
ser percebida como tensão muscular. Outras descrições envolvem calor, frio,
coceira, picada, agulhada (mais comum), dor, repuxo.
Em resumo, tudo depende de quais receptores nervosos estão sendo
ativados, se mais profundo ou menos, se responde mais rapidamente ou
não, e se perdura sua ativação por mais tempo.
25
Quanto mais profundo o receptor, maior o seu campo receptivo,
portanto menor a resolução espacial para fins de substituição sensorial.
Como existem nocireceptores em proximidade com os mecanoreceptores,
também é possível em situações limite obter sensação de dor, calor ou frio.
Dependendo da região do corpo, os receptores podem estar mais
próximos uns dos outros, havendo maior densidade. Costuma-se definir
então o limiar de discriminação, a distância entre dois pontos percebidos
como separados, ou TPDT (two point discrimination threshold), sumarizado
na Fig.10.
Fig.10. Limiar de discriminação entre dois pontos (TPDT) em função da região do corpo [KANDEL,91].
26
Tabela 3. Valores de TPDT para diferentes locais do corpo [NOHAMA,97]. Local do corpo Toque estático(mm) Vibroatáctil(mm) Eletrotáctil(mm)
Ponta dos dedos 3 2 <7
Palma da mão 10 8
Fronte 17
Abdome 36 10
Braço 38 9
Região lombar 39 11-18 5 – 10
Coxas 43 10
Antebraço 44 9
Panturrilha 46 9
Costuma-se definir ainda os limiares de sensação a partir da
intensidade mínima para perceber o estímulo (limiar de sensação ou LS) e a
intensidade mínima para sentir dor ou desconforto (limiar de dor ou LD).
Para facilitar a comparação, costuma-se dividir um pelo outro para saber a
faixa dinâmica em decibéis de cada tipo de região.
Pesquisadores que estimulam o dedo o fazem utilizando uma matriz
limitada a apenas 49 (7x7) pontos [KACZMAREK, 95] ou por meio de uma
matriz maior, mas com o dedo percorrendo esta matriz como se fosse um
livro Braille [MAUCHER,01]. Kaczmarek [98] também começou a testar há
alguns anos o uso de estimulação na língua, que tem a vantagem de reduzir
a amplitude necessária para cerca de 3 Volts, devido à ausência de
epiderme. Todavia, esta solução ainda tem o problema de limitação de
quantidade de eletrodos, em 12x12, além de ser de dimensões menores e
maior dificuldade de construção. Tang [99] também usou o palato, pela
mesma razão de menor tensão elétrica, mas com a vantagem de não sofrer
interferência das papilas gustativas.
Foi observado que um estímulo na forma de trem de pulsos gera uma
sensação percebida, ou intensidade subjetiva, que aumenta com o aumento
da amplitude ou da largura dos pulsos, e em menor grau com o aumento de
sua freqüência.[NOHAMA,97], [SUMMERS,92].
27
Tabela 4. Pesquisas em estimulação eletrotáctil [NOHAMA,97].
Legenda da Tabela 4:
Formas de onda: M:monofásica, + ou -; B: bifásica; PT: rajada de até 40 pulsos (duração de 10 µs, período de 100 µs, duração da rajada de 4 ms); LD/LS: razão entre os limiares de dor e de sensação; (a) melhor freqüência: 1-100 Hz; (b) melhor freqüência: 1-200 Hz; (c),(d) espaçamento entre eletrodos: 0,79 e 6,35 mm; (e) AI: aço inox. DADOS extraídos de Aiello&Valenza,1984 (A); Collins & Saunders, 1970 (B); Girvin et al, 1982 (C); Higashiyama & Tashiro, 1983 (D); Lin, 1984 (E); Melen & Meindl, 1971 (F); Pfeifer, 1968 (G); Rollman, 1973 (H); Saunders, 1973 (I); Saunders, 1977 (J); Saunders&Collins, 1971 (K); Solomonow & Preziosi, 1982 (L); (adaptada de Kaczmarek et al, 1991).
2.3.2 Mascaramento, lateralidade, adaptação
Existem alguns efeitos que afetam a resposta de um outro receptor
nervoso a um determinado estímulo.
28
Assim, mascaramento ocorre quando um receptor interfere com a
resposta do outro, por exemplo, quando uma estimulação mecânica mascara
uma sensação evocada eletricamente [NOHAMA,97].
Já a lateralidade é a influência do lado dominante na resposta aos
estímulos. No lado dominante o TPDT é menor, bem como os limiares de
dor e de sensação.[SOLOMONOW,77].
A adaptação é uma acomodação do receptor nervoso a um estímulo
prolongado, diminuindo sua resposta em relação à primeira resposta do
início deste estímulo, ou seja, seu Limiar de Sensação eleva-se com o
transcorrer do tempo. Segundo Kaczmarek [95], a elevação do Limiar de
Sensação segue uma função exponencial com constante de tempo entre 20
e 72 segundos. Ao aumentar a repetição das rajadas do trem de pulso usado
na estimulação elétrica, de 5 para 45 Hz, o Limiar de Sensação aumenta 7
vezes, retornando ao Limiar de Sensação inicial após 15 minutos. Para
impedir este efeito, ele recomenda rajadas de freqüência mais alta, entre
100 e 400 Hz.
2.3.3 Treinamento
Segundo Bach-Y-Rita [89], pode ocorrer uma plasticidade cerebral à
medida que se executa treinamento junto aos usuários, aprendendo da
mesma maneira que se aprende por exemplo uma língua estrangeira, ou um
cego aprendendo a ler caracteres Braille. Com o aumento do aprendizado, a
extração de informações se torna mais automática e inconsciente.
Ainda segundo Solomonow e Prados [82], após 14 dias de
treinamento o Limiar de Sensação diminui, ao passo que o Limiar de Dor
cresce de 1 a 3 vezes.
2.3.4 Efeitos lesivos
O choque elétrico classifica-se em alguns níveis:
• Limiar de sensação, da ordem de mA,
• Limiar de dor, da ordem de 100 mA,
• Limiar de fibrilação, da ordem de 0,5 A,
29
• Contração do coração, em cerca de 6A.
Estes testes foram realizados com animais desde a década de 1950,
e pressupõem freqüência de 60 Hz, e sinal atravessando o coração, ou seja,
na pior condição possível, entrando por uma mão e saindo pela outra.
Com relação à freqüência, o efeito do choque elétrico diminui com o
aumento e diminuição da freqüência, sendo o maior dano causado na
freqüência na faixa de 50 a 60 Hz, exatamente a freqüência adotada
mundialmente na rede elétrica [KINDERMAN,00], [GEDDES,95], [ABNT,81].
Para estimular a sensação táctil é necessário que os picos de
corrente atravessem a epiderme, com conseqüente aumento de tensão no
local, podendo exceder a tensão de ruptura da pele, causando dor. Podem
ocorrer três tipos de queimaduras a partir da eletro-estimulação:
[NOHAMA,97]:
• eletroquímicas, evitável com nível DC próximo a zero;
• térmicas, difícil em freqüências abaixo de 1 kHz, exceto quando a
intensidade excede o limiar de dor;
• pequenas pintas pretas ao se retirar o eletrodo, devido ao aumento de
densidade de corrente instantâneo na retirada.
2.3.5 Parâmetros do estímulo elétrico
Recomenda-se usar trem de pulsos em rajadas, ajustando-se a
freqüência e o ciclo de trabalho dos pulsos e da envoltória das rajadas, o
que equivale a ajustar o tempo superior e inferior de cada pulso, a
quantidade de pulsos e o intervalo entre rajadas, podendo ter pulsos apenas
positivos ou também negativos, conforme Fig.11 [NOHAMA,97],
[SUMMERS,92].
Alguns autores sugerem o uso de envoltórias que aumentam e
diminuem gradativamente o sinal para melhorar o conforto do usuário
[NOHAMA,97], [CASTRO,00].
30
Fig.11. Trem de pulsos com tempo morto: exemplo de BFM usando pulsos bipolares DC [NOHAMA,97].
2.3.6 Fenômeno Saltatório
A seguir são apresentadas algumas características do sistema
somestésico que poderão ser aproveitadas para melhoria futura do sistema
aqui apresentado, na busca de uma melhor resolução espacial.
Graças à bainha de mielina, o sinal elétrico parece saltar de um nodo
de Ranvier a outro, pois vai muito mais rápido do que se fosse apenas pela
propagação do potencial de ação. Porém, o fenômeno saltatório não tem
relação com esta condução de sinais elétricos entre nodos de ranvier.
O fenômeno na realidade foi descoberto por Geldard e tem a ver
também com a freqüência dos estímulos. Por exemplo, consiste na
estimulação do mesmo ponto no braço, próximo ao cotovelo, por vários
toques rápidos, com intervalo de cerca de 100 ms, e depois com um toque
próximo ao punho, resultando uma sensação esperada. Se aumentar o
intervalo entre os toques rápidos, sente-se na sensação de pontos
intermediários entre os pontos de estimulação, como se um pequeno animal
estivesse correndo sobre a pele. Também ficou conhecido como “cutaneous
rabbit”.
Este fato pode ser usado para criar eletrodos virtuais na matriz de
eletrodos do sistema desenvolvido, criando uma maior resolução, conforme
31
será discutido na seção do projeto. Este fenômeno também foi observado
nos sistemas auditivo e visual [GELDARD,75].
2.3.7 Fenômeno Phi Visual e Táctil
O fenômeno phi visual é conhecido e utilizado amplamente,
consistindo na percepção de movimento quando pontos próximos são
mostrados alternadamente, dependendo da distância dos pontos e da
freqüência em que são mostrados.
É ele que permite perceber imagens em movimento em filmes apesar
de serem na realidade fotografias em seqüência mostradas em velocidade
rápida.
De maneira semelhante, existe o fenômeno phi táctil, que permite
perceber pontos intermediários na pele [NOHAMA,97].
2.3.8 Fenômeno de sensação fantasma
Uma percepção comum entre amputados é a sensação oriunda do
membro ausente quando outras partes do corpo são tocadas. Isto ocorre
normalmente quando uma parte do corpo cuja representação somatotópica
margeia aquela do membro amputado. Por exemplo, alguém que perdeu o
braço pode “senti-lo” quando toca a face [BEAR,02].
Contudo alguns autores confundem o fenômeno do item 2.3.6 com
este de sensação fantasma, chamando o fenômeno saltatório (“saltation”) ou
o phi táctil de “phantom sensation”, chegando a descrevê-los exatamente da
mesma forma [SHIRAI,03]. Neste trabalho foi considerada a nomenclatura
médica usual, conforme descrita aqui nos itens anteriores.
2.4 ESTIMULAÇÃO VIBROTÁCTIL
A estimulação vibrotáctil é gerada a partir de estímulos mecânicos
sobre a pele atuando sobre os mesmos principais mecanoreceptores. As
formas mais usuais de estimulação mecânica a citar são:
32
• atuadores eletromecânicos, podendo ser pequenos motores excêntricos
que gerem vibrações, ou pequenos eletroímãs que acionam agulhas,
semelhante às cabeças de impressão de impressoras matriciais;
• atuadores piezoelétricos, que transformam uma tensão elétrica em um
pequeno movimento. Um exemplo pode ser visto na Fig.12 ;
• acionadores baseados em shape memory alloys (SMA), ou ligas
metálicas com memória de forma, que permitem manter o estímulo
mecânico sem manter a energia no estimulador, reduzindo o consumo de
bateria e aumentando a autonomia dos equipamentos.[KOO,06]
O problema com todas estas soluções de estimuladores mecânicos é
que elas são de dimensões maiores que os estimuladores elétricos, e
consomem muito mais energia, diminuindo a duração das baterias, sendo
recomendada apenas para pesquisa por enquanto. Heidelberg por exemplo
usa atuadores pneumáticos, mas o sistema que gera estes gráficos tácteis
precisa ficar posicionado sobre uma mesa, e o usuário a explora com sua
mão [MAUCHER,00].
Fig.12. Display Braille convencional: (a) uma celula Braille composta de 8 pontos, (b) display complleto formado por uma arranjo linear de células da Pulse Data
International Ltd [PULSE,05].
33
33 VVIISSÃÃOO
A visão é o principal canal de entrada de informações do exterior para
o ser humano, com o olho conectado diretamente ao sistema nervoso
central. Como este trabalho visa substituir a visão pelo tato, faz-se
necessário ter uma compreensão mínima da visão e de sua funcionalidade,
de maneira a se poder implementar possíveis processamentos que possam
ser feitos para compensar deficiências do tato em relação à visão.
Para a elaboração deste projeto não é necessário entender
profundamente o sistema de visão, as diversas camadas da retina, os
neurotransmissores envolvidos nos disparos, ângulos de incidência ou
especificidades de composição de cores e possíveis efeitos. Basta entender
em linhas gerais o que ocorre na recepção das imagens e a percepção
gerada no córtex, permitindo assim saber quais problemas podem ocorrer de
maneira a determinar quais das soluções propostas na literatura podem ser
aplicadas a quais casos de deficiência visual, seja parcial ou total.
Por exemplo, alguém que tenha tido uma lesão no nervo óptico não
poderá usar um implante de retina artificial [CHOW,01] ou sistema de laser
que projete no fundo do olho uma imagem [MICROVISION,05]. Contudo este
sistema de laser pode ser usado em uma pessoa com degeneração macular,
com problema de visão noturna, em que a quantidade de luz não excita
suficientemente os receptores visuais.
As patologias da visão podem ser congênitas ou adquiridas, ou seja,
por lesão ou por característica genética do paciente. Conforme mencionado
anteriormente, algumas delas podem ser corrigidas, e sua conseqüência
pode ser perda total da visão (cegueira) ou visão definida como subnormal.
Algumas ocorrem devido a problemas na parte anterior do olho, tais
como a córnea, íris e cristalino, e outras são geradas devido a problemas na
parte posterior, tais como a retina, mácula, fóvea, receptores visuais (cones
e bastonetes) e nervo óptico. Patologias mais simples, como a miopia e
hipermetropia, quando o foco da imagem se forma antes ou depois da fóvea,
34
requerendo apenas lentes corretivas. Elas podem ser causadas pelo
comprimento do globo ocular ser maior ou menor que o necessário, mas
também podem ocorrer devido a deformações do cristalino. Por isso que
pessoas de maior idade, que perdem a elasticidade do cristalino e dos
músculos ciliares não atuam mais adequadamente, normalmente começam
a necessitar de óculos para enxergar de perto. Isto pode ocorrer por volta
dos 45 anos.
É importante ainda saber que uma parte dos neurônios do sistema
visual desempenha papel de detectores de contornos e de movimentos,
ausentes no sistema somestésico. Assim, pode-se prever soluções de pré-
processamento das imagens a serem capturadas no sistema proposto que
implementem parte destas funções.
É importante destacar que a maneira mais efetiva e comum de se
estimar a profundidade de uma imagem é utilizando-se dois olhos Como
estão ligeiramente deslocados em relação ao seu eixo central, pode-se
calcular geometricamente a profundidade. O cérebro faz isto
automaticamente, mas o algoritmo para ser implementado artificialmente é
complexo. A dificuldade é determinar, no cruzamento dos raios, qual é o
correto.
Também são vistos aspectos psicológicos da cegueira, da mesma
maneira importante para definir e entender o projeto do sistema proposto.
Finalmente, noções das técnicas de orientação e mobilidade utilizadas
pelos deficientes visuais são cobertas, de maneira a entender como o cego
raciocina ao montar seu mapa mental, e assim ajudar a planejar o projeto e
os testes do sistema em questão.
3.1 ACUIDADE VISUAL
Acuidade visual (AV) é a medida do limiar de discriminação de dois
pontos separados espacialmente. A melhor acuidade visual ocorre na região
especializada da retina para a visão de detalhes, a fóvea [MARANTES,00].
35
A acuidade depende de diversos fatores, inclusive da região da retina
estimulada pela luz, intensidade da iluminação, tempo de exposição do
estímulo, movimento do objeto ou dos olhos e idade do paciente.
Pode-se indicar a acuidade visual por uma relação de valores ou por
um índice. Na notação mais utilizada, a de Snellen, 1,0 significa o mesmo
que 20/20, e 0,5 é o mesmo que 20/40. O primeiro número é a distância em
pés que o objeto a ser lido se encontra do olho que está sendo examinado.
O segundo refere-se ao tamanho do objeto, por exemplo uma letra. Assim,
quem tem 0,5 ou 20/40 significa que para conseguir ler as letras devem ter
seu tamanho dobrado.
A pessoa com acuidade 20/40 pode ver a 20 pés (6 metros) o que
uma pessoa de visão normal pode ver a 40 pés (12 metros). Pode-se ter
uma idéia da acuidade na Fig.13.
Fig.13. Testes de Snellen mostrando a percepção do portador de acuidade visual de 20/20, 20/30, 20/50 e 20/80 [UMBAUGH, 97].
36
Existem diversos tipos de testes para detectar diferentes patologias, e
o mais comum deles em consultórios é o teste de Snellen, sendo um deles
composto por padrões de letras E em diversas rotações
3.2 VISÃO SUBNORMAL X CEGUEIRA
A cegueira total ou AMAUROSE pressupõe completa perda de visão,
não havendo nem percepção luminosa. No jargão oftalmológico é conhecida
por visão “zero”.
O termo cegueira não é absoluto, reunindo diversos graus de visão
residual. Não significa total incapacidade para ver, mas limitações
incapacitantes para o exercício de tarefas rotineiras. Para fins de
classificação, divide-se a população em pessoas com cegueira legal, visão
subnormal e videntes.
Esta classificação é feita de acordo com sua acuidade visual, descrita
anteriormente, e o campo visual, definido como a amplitude da área
alcançada pela visão. Assim, uma pessoa tem cegueira legal se tiver pelo
menos um dos 2 critérios seguintes:
• se a visão corrigida do melhor dos seus olhos é de 20/200 ou menos, isto
é, se ela pode ver a 20 pés (6 metros) o que uma pessoa de visão normal
pode ver a 200 pés (60 metros),
• se o diâmetro mais largo do seu campo visual subentende um arco não
maior que 20 graus, ainda que sua acuidade visual nesse estreito campo
possa ser superior a 20/200 (o normal é 150º). Esse campo visual
pequeno também é chamado de “visão em túnel” ou em “ponta de
alfinete”.
Pessoas com cegueira legal, também denominada de cegueira
parcial, econômica ou profissional, são capazes no máximo de contar dedos
à curta distância e perceber vultos.
Existem ainda pessoas que só tem percepção luminosa de claro e
escuro, e projeção luminosa quando o individuo também é capaz de
identificar a origem da luz [CONDE,02].
37
A Tabela 5 resume a classificação de deficientes visuais, em que para
ser considerado portador de visão subnormal um ou dois dos 2 critérios
servem:
• acuidade visual de 6/60 e 18/60 (escala métrica)
• campo visual entre 20 e 50º.
Tabela 5. Resumo de definições de cegueira e visão subnormal Acuidade Campo
Normal --- 140º
Subnormal entre 20/200 e 60/200 Entre 20º e 50º
Cegueira < 20/200 < 20º
Pedagogicamente, delimita-se como cego aquele que, mesmo
possuindo visão subnormal, necessita de instrução em Braille, e como
portador de visão subnormal aquele que lê tipos impressos ampliados ou
com o auxílio de potentes recursos ópticos.
Observe que a visão subnormal, ou Baixa visão, leva à incapacidade
funcional e não pode ser corrigida com tratamento clinico, cirúrgico ou com a
utilização da correção óptica habitual (óculos ou lentes de contato),
acarretando dificuldades para atividades da vida diária, aprendizado,
atividade profissional, sociabilidade, sem considerar efeitos psicológicos e
familiares. Com treino e orientação pode ser desenvolvida eficiência em
tarefas que sem treinamento seriam impossíveis.
Mas do ponto de vista estritamente médico cego é apenas aquele que
não tem sensação de luz nenhuma [SAMPAIO,00].
3.3 DADOS ESTATISTICOS SOBRE DEFICIÊNCIA VISUAL
Na população brasileira, de acordo com o censo de 2000 do IBGE,
48,1% da população brasileira possui alguma deficiência visual, parcial ou
completa. Desses, 43% são homens, 57% são mulheres. É um grande
aumento em relação ao censo anterior, que acusa cerca de 2%. Isso deve-
se também ao fato de os critérios terem sido mudados, e de ter havido um
38
melhor treinamento dos recenseadores do que no censo de 1990. A
mudança foi provocada para utilizar os mesmos critérios utilizados pela OMS
(Organização Mundial da Saúde, ou WHO, World Health Organization) da
ONU [FERREIRA, 02].
Contudo, há quem discorde da metodologia, pois há aprofundamento
apenas por região, sexo, religião, e não por tipo de causa de doença, nem
se subdivide quem tem visão subnormal da pessoa que apenas requer uso
de lentes corretivas.
Segundo dados de 1994 da OMS, estima-se existirem no mundo 38
milhões de pessoas cegas e 110 milhões com baixa visão. Dos cegos, as
causas predominantes são 16 milhões devido à catarata (42%), 6 milhões
devido a tracoma (15%) e 5,2 milhões de pessoas devido a glaucoma (14%)
[WHO, 03].
3.4 ASPECTOS PSICOLÓGICOS DA CEGUEIRA
Como varia muito de pessoa para pessoa a época em que ocorre sua
perda de visão, bem como o percentual desta perda, é necessário adequar-
se a cada um o tratamento dedicado. Estes fatores têm implicações na
aprendizagem e ajustamento do individuo, pois a reorganização perceptiva
do deficiente visual tem implicações na sua aprendizagem [AMIRALIAN,85].
Se uma pessoa perde sua capacidade visual até o limite de 5 anos,
considera-se que é um cego congênito, pois até esta idade a visão não está
totalmente formada. Se ocorrer depois dessa idade, denomina-se como cego
adquirido. Assim, classificam-se os PPDV basicamente em quatro grupos,
portadores de:
• Cegueira congênita
• Cegueira adquirida
• Visão subnormal congênita
• Visão subnormal adquirida
39
As pessoas consideradas cegas são as que apresentam perda total
da visão ou que a têm abaixo de um nível que permita realizar a apreensão
do mundo circundante pela visão, bem como impedem a aprendizagem
acadêmica pelo método comum. Os portadores de visão subnormal podem
utilizar sua visão residual para complementar seus outros sentidos, e
atualmente são incentivados a fazê-lo, ao contrário do que ocorria no
passado.
Quem perde a visão após os 5 anos de idade não precisa depender
da audição e tato para adquirir conhecimentos e formar imagens mentais,
podendo reter imagens visuais e relacioná-las com imagens auditivas e/ou
tácteis [LOWENFELD,71].
Comum aos 4 grupos é o processo perceptivo do mundo que os
cercam. Semelhante a uma pessoa surda, o deficiente visual precisa de
modificações no papel dos sentidos restantes, ocasionando uma
reorganização perceptiva exigida pela perda visual [MYKLEBUST,66].
Para melhor estudar a situação, pode-se definir 2 categorias de
sentidos: os de distância e os de proximidade. Os primeiros apreendem o
ambiente externo sem a necessidade de contato direto com o objeto,
incluem a visão e audição. Os de proximidade requerem o contato direto,
sendo o tato, olfato e gustação [BAY, 1969].
Durante seu desenvolvimento onto e filogenético, o ser humano usou
uma organização sensorial em que os sentidos de distância são primordiais,
e os de proximidade são complementares, com todos definindo seu campo
ambiental [MYKLEBUST,66].
Assim, os sentidos de distância são bem desenvolvidos e flexíveis,
podendo cada um ser usado para exploração e aquisição de experiências. A
audição e visão podem se completar, mas não são interdependentes e nem
decorrem um do outro. Já os sentidos de proximidade não sevem em um
adulto como sentido dirigente, pois são mais primitivos e imaturos que os
sentidos de distância.
40
Contudo, quando o indivíduo é privado ou limitado em um dos
sentidos de distância, esta hierarquia muda.
No cego a audição torna-se o único sentido de distância atuante.
Contudo, a visão é direcional, focalizando apenas a área diante da pessoa,
enquanto a audição atua em todas as direções ininterruptamente. Pode-se
fechar os olhos e perder contato com um objeto, mas o mesmo não ocorre
com uma fonte sonora.
Assim, a audição é considerada como um sentido de fundo do ponto
de vista psicológico, ao passo que a visão é primordialmente um sentido do
primeiro plano, na maioria das vezes. Normalmente, usa-se a visão para
focalizar uma experiência após esta ter sido identificada pela audição
[AMIRALIAN,85].
Em casos raros, pode haver uma inversão, com a visão atuando como
um sentido de fundo e a audição como um sentido de primeiro plano, como
ao se ouvir um concerto musical.
Apesar de ambos os sentidos, visão e audição, serem consideradas
espaciais e temporais, as experiências visuais em geral são estáveis,
podendo uma imagem ser mantida, enquanto a audição é mais temporal.
Com a visão percebe-se de um objeto, de uma só vez, seu tamanho,
forma, disposição e distância no espaço, ao passo que a audição fornece
indicação do momento. Portanto, é comum usar-se a visão para confirmar
informações obtidas pelo tato ou audição.
Os demais sentidos, de proximidade, ou seja, tato, olfato e gustação,
são menos desenvolvidos. Apenas enquanto é bebê o ser humano depende
mais deles, e só volta a depender se um dos sentidos de distância for
prejudicado.
Uma experiência sensorial só é apreendida usando-se todos os
canais sensoriais, mesmo que em geral eles não sejam simultaneamente
estimulados. Caso falte um canal, a experiência é percebida de maneira
diferente.
41
Ao perder a visão, o cego começa a depender mais dos demais
sentidos, e até os sentidos de proximidade se tornam suplementares e
críticos para a aprendizagem.
O tato em especial se destaca, mas conforme descrito por Fraiberg
(1977), na ausência da visão, a seqüência de uso das mãos para exploração
ambiental cai. Em bebês cegos suas mãos ficavam paradas, enquanto em
bebês videntes elas estavam sempre buscando brinquedos e outros objetos
identificados pela visão. Observa-se que isto acaba prejudicando até o
aprendizado de Braille [AMIRALIAN,85].
O mesmo ocorre em portadores de visão subnormal, devendo ser
incentivado o uso do tato, caso contrário a apreensão do mundo ficará
restrita em conhecimento e experiências, ocasionada pela dificuldade de
discriminação e desmotivação. Contudo, não se deve descuidar do
treinamento da visão residual, apesar de ser apenas um complemento, e
não um substituto das técnicas especiais. Instrutores de técnicas de
Orientação e Mobilidade da Fundação Dorina Nowill apontaram que
antigamente o portador de baixa visão não era incentivado a complementar
seus esforços de OM usando sua visão residual, mas que isso tem mudado.
Porém, é importante destacar que não existe evidência cientifica de
que a ausência de um sentido implique na superativação dos outros, são
necessários aprendizagem e ajustamento para ocorrer a reorganização
perceptiva. Se o tato não for estimulado, pode até ocorrer um atraso no seu
desenvolvimento em crianças cegas congênitas [AMIRALIAN,85].
Deve-se lembrar ainda que cegos congênitos têm maior dificuldade na
aprendizagem, pois não tem algo a que referenciar. Uma maçã para um
cego adquirido tem a mesma imagem mental que de um vidente. Contudo
um cego congênito não tem esta imagem, ele vai se referenciar ao cheiro,
textura, formato, mas não a algo aproximadamente esférico e avermelhado.
Em conversas com instrutores da Fundação Dorina Nowill foi mencionado o
caso de um aluno vindo de uma fazenda que não conseguia compreender o
conceito de calçada, pois não tinha experiência prévia em seu ambiente
42
original. Foi necessário fazer uma analogia com margens de rios, conceito
que ele conhecia, para poder compreender o novo conceito.
Levando isso em conta, o critério de seleção para as pessoas que
testaram o equipamento deste trabalho é que fossem adultos que tenham
um mínimo conceito formado de padrões geométricos, para ter com o que
comparar. Como se pode ver na seção correspondente, foram 3 grupos de 3
ou 4 pessoas cada, um de cegos congênitos, um de cegos adquiridos e um
de videntes.
3.5 NOÇÕES DE ORIENTAÇÃO E MOBILIDADE (OM)
Orientação é capacidade de perceber o ambiente, saber aonde
estamos, enquanto que mobilidade é a capacidade de nos movimentarmos
neste ambiente.
O ensino de técnicas de OM para deficientes visuais visa ensiná-los a
usar os sentidos remanescentes, tais como audição, tato, cinestesia
(percepção de seus movimentos), olfato e visão residual, se houver, para se
orientar [FELIPPE,97].
Uma pessoa portadora de deficiência visual (PPDV) pode se
locomover usando ajuda de um guia vidente, seu corpo (autoproteções),
bengala longa, mostrada na Fig.14, cão-guia ou ajudas eletrônicas.
Estas ajudas eletrônicas também são conhecidas pela sigla em inglês
ETA (electronic travel aid), ou ajuda eletrônica para locomoção. Entre elas
pode-se adiantar bengala longa complementada por sistema de medição de
distância por laser ou ultra-som, e algumas destas são descritas adiante no
texto.
Não é o escopo deste trabalho revisar todas as técnicas de OM,
portanto não será visto como o guia vidente e o cão-guia devem atuar.
As técnicas de autoproteção ensinam a usar o corpo e alguns
equipamentos para locomoção e exploração do ambiente. Entre elas podem
ser listados procedimentos sistemáticos (algoritmos) para proteção inferior e
superior, rastreamento com a mão, enquadramento e tomada de direção,
43
localização de objetos, procedimentos com trincos e maçanetas, e
finalmente a familiarização.
As técnicas em geral consistem em uma seqüência de passos a
serem feitos, de maneira a exaurir as possibilidades.
Fig.14. Bengala longa rastreando [FELIPPE,01].
3.5.1 Proteção inferior e superior
Para se proteger a parte inferior ou superior do corpo, usa-se a mão
com o braço flexionado e o dorso da mão para frente, distante o suficiente
para que antecipe as pontas dos pés.
3.5.2 Rastreamento
No rastreamento com a mão procede-se de maneira semelhante, mas
mantendo contato com uma parede ou corrimão, procurando se antecipar à
ponta dos pés.
3.5.3 Enquadramento e a tomada de direção
O enquadramento permite à pessoa estabelecer uma linha de marcha
reta ou orientada. Para isso, ela deve encostar suas costas em algum objeto
de destaque do ambiente, e seguir uma linha perpendicular para sua
trajetória.
44
3.5.4 Localização de objetos
Para se localizar objetos deve-se realizar uma busca sistemática
adequada, segura e eficiente. Para objetos caídos, deve-se parar e procurar
ouvir aonde caiu, voltando-se para a origem do som e caminhando em
direção ao ponto em que se julga estar o objeto. Deve-se então procurar de
duas formas: em movimentos circulares (leque) ou em linhas verticais e
horizontais (grade), rastreando a área com o dorso dos dedos.
Para objetos sobre móveis (mesas,
balcões, prateleiras) a pessoa deve estar
sentada ou de pé frente ao móvel, e movimenta
as mãos com o dorso pra frente até contatar a
borda do móvel. A partir do contato, usando a
linha média como referência, a pessoa começa
a aplicar um modelo de busca (leque ou grade),
como ilustrado na Fig.15.
Fig.15. Método de Localização [FELIPPE,01].
3.5.5 Trincos e semelhantes
Para trincos, maçanetas, e semelhantes, novamente a pessoa de
frente para a porta movimenta as mãos com o dorso para frente até tocar o
objeto. Então deve deslizar as mãos horizontalmente à direita e à esquerda
até encontrar os batentes. Basta então acompanhar os batentes ou
molduras em movimentos de deslize vertical das mãos até encontrar a
maçaneta.
3.5.6 Familiarização
A familiarização é a mais complexa e demorada das técnicas, pois
depende do tamanho do ambiente. A técnica é semelhante a todas as
anteriores, mas aplicada em escala bem maior. Aliás, o uso da bengala
também é semelhante, usando-se modelos de busca de leque ou grade,
ilustrado na Fig.16 e na Fig.17.
45
Fig.16. Métodos do perímetro e do cruzamento para familiarização [FELIPPE,01].
No método do perímetro, a pessoa escolhe um ponto de partida,
geralmente a porta principal, e faz o enquadramento paralelo à parede ou a
um objeto. Faz o rastreamento, circundando o perímetro até retornar ao
início. A seguir, pode fazer o rastreamento em sentido contrário. O número
de repetições depende do ambiente, situação e necessidades individuais.
O método dos cruzamentos é semelhante, parte-se de um ponto
escolhido, mas agora fazendo o cruzamento em linha reta a partir do
enquadramento na parede. É semelhante ao algoritmo de se visitar uma
feira de exposições, fazendo zig-zag pelos corredores do evento.
Fig.17. Início da familiarização com guia vidente e com bengala longa [FELIPPE,01].
46
Oportunidades de atuação deste projeto:
Como este trabalho visa facilitar a vida do deficiente visual, as
técnicas de localização de objetos e familiarização são as que mais podem
ser afetadas positivamente. Todo o trabalho está voltado para aplicações de
familiarização, mas é possível usar os equipamentos e programas
desenvolvidos para localização com a mesma facilidade. Basta ajustar o
zoom (aproximação ou afastamento) implementado.
A partir desta rápida descrição, pode-se observar a importância que
um sistema que agilize o processo de familiarização pode ter na vida de uma
PPDV.
Além disso, a bengala longa, instrumento inseparável de um
deficiente visual, não pode descobrir obstáculos altos, como galhos de
arvores e “orelhões” (cabines telefônicas).
Outra dificuldade é ler letreiros e sinais, como quando se precisa
encontrar uma determinada sala em um prédio vazio ou tomar ônibus
quando se está sozinho no ponto. Neste caso é necessário parar todos os
ônibus e perguntar aos motoristas. Em um prédio desconhecido, a PPDV
procura se informar primeiro, descobrir como as salas são numeradas, e
contar os passos, por exemplo, o que é difícil, demorado e trabalhoso.
Este trabalho visa facilitar estas dificuldades. Em resumo, ajuda o
cego a montar o mapa mental de suas redondezas.
3.5.7 Atividades da Vida diária (AVD)
Apenas a título ilustrativo, é interessante salientar que também faz
parte da adaptação e aprendizagem do deficiente visual descobrir como
fazer coisas que no dia-a-dia os videntes não dão valor. Cozinhar, tomar
banho, vestir-se (escolher cores é um problema), barbear-se, trocar as
fraldas de um filho, todas são coisas que o videntes acham simples, mas
que devido à falta de visão podem se tornar difíceis e até perigosas. Estas
compõem as atividades da vida diária.
47
44 EEQQUUIIPPAAMMEENNTTOOSS DDEE AAUUXXÍÍLLIIOO EEXXIISSTTEENNTTEESS
De acordo com a norma ISO 9.999 e a CIF 2001 da OMS
(Organização Mundial de Saúde), define-se “tecnologia assistiva” ou “ajuda
técnica” a "Qualquer produto, instrumento, estratégia, serviço e prática,
utilizado por pessoas com deficiência e pessoas idosas, especialmente
produzido ou geralmente disponível para prevenir, compensar, aliviar ou
neutralizar uma deficiência, incapacidade ou desvantagem e melhorar a
autonomia e a qualidade de vida dos indivíduos”.
Neste capítulo são listados alguns dos auxílios típicos usados no dia-
a-dia pelos deficientes visuais, e posteriormente também quais são as
pesquisas em andamento ao redor do mundo nesta área, mesmo algumas
que não seriam consideradas aplicações de tecnologia assistiva, mas cujos
frutos possam depois ser usados para estes fins.
Enquadra-se nessa situação uma aplicação usando estimuladores
tácteis para o fornecimento de informações complementares a pilotos de
aviões de combate, fornecendo-lhes roupas com tactors (tactile actuators) ou
atuadores tácteis.
Outro sistema mais ousado, não considerado um sistema de
substituição sensorial (SS), mas ainda assim digno de menção pois sua
tecnologia poderá no futuro criar possíveis auxílios a deficientes visuais
apesar de projetada originalmente para pilotos de combate, é a projeção de
imagens a laser sobre a retina, sobrepondo-se às imagens normais vistas.
Assim é possível projetar informações do painel do avião, fazendo com que
para qualquer lado que o piloto olhe o painel esteja sempre à sua frente. O
mesmo já existe usando projeção sobre o pára-brisa do avião, ou mesmo
sobre a viseira do capacete, mas esta tecnologia de projeção sobre a retina
seria mais natural e poderá também ajudar portadores de cegueira noturna,
pois ao se atribuir maior intensidade luminosa pode-se compensar a menor
sensibilidade à luz gerada por esta doença. O nome desta tecnologia é RSD,
48
ou Retinal Scanning Display, em desenvolvimento pela empresa americana
Microvision [MICROVISION,02 ].
Nesta tentativa de melhorar a vida diária de deficientes visuais
existem atualmente muitos grupos no mundo, com projetos tais como
desenvolver próteses visuais que visam criar uma retina artificial [CHOW,01],
[CHEN01], estimular diretamente o córtex cerebral [DOBELLE,00], e outros
grupos trabalhando com equipamentos de SS, usando o tato [BACH-Y-
RITA,70], [BACH-Y-RITA,72], [SCHIFF,82], [BURDEA,96], [LENAY,00],
[YARMUSH,01] ou audição [MEIJER,92].
4.1 AUXÍLIOS USUAIS
Entre os equipamentos de maior uso pelo deficiente visual encontram-
se alguns de baixo teor tecnológico como a bengala longa, bola com guizos
e guias para escrever em Braille e para assinar cheques. Outros
equipamentos são de maior tecnologia, como o Optacon e ampliadores de
vídeo. Alguns estão descritos a seguir [CLARK,77], [BLAZIE,95], [ONCE,00].
Disponível comercialmente ao consumidor não foi encontrado nenhum
equipamento que passe informações visuais por meio do tato, a um preço
acessível, apenas equipamento para pesquisas. Existe equipamento de
substituição sensorial para levar imagens ao deficiente por meio de sinais
audíveis como o “The Voice” e semelhantes, comentados mais à frente.
O que é amplamente difundido são os equipamentos que funcionam
como lupa, permitindo a ampliação de textos para deficientes visuais,
detalhado no decorrer deste texto. Antigamente existiram também
equipamentos como o Optacon, que ao ser passado por cima do texto ou de
figuras, transforma essa imagem em uma imagem em relevo por meio de
pinos que se elevam. Mas isto já existe há mais de uma década, e não tem
encontrado tanta receptvidade, devido aos custos altos e dificuldade de uso.
Em leitura de texto, por exemplo, é difícil para o deficiente visual, pois o
relevo que se forma é da letra normal, enquanto ele está acostumado com
Braille, exigindo muito tempo de treinamento para se acostumar.
49
Os sistemas ainda podem ser classificados em sistemas para
pessoas com baixa visão ou com perda total.
Para baixa visão encontram-se os ampliadores de vídeo por software
ou hardware. A versão por software em geral são programas que atuam
como uma lupa ao passar o mouse sobre um texto, mas tem ampliação
limitada. Outros aparelhos atuam como um circuito fechado de TV em que a
imagem capturada é projetada ampliada em uma TV. Existem diversos
fabricantes estrangeiros, e um nacional, a Terra Eletrônica, de São Bernardo
do Campo, SP, que faz a Lupa Eletrônica.
Entre os sistemas para cegos existem programas que lêem em voz
alta o texto do computador, e teclados com uma linha de células Braille
mecanizadas, com pinos que se elevam para mostrar o correspondente em
Braille de cada letra ou símbolo mostrado na tela. Contudo, esta linhas são
muito caras, na ordem de milhares de dólares por uma linha, e não são
muito difundidas no Brasil [BLAZIE,95].
Dos equipamentos habituais pode-se destacar ainda:
• bengala longa (white cane): instrumento básico para locomoção do
deficiente visual;
• Reglete (slate) e perfurador para escrever mensagens curtas,
semelhantes ao guia usado antigamente para perfurar cartão de loteria
em casas lotéricas, conforme Fig.18;
• Guia para assinar cheques;
• Bolas com guizos para jogar futebol;
• Roupas com marcadores para identificar cores;
• Rotulador em Braille;
• Diversos materiais em alto relevo, como bússolas, fitas métricas, relógios
de pulso (com tampa levantável);
• Diversos dispositivos falantes, como gravadores, calculadoras (até
científicas), leitor de cores capaz de distinguir matiz, brilho e intensidade.
50
Fig.18. Reglete importado com caneta correspondente
4.2 SOLUÇÕES TECNOLÓGICAS NÃO INVASIVAS
Nesta seção estão listados alguns equipamentos que utilizam maior
tecnologia, geralmente apenas eletrônicos, tanto comerciais como em
desenvolvimento nos diversos centros de pesquisa ao redor mundo.
Na Tabela 6, adaptada e ampliada a partir de [LENAY,00], estão
listados os principais sistemas em uso ou em desenvolvimento hoje no
mundo. Esta tabela engloba igualmente os dispositivos técnicos (sensores e
atuadores) possíveis de serem usados neste contexto. Note que certos
dispositivos de auxílio à locomoção podem igualmente ser considerados
como sistemas de SS. A tabela contém os sistemas de ETA (electronic travel
aid), de auxílio eletrônico para locomoção, e também os SSS propriamente
ditos (sensory substitution systems) ou sistemas de substituição sensorial.
Os estimuladores (atuadores) que enviam a informação ao usuário
podem ser de diversos tipos, destacando-se os tipos:
• EM: eletromagnético • ET: electrotáctil • SMA: shape memory alloy (liga metálica com memória de forma) • PE: piezo-elétrico • AP: ar sob pressão • SG strain gauge • EL: esticamento lateral
51
Tabela 6. Lista não exaustiva de diferentes sistemas de SS (adaptada de [Lenay,00].) Tipo Sensor Estimulador/
Atuador Referência
ETA1 5 de ultra-som Estereofônico Sonic Pathfinder (Heyes, 1984) ETA 2 de ultra-som Monofônico Ultrasonic Torch (Kay, 1965) ETA/SSS2 3 de ultra-som Estereofônico Sonic Glasses (Kay, 1974) ETA/SSS 3de ultra-som Estereofônico TriSensor (Kaspa) distribuído pela
SonicVison ETA/SSS 1 de ultra-som Táctil (EM) Mowat Sensor (Pulse Data Int Ltd) SSS Câmera vídeo Estereofônico The Voice (Meijer, 1992) SSS Câmera vídeo Táctil (EM) TVSS (20x20 tactors, Bach Y Rita 1969) SSS Câmera CCD Táctil (ET) Videotact (1996) Unitech Research Inc SSS Sonoro (micro) Táctil (EM) Tactile Sound Transducer (Clark
Synthesis) SSS Táctil (SG) Táctil (EM) EVTS (Orbitec, apenas 20
estimuladores) Táctil (PE) Exeter Fingertip Stimulator Array,
Sing & Summer, 1998 (10x10 em 1cm2) Táctil (EM) Tactile Feeling Display,
(Asamura,Shinoda et al, 1998) Táctil (SMA) Shape memory alloy (Grant and
Hayward, 1997) Táctil (AP) Estimulação usando ar sob pressão
(Asamura, Shinoda et al, 98) Téctil (EL) Esticamento lateral por efeito
piezoeletrico (Pasquero, 2003) Câmera CMOS Tecnologia barata permitindo
miniaturização de sensores Implante ocular Estimulação de células ganglionares da
retina (Wyatt e Rizzo, 1996) Implante cortical (Schimidt et al, 1996) 1 ETA significa "Electronic Travel Aid", sistema de ajuda eletrônica de locomoção. 2 SSS significa "Sensory Substitution System", sistema de substituição sensorial.
A maioria dos artigos segue a idéia original de Bach-y-Rita [72], de
substituição sensorial, montando um dicionário de objetos mais comuns e
testando diversas configurações de equipamentos. O equipamento original
utilizava vibradores mecânicos montados nas costas de uma cadeira de
dentista, estimulando o padrão visual nas costas do usuário. Depois o
resultado era comparado em pacientes cegos sem treino e após treinar,
versus a mesma imagem projetada em osciloscópio para voluntários com
visão poderem tentar reconhecer os mesmos objetos. O processamento
naquela época era todo analógico, o que dificultava muito a construção.
Ainda assim conseguiram fazer uma versão portável, com baterias
costuradas em um colete, mas ainda era todo de tecnologia analógica e
grade.
52
Bach-Y-Rita, Kaczmarek e seus colegas depois desenvolveram novos
equipamentos usando estimulação elétrica no abdome, e eles mesmos
tentaram inclusive de microatuadores para a ponta do dedo (década de 90) e
eletro-estimulação da língua [KACZMAREK,97]. Esta tecnologia da língua foi
transferida em 2005 à nova firma Wicab, criando um produto chamado
BrainPort, redirecionando-o para aplicações mais práticas e de resultado
mais imediato, como em tratamento de labirintite e para orientação de
mergulhadores em águas com pouca visibilidade. Este projeto foi anunciado
apenas recentemente, em 2006, pois está sendo desenvolvido sob
financiamento da marinha dos EUA [WICAB,06].
No Japão outros pesquisadores estão tentando algo semelhante,
usando o palato (céu da boca), usando aparelhos ortodônticos
[SHINODA,00]. A vantagem destes dois enfoques está na menor quantidade
de energia necessária para atingir os receptores nervosos, devido à
ausência de epiderme, usa-se tensão de 3 V em vez de 50 V. A
desvantagem é a baixa quantidade de receptores, gerando tamanhos
pequenos de matrizes de eletrodos. Outra vantagem segundo Kaczmarek
[97] é que a estimulação na língua que eles utilizam é por tensão constante,
enquanto nos demais estimuladores desenvolvidos por eles, para o bdomen
e dedo, a estimulação era feita por corrente constante.
Kaczmarek resumiu em dois artigos sobre estimulação abdominal em
2000, toda a área até então, citando mais de 70 artigos das décadas de 70,
80 e 90 [KACZMAREK,00].
No Brasil, Antonino em 1993 fez um estimulador em proto-board
conectado a um PC que enviava letras pela porta paralela. Mais tarde
Danielle Fonseca usou este protótipo para testá-lo com diversos pacientes,
bem como a adaptação deles ao sistema. Mas ela o usou sem resolver os
problemas do equipamento, feito em protoboard, que mais tarde foi
abandonado [ANTONINO,93], [FONSECA,95].
53
Em anos recentes, alunos da Faculdade de Engenharia Industrial
(FEI) replicaram as idéias de Antonino, com um protótipo mais elaborado,
montado em PCI.[ROSSI,06].
Na Universidade Federal de Campina Grande estão iniciando neste
ano de 2006 trabalho com uma luva com atuadores tácteis, para indicar a
existência de obstáculos a frente do usuário [ALVES,00].
Diversos trabalhos foram feitos para sistemas hápticos para uso em
telecirurgia ou robótica em geral, envolvendo realimentação táctil e de força,
bem como muitos artigos sobre estimulação táctil para wearable computers.
Existem vários trabalhos sobre ETA (Electronic Travel Aids – auxílio
eletrônico para mobilidade) baseados em técnicas de navegação robótica
usando ultra-som publicados em conferências, mas trabalhando com
substituição sensorial de visão para tato especificamente existem poucos
grupos, que estão listados nos apêndices. Basicamente, os grupos que
publicam regularmente são os de Madison, Louvain, Heildelberg, Strasbourg
e Tókio.
Até a proposta deste trabalho, ninguém havia focado em problemas
práticos mais imediatos, como orientação e mobilidade, e nem em
segmentação de sinais e reconhecimento de caracteres, com possível
estimulação táctil de caracteres Braille, com os quais o cego já está
acostumado.
Optacon
Era um equipamento formado por uma mini-câmera e uma matriz de
pinos. Passando-a por sobre um texto, elevam-se os pinos da matriz,
proporcional ao desenho das letras escritas, vonforme visto na Fig.19 . Saiu
do mercado por exigir grande treinamento e ser cansativo. Segundo
conversas com usuários, preferiam trabalhar com Braille mesmo, pois
estavam mais acostumados. Além de ter alto custo, na faixa de 4 mil
dólares.
54
Fig.19. Optacon sendo utilizado [ONCE,00]
Laser cane (bengala laser) e Polaron
Feita pela Nurion Industries, da Pensilvânia, é um sistema de bengala
longa normal, acoplada a um estimador de distância por laser, conforme
Fig.20. Semelhante a um sonar, envia um sinal e mede o tempo até ele
voltar e assim estima a distância baseado nesta medição de tempo. São 3
feixes de laser para detectar obstáculos no chão, no alto e na altura da
cintura. A mesma empresa desenvolve também o Polaron, do formato de
uma lanterna, com operação semelhante à bengala laser, mas sendo
baseado em ultra-som.
Fig.20. Demonstração da bengala laser e seu raio de ação [NURION,06]
MOWAT sensor
É um sensor que opera com o mesmo princípio anterior, mas é para
ser carregado como uma lanterna.
55
Sonic Guide
É um sistema composto de óculos com sensor de ultra-som acoplado
para ajudar na orientação. Originalmente feito por Leslie Kay, em 1974, ele
transfere informações visuais por meio de sons de diferentes freqüências e
com mais harmônicas quando o objeto não é plano. Ou seja, emite
diferentes harmônicas para diferentes distâncias medidas [KAY,00],
[BRABYN,82].
The Voice
É um sistema para cegos totais, em que se envia informações visuais
por meio de sons de diferentes freqüências, semelhante ao Sonic Guide,
porém mais portátil. Distâncias horizontais são passadas por meio de tons
de diferentes freqüências, veticais por meio de maior tempo de estimulação.
A literatura indica bons resultados para imagens simples de duas
dimensões, mas para imagens mais complexas torna-se uma cacofonia, de
difícil percepção. http://www.seeingwithsound.com/voice.htm
SonicVision’s KASPA
Este sistema utiliza o mesmo princípio do The Voice, enviando
informações visuais por meio de estimulação sonora. http://sonicvision.co.nz/
TalkingSigns
Foi um sistema desenvolvido pela equipe de John Brabin ,no SKI
(Smith Kettlewel Institute) da década de 70, composto por sinais e letreiros
que emitiam sons quando alguém com um emissor aproximava-se deste
letreiro, sendo então identificado, ativando uma mensagem pré-gravada
sobre o letreiro.
Ponto de ônibus e semáforos falantes
São projetos das prefeituras de Campinas e Porto alegre para facilitar
aos deficientes visuais escolher seus ônibus, baseando-se em tecnologia
semelhante ao Talking Signs, para pontos de ônibus, esquinas e semáforos.
56
Videotact e BrainPort
São sistemas baseados nos experimentos de Paul Bach-Y-Rita e Kurt
Kaczmarek nas três últimas décadas, foram criadas duas empresas para
disponibilizar comercialmente suas pesquisas.
A primeira comercializa um sistema que consiste em controle de
estimulador, que pode ser mecânico ou elétrico, e podendo usar matriz de
até de 32 x 24 eletrodos sobre o abdome. Só é usado em algumas poucas
universidades para pesquisa, devido ao altíssimo custo, de cerca de 70 mil
doláres.
Mostrada na Fig.21 esta a matriz de eletrodos usada pela segunda
empresa, Wicab, que abriu em 2005 e baseia-se nos trabalhos mais
recentes usando a língua como canal de estimulação elétrica. A empresa
mudou o enfoque para aplicações mais práticas, destacando-se o uso por
otorrinolaringologistas para tratamento de problemas do labirinto, e uma
aplicação para uso militar pela marinha dos EUA, para mergulhadores se
orientarem em água de baixa visibilidade.
Fig.21. Matriz de eletrodos para estimular a língua, da Wicab
EasyWalker
Feito pela Fame Electronics da Holanda. Usa infra-vermelho para
guiar o usuário para a direção escolhida em teclado, por meio de prédios
com sinais pré-instalados [TIRESIAS,03].
57
Electronic Guide Stick
Feito pela Hyderabad Science Society, da India. É uma bengala a
pilha com sensor para interagir com fio guia instalado na calçada.
Location Finder
Feito pela Maxi Aids de Nova Iorque. Ao pressionar um chaveiro
emissor, dispara um sinal no local que se quer chegar (um carro, por
exemplo).
Teletact
Feito pela New Technology for Blind People, da França. Fornece
sinais de distância, nos mesmos princípios do Polaron e semelhantes, do
formato de uma lanterna, usa ultra-som para estimar a distância a
obstáculos e fornece uma vibração como sinal de retorno.
Sonic PathFinder
Mostrado na Fig.22, é feito pela Perceptual Alternatives, da Austrália.
Usa os mesmos princípios anteriores, com estimativa de distâncias por ultra-
som, mas é feito no formato para se usar na cabeça.
Fig.22. Modelo do Sonic PathFinder
NavBelt e GuideCane
São dois equipamentos desenvolvidos pela equipe do professor
Johann Borenstein, da Universidade de Michigan, aproveitando sua
experiência no projeto de robôs móveis. Ele criou dois sistemas com
sensores de ultra-som, usando sensores da Polaroid modelo 6500 (atual
SensComp), para poder estimar a distância aos obstáculos. No NavBelt
ficam implantados em um cinto, enquanto no GuideCane simula-se um cão
58
guia, fazendo a bengala longa ficar conectada a um robô móvel, conforme
pode-se observar na Fig.23. Contudo, estes sistemas não servem para
detectar obstáculos altos como orelhões e árvores sem poda.
Fig.23. Fotos do NavBelt e GuideCane, e seus esquemáticos [BORENSTEIN,96].
E existem vários outros que medem distância por ultra-som ou infra-
vermelho, como o Walkmate da SaveMax de New Jersey, o DRO da Seal
Italiana, o GPS-talk da Sendero Group da Califórnia, o MiniGuide da GDP
Research, da Austrália, indica a distância por meio de tons audíveis.
Patente da Sony para estimulação direta não invasiva
A Sony Corporation registrou junto ao departamento de patentes dos
EUA um sistema de estimulação direta do cortex cerebral, que eles
denominam de “Method and system for generating sensory data onto the
human neural córtex”. Ela requereu inicalmente em 2000, e recebeu a
patente em 2003, com continuações posteriores, a mais recente em
dezembro de 2004 (patente US 2004/267118).
Já existem pesquisas de estimulação direta não invasiva usando
estimulação magnética transcraniana, mas que no momento é incapaz de
59
estimular com feixes finos a ponto de ativar áreas especificas do córtex. A
Sony baseia sua patente em estímulos por ultra-som, alegando uma melhor
precisão de estímulos, mas ainda não estão comprovados seus efeitos a
longo prazo, e nem foram realizados experimentos [HOGAN,05].
4.3 SOLUÇÕES QUE ENVOLVEM CIRURGIAS
Existem outras pesquisas de fundo mais ambicioso, tentando
substituir a retina ou o conjunto olho-nervo estimulando diretamente o córtex,
mas são técnicas ainda em teste. A substituição da retina ainda não funciona
totalmente, primeiramente está sendo testado o problema de possíveis
infecções, com a limitação de não atender a todas as causas de cegueira,
servindo para quem tem retinose pigmentar e degeneração macular
[CHOW,01], [MAYNARD,01].
O segundo trabalho, de estimulação direta de córtex cerebral, já foi
implantado, mas ainda fornece apenas visão de túnel, formando imagens de
apenas 8x8 pixels. De acordo com Dobelle [00] já é possível a visualização
de manchas, mas a definição está muito baixa e envolve um custo muito
grande, além de um conector no crânio que pode servir de foco de
infecções, e que impede o paciente de praticar certos esportes como
natação.
Existem também pesquisas para recuperar algumas patologias do
olho utilizando células tronco, com resultados animadores, como Michael
Young no Schepens Eye Research Institute, mas não são o foco deste
trabalho [LEUTWYLER,00].
60
55 PPRROOCCEESSSSAAMMEENNTTOO DDEE IIMMAAGGEENNSS
Algumas rotinas de pré-processamento são necessárias antes de se
enviar a imagem capturada para a pele do usuário, pois o tato tem
deficiências em relação à visão.
Como a retina tem uma camada de neurônios específicos para
detectar contornos, enquanto a pele não possui, é necessário usar técnicas
de detecção de bordas em pré-processamento no PC.
Devido à menor quantidade de receptores nervosos na pele em
relação à visão, é necessário fazer uma redução desta resolução, caindo da
ordem de 240x320 pontos para 15x20.
Como a estimulação escolhida é elétrica, em um primeiro momento
não é possível estimular níveis de cinza nem cores na pele, assim se
procede a uma binarização da imagem, apenas ativando ou não um
eletrodo.
5.1 PRINCÍPIOS GERAIS
Comparada aos equipamentos de processamento de imagem, a
imagem que a visão humana recebe é praticamente contínua, pois há
milhões de receptores nervosos (cones e bastonetes) para rebecer esta
informação. Quando se faz processamento digital de imagens, captura-se
esta imagem analógica em uma matriz de pontos, cada ponto geralmente
representando a intensidade e cor, segundo a Fig.24.
Cada ponto da imagem é conhecido como pixel, abreviatura de
picture element, e pode ser representado por um byte equivalente a 256
níveis discretos de tons de cinza, ou 3 bytes representando as 3 cores, por
exemplo RGB (vermelho, verde e azul), sistema aditivo geralmente usado
em monitores.
Outros padrões de cores existem, por exemplo, para cores
subtrativas, usados em impressoras e gráficas, quando a luz incidente é
refletida pelo papel mas sem a componente da cor. Um exemplo é o padrão
61
CMY (cian, magenta e amarelo). Os padrões aditivo e subtrativo podem ser
visualizados na Fig.25
Fig.24. Representação digital de uma imagem [CARVALHO,03].
Um outro exemplo é o padrão HSV que representa separadamente o
matiz, saturação e intensidade, importante quando se quer trabalhar
independente do matiz. Serve, por exemplo, para detectar falhas em
imagens de couro bovino. Neste trabalho não é necessário se preocupar
com codificação de cores, pois todas as imagens finais são binárias. A partir
desta imagem capturada, é possível usar algoritmos e cálculos matemáticos
para processar esta imagem e alterar suas características, tais como
contraste, resolução, melhoria da qualidade e eliminação de ruídos, entre
outras.
62
Fig.25. Cores primarias aditivas e subtrativas [GONZALEZ,92].
5.2 CAPTURA
A imagem na natureza é continua, em todos os aspectos, temporal,
de intensidade e de espacial (quantidade de pontos).
Ao se capturar uma imagem, discretiza-se a quantidade de pixels no
espaço, na horizontal e na vertical, e também o valor da intensidade de cada
pixel. Um exemplo da discretização de níveis de cinza de uma imagem pode
ser vista na Fig.26.
Fig.26. Efeito da quantização dos níveis de cinza: imagem de 240x320 pixels, com níveis de cinza indo de 256 níveis a 2 níveis (imagem binária)
16 niveis (4 bits) 8 niveis (3 bits) 4 niveis (2 bits) 2 niveis (1 bit)
256 niveis (8 bits) 128 niveis (7 bits) 64 niveis (6 bits) 32 niveis (5 bits)
63
Existem diversas maneiras de se capturar uma imagem, tais como
placa de captura e sensores de imagem, sendo a primeira usada quando se
requer uma grande precisão e resolução, como em sistemas de vistoria em
indústria. Variam também com o tipo de radiação eletromagnética ao qual os
sensores são sensíveis, pois pode-se utilizar sistemas sensíveis a luz visível
ou até calor (infravermelho) caso seja necessário em usos industriais e
médicos, por exemplo.
Uma maneira mais simples é usar sensores de imagem desenvolvidos
para webcams e câmeras fotográficas digitais, largamente utilizados
atualmente, e devido a essa alta escala de produção, economicamente
muito mais baratos e viáveis.
Os principais tipos de sensores são os CCD (charged coupled devies)
e MOS (metal oxide semiconductor), siglas que se relacionam à tecnologia
construtiva utilizada. Contudo, para a aplicação deste trabalho não é
necessário conhecer os detalhes microeletrônicos profundamente, basta que
se saiba quando utilizar um ou outro. O CCD é mais sensível à luz, podendo
ser utilizado em ambientes quase completamente escuros, abaixo de 0,1 lux,
enquanto o sensor MOS é mais voltado para aplicações portáteis ou à
bateria, pois seu consumo é muitas vezes menor que o do sensor CCD.
Para câmeras mais caras costuma-se usar três sensores, um para
cada cor. Mas para diminuir custos, os sensores mais comuns são sensíveis
às três cores (RGB) segundo um padrão de distribuição chamado Padrão de
Bayer, ou Mosaico de Cores, ilustrado na Fig.27. O verde predomina por ser
a radiação a que o olho humano é mais sensível, mas pode-se interpolar
para atingir resoluções maiores.
R G R G
G B G B
R G R G
G B G B
Fig.27. Mosaico de cores ou padrão Bayer de distribuição padrão de distribuição de cores dos sensores de imagem.[TEXAS,03].
64
Com relação à resolução, existem classificações para vídeo analógico
e vídeo digital. O padrão de cores e resoluções para vídeo analógico está
resumido na Tabela 7, enquanto a Tabela 8 resume as resoluções
analógicas e digitais também. Observe que o padrão SIF equivale a ¼ de
D1, enquanto o pequeno padrão QCIF destina-se ao uso de equipamentos
portáteis como celulares.
Tabela 7. Características principais dos formatos analógicos Tamanho
Do quadro
Taxa de
Quadros
Por segundo
Relação de
Aspecto
(horiz x vert)
Tipo de linhas
por quadro
NTSC (EUA) 720 x 480 30 4:3 Entrelaçado
PAL 720x576 25 4:3 Entrelaçado
SECAM (França) 720x576 25 4:3 Entrelaçado
HD (alta definição) 1920x1080
1280x720
704x480
640x480
24,25,30,60 4:3 e 16:9 Entrelaçado
E progressivo
Tabela 8. Resoluções comuns de imagem [TEXAS,03]. Formato analógico Nome comum Resolução digital
HDTV HD 1920x1080
XGA 1024x768
SVGA 800x600
NTSC (~PAL) D1 720x480
704x4801
VGA 640x480
CIF 352x288
VHS2 SIF2 352x240
QCIF 176x144 2VHS e SIF resultam percepção semelhante176x144 1as primeiras 16 linhas são usadas para legendas e teletexto
5.3 DETECÇÃO DE BORDA
A detecção do contorno (borda) de objetos, em inglês edge detection,
consiste basicamente em buscar diferenças bruscas na imagem, ou seja,
componentes de alta freqüência.
65
Pode-se trabalhar com técnicas no domínio da freqüência, aplicando-
se filtros passa-alta para manter as componentes de alta freqüência.
Trabalhando-se com técnicas espaciais, uma das maneiras equivale à
busca de pontos de máximos de funções por meio de derivadas, mas feito
em cada direção da imagem. Como a imagem é discreta e não contínua, a
derivada se reduz a uma equação de diferenças em cada direção, com
diferentes técnicas tentando otimizar este cálculo para obter melhores
resultados sem comprometer demais os requerimentos de processamento e
tempo gasto nele.
Uma técnica simples é fazer o equivalente a uma convolução
bidimensional da imagem original com uma janela deslizante, e cada técnica
usa janelas de diferentes tamanhos com diferentes coeficientes.
Os filtros mais conhecidos são Sobel, Canny, Roberts, Hewitt e
Laplaciana da Gaussiana, com os resultados mostrados na Fig.28. Existem
também outras técnicas com resultados mais otimizados, porém são mais
exigentes do ponto de vista computacional, como a de Marr-Hildreth e
métodos iterativos como o Chen e Medioni, descritos a seguir.
Fig.28. Exemplos de detectores de bordas mais comuns
66
.
Fig.29. Equações de implementação do gradiente para filtro de Roberts [RUSS,02].
• L.G.Roberts: detecção de bordas por meio da simples implementação
da função gradiente, com janela 2x2, mostrada na Fig.29;
• Sobel: semelhante à Roberts, mas usando janela deslizante de 3x3,
com diferentes pesos podendo enfatizar as bordas em diferentes
direções;
• Canny: mostra que em 1-D o filtro ótimo, de acordo com seus
critérios, é uma combinação linear de 4 exponenciais bem
aproximadas pele 1a Derivada da Gaussiana;
• A.Rosenfeld &M.Thurston: inclusão de uma suavização antes da
diferenciação para solução da sensibilidade ao ruído;
• M.Hueckel: desenvolveu um procedimento para o ajuste e otimização
de bordas bidimensionais, no qual os pixels de um círculo são
expandidos em um arranjo de funções bidimensionais por meio da
Série de Fourier em coordenadas polares;
• Marr-Poggio & Marr-Hildreth: definiram um esquema de detecção de
bordas, adotado como padrão, o qual primeiro tomava a convolução
do sinal (imagem original) pelo filtro LoG (Laplaciano da Gaussiana)
e, em seguida fazia a localização dos cruzamentos de zero desta
convolução;
• Torre & Poggio: uso de filtros bidirecionais baseados em derivadas
direcionais especialmente na vizinhança de cantos (corners);
• Dickey & Shuningham: definem uma borda como sendo um degrau de
descontinuidade entre regiões de intensidade uniforme e mostram
que um filtro ideal é dado por uma função de onda esferoidal;
67
• Lunscher & Beddoes: mostram que o filtro de Marr-Hildreth é
aproximadamente igual ao de Dickey & Shuningham, só que mais
simples de estudar e de implementar;
• Haralick: localiza bordas nos cruzamentos de zero da 2a derivada na
direção do gradiente;
• Shen & Castan: Propõem um "filtro linear ótimo", no qual as imagens
são convoluidas com a função f(x) = -0.5 ln(b)b(x) antes da
diferenciação;
• Shen & Medioni:método iterativo para detecção de bordas próximas.
Deve-se notar que as diferenças nas imagens resultantes das
aplicações dos filtros Sobel, Prewitt e Roberts são pouco perceptíveis,
observando que poucas bordas foram detectadas, enquanto que os filtros
LoG, Zero-crossing e o de Canny detectam regiões densas de bordas por
toda a figura, sendo este último mais eficiente. No entanto, percebe-se
também nestes filtros muito ruído.
5.4 DIFUSÃO ANISOTRÓPICA ROBUSTA
É uma técnica usada para simplificar uma imagem ao fazer a
detecção de bordas. Surgiu de analogia com conceito de difusão de calor em
termodinâmica, gerando o que se chama de espaço de escala. Assim, cada
ponto é substituído por uma média ponderada de seus vizinhos, de acordo
com uma equação de propagação com coeficientes que determinam a
velocidade da difusão e seu resultado. Para não distorcer a imagem, usam-
se diferentes pesos em cada direção, daí o nome de anisotrópica
[PERONA,90], [BLACK,98], [KIM,01], [MELO,04]. Na Fig.30 pode-se ver um
exemplo de resultado da aplicação do método.
Fig.30. Exemplo de simplificação da imagem por difusão anisotrópica robusta [KIM,01]
68
5.5 TÉCNICAS DE SEQÜÊNCIA DE ELEMENTOS DE IMAGEM
Estas técnicas são conhecidas em inglês como edge tracking e chain
code, e são úteis para criar uma seqüência de desenho dos pixels de uma
imagem, ou seja, gerar a imagem como se estivesse desenhando em uma
plotter (traçador gráfico) ou à mão livre.
Edge tracking significa acompanhamento de borda, e chain code
significa código de encadeamento. Consistem em determinar a partir de um
ponto inicial qual o próximo ponto que deve ser desenhado. Ao atingir um
último ponto de uma linha, inicia-se uma busca por nova linha até se
encontrar ou exaurir os pontos da imagem [GONZALEZ,87], [SALEM,05].
5.6 DIMINUIÇÃO DE RESOLUÇÃO
A diminuição da resolução de uma imagem consiste basicamente em
substituir um ponto por um valor baseado nos valores de sua vizinhança,
podendo este valor ser a média aritmética, mediana, máximo ou mínimo do
grupo. Quando se faz média, é necessário manter cuidado para não
distorcer o histograma da imagem, ou seja, sua distribuição de freqüência de
pontos [GONZALEZ,87].
Pode-se variar principalmente a região de abrangência dos vizinhos a
serem considerados no cálculo da média, em geral considerando-se os 4
vizinhos em formato de cruz (vizinhança-4) ou os 8 imediatos (vizinhança-8),
conforme visto na Fig.31.
Fig.31. Padrões de vizinhança: 4 em cruz; 3x3 quadrado; 5x5 octogonal com 21 pixels; 5x5 com 25 pontos; 7x7 com 37 pontos; [RUSS,02].
69
Se for necessário diminuir mais a resolução, pode-se repetir a
operação várias vezes até atingir a resolução desejada, conforme Fig.32.
Fig.32. Exemplo de imagem a ser usada, baixando de 240x320 original da Webcam até 15x20 da matriz de eletrodos
Outro cuidado a ser tomado é quando se chega nas bordas da
imagem, podendo-se repetir os pontos da coluna ou linha vizinha, ou
considerá-los em um valor padrão qualquer, com valor máximo ou mínimo
da imagem.
5.7 SEGMENTAÇÃO PARA ENCONTRAR LETREIROS
Consiste em técnicas para demarcar regiões de interesse em uma
imagem, tal como encontrar uma placa de carro em uma fotografia de multa
em radar de alta velocidade.
Neste projeto preferiu-se implementar por alternância de contraste,
uma técnica mais simples e menos exigente computacionalmente que no
protótipo 2, sem o PC, pode ser implementada diretamente no
microcontrolador.
Esta última é uma técnica simples, que apresenta bom resultado para
letreiros, baseando-se em buscar na imagem alterações periódicas entre
próximo ao máximo e mínimo nos valores dos pixels, típico de letras e
algarismos [VASCONELOS,01], [CASEY,96], [PLAMA,04],[KETELAARS,02].
70
A partir da determinação da localização do letreiro, usam-se técnicas
descritas no item anterior, de código de encadeamento, para seguir as letras
e determinar a região completa do letreiro.
Existem outras técnicas mais otimizadas, mas o foco deste trabalho
era implementar algo completo, porém não exaustivo em cada item. Sendo
assim, esta técnica já apresentou resultados satisfatórios, podendo ser
objeto de estudo posterior melhorar tais técnicas. Uma técnica que se
mostra promissora é Watershed segmentation, que simula o escoamento de
água em relevos, outras mais também podem ser encontradas na literatura
[PALMA,04], [GONZALEZ,87].
5.8 RECONHECIMENTO DE CARACTERES
Como havia a idéia de eventualmente se reconhecer os letreiros e
passá-los por estimulação em letras Braille, foi feito um estudo dos
reconhecimentos de caracteres em reconhecimento de padrões,
especificamente voltados para OCR (Optical Character Recognition) ou
reconhecimento óptico de caracteres [MORI,92], [HAYKIN, 02],
[DIETTERICH,00], [DIETTERICH,97], [PRECHELT,94], [FLEXER,1996],
[DINIZ,97] e [SILVA,2001].
Foram implementadas rotinas em MatLab para reconhecimento de
caracteres usando redes neurais artificiais do tipo MLP-BP (multi-layer
perceptron), com treinamento por back-propagation, tendo sido usada uma
base de dados de 10 mil algarismos, com 8 mil para treinamento e 2 mil para
validação da rede. Como havia diversas possibilidades, foi desenvolvida
uma técnica de comparação de desempenho das diversas redes testadas
considerando-se não apenas o acerto, mas também a dificuldade e a
conseqüência dos erros [RAMALHO,03].
Contudo, para implementação no presente sistema, optou-se por
treinar o próprio usuário em reconhecer os desenhos das letras e
algarismos, pois seria computacionalmente intensivo, consumindo ciclos de
máquina importantes no tempo de processamento do microcontrolador. Além
disso, como mostrado nos capítulos de testes e resultados, os resultados
preliminares indicaram um aumento na margem de acerto no
71
reconhecimento de padrões de cerca de 30% para cerca 80%, após um
curto período de treinamento de algumas horas, resultando em um
desempenho superior ao que normalmente se consegue em OCR.
72
66 PPRROOJJEETTOO
Inicialmente a proposta foi que se tentasse criar um sistema de visão
artificial completo, operando em tempo real, com frame rate (quadros por
segundo) próxima à usada em vídeo e televisão, procurando substituir a
visão por estímulos tácteis, elétricos ou vibro-mecânicos.
Contudo, após verificação na literatura do estado da arte em
substituição sensorial, observou-se que esta era uma proposta muito
ambiciosa para a tecnologia atual, e impossível de ser feita em um prazo de
doutoramento por um único pesquisador, ao contrário de outras
universidades e centros de pesquisa no exterior que contam com equipes
multidisciplinares.
Para focar o projeto de maneira a ser realizável no prazo disponível,
bem como de real utilidade, foram feitas diversas reuniões em instituições
para cegos, como a Fundação Dorina Nowill. Assim, definiu-se a real
necessidade dos deficientes visuais a partir das sugestões apresentadas
pelos instrutores e funcionários. Muitos deles sendo deficientes visuais
puderam descrever os problemas diários mais simples, que poderiam ser
resolvidos com um pouco mais de esforço, mas que não demorassem
décadas e nem exigissem uma equipe multidisciplinar.
O interessante é que pessoas de outra instituição de cegos chegaram
a recusar marcar reuniões, pois reclamaram que não se deviam dar falsas
esperanças ao cego fazendo tentativas para voltar a enxergar, e sim
procurar adaptá-lo cada vez mais à sua condição. É exatamente isso a que
se propõe o presente projeto.
A partir das situações levantadas durante as entrevistas, foi feita uma
seleção de quais problemas deveriam ser atacados, ou seja, a familiarização
em ambientes desconhecidos e leitura de letreiros e sinais. Assim, foi
definido quais características um equipamento para desenvolver os
experimentos em questão deveria possuir, bem como sua velocidade de
processamento, sendo possível tentar resolver como restrição de projeto, o
73
desafio de fazer um equipamento de baixo custo. Foi verificada até mesmo a
possibilidade de se adquirir um equipamento desenvolvido pelos
pesquisadores de Madison, usado também em Strasbourg, mas o custo era
proibitivo, à época mais de 70 mil dólares pelo estimulador, interface e matriz
de eletrodos [KACZMAREK,92], [SAMPAIO,01].
Optou-se então por fazer algo complexo do ponto de vista técnico,
que resolvesse os problemas propostos, mas a um custo acessível.
O sistema então foi projetado para capturar uma imagem, simplifica-la
e passá-la ao usuário via estimulação táctil. Mas o estimulador é
suficientemente flexível para possibilitar diferentes testes iniciais, o que
possibilita atualmente seu uso não apenas para o fim inicialmente proposto,
mas também para pesquisas do sistema somestésico a serem realizadas por
psicólogos experimentais e fisiologistas. Na Fig.33 pode-se ter uma visão
geral do projeto.
Fig.33. Visão geral do protótipo 1 do sistema
2
5
3
7
6
1 4
74
Legenda:
1.sensor de ultra-som – para definir distância 2.câmera – para capturar imagens 3.microcomputador – para processar a imagem 4.Kit de microcontrolador: controla quais eletrodos ativar 5.circuitos de estimulação:
placa-mãe com fonte e configuração placas de chaveamento e estimulação por coluna placa de conversão do sinal de ultra-som para emitir vibração
6.Matriz de eletrodos 7. Vibrador
Foi definida a forma de capturar uma imagem, os algoritmos para
processá-la, a construção de uma matriz de eletrodos e o tipo de
estimulação (mecânica ou elétrica). No caso da estimulação elétrica foram
projetadas várias possibilidades de ajuste. O sistema é capaz de gerar
diferentes padrões, testar entre estimulação isolada por eletrodo individual
ou por vários eletrodos simultaneamente, com sinal elétrico com nível médio
zero (sinal Bifásico) ou não (Monofásico), e diversos outros quesitos. E tudo
isso da maneira mais portátil possível, e isolado da alimentação da rede por
medida de segurança, com o fator custo baixo como premissa básica.
A estimulação eletrotáctil tem vantagens claras sobre a vibrotáctil por
não ter partes móveis, por manter contato constante com a pele durante o
movimento, por ter maior eficiência energética e principalmente por ter maior
facilidade de fabricação [CASTRO,00].
Após a busca de fornecedores adequados para um possível uso de
estimuladores vibro-mecânicos, chegou-se à conclusão que estimulação
elétrica seria a escolhida, pois estimuladores por vibração mecânica
consumem muita energia e tem sua implementação mais demorada e difícil.
Optou-se por estimulação por tensão para não haver riscos de
queimar o paciente, pois em estimulação por corrente caso o eletrodo não
tenha uma plena aderência à pele, diminui-se a área de contato do eletrodo
e aumenta a potência a ponto de poder ferir o usuário. Isto poderia ocorrer
ainda mais, pois no sistema final são 300 eletrodos em uma matriz, ao passo
que em estimulação elétrica neuro-funcional costuma-se usar poucos
75
eletrodos, na ordem de unidades, sendo mais fácil seu controle e
possibilitando o uso de estimulação por corrente.
Foi feito um primeiro protótipo em escala menor para provar os
conceitos, e só então desenvolvido um equipamento maior. Portanto dois
protótipos foram feitos, um para acionar matriz de 5x7 e outro para matrizes
de 15x20. A descrição dos sistemas implementados pode ser encontrada
nos artigos do autor a respeito e fazem parte do pedido de patente requerido
junto ao INPI [PEREIRA,06], [PEREIRA,06a], [PEREIRA,06b].
Como os experimentos incluem seres humanos, por segurança
devem ficar isolados da alimentação AC, assim usaram-se baterias
recarregáveis, importante tanto para equipamentos portáteis como para os
de aplicações médicas. As baterias escolhidas foram as de NiMH, que
apresentaram a segunda melhor densidade energética, mas que tem fator
de forma compatível com baterias comuns, e pouco efeito memória
[PEREIRA,04a].
6.1 DESCRIÇÃO DOS EQUIPAMENTOS E PROGRAMAS
Como descrito no capítulo de introdução, o protótipo 1 implementado
consiste de câmera, PC (microcomputador), placa de microcontrolador,
equipamento estimulador e matriz de eletrodos.
Complementar a ele existe um circuito de ultra-som com sensor e
saída inversamente proporcional à distância do obstáculo, para acionar um
vibrador constituído de um motor excêntrico. Este sistema auxiliar serve para
estimar a distância, que não é obtida pela falta de estereoscopia. Por
exemplo, o usuário tem que saber discernir se à sua frente está uma mesa
pequena próxima ou uma mesa grande distante.
A imagem é capturada e enviada ao micro para processamento, que
consiste em transformar em tons de cinza, simplificar a imagem e detectar
contornos, diminuir resolução e transferir ao microcontrolador. Este é usado
por possibilitar um melhor controle da temporização do equipamento
76
estimulador do que programas em PC rodando algum sistema operacional
multitarefa que não seja de tempo real, tal como Windows ou Linux.
Devido à multidisciplinaridade do projeto, descrita no capítulo de
introdução, após um estudo preliminar, foi decidido simplificar os estímulos
trabalhar apenas com estimuladores elétricos e não com vibradores
mecânicos, pois seria necessário um estudo de miniaturização mecânica
que não seria factível no tempo disponível para execução de um programa
de doutorado. Contudo, se necessário o equipamento projetado para
controlar os estímulos também pode controlar o acionamento de vibradores
mecânicos em vez de enviar estímulos à uma matriz de eletrodos.
6.2 CAPTURA DE IMAGEM
No apêndice 10 pode ser encontrado um histórico das decisões de
projeto e sua evolução. Porém, pode-se resumir que a melhor opção foi usar
inicialmente no protótipo 1 uma webcam conectada a um PC, pois facilita a
depuração usar um hardware já funcionando, e porque existem bibliotecas
de acesso a essas câmeras nas duas ferramentas usadas para prototipar o
sistema, Java e MATLAB.
Para o segundo protótipo optou-se pelo uso do kit C328, que usa
interface serial. Ele inclui um sensor de imagem da OV6740 integrado a um
chip de controle de comunicação serial e compactação JPEG, que no caso
deste projeto não seria necessária.
6.3 MICROCONTROLADOR
Para agilizar o desenvolvimento e diminuir a quantidade de itens a
depurar no protótipo 1, foi decidido usar uma placa de microcontrolador
pronta. Foi escolhido um compatível com 8051 pelo fato do autor já ter
utilizado o componente previamente, diminuindo a curva de aprendizagem e
os fatores de erro, e por ser de velocidade suficiente para a aplicação,
conforme descrito no item 6.7.6. No protótipo 1 foi usada uma placa cedida
pela CNZ, e no protótipo 2 foi criada uma placa usando 8051 compatível da
Atmel.
77
6.4 ELETRO-ESTIMULADOR
O sistema para estímulos elétricos realiza 3 funções para cada
canal/coluna a ser estimulada:
• Gera a forma de onda,
• Amplia esse sinal para a tensão necessária para ativar os receptores
nervosos da pele,
• A partir de um sinal de controle, comuta esse sinal de maior nível de
tensão até cada um dos taxels (eletrodos) que deve ser ativado para o
correspondente pixel da imagem simplificada (ou letreiro) que estiver
ativo, baseado na informação recebida serialmente do PC.
Normalmente a segunda e terceira funções podem ser implementadas
em um mesmo circuito.
De acordo com a revisão da literatura, deve-se gerar um trem de
pulsos com intervalo entre as rajadas, conforme figura 9 do capítulo 2, com
os melhores resultados tendo sido alcançados com trens de pulso da ordem
de 200µs de duração e ciclo de trabalho de 50%, mas podendo-se ajustar.
Costuma-se usar 4 ou 5 pulsos em cada rajada, com espera de cerca de 20
a 25 ms até a próxima rajada [NOHAMA,97], [WAY,97], [KACZMAREK,91],
[KACZMAREK,00], [SUMMERS,92].
Nas Fig.34, Fig.35 e Fig.36 podem ser observados os resultados dos
circuitos desenvolvidos neste trabalho, quando a sensação de vibração mais
confortável foi obtida com pulsos de freqüência de 5 kHz e envoltória de 100
Hz, ou seja, pulsos de 200µs de período, ciclo de trabalho de 40% (80µs em
cima e 120µ nível baixo), com 5 a 10 pulsos por rajada e intervalo entre
rajadas de 8ms.
78
Fig.34. Trem de pulsos antes da etapa de amplificação
•
Fig.35. Trem de pulsos antes da amplificação
Fig.36. Trem de pulsos após a amplificação, com distorção devido à saturação do núcleo do transformador de pulso.
O nível médio do sinal pode ser nulo ou não. Alguns autores alegam
que o nível médio diferente de zero pode com o tempo ionizar a pele em
contato com o eletrodo, provocando queimaduras, e recomendam usar nível
médio nulo. Assim, os elementos de chaveamento devem conduzir nos dois
sentidos, e mais será comentado adiante [KACZMAREK,91].
79
Outros autores alegam que quando o sinal tem nível médio nulo é
necessária uma intensidade maior do sinal, resultando em maior
desconforto. Por isso foi preferível deixar o hardware mais flexível e testar
este item também [KACZMAREK,91].
Além disso, foi descoberto mais tarde no decorrer dos testes que, se
for colocado um tempo morto entre os ciclos positivo e negativo, o circuito de
ampliação pode diminuir suas perdas e consumir menos bateria, podendo
aumentar sua duração ou mesmo usar transformadores e transistores
menores. Este é o tipo de modulação BFM, usado por Szeto e Rizzo
[SZETO,77].
A seguir são descritos alguns dos circuitos atuais. Uma descrição das
decisões tomadas durante o projeto, com outras idéias iniciais que foram
tentadas e descartadas estão descritas no apêndice 10. Elas foram incluídas
para facilitar a quem tiver interesse de replicar os resultados daqui, sem ter
que cometer os mesmos erros.
6.4.1 Circuito de endereçamento
Definiu-se uma arquitetura parecida com a de microcomputadores e
barramentos padrão como STD BUS e NUBUS. Para permitir uma melhor
visualização dos leds indicativos dos eletrodos ativados, e para permitir uma
maior flexibilidade e escalabilidade, foi definido que seriam feitas placas de
estímulo, uma para cada coluna da matriz de eletrodos. Estas placas são
colocadas sobre uma placa-mãe verticalmente, como em um PC. No
protótipo 1, de 5x7 foram 5 placas de 7 eletrodos, no protótipo 2, de 15x20,
foram 15 placas de 20 eletrodos.
O endereço do eletrodo é definido enviando-se primeiramente o
endereço da placa, que consiste de 4 bits, e depois o padrão de quais
eletrodos devem ser ativados simultaneamente por meio de um latch.
Assim, a seleção de coluna é feita por comparação de endereços
codificados com pinos vindos diretamente do microcontrolador sendo
comparados com 4 jumpers locais em um 7486. Isto permitiria até 16
endereços, mas um fica reservado para que ao ativar as colunas de
80
eletrodos, exista um endereço vago para mudança de colunas, permitindo
manter uma coluna enquanto vai endereçar outra; isto pode ser visto no
esquema elétrico do apêndice 5, mas analisado em detalhes adiante no
texto.
A seleção de eletrodos era feito inicialmente com multiplex permitindo
acionar apenas um eletrodo, mas depois foi alterado para usar um latch
74573, permitindo ativar até todos os eletrodos de uma coluna; e com o OE
(output enable) é possível desligar todos os eletrodos de uma vez; usou-se o
74573 por ter entradas e saídas alinhadas e facilitar o layout da PCI.
6.4.2 Circuito de amplificação do sinal e chaveamento
O circuito tem uma placa para controlar cada coluna da matriz de
estímulos, todas colocadas em um barramento comum de placa-mãe. Cada
placa pode servir de mestre (gerar e enviar), escravo (receber) ou
independente (gerar apenas para si) tanto o sinal de baixa tensão (cerca de
6 V) ou de alta tensão (cerca de 30 a 70 V). Assim, a placa do protótipo 1 de
5x7 tem os seguintes itens:
• Seleção de coluna, com o comparador 74HC86 que aciona a trava (latch;
• 4 Jumpers para configurar o endereço de cada placa;
• Seleção do eletrodo na placa, via 74HC573;
• Oscilador para geração dos pulsos por hardware, usado inicialmente,
baseado em dois 555 e potenciômetros para ajuste de freqüência de
rajada (burst), freqüência de modulação (para limitar o número de pulsos)
e o ciclo de trabalho dos 2, permitindo ajuste. No protótipo 2 isto foi
eliminado, deixando a geração apenas por software;
• Jumpers para permitir que o sinal de oscilação possa ser transferido para
a seção de amplificação, ou receber o sinal de oscilação de fora;
• Amplificador inicialmente baseado em transistor Darlington e
transformador de pulso, com ajuste de nível de tensão, mas que
apresentava problemas de sensibilização dos usuários. A tensão no
transformador era fixa, e ao ajustar a corrente de base transistor, ao sair
do corte o início do estímulo era repentino, com tensão já relativamente
81
alta. Para ir ajustando o nível de intensidade da tensão, o transistor
operava na região linear, consumindo mais bateria. Em uma segunda
etapa, mudou-se para o transistor operar na região de corte/saturação de
uma tensão ajustada por um regulador LM317, aumentando a autonomia
e melhorando a sensibilidade do usuário. No protótipo 2 é adotado
conversor DC-DC de maior eficiência para ajuste da tensão;
• Leds para indicar qual padrão de estimulação o usuário esta recebendo,
servindo para depurar possíveis falhas e problemas. Mas existe um
jumper para opcionalmente cortar a alimentação dos leds e economizar
bateria;
• Jumpers para configurar cada placa para servir de mestre, escravo ou
independente para os sinais de oscilação tanto de baixa como de alta
tensão, conforme visto na Fig.37 e detalhado no apêndice 6. Ou seja, a
placa pode receber de fora o sinal de baixa tensão, gerar apenas para si
ou gerar e exportar para as demais placas, o mesmo valendo para o sinal
amplificado.
Fig.37. Esquema de cada placa de estimulação do prototipo1
Foi feita também uma placa-mãe em que as outras se encaixariam,
contendo jumpers de configuração e circuitos de alimentação, chave de
pânico (liga-desliga), conectores para acessar o microcontrolador e
regulador de tensão. Tudo foi colocado em uma caixa plástica, junto com um
mini-ventilador, para resfriamento dos reguladores de tensão, e bateria
recarregável, conforme mostrado na Fig.38 e na Fig.39.
82
Fig.38. Placa para estimulação de cada coluna de eletrodos; os leds ficam no topo, formando a imagem quando várias placas estão na vertical e em paralelo na placa-mãe.
Fig.39. Montagem das 5 placas, faixa abdominal para fixação e matriz de eletrodos do protótipo1.
6.4.3 Alimentação
Utiliza-se conjunto de pilhas recarregáveis 12 pilhas de NiMH, 1,8 AH
ou mais, permitindo autonomia para cerca de 2 horas de uso. Em estudo
específico foram escolhidas a de níquel metal hidreto (NiMH) por ter efeito
memória menor e maior capacidade de corrente que níquel cádmio. As de
Lítio-ion não apresentam efeito memória e tem densidade de corrente maior,
mas seus carregadores são especiais, seu custo é muito maior e seu
formato não segue padrão de tamanho habitual (AA) por ter a voltagem de
sua célula praticamente o dobro, 3 V, enquanto as de NiMH ficam próximas,
em 1,2 V. Esta diferença não se nota, pois pilhas normais têm tensão
nominal de 1,5 V, mas que caem rapidamente PEREIRA,04a].
83
A alimentação percorre dois reguladores, um 7805 para alimentar a
parte digital de endereçamento, e um LM317 cujo ajuste é feito pelo usuário,
permitindo uma variação continua da tensão máxima que chega ao primário
do transformador da etapa da amplificação e, por conseguinte a tensão
máxima do secundário que chega ao eletrodo.
6.4.4 Amplificação
Na Fig.40 é mostrado o circuito de amplificação do trem de pulsos,
consistindo basicamente de um transistor Darlington chaveando sob controle
do microcontrolador, e transformador de pulso para elevar a tensão. O diodo
é apenas para descarregar a energia armazenada no núcleo do trafo e
proteger o transistor. Não é mostrado na figura, mas no secundário do trafo
há em série uma associação paralela de jumper e diodo. Quando o jumper
está colocado, o eletrodo recebe sinal bidirecional, quando o jumper está
retirado, o diodo é inserido no circuito e o sinal vira monofásico, circulando
em apenas uma direção.
Fig.40. Etapa de amplificação com TIP e transformador de pulso
O barramento tem pinos duplos por facilitar a montagem e aumentar a
rigidez mecânica, usando barras de pinos paralelos e conectores latch. Na
realidade são 3 grupos de pinos em 3 conectores separados e sua
configuração pode ser consultada no apêndice 6:
84
• Endereço de linha e coluna:
o 4 pinos duplos para coluna codificados;
o 7 pinos duplos, um para cada linha da coluna;
o 1 pino duplo de OE do latch, para desligar todos juntos por
software;
• Barramento de alimentação de baixa tensão e pulsos
o 2 pinos duplos para +V e 4 pinos duplos para –V para 555 e TIP;
o 1 pino duplo para sinal de saída de oscilador. Deve-se configurar
as placas para apenas uma ser configurada como mestre: podem
ser configuradas como um mestre e os outros escravos, ou todos
independentes ou todos escravos para quando o sinal vem de um
pino do microcontrolador;
o 1 pino duplo para +5 V, para os 74XX;
o 1 pino duplo vago para expansão;
o 1 pino duplo para o terra dos leds, permitindo que todos sejam
desligados quando se faz testes em videntes ou se queira
economizar energia das baterias;
• Barramento para alta tensão (AT), mas deve-se configurar as placas para
haver no máximo só uma placa mestre exportando sinal. Podem ser
configuradas como todas escravas, todas independentes, ou uma mestre
e o resto escravo. São 8 pinos, 4 para ida e 4 para retorno. (2 duplos
cada).
Assim, são 3 conectores, 26 pinos para endereço, 10 pinos para
oscilação de baixa tensão, e 8 para alta tensão.
Na placa-mãe existem trilhas e jumpers para configurar se todas as
placas receberão o mesmo sinal de AT, ou se cada placa receberá um sinal
individualizado, permitindo o uso de uma placa externa opcional como fonte
para experimentos não previstos. Foi desenvolvida uma placa para testes
85
iniciais, inclusive com fonte de corrente, cujo circuito está no apêndice 12,
mas depois não foi necessário usar permanentemente, pois em testes
preliminares verificou-se que o circuito de estimulação por tensão projetado
em cada placa fornecia sensibilidade adequada;
6.4.5 Chaveamento
O sinal de trem de pulsos gerado é amplificado em cada canal de
estimulação, e o sinal então de alta tensão (cerca de 30 a 70 V) de cada
placa, que corresponde a uma coluna da matriz, deve ser chaveado para
cada eletrodo que deva receber este sinal.
Como o equipamento se destina também a pesquisas do sistema
somestésico, era desejável que pudesse ser testado com sinais monofásicos
e bifásicos. O chaveamento para ser bifásico (nível DC não nulo) deveria ter
um elemento que pudesse conduzir sinal em ambos os sentidos.
Foram testadas diversas opções descritas no apêndice 10, tais como
transistores MOSFET, pontes H, pontes integradas em CIs, optoacopladores
em contraposição, matrizes de comutação telefônica, MOCs
(optoacopladores com saída em TRIAC) e finalmente relés de estado sólido
(solid state relays - SSR) e optos mais pontes de diodos.
A solução com melhor desempenho foi a do SSR, pois permite
condução em ambos os sentidos e um isolamento necessário para
segurança do usuário, separando a parte de comando da parte de potência.
Cada placa do protótipo 1 foi feita com 7 SSR, um para cada eletrodo,
conforme visto na Fig.41
Fig.41. Circuito de chaveamento do sinal de alta tensão
86
O SSR tem na entrada um led emissor, tal qual um MOC ou 4N25 ou
4N38, mas com chaves MOS na saída. Assim, funciona exatamente como
um relé, mas apresentando resposta rápida e sendo mais compacto.
Usam-se os SSR da Metaltex, que não apresentam queda de tensão
quando conduzem, tendo sido testado até 10 KHz sem problemas, apesar
da freqüência de operação ser no máximo por volta de 5KHz. Um mesmo
neurônio não consegue responder em freqüências acima disto devido a seu
período refratário, mas outros neurônios vizinhos podem responder,
permitindo a estimulação até cerca desta freqüência.
6.5 MATRIZ DE ELETRODOS
Para estimular os mecanoreceptores da pele, fez-se uso de matriz de
eletrodos concêntricos, cujo tamanho e espaçamento dos eletrodos está de
acordo com sugestões da literatura, revisadas em [NOHAMA,97],
[SUMMERS,92] e [KACZMAREK,91], sendo mais indicado para este caso os
eletrodos concêntricos de estimulação cutânea.
Após alguns testes e idéias descritas no apêndice 10, chegou-se à
conclusão de fazer dois tipos de matrizes: uma de fibra para o prototipo1 e
outra de circuito impresso flexível para o protótipo 2.
A primeira, de 5x7 para o protótipo 1 foi feita usando placa de circuito
impresso (PCI) rígida de fibra, com eletrodos feitos de níquel, soldados
sobre a placa. Os 35 eletrodos são organizados em 5 colunas de 7 eletrodos
cada, resultando em um tamanho aproximado de um maço de cigarros.
O anel externo e o pino central de cada eletrodo foram feitos de níquel
soldado sobre a placa. A conexão é feita por meio de soldagem de barra
paralela de pinos, em que se encaixam 5 conectores latch de 10 pinos cada,
um para cada coluna, conectando-se à placa correspondente por meio de
flat cable (cabo multivias). São 7 pinos centrais e 1 pino de retorno comum
por coluna, mas usou-se conector de 10 pinos porque não se encontrou o de
8 pinos. O desenho do circuito está na Fig.42, e uma foto da placa em fibra
pode ser vista na Fig.43.
87
Fig.42. Circuito da matriz de eletrodos feita em fibra
Fig.43. Foto da placa da matriz de eletrodos em fibra
Foram feitas algumas placas em dupla face, uma para soldar os anéis
para o eletrodo e seu uso em estimulação dos usuários, fixado por faixa
abdominal conforme mostrado na Fig.43. Uma outra placa maior, com mais
espaçamento e eletrodos maiores foi feita para realizar testes específicos,
mas será visto no capítulo de resultados que a menor resultou em melhor
eficiência.
Uma placa foi também utilizada para realizar testes de circuito com
carga sem precisar estar usando a faixa, usando resistores de 2.5W e 1KΩ,
e capacitor de 10nF no lugar dos eletrodos para simular a pele, mostrado na
88
figura 59 do apêndice 7. Nesta mesma figura é mostrada uma placa feita
para facilitar a medição de corrente de estimulação, usando conector tipo
Jack P1 para interromper o fluxo de corrente. A placa conecta-se por cabos
multivias entre as placas de estímulo e a da matriz de eletrodos, contendo
40 conectores P1 fêmea, um para cada coluna, e mais um para cada um dos
35 eletrodos, permitindo medir com um multímetro “true-RMS” (Fluke87) com
pontas de prova adaptadas a um conector P1 macho. Quando se quer medir
a corrente, basta inserir o P1 para ele entrar em série com o circuito.
Fig.44. Placa de eletrodos em fibra, com a faixa de fixação, e instalada.
6.6 PROGRAMA DE CONTROLE
Este programa é executado no kit de microcontrolador compatível
com 8051, sendo feito em linguagem C. É o responsável principalmente pela
ativação dos taxels (eletrodos) que devem ser ativados, correspondentes
aos pixels que estão acionados na imagem simplificada vinda do PC.
Efetua ainda mais duas tarefas: faz a comunicação serial com o PC,
lendo um buffer gerado pelo programa que trata a imagem, e faz os ajustes
de configuração do estímulo gerado no sinal de controle em um pino de IO
do microcontrolador. Estes ajustes envolvem:
• Largura de cada pulso positivo;
• Ciclo de trabalho (equivale a ajustar a freqüência do pulso);
• Quantidade de pulsos por rajada (burst);
• Intervalo entre rajadas de pulsos;
• Padrão geométrico ou imagem recebida pelo PC
89
Por hardware são feitos os demais ajustes:
• por um potenciômetro multivoltas com o qual o próprio usuário pode ajustar a amplitude do sinal,
• por jumper a escolha entre sinais com média DC nula ou não (bifásico ou monofásico),
• por jumper a geração de pulsos positivos e negativos com tempo morto entre eles.
Este último é gerado na placa mãe a cada 2 pulsos sendo alternado
por meio de um divisor de freqüências implementado com flip-flop tipo D.
Este tempo morto na realidade é usado para diminuir as perdas no circuito
de ampliação do sinal (transformador de pulso e transistor), e, por
conseguinte o consumo de bateria.
No futuro poderão ser feitas melhoras para testar mais idéias,
algumas adiantadas a seguir:
• Nível de tensão do estímulo, não apenas on-off como hoje, para que
possam ser implementados testes:
o Usar envoltórias entre elípticas no trem de pulsos, melhorando o
conforto dos estímulos (hoje poderia ser feito usando um circuito
modulador externo), de acordo com Nohama [95].
o Usar o fenômeno de integração para toda a matriz, para criação
de eletrodos virtuais intermediários entre cada 2 colunas (limitação
do desenho da matriz, com um retorno por coluna) [NOHAMA,97],
[TAN,97], [SHIRAI,00]. Relembrando, o fenômeno ocorre quando 2
eletrodos vizinhos estão ativos. Se tiverem a mesma intensidade,
fica no meio, se não a sensação é percebida perto do eletrodo
com sinal mais intenso. Isto vai envolver uma mudança no
hardware, incluindo um ou dois conversores D/A ligados ao
microcontrolador (ou DSP, se for mudado o processador). O
problema é que os microcontroladores e processadores DSP, em
geral, podem ser encontrados com opções de conversores A/D
embutidos, mas não D/A. Até porque em geral é necessário um
90
circuito de condicionamento de sinal na saída de um sistema de
DSP para acertar ao nível externo de onde for atuar, e com filtro
passa-baixa para eliminar harmônicas e suavizar o sinal.
A interface de configuração é composta de três teclas, semelhante a
ajuste de relógio de pulso, sendo duas para ajuste da seleção atual subindo
ou descendo, e uma terceira para aceitar o ajuste escolhido e partir para o
ajuste da próxima característica da estimulação.
A atual opção default dos ajustes foi fixada no código fonte, após
testes com alguns usuários, sendo escolhida a configuração que forneceu
melhor sensibilidade à maioria.
Além disso, nos testes de padrões geométricos, utilizados para
treinamento dos usuários, o equipamento pode ser operado independente do
PC, usando um menu para seleção do tipo de padrão geométrico a ser
gerado. No teste ligado ao PC, recebendo a imagem da Webcam após
tratamento digital, deve-se usar a opção default, que equivale a usar o menu
de escolha de padrões geométricos e selecionar o recebimento da imagem
via porta serial do PC.
Maiores detalhes sobre os testes estão no capítulo 7, mas pode-se
resumir que os padrões de treinamento e testes usados incluem reta
horizontal, vertical, inclinada para cima e para baixo (diagonais), quadrado
pequeno e grande, retângulo pequeno e grande, triângulos em 4
orientações, círculo, letra E em 4 orientações, várias letras e algarismos.
Permite-se ainda ajustar o método de estimulação, em coluna
individual, coluna mantendo a anterior, carimbo (todas as colunas ao mesmo
tempo), e taxel individual (semelhante à escrita manuscrita), que resultou na
melhor taxa de reconhecimento.
Finalmente, ajusta-se também o tempo de permanência aceso para
cada coluna ou taxel, e o tempo apagado ao final de cada imagem
estimulada até iniciar a próxima.
91
6.7 PROGRAMAS DE PROCESSAMENTO DE IMAGENS
Todos os programas de processamento de imagens foram
desenvolvidos inicialmente em MATLAB 6.5 por permitir prototipação rápida,
incluindo diversas rotinas de detecção de bordas e diminuição de resolução.
Depois os algoritmos desenvolvidos foram portados para Java, pois
para capturar imagem vinda da webcam usa-se a a biblioteca JMF da Sun,
Java Multimídia Framework, que já traz alguns programas de exemplos. Por
exemplo, rotinas para converter padrão RGB de 24 bits para tons de cinza,
rotina de binarização, com escolha do limiar de corte (threshold), e
implementação de um filtro detector de borda espacial na forma de matriz
3x3, em que se pode alterar os pesos e simular diferentes filtros.
Posteriormente, a partir do MATLAB 7.0, o lançamento do Image
Acquisition Toolbox facilitou o desenvolvimento de algoritmos e testes em
tempo real da imagem da câmera. Uma toolbox é uma biblioteca de
programas que rodam em MATLAB, neste caso criada para capturar
imagens por meio da API Vídeo for Windows, que acessa webcams e outros
dispositivos de imagens como scanners.
Simulou-se diversos algoritmos, com o melhor resultado sendo
alcançado com a seguinte seqüência de operações:
• conversão para tons de cinza,
• simplificação da imagem,
• detecção de bordas,
• binarização,
• diminuição de resolução.
Testou-se vários tipos de detecção de borda, com o melhor resultado
obtido pelo LOG (laplaciana da gaussiana).
6.7.1 Binarização
Na binarização foi implementada uma solução de acordo com
NiBlack, em que se faz determinação de limiares regionais em vez de global,
92
útil quando a iluminação não é uniforme por toda a imagem. A Fig.45 mostra
claramente a vantagem do método.
Fig.45. Comparação da binarização tradicional, limiar global médio, com limiar 0,3 e 0,6, e por Niblack (limiar regional)
6.7.2 Diminuição da resolução
Na resolução foram testadas diminuições progressivas de 240x320
até 15x20, caindo a ¼ de cada vez. Assim, foi-se de 240x320 para 120x160,
60x80, 30x40 e finalmente 15x20, conforme ilustrado na Fig.32.
Ressalta-se que a diminuição feita nesta ordem requer que se use
ponto de mínimo em vez de média, para manter as bordas encontradas na
93
etapa anterior. A média suavizaria o sinal, tendendo a apagar as retas das
bordas.
Até a resolução de 30x40 visualmente ainda é possível reconhecer a
imagem original, mas com 15x20 torna-se difícil o reconhecimento.
Porém, pode-se implementar com esta resolução sem baixar a
quantidade de informações, apenas usar uma janela deslizante sobre a
imagem maior de 30x40.
Existem planos para no futuro também ser utilizado fenômenos de
integração espacial para gerar uma resolução maior, por meio de “eletrodos
virtuais”.
6.7.3 Simplificação
Foram implementadas rotinas de simplificação usando difusão
anisotrópica por espaço de escala, mostrada na Fig.46, e algoritmos para
espessar as linhas dos contornos são baseados em morfologia matemática.
Fig.46. Imagem simplificada por difusão anisotrópica com k = 0.02, ? = 0.25, 60
iterações, com k = 0.02, ? = 0.25, 60 iterações.
6.7.4 Letreiros
Também foram implementadas em MATLAB rotinas básicas de
segmentação de imagem para encontrar letreiros, fazendo um zoom in
94
(aproximação) sobre este letreiro, enviando o desenho do contorno dos
caracteres ao equipamento para estimulação.
Existem vários algoritmos de extração de letreiros, especialmente
usados em placas de veículos, mas estes têm sua aplicação mais restrita,
pois já se sabe de antemão a quantidade de caracteres, distância do solo e
tamanho da placa [VASCONCELOS,01], [KETELAARS,02], [DESOUZA,00].
Para este trabalho foi implementado um algoritmo de segmentação de
caracteres baseado em “run length encoding”, que codifica a imagem
usando o comprimento de seqüências de zeros e uns em cada linha. Faz-se
então a média e desvio padrão destes segmentos para cada linha.
A linha que tiver maior quantidade de pixels pretos e menor desvio
padrão tem maior probabilidade de conter caracteres. Quanto menor o
desvio padrão, mais uniforme são os segmentos desta linha. Assim, cria-se
um índice da divisão de quantidade de pixels pretos pelo desvio padrão da
linha. As linhas que estiverem com este índice bem baixo são as melhores
candidatas, sendo separadas. Repete-se o processo para separar as
colunas dentro das linhas previamente separadas, e assim o contorno dos
letreiros é separado do resto da imagem.
É importante destacar que pensou-se em desenvolver síntese de voz,
mas isto limitaria o uso do equipamento por pessoas surdo-cegas. Alem
disso, implicaria implementar técnicas de reconhecimento óptico de
caracteres (OCR), para separar e reconhecer cada caractere do letreiro.
95
Fig.47. exemplo`s de imagem processada para encontrar letreiro, usando binarização por Niblack, segmentação do letreiro por desvio padrão de run length coding, e resultado da
segmentação
Fig.48. Desvio padrão por linha da imagem da figura anterior: os menores indicam a linha com caracteres.
6.7.5 Reconhecimento de caracteres
Foi estudada a possibilidade de uso de redes neurais artificiais para o
reconhecimento de caracteres, comparando resultados de diferentes
implementações, funções e parâmetros diversos de RNAs de caracteres
obtidos em [LE CUN, 02], usando técnicas descritas em [HAYKIN, 02],
[DIETTERICH,00], [DIETTERICH,97], [DINIZ,97], [FLEXER,1996],
96
[PRECHELT,94] e [SILVA,2001]. Aliás, o cálculo do índice usado para
comparar RNAs (e outros aproximadores de funções) é normalmente o
método dos mínimos quadrados. Como fruto de estudos para este projeto foi
proposta uma nova metodologia para comparação de desempenho de redes
neurais, baseada não apenas no acerto simples, mas corrigindo-se o índice
de acertos por uma média ponderada dos erros, subdivididos em classes
segundo sua dificuldade e/ou conseqüência, e associados pesos a estes
erros [RAMALHO,03].
Com os resultados preliminares obtidos pelos reconhecedores de
caracteres por RNAs, foi definido que seria mais rápido e seriam obtidos
resultados melhores se o próprio usuário fosse treinado para reconhecer os
padrões dos caracteres, em vez de se treinar uma RNA, já que este não era
o foco principal do trabalho.
6.7.6 Estimativa de Tempo de Processamento do protótipo 1
No protótipo 1, no PC a imagem é recebida da webcam em formato
RGB e resolução de 240x320 pixels, requerendo conversão em tons de
cinza, binarização e diminuição de resolução, além da detecção de borda e
segmentação de letreiros. O processador escolhido deve ser capaz de fazer
as funções abaixo:
• Recepção da imagem do PC ou do sensor de imagem, serialmente;
• Geração do trem de pulsos da estimulação;
• Endereçamento de cada eletrodo da matriz;
• Processamento da imagem (apenas no protótipo 2).
Um microcontrolador compatível com o 8051, tal como o 8952 da
Atmel, executa cada instrução na média de 12 ciclos de máquina. Operando
com clock de cerca de 12 MHz, então cada instrução demora
aproximadamente um microssegundo para ser executada.
Para a escolha do microcontrolador do protótipo 1 foram consideradas
apenas as três primeiras tarefas, já que o processamento digital de imagens
no protótipo 1 é feito no PC, portanto não influencia qual processador usar,
permitindo o uso de kit pronto de 8051. No entanto, no protótipo 2 há uma
97
limitação nos tipos de algoritmos implementados, descritos com mais
detalhes anteriormente.
Nos testes executados chegou-se à conclusão que a melhor resposta
ocorre quando estimulado taxel a taxel, sequencialmente como se estivesse
desenhado com uma caneta. Assim, envia-se a imagem tratada digitalmente
pelo PC na forma dos dados necessários para o microcontrolador ativar os
eletrodos em suas respectivas placas. Se configurado para testes
somestésicos, poderiam ser enviados códigos para ativar até uma coluna
inteira de eletrodos de cada vez.
Desta maneira, o método de enviar a imagem consiste em enviar três
bytes para cada taxel: dois para indicar as máscaras usadas para endereçar
a coluna e um para indicar o taxel a ser ativado na coluna. Na pior das
hipóteses, a imagem completa ativaria todos os 35 taxels, mas isso não faz
sentido, em geral uma imagem não ativa nem 30% deles.
À taxa de 9600 bits por segundo pode-se então enviar 1/3 dos 35
pixels em 0,03 segundos, conforme o cálculo:
12 taxels/imagem x 3 bytes/taxel x 8 bits/byte /9600 bps = 0,03 segundos.
Sistemas semelhantes da literatura indicam que um usuário demora
mais de um minuto para reconhecer imagens, o que foi confirmado pelos
resultados obtidos com este sistema, descritos no capítulo 8. Portanto, neste
intervalo sobra muito tempo para o resto do processamento.
A geração do trem de pulsos se dá por interrupção ativada pelo timer
interno, sendo de rápida execução, bastando apenas alternar pinos de IO
quando entra na interrupção a cada poucos milisegundos. Definindo-se as
rajadas de trem de pulsos de 5 kHz, ativadas em 100 Hz, resulta cerca de 10
interrupções a cada rajada, ou 1000 alternâncias por segundo. Como cada
interrupção demora cerca de 10 µs, utliza-se 10 x 1000 = 10 ms para gerar o
trem de pulsos em cada segundo, ou menos de 1%. Em testes realizados
com o código da rotina de timer implementado em assembly, o pulso mais
estreito possível com 8952 a 12MHz foi de cerca de 20 µs, o que é bem
mais rápido que a capacidade dos neuroreceptores da pele.
98
Foi visto na descrição do hardware que o circuito projetado usa placas
individuais para controlar cada coluna (ou linha se girado 90 graus) da matriz
de eletrodos. Para endereçar um eletrodo é necessário primeiro enviar o
padrão de eletrodos a serem estimulados naquela coluna e só então enviar o
endereço da respectiva coluna. Contudo, o endereçamento é feito com
poucas instruções, resultando poucos microssegundos entre o
endereçamento e envio de uma coluna e da seguinte. O endereçamento de
cada eletrodo é feito enviando os 3 bytes citados a cada imagem, resultando
alguns microssegundos para cada taxel. Para ser exato, cerca de 10 µs por
taxel, como são 35, ficaria uma imagem inteira enviada em cerca de 350 µs.
Mas para melhorar o reconhecimento, deve-se esperar um tempo
entre um taxel e outro, senão o usuário percebe como sendo ambos
ativados simultaneamente. Testes dos ajustes preliminares indicaram que o
melhor resultado obtido foi com espera entre ativação de eletrodos de cerca
de 500 ms. Também ao final de cada imagem é inserida uma pausa para
diferenciar entre o início e final de uma imagem, ajustado em
aproximadamente 1 segundo.
Conforme mencionado, está demonstrado no capítulo de resultados
que o usuário demora um tempo da ordem de um minuto ou mais para
reconhecer imagens simples. Considerando-se um tempo de um minuto, um
8952 pode executar 60 x 12 milhões de instruções neste intervalo, sendo
suficientemente rápido para viabilizar a escolha do método de estímulo,
podendo ser por eletrodo, por coluna ou até mesmo simular ativar todas as
colunas simultaneamente. Pode-se adiantar que nos resultados foi
observado que o melhor reconhecimento é alcançado quando se estimula
taxel a taxel.
6.7.7 Processador escolhido
Para o protótipo 1 foi usado um kit de desenvolvimento de
microcontrolador compatível com 8051, que contém um 8952 ATMEL, porta
serial, display de cristal líquido, 12 pinos de IO disponíveis e apenas 4
teclas, usadas para a escolha de parâmetros de estimulação e nos testes de
99
padrões geométricos, possibilitando que estes últimos fossem realizados
independentes do PC.
Devido à limitação de 4 teclas, foi implementada uma interface
homem-máquina simples, semelhante ao ajuste de relógios de pulso. Para
cada item a ser ajustado, uma tecla sobe a escolha da seleção, outra desce,
e uma terceira aceita a seleção, com o LCD então mostrando o próximo
ajuste a ser feito. Após todos os ajustes (largura do pulso, quantidade de
pulsos, tempo de pausa entre taxels e entre imagens, padrão a ser
estimulado, método de estímulo, entre outros) terem sido feitos duas vezes,
a estimulação é iniciada.
Para o protótipo 2 foi usado também microcontrolador 8051-
compatível mais rápido, mas desenvolvendo-se a placa de CPU
internamente, ligada na própria placa-mãe também.
6.8 PROTÓTIPO 2
Uma vez que os testes feitos com o protótipo 1, de 5x7, mostraram-se
promissores, foi iniciada a construção do protótipo 2, de 15x20 eletrodos. Ele
é baseado nos princípios comprovados com o primeiro, mas sem a parte de
geração de trem de pulsos por hardware de cada placa, usando-se apenas
os pinos do microcontrolador para gerar o trem de pulsos e seus ajustes.
A diferença básica é que agora tudo tem que ser maior para poder
criar 15 linhas de 20 eletrodos, concentrando-se as alterações nos itens
listados abaixo e descritos em detalhes nos parágrafos seguintes:
• Placa-mãe maior;
• Placa de estímulo com mais elementos de chaveamento;
• Geração da tensão de estimulação por conversor DC-DC e
optoacopladores, em vez de transformador de pulso;
• Placa de microcontrolador integrada à placa-mãe, com 8051–
compatível mais rápido;
• Sensor de imagem interfaceado serialmente ao microcontrolador,
dispensando o PC;
100
• Sensor de ultra-som e motor excêntrico vibratório testados e
incorporáveis ao sistema.
Assim, a placa-mãe é bem maior, capaz de acolher 15 placas de
estímulo, e cada placa de estímulo continua com circuito de seleção de
endereços da placa e de cada eletrodo por meio de comparadores e latches
TTL.
Agora, como mais sinais podem ser alimentados simultaneamente,
foram colocados circuitos integrados para aumentar a corrente fornecida, o
ULN2804. Isto permite que em vez de se utilizar latch transparente 74573 se
use latch sensível a borda, 74273, diminuindo a complexidade do software,
pois não se precisa mais usar um endereço inválido de coluna ao trocar de
coluna.
Cada placa não é mais configurável para amplificar seu próprio trem
de pulso ou receber de fora, ela apenas recebe o sinal de estimulação
pronto da placa-mãe, que o reebe da placa de geração de sinal.
Também foi projetada uma placa à parte para o microcontrolador
(CPU) e outra para a fonte de alimentação, ambas conectadas também ao
barramento da placa-mãe.
Anteriormente foi explicado que por segurança o sinal de estimulação
escolhido é gerado por tensão constante, da ordem de 40 a 60 Volts. Para a
geração desse sinal, no protótipo 1 usava-se em cada placa um
transformador de pulso chaveado por um transistor darlington, com a tensão
ajustada a partir de um regulador LM317 que alimentava o transformador e
circuito de chaveamento. Mas isto podia saturar e distorcer a onda no
secundário, tornando-a um trapézio em vez de exatamente um pulso
quadrado, caso a largura de pulso fosse maior que o previsto no projeto
deste do pulso.
Para garantir maior flexibilidade nos testes, a placa–mãe original
permitia até mesmo que se gerassem externamente os sinais dos 5 canais
101
de estimulação, o que permitiu que fosse testada a estimulação por corrente
e por tensão, utilizando um circuito amplificador ajustável por jumpers,
conforme se pode ver no Anexo 12. Como o sinal gerado com estimulação
por tensão constante, usando-se o circuito original, demonstrou nos testes
ser suficientemente bom para viabilizar a sensação de vibração do estimulo
em cada eletrodo, e assim permitir o reconhecimento dos padrões
geométricos usados nos testes do capítulo 7, decidiu-se continuar usando a
alimentação por tensão constante no projeto do circuito do protótipo 2.
No circuito do protótipo 2 manteve-se a estimulação por tensão
constante, mas buscou-se diminuir a distorção descrita anteriormente devida
ao transformador de pulso. Buscou-se então gerar a tensão mais alta por
conversor DC-DC tipo fly-back, com saída ajustável por um potenciômetro
multivoltas, chaveando-se esta tensão mais alta usando-se optoacopladores
do tipo H11D1, capaz de suportar tensão VCE de até 200 Volts (o 4N38
suporta apenas 30 V).
Outra diferença consiste no elemento chaveador do sinal que vai a
cada eletrodo. O primeiro protótipo usa SSR (relés de estado sólido), que
são opto acopladores com o receptor sendo capaz de conduzir em ambos os
sentidos. Mas seriam necessários 300 destes optoacopladores no protótipo
2, que devido ao custo individual se tornaria o maior custo do equipamento.
Assim, no protótipo 2 eles foram substituídos por um circuito com ponte de
diodos mais opto acoplador com saída comum, transistor bipolar. Assim, o
opto colocado nos terminais retificados da ponte permitem comutar um sinal
bidirecional nos outros 2 terminais da ponte. Esta solução custa cerca de um
terço por eletrodo, barateando em muito o circuito total, mas mantendo a
mesma funcionalidade.
6.8.1 Sensor de Imagem
Conforme previamente mencionado, para dispensar o uso do PC e
webcam, tornando o sistema mais portátil, foi definida a aquisição da
imagem por sensor de imagem e seu interfaceamento direto ao processador
central do sistema, atualmente um microcontrolador 8952 da Atmel.
102
Assim, algumas soluções foram buscadas, sempre usando um sensor
de imagem, de tecnologia CCD ou MOS, que pudesse ser montado em um
óculos para maior facilidade de uso.
Após algumas idéias, finalmente foi definido o uso do kit serial C328
da COMTECH, específico para câmeras fotográficas estáticas, que usa
sensor de imagem OV7640 da OMVISION e chip de interface serial e
compressão JPEG, este último não utilizado neste projeto.
Ele facilita a implementação, requerendo apenas 4 fios, 2 de
alimentação, e dois para comunicação serial, um de transmissão e outro de
recepção. Ou seja, enquanto um sensor paralelo exigiria 8 pinos do
microcontrolador, este usa a porta serial do controlador, requerendo apenas
a conversão dos sinais de 5 V do microcontrolador para 3,3 V do C328. Os
pinos liberados podem ser usados então para realizar a seleção dos
eletrodos a serem estimulados.
O microcontrolador pode então enviar serialmente um comando para
capturar a imagem do sensor escolhendo em qual de diversos padrões de
tamanho e cor, o que diminui o processamento posterior necessário. As
opções são diversas configurações de resolução (VGA, CIF, SIF, QCIF,
128x160, 64x80) e padrão de cores (4, 16 ou 256 niveis de cinza, ou cores
em 12-bit RGB ou 16-bit RGB).
A configuração escolhida para a imagem do sensor foi em quadros de
64x80 pixels, 4 tons de cinza, a menor resolução permitida, assim
requerendo menos memória no microcontrolador, mas ainda com resolução
suficiente para detecção de bordas e demais processamentos, antes de se
fazer a diminuição da resolução para posterior envio à matriz estimuladora e
seus taxels.
Este kit de sensor de imagem está mostrado na Fig.49, Fig.50 e
Fig.51, sendo mais prático de usar pelo seu pequeno tamanho, baixo
consumo, e alta integração, simplificando a interface ao processador.
103
Fig.49. Sensor serial C328, de fator de forma compacto (13 x 14 10 mm).
Fig.50. Sensor montado sobre óculos para minimizar o impacto estético
Fig.51. Circuito de teste de interface do sensor de imagem a microcontrolador
6.8.2 Chaveamento de potência
A desvantagem do protótipo 1 está no preço o SSR, que custa cerca
de 7 reais (2 dólares) cada um. Assim para o protótipo 2 foi criado um
circuito semelhante a um retificador de onda completa baseada em ponte de
diodos. O princípio é simples, basta tomar o secundário de um transformador
e alimentar 4 diodos em ponte. Dois dos terminais são conectados à tensão
alternada, e 2 alimentam a carga que recebe então um sinal pulsado que
pode ser melhorado usando um capacitor que diminui o ripple em paralelo à
carga, que começa a receber então tensão praticamente contínua (DC). Se
104
no lugar da carga for colocado um elemento de chave (um FET ou bipolar
simples) e em um dos ramos entre o secundário e a ponte se colocar o
eletrodo, com uma só chave será possível ligar e desligar uma tensão
alternada no eletrodo.
No protótipo 2, quando implementado o tempo morto para diminuir
consumo de potência, são usados na geração do sinal estimulador 2 pinos
de controle vindos do microcontrolador.
6.8.3 Matriz de eletrodos
Para o protótipo 2, desenvolveu-se uma matriz de 15x20 com circuitos
impressos flexíveis (CIF), encomendada junto à MDL, Menbrana Digital Ltda,
fabricante de teclados de membrana e circuitos deste tipo.
A vantagem desta segunda opção é que se adapta melhor à pele do
usuário, diminui o peso e melhora a condução, melhorando a sensibilidade
do usuário.
Os circuitos impressos flexíveis (CIF) podem ser feitos de 2 maneiras:
aditiva ou subtrativa. A tecnologia de construção é define algumas limitações
como em número de camadas, se aceita soldagem ou não, se aceita
colagem de componentes e o tipo de conector utilizado.
Na construção aditiva deposita-se camada de condutor metálico,
normalmente uma tinta à base de prata, sobre um filme de poliéster, usando
camadas isolantes para se poder fazer um circuito multicamadas. Para
aplicações médicas como em eletrodos de ECG (eletrocardiograma), EEG
(eletro-encéfalo-grama), ultra-som e outros, existe uma tinta de cloreto de
prata, para poder resistir melhor à corrosão do ataque do gel condutor e do
próprio suor do paciente. Como não aceita soldagem, requer conectores do
tipo crimpagem, como os da Nicomatic, mostrados na Fig.52 e Fig.53.
105
Fig.52. Conectores de crimpagem para circuitos flexíveis, da Nicomatic.
Fig.53. Exemplos de conectores: Nicomatic (preto) e Berg/Dupont (azul);
O método subtrativo usa um filme especial com camada de cobre de
fábrica e sofre processo semelhante ao da construção de placas de circuito
impresso convencionais. A película mais conhecida é a Pyralux da Dupont,
que é uma película de Kapton (poliimida) recoberta de cobre, que permite
corrosão e soldagem normal de componentes.
Para a matriz de 300 eletrodos foi encomendada junto à empresa
carioca MDL, Membrana Digital Ltda, a fabricação de matriz de eletrodos
baseada na tecnologia aditiva, conforme a Fig.54, Fig.55, Fig.56 e Fig.57.
106
Fig.54. Desenho de 2 colunas da matriz encomendada, com as camadas superpostas, e exemplo de uma linha da matriz final.
Fig.55. Exemplo de matriz encomendada 7x7, com 3 camadas: anel externo de retorno por placa, anel central de estimulação e isolante do meio. (cerca de 10 x 10 cm)
Fig.56. Desenho da matriz final flexível, de 300 eletrodos, com suas diversas camadas para eletrodo central e retorno comum a cada linha.
107
Fig.57. Matriz flexível de 15x20 eletrodos, do tamanho aproximado de uma folha A4.
6.8.4 Estimativa de tempos para o protótipo 2
No segundo protótipo o sensor de imagem do C328 já envia a
imagem em formato reduzido, 64x80, em apenas 4 tons de cinza. Isso
simplifica muito a área de memória requerida, bem como o tempo para
processamento. Porém, todo o processamento da imagem deve ser
implementado nele, limitando o tipo de processamento, a menos que se
usem processadores mais poderosos, como microcontroladores da Dallas
semiconductors compatíveis com 8051, 40 vezes mais rápidos, ou mesmo
processadores DSP da Texas Instruments, como TMS320C5510, cerca de
20 vezes mais rápidos que o microcontrolador 8952 utilizado.
Para a diminuição de resolução basta reduzir duas vezes, de 64x80
para 32x40 e depois para 16x20. Para manter as retas encontradas durante
a detecção de borda, faz-se a redução não pela média, mas pelo valor
mínimo, pois zero corresponde a preto. Assim, a diminuição de resolução é
feita apenas duas vezes, e sem precisar média fica ainda mais rápida.
Numa estimativa rápida, tem-se 64x80 /4 = 1280 cálculos de pixels
num primeiro momento, que envolvem 5120 comparações, a 1 µs por
comparação, leva cerca de 5 ms para a primeira redução. Na segunda, tem-
se 32x40 /4 =320 cálculos, com 1280 comparações, que equivalem a quase
1,3 µs. Portanto, para reduzir a resolução em menos de 10 ms um
microcontrolador 8952, lento, pode processar, pois há cerca de um minuto
até o usuário reconhecer a imagem. Porém, no futuro para processamentos
108
mais complexos, como difusão anisotrópica, um microcontrolador compatível
com 8051, mas mais rápido, ou processador DSP se faz necessário.
6.8.5 Estimativa da distância por ultra-som
Para compensar a falta de estereoscopia pelo uso de uma única
câmera, e poder diferenciar um obstáculo grande e distante de um pequeno
e mais próximo, foi projetado um sistema complementar de estimativa de
distância usando sensor de ultra-som.
Uma maneira típica de se usar a propagação de ondas acústicas
acima do limite de audição humana, cerca de 40 a 50 kHz, e por medição de
tempo de eco. Um transmissor emite um sinal de duração muito breve e
dispara um temporizador. Quando o receptor deste sinal recebe o sinal
refletido no obstáculo, mede o tempo que levou para ir e voltar. Sabendo-se
a velocidade do som no ambiente, aproximadamente constante para cada
meio, pode-se usar um microcontrolador para calcular a distância e
compensar qualquer não linearidade do modelo, conforme visto na Fig.58.
Deve-se tomar cuidado com esta implementação para garantir que a
duração do pulso seja menor que o mínimo de tempo do eco para prevenir
sobreposição. Costuma-se calibrar um sistema desses cada vez que ele for
usado em condições ambientais diferentes. Sem calibração, grandes
variações de temperatura e umidade podem gerar resultados errados devido
à variação da velocidade do som nestas condições [BORENSTEIN,96],
[SHOVAL,00].
Fig.58. Esquema de medição por ultra-som
No caso do sistema aplicado ao projeto de SS, a aplicação é mais
simples ainda, pois não é necessária uma medição precisa, e sim apenas
uma estimativa desta distância. Assim, usa-se um circuito para gerar um
sinal de tensão proporcional a esta distância, que por sua vez é invertido
109
para acionar um motor excêntrico para vibrar mais quanto mais perto de um
obstáculo o usuário estiver.
Foram usados sensores da Senix e motores excêntricos adquiridos
junto à Jameco americana, e o sensor MaxEZ1 da MaxBotix, adquirido junto
à Zagros Robotics, mostrados na Fig.59
Fig.59. Sensor de ultra-som, motores excêntricos, e sistema de estimativa de distância,
e Sensor Max EZ1, de dimensões reduzidas (20 x 22 x 16.4 mm).
Observe que o motor excêntrico plano, com formato de moeda,
poderia no futuro ser utilizado na montagem de uma matriz de estimulação
vibromecânica, mas isto esbarra no alto custo destes motores, atualmente
em cerca de 4 dólares cada. Para integrar 15x20 em uma matriz, o custo
destes atuadores ficaria proibitivo em um primeiro momento.
110
77 TTEESSTTEESS
Os testes foram conduzidos em três etapas, uma preliminar para
ajuste do equipamento, uma para treinamento dos usuários, e finalmente
uma para avaliar o envio ao usuário de imagens capturadas e tratadas no
PC. Os formulários usados neste treinamento estão listados no apêndice 1
deste trabalho.
7.1 OBJETIVOS DOS TESTES
Os principais objetivos dos procedimentos de testes desenvolvidos
foram definir a melhor maneira de utilizar o equipamento, e treinar três
grupos de sujeitos no reconhecimento de padrões geométricos, observando
seus acertos percentuais e tempos de reconhecimento.
As questões a seguir foram objeto dos testes realizados.
7.1.1 Testes de ajustes:
1. Qual o menor espaçamento entre eletrodos, entre dois extremos
sugeridos pela literatura;
2. Qual é o melhor tamanho de eletrodos dentre 2 extremos (mínimo e
máximo sugeridos pela literatura); faz sentido usar uma matriz com maior
número de pontos por área? Existe um tamanho ideal para a matriz?
3. Qual é o melhor lugar para a estimulação eletrotáctil: abdome, antebraço,
dedo, palma da mão? Não usar no abdome implicaria diminuir o tamanho
dos eletrodos para se adequar à fisiologia destas outras regiões do
corpo, gerando maior dificuldade na implementação da matriz;
4. Qual é a largura de pulso mais confortável e que resulta melhor
percentual de acerto?
5. Qual quantidade de pulsos em cada rajada?
6. Qual pulso resulta melhor sensação/conforto e segurança ao usuário
para não queimá-lo: pulsos bifásicos (com nível DC nulo) ou monofásicos
(nível DC não nulo)?
7. Deve-se usar padrão desenhado em carimbo, por coluna apagando a
anterior, por coluna mantendo todas acesas, ou apenas 1 taxel (eletrodo)
111
de cada vez? Os testes desenhando linha por linha foram eliminados
porque bastaria girar a matriz 90 graus e testar com o mesmo padrão;
7.1.2 Testes de treinamento
1. Qual o tempo necessário para reconhecer as figuras?
2. Existe uma diferença no acerto para o reconhecimento de padrões
geométricos entre os três grupos (cegos congênitos, cegos adquiridos e
videntes)?
3. Existe diferença no tempo para reconhecer padrões geométricos entre os
três grupos?
4. Quais formas são mais facilmente reconhecidas?
7.1.3 Questões para futuros testes:
1. É possível estimar corretamente relações de tamanho?
2. O uso de envoltória melhora o conforto do estímulo elétrico?
3. É possível usar fenômeno de integração para criar efeito de “eletrodos
virtuais” e melhorar a resolução da matriz de estimulação?
4. Até que ponto é possível reconhecer figuras em movimento e sua
trajetória?
7.2 TESTES PRELIMINARES PARA AJUSTE
Antes de começar os testes de treinamento com usuários, foi previsto
o ajuste dos equipamentos para os parâmetros a seguir:
1. forma de onda da estimulação (formato, repetição de pulsos, amplitude)
que forneça a melhor sensação ao usuário;
2. espaçamento e tamanho de eletrodos;
3. método de estimulação, ilustrados na Fig.60:
o por carimbo (todos os taxels da imagem simultaneamente),
o por coluna individual (acende uma coluna e apaga a anterior),
o por coluna mantendo as anteriores (ao acender uma coluna
manter as anteriores até gerar a imagem completa),
o por taxel individual (simulando uma escrita manual, ou desenho de
traçador gráfico, ou plotter).
112
Fig.60. Quadrado pequeno desenhado por diversos métodos: a.como carimbo (primeiro quadro), b.por coluna individual (quadros 2 a 4), c.por coluna mantendo a anterior (quadros
5 a 7), d.taxel a taxel (quadros de baixo) – em cinza são os taxels estimulados e depois apagados
Para ajustes de sensibilidade, foram gerados 2 grupos de testes com
três indivíduos, cada grupo com 32 possibilidades para os 5 parâmetros a
serem ajustados. Cada indivíduo testou um grupo com a matriz menor e
outro com a matriz maior, resultando melhor sensibilidade e conforto com a
matriz menor. Na Fig.61 mostra-se o formato do trem de pulsos, cujos
valores testados foram:
• Toff: Intervalo entre rajadas: 5 a 8 ms;
• Npulsos: Número de pulsos: 5 a 10;
• Thigh: Tempo no nível alto: 41 a 80 µs;
• Tlow: Tempo no nível baixo: 60 a 120µs;
• método de estimulação
Isto resultou em freqüência de envoltória entre 96 e 182 Hz,
freqüência dos pulsos entre 2 e 10KHz, ciclo de trabalho entre 20 e 57%, e
percentagem de sinal alto sobre tempo total entre 2,3% e 12.5%.
Fig.61. Trem de pulsos com tempo morto: exemplo de BFM usando pulsos bipolares DC [NOHAMA,97].
113
A amplitude do sinal foi ajustada pelo próprio usuário por meio de um
potenciômetro multi-voltas, ou seja, por hardware e não por software.
Destes 32 ajustes realizados com 3 usuários, os 4 melhores ajustes
foram escolhidos para os testes de treinamento da seção seguinte.
7.3 TESTES PARA TREINAMENTO DE USUÁRIOS
Depois de serem definidas as 4 melhores configurações do
equipamento, na primeira sessão de treinamento cada sujeito escolheu qual
das 4 lhe permitia melhor sensação vibratória, sendo esta configuração
então usada nos demais testes deste sujeito.
Foram realizados testes para treinamento com 3 grupos de usuários:
• videntes (com visão normal);
• cegos congênitos (de nascença ou que se tornaram cegos até os 5 anos
de idade);
• cegos adquiridos (após os 5 anos de idade) [ANTONINO,93],
[KACZMAREK,00].
Cada grupo foi composto por 4 a 5 voluntários adultos, de ambos os
sexos. Não foram incluídos neste estudo portadores de doenças cardíacas e
mulheres grávidas. O objetivo não foi fazer amostras estatisticamente
representativas, mas apenas demonstrar a viabilidade do projeto como um
todo e do hardware e software em especial, apenas apontando possíveis
caminhos para estudos posteriores com os grupos mencionados
anteriormente.
Estes três grupos foram treinados no reconhecimento destes padrões
geométricos: reta horizontal, reta vertical, reta inclinada para cima ou para
baixo, letra L, quadrado, triângulo para esquerda e direita, e círculo.
Neste estudo foi avaliada para cada individuo testado, o percentual de
acerto e o tempo despendido para reconhecer os padrões (latência), em
cada sessão de treino realizada.
Para cada grupo experimental foram calculadas as médias do
percentual de acertos e da latência para os reconhecimentos dos padrões
114
geométricos, para cada sessão, sendo apresentados na forma de gráficos
em função da quantidade de sessões de treinamento.
Também foram computadas as médias do percentual de acertos e
latência de reconhecimento dos padrões geométricos, subdivididos em
padrões simples (retas) e complexos (os demais), e gerados gráficos destes
resultados para cada um dos grupos.
No capítulo 8, de resultados, um sumário foi gerado numa tabela, com
a média de todas as sessões por grupo e tipo de padrão.
Estes padrões geométricos foram gerados diretamente no
equipamento via kit de microcontrolador, dispensando o uso do PC nestes
testes. Como o segundo protótipo tem maior resolução, os testes para
imagens mais complexas recebidas serialmente do PC foram feitos apenas
nele, conforme descrito na subseção 3. O sensor de ultra-som e a
segmentação de letreiros foram adicionados após estes testes, apenas no
protótipo 2.
7.3.1 Metodologia das sessões de treinamento
Na primeira sessão de treinamento, primeiramente o usuário
experimentou os quatro ajustes de estimulação previamente escolhidos, e
escolheu destas, aquela que lhe foi mais confortável.
Após isso, em cada sessão o usuário foi treinado inicialmente com
quatro padrões geométricos simples (reta horizontal, reta vertical, diagonal
para baixo e para cima). O usuário teve até 5 minutos para reconhecer cada
padrão estimulado, sendo anotado o que ele pensou ser o padrão, bem
como a latência (tempo que levou para reconhecer).
Para ensiná-lo a reconhecer cada um dos quatro padrões simples,
primeiro informou-se o que foi estimulado, e ao final da sessão informou-se
se acertou ou não, para possibilitar a aprendizagem.
Após o treinamento dos quatro padrões simples, iniciou-se o estímulo
de padrões um pouco mais complexos (letra L, quadrado, triângulo para
direita, triângulo para esquerda e círculo), variando-se a seqüência de uma
sessão para outra de maneira aleatória para evitar sua memorização.
115
Nesta segunda etapa de testes usou-se o mesmo procedimento
anterior, com exceção de que os erros e acertos foram informados apenas
ao final do conjunto de padrões.
Para os dois primeiros usuários inicialmente não se havia limitado a
quantidade de sessões seguidas de treinamento, porém notou-se que se
realizadas mais de duas seguidas, a terceira apresentava menor acerto. Os
sujeitos cegos envolvidos mencionaram que isto ocorre também quando se
faz leitura Braille, quando após leituras realizadas durante muito tempo
requerem um intervalo de descanso quando então retornam à velocidade
normal de leitura e acerto. Assim, foram feitos a partir daí no máximo duas
sessões seguidas de treinamento, preferencialmente duas por dia, em dias
seguidos. Quando se precisou fazer mais de duas por dia, um intervalo de
pelo menos 30 minutos entre a segunda e terceira sessões.
Cada sessão durou no máximo 45 minutos, composta pela
estimulação e reconhecimento de quatro padrões simples e cinco
complexos, cada um durando no máximo 5 minutos.
Cada sessão completa foi repetida até se atingir 10 sessões com
cada usuário.
Nos treinamentos dos videntes, para evitar que eles tivessem acesso
ao padrão estimulado, utilizou-se venda para os olhos, mas também havia a
opção de um jumper para desligar os leds de indicação do padrão luminoso
ao pesquisador.
7.4 TESTES COM IMAGENS GENÉRICAS
Após o usuário completar seu treinamento de padrões geométricos e
caracteres, foram realizados testes utilizando-se imagens controladas, como
mesa, meca e cadeira e duas mesas. Também era possível enviar as
imagens capturadas com a Webcam no PC, simplificadas e enviadas ao
equipamento, de modo a observar e quantificar os acertos.
116
88 RREESSUULLTTAADDOOSS
Nesta seção encontram-se dados coletados sobre o ajuste do
equipamento e treinamento dos usuários, bem como sobre o funcionamento
e consumo do equipamento.
8.1 SENSAÇÃO OBTIDA VERSUS AJUSTES INICIAIS
O objetivo de permitir que os estímulos elétricos fossem sentidos
como leves vibrações foi atingido por meio dos ajustes dos parâmetros de
software feitos pelo pesquisador, a partir da informação de sensação
fornecida pelo usuário, e por meio do ajuste da amplitude do sinal feita pelos
próprios usuários usando um potenciômetro multivoltas.
Foi usado gel condutor não salino para melhorar a condutibilidade e
interface entre a matriz de eletrodos e a pele. Inicialmente quando o gel não
havia sido usado, as sensações foram descritas como “agulhadas”. O uso de
gel condutor não salino é recomendado pela literatura quando o eletrodo
central tem área maior que 1 mm2, para preencher o espaço e distribuir
melhor a corrente. Como o pino central do eletrodo deste projeto tem 1 mm
de diâmetro, com área de 1,57 mm2, o gel é necessário [NOHAMA, 95].
A intensidade do estímulo não foi suficientemente grande para atingir
camadas mais internas e acionar placas motoras, portanto, não se observou
contrações musculares, com exceção dos testes realizados no antebraço,
onde as placas motoras estão mais próximas da superfície.
Este teste no antebraço foi um dos testes de sensibilidade realizados
em alguns locais do corpo de 3 indivíduos, como coxa, panturrilha,
antebraço, palma da mão e abdome. A melhor sensação, com melhor
resolução, foi obtida para todos os usuários no lado inferior do abdome,
confirmando dados da literatura.
O dedo não foi testado por implicar uso de matriz menor, com
eletrodos menores, devido à maior densidade de receptores nervosos, o que
seria mais difícil de implementar.
117
Devido à menor densidade e ao maior espaçamento dos receptores
nervosos, conforme visto na Fig.10, para o abdome foram testadas as duas
matrizes de estimulação de 5x7 criadas em tamanhos diferentes. Elas foram
construídas em placa de circuito impresso de fibra de vidro e eletrodos de
níquel, com dimensões sugeridas na literatura [KACZMAREK,91],
[NOHAMA,95]. Quatro indivíduos as testaram, identificando a menor delas
como melhor para identificação e tendo maior facilidade de uso, sendo
apenas esta matriz menor então usada para a etapa de treinamento.
O menor espaçamento entre eletrodos e tamanho menor de eletrodos
possibilitou criar a matriz de eletrodos final, usada na estimulação de
imagens mais complexas, em tamanho maior com 15x20 eletrodos. Ela foi
construída usando técnicas de circuitos impressos flexíveis, com tamanho
aproximado de uma folha de papel tamanho ofício, cobrindo totalmente o
abdome do usuário.
A Tabela 9 lista as quatro melhores configurações de ajustes de três
indivíduos dentre as 32 testadas. Posteriormente, estas 4 configurações
foram usadas no início da primeira sessão de treinamento de cada um dos
demais usuários para escolher qual delas seria mais adequada a cada um,
proporcionando-lhe melhor sensação e conforto.
Tabela 9. Configurações que resultaram sensação vibratória mais agradável Intervalo toff (µs)
Número pulsos
Thigh (µs)
Tlow (µs)
%ciclo de trab
%on s/total
fpulso (KHz)
fenvoltória (Hz)
5 10 41 160 20% 5.8% 5.0 143
5 10 41 60 41% 6.8% 9.9 166
8 5 80 60 57% 4.6% 7.1 115
8 5 120 80 40% 4.4% 5.0 111
A última configuração da Tabela 9 foi a que a maioria dos usuários (7
de 12) descreveu como mais agradável, sendo escolhida como default para
o aparelho. Mais dois parâmetros de tempo podiam ser ajustados por
software, waitcol, que representa o tempo que a coluna ou taxel permanece
estimulado; e waitimg, que representa o tempo de espera ao final da
estimulação de cada imagem completa, antes que fosse reiniciada a
118
estimulação. Após alguns testes preliminares, a melhor sensação obtida foi
ajustando-se o primeiro para 1000 ms e o segundo para 500 ms.
Seguindo orientação da literatura, foram utilizados pulsos bifásicos
(com nível DC nulo) na estimulação, para evitar a ionização da pele.
Contudo, o equipamento permite que testes futuros possam ser feitos
também com pulsos monofásicos, para permitir testes comparativos se for
necessário.
Como a matriz é muito grande, fica difícil manter contato perfeito com
a superfície da pele em toda a extensão da matriz. Caso fosse feita
estimulação por corrente constante, uma eventual diminuição na área de
contato ocasionaria uma maior potência elétrica no eletrodo em questão,
podendo lesar a pele do usuário. Este efeito foi evitado utilizando-se
estimulação por tensão constante, que em caso de diminuição da área de
contato, diminui a potência, não gerando o estímulo, mas protegendo o
usuário.
Nos ajustes iniciais, com os 3 primeiros usuários, ainda foi possível
verificar que o melhor reconhecimento foi obtido usando-se o método de
estimulação de taxel individual, em que o padrão geométrico era desenhado
em seqüência de eletrodos, como se fosse alguém escrevendo com uma
caneta. Os outros métodos confundiam os usuários, de tal maneira que eles
não conseguiam distinguir os padrões. Provavelmente o usuário relacionava
o padrão estimulado com a forma com que ele próprio desenha, ou seja, o
método de estimulação por carimbo ou colunas não é uma maneira intuitiva
de se escrever ou desenhar algo. Usando os métodos de estimulação por
carimbo, coluna mantendo ou coluna individual, nenhum dos 4 padrões
geométricos de treinamento inicial (reta horizontal, vertical, inclinada pra
cima e pra baixo) foi reconhecido por estes três primeiros usuários. Isto foi
diferente do que foi observado para o método de taxel individual, em que
desde a primeira estimulação os usuários foram capazes de reconhecer pelo
menos um dos padrões estimulados. Assim, o método de taxel individual foi
escolhido como único método para os demais treinamentos da etapa
seguinte.
119
8.2 RESULTADOS DOS TESTES DE TREINAMENTO
Os resultados obtidos nos testes de treinamento, realizados com
usuários do sistema, em três grupos (videntes, cegos adquiridos e cegos
congênitos), estão apresentados na Tabela 10 e Fig.62 a Fig.65.
O grupo de videntes começou com acerto em cerca de 50% a 65%,
variando para padrões geométricos simples (retas) e complexos, e com o
transcorrer das sessões não teve melhora no acerto, apesar de ter diminuído
sua latência de cerca de 110 segundos para algo em torno de 30 segundos.
Talvez deva-se à ansiedade de responder rapidamente, pois a latência caiu
muito sem ter melhorado o acerto.
O grupo de cegos adquiridos apresentou diminuição da latência, indo
de cerca de 100 segundos, inicialmente, para cerca de 45 segundos ao final,
enquanto seus acertos foram de 30% para mais de 80%.
O grupo de cegos congênitos apresentou o melhor resultado, com sua
latência semelhante à dos cegos adquiridos, mas com acertos indo de 50%
a praticamente 100% já a partir da sexta sessão de treinamento. Um deles
teve acerto próximo de 100% desde a primeira sessão.
De maneira geral, pode-se observar que o reconhecimento de
padrões geométricos simples é muito maior do que dos complexos, que só
melhoram com o transcorrer das sessões de treinamento.
Em resumo, foi observado que à medida que as sessões foram sendo
realizadas, o tempo de reconhecimento (latência) foi diminuindo e o
percentual de acerto foi aumentando em todos os grupos. Este mesmo tipo
de desempenho foi observado também por Maucher[00] e Kaczmarek[95]
em seus experimentos tácteis.
Como já mencionado anteriormente, o percentual de acerto só não
aumentou de uma sessão de treinamento para a seguinte em alguns casos
iniciais quando foram realizadas várias sessões seguidas no mesmo dia,
sem intervalo. Notou-se que após o uso contínuo por mais de uma hora,
durante os treinamentos, o usuário tinha seu percentual de acerto reduzido,
provavelmente devido a cansaço ou habituação nervosa, e a partir daí esta
condição foi evitada nos demais testes. Contudo, isto não inviabiliza o uso
120
do sistema, pois a idéia básica é que o sistema não seja para trabalhar como
visão artificial contínua, e sim como auxílio esporádico para reconhecimento
de ambientes desconhecidos e leitura de letreiros. Assim, o usuário não
deverá usar o sistema mais do que alguns minutos de cada vez. Vale
lembrar que a idéia é que o usuário ligue o equipamento disparando uma
captura, processamento e estimulação da imagem apenas sob seu
comando, não continuamente, também para que se possa maximizar a
duração da carga das baterias.
Uma observação feita pelos voluntários cegos adquiridos é que eles
tentavam fazer uma analogia com algo conhecido anteriormente antes de
ficarem cegos, e isto produzia uma maior latência e erros esporádicos. No
cego congênito isto não foi verificado, pois neste caso ele não tem
referência, qualquer novo treinamento é identificado imediatamente. Pode-se
observar nos gráficos que a média de acertos para os congênitos é maior e
a latência é menor. Contudo, como a quantidade de voluntários foi pequena,
isto mostra apenas uma possibilidade de estudo futura, não se teve
pretensão de fazer uma análise estatística exaustiva, apenas de mostrar a
viabilidade da idéia e apontar caminhos de estudos futuros.
Outro ponto a ser destacado foi o melhor desempenho dos usuários a
partir do momento que se passou a usar método de estimulação ponto a
ponto em vez dos outros três, de carimbo e por coluna (individual ou
mantendo as anteriores). Na estimulação ponto a ponto ao se ativar um novo
taxel se desativa o anterior, e com isso simula-se o mesmo método usado
quando se escreve com uma caneta, mais intuitivo ao usuário. Além disso, o
fato de se estimular um eletrodo de cada vez provavelmente reduz a
possibilidade de interferências entre os mecanoreceptores adjacentes.
121
VIDENTES: % acertos x sessões
0%
20%
40%
60%
80%
100%
1 2 3 4 5 6sessões
% d
e ac
erto
s
media simples
med.complexos
media videntes
VIDENTES: Tempo de reconhecimento x sessões de
treinamento
0
20
40
60
80
100
120
1 2 3 4 5 6sessões
tem
po (
s)
media simples
med.complexos
media videntes
Fig.62. Gráfico de %acerto e latência, média para grupo de videntes.
CEGOS ADQUIRIDOS: % acertos x sessões
0%10%20%30%40%50%60%70%80%90%
100%
1 2 3 4 5 6sessões
% d
e ac
erto
s
media simples
med.complexos
med.adquiridos
CEGOS ADQUIRIDOS:Tempo de reconhecimento x sessões de
treinamento
020406080
100120140160180
1 2 3 4 5 6sessões
tem
po (
s)
media simples
med.complexos
med.adquiridos
Fig.63. Gráfico de %acerto e latência, média para grupo de cegos adquiridos
122
CEGOS CONGENITOS: % acertos x sessões
0%10%20%30%40%50%60%70%80%90%
100%
1 2 3 4 5 6sessões
% d
e ac
erto
s
media simples
med.complexos
med.congenitos
CEGOS CONGENITOS:Tempo de reconhecimento x sessões de
treinamento
0102030405060708090
1 2 3 4 5 6sessões
tem
po (
s)
media simples
med.complexos
med.congenitos
Fig.64. Gráfico de %acerto e latência, média para grupo de cegos congênitos.
MEDIA DE TODOS: % acertos x sessões
0%
20%
40%
60%
80%
100%
1 2 3 4 5 6qdte de sessões
% d
e ac
erto
s
ccongenitos
c.adquiridos
videntes
MEDIA DE TODOS: Tempo de reconhecimento x sessões de
treinamento
020406080
100120140
1 2 3 4 5 6
sessões
tem
po (s
)
ccongenitos
c.adquiridos
videntes
Fig.65. Gráfico de %acerto e latência, comparando os 3 grupos.
123
Tabela 10. Evolução da latência e acerto%, por grupo e padrão geométrico estimulado EVOLUÇÃO: DA LATÊNCIA média dos usuários por grupo, por tipo de padrão
TEMPO(s) TEMPO(s) TEMPO(s)congenitos adquirido videntesincial final inicial final inicial final
Reta horiz. 43 29 49 20 36 17Reta vert. 37 29 116 80 40 30Diag.p/baixo 46 12 96 76 85 32Diag.p/cima 27 11 71 26 115 43Letra ELE 45 23 179 20 74 38Quadrado 56 17 104 67 55 62Triang.direita 73 47 102 49 174 68Triang.esq. 86 30 226 13 110 76Circulo 154 58 169 66 124 47media simples 38 20 83 50 69 31med.complexos 83 35 156 43 107 58media todos 63 28 123 46 90 46
EVOLUÇÃO do ACERTO%: média dos usuários por grupo, por tipo de padrãoACERTO ACERTO ACERTOcongenitos adquiridos videntesinicial final inicial final inicial final
Reta horiz. 100% 100% 75% 100% 80% 100%Reta vert. 50% 100% 25% 100% 80% 60%Diag.p/baixo 50% 100% 0% 50% 60% 60%Diag.p/cima 100% 50% 50% 25% 60% 60%Letra ELE 100% 100% 25% 100% 40% 60%Quadrado 50% 50% 25% 0% 60% 80%Triang.direita 100% 100% 50% 100% 0% 40%Triang.esq. 100% 50% 25% 50% 60% 40%Circulo 100% 100% 0% 50% 100% 0%media simples 75% 88% 38% 69% 70% 70%med.complexos 90% 80% 25% 60% 52% 44%media todos 83% 83% 31% 64% 60% 56%
Tabela 11. Sumário da evolução de cada grupo, media de todos os padrões estimulados SUMÁRIO DA MEDIA DE TODOS OS PADROES, POR GRUPO A CADA SESSAOTEMPOS sessao1 sessao2 sessao3 sessao4 sessao5 sessao6ccongenitos 63 46 31 34 20 28c.adquiridos 123 111 63 81 45 46videntes 90 57 45 38 40 46
%ACERTOS sessao1 sessao2 sessao3 sessao4 sessao5 sessao6ccongenitos 75% 88% 100% 88% 88% 88%c.adquiridos 38% 38% 56% 65% 56% 69%videntes 70% 90% 90% 70% 75% 70%
124
8.3 RESULTADOS PARA IMAGENS CONTROLADAS
Conforme mencionado, foram realizados testes com os usuários,
estimulando padrões de imagens controladas. Especificamente foram
desenhadas três imagens em três dimensões: mesa, mesa e cadeira, e duas
mesas, todas desenhadas utilizando-se o método de estimulação taxel a
taxel, estimulando os eletrodos sequencialmente.
Porém, o percentual de acerto se mostrou baixo nos três grupos,
abaixo de 30%. A principal reclamação é que torna-se difícil reconhecer uma
imagem a partir da seqüência de eletrodos estimulados. Em outras palavras,
o que se mostrou melhor para padrões geométricos simples e mais
complexos, tornou-se um problema para a estimulação de objetos.
Mais treinamento e testes precisarão ser feitos, inclusive tentando
mudar o método de estimulação. Para o caso de imagens de objetos seja
melhor utilizar estimulação como se fosse um carimbo.
8.4 CONSUMO DE ENERGIA
Conforme mencionado anteriormente, o aparelho foi projetado para
permitir diferentes métodos de estimulação, incluindo por carimbo, coluna
individual ou mantendo as anteriores, ou por seqüência de eletrodos
individuais.
O estímulo que teve melhor sensação de conforto por parte dos
usuários ocorreu para tensão de estimulação entre 40 e 60 Volts, variando
de paciente para paciente, mas com um consumo por eletrodo de corrente
da ordem de 10 mA por eletrodo.
Como o melhor reconhecimento e sensação foram obtidos usando-se
o método de estimulação por taxel individual, a corrente em um dado
instante foi sempre no máximo 10 mA.
Por questões de segurança não está previsto o uso simultâneo de
todos os eletrodos da matriz, mas foram realizadas medições com simulador
de pele que mostraram que o limite superior de consumo de todo o sistema
da matriz 5x7 foi de 300 mA quando todos os eletrodos e seus leds estão
ativos.
125
Outra forma de diminuir o consumo foi retirar um jumper que
desligava os leds de indicação do padrão luminoso ao pesquisador. Estes
leds em um equipamento comercial seriam desnecessários e sem utilidade
para um usuário cego, devendo ser suprimido.
126
99 CCOONNCCLLUUSSÕÕEESS EE TTRRAABBAALLHHOOSS FFUUTTUURROOSS
Destaca-se a multidisciplinaridade deste trabalho, pois para sua
implementação foi necessário conhecimento de diversas áreas, mesmo que
algumas mais superficialmente, tais como: fisiologia, visão, cognição,
técnicas de orientação e mobilidade, eletrônica digital, eletrônica analógica e
eletrônica de potência, transformadores, baterias recarregáveis, circuitos
impressos flexíveis, microprocessadores, processamento de imagens,
reconhecimento de padrões, redes neurais e normas técnicas eletro-
médicas.
Assim, a integração destas diversas técnicas foi o que possibilitou
buscar-se uma solução inédita para um problema de cunho social. Aliás,
talvez este tenha sido um dos fatores decisivos para o projeto ter sido
agraciado com o 1º lugar nacional na categoria pesquisadores para o 1º
Premio de Inovação Tecnológica Werner Von Siemens, no ano de 2005.
A implementação deste trabalho resultou em um circuito estimulador
flexível, com possibilidade de estudo de diferentes fenômenos tácteis, além
da criação de uma matriz de eletrodos inovadora.
Também mostrou-se viável o uso de conjunto ponte de diodos mais
optoacoplador simples usado para substituir relés de estado sólido 5 vezes
mais caro, com um funcionamento adequado a um custo muito menor,
principalmente porque se usam 300 destes elementos em cada
equipamento.
O custo de material do equipamento ficou bem acessível, abaixo do
valor de um PC de mercado, ou seja, menos de mil dólares. Isto leva em
conta os custos de várias PCI (700 reais), soquetes e componentes (900
reais) e baterias (100 reais), total cerca de 1700 reais.
O sistema apresentou resultados promissores, demonstrando a
viabilidade da implementação do envio de informações visuais por meio de
estimulação cutânea, no caso, estimulação elétrica, mas que no futuro pode
ser alterada para ativar estimuladores mecânicos.
127
As técnicas de processamento de imagem utilizadas mostraram-se
adequadas para começar as deficiências do tato em relação à visão,
especificamente a menor resolução e a falta de camadas detectoras de
contornos. Trabalhos mais aprofundados em cada área podem ser
desenvolvidos no futuro buscando melhorar este processamento de
imagens.
Notou-se que após o uso contínuo por mais de uma hora durante os
treinamentos o usuário tinha seu percentual de acerto reduzido. Contudo,
isto não inviabiliza o uso do sistema, pois a idéia básica não é para trabalhar
como visão artificial contínua, e sim como auxílio esporádico para
reconhecimento de ambientes desconhecidos e leitura de letreiros. Assim, o
usuário não usará o sistema mais do que alguns minutos de cada vez.
Na segmentação de padrões para reconhecer letreiros, foi criada uma
nova forma de comparação de reconhecedores de padrão. O cálculo do
índice usado para comparar redes neurais artificiais (e outros aproximadores
de funções) é normalmente o método dos mínimos quadrados, resultando
apenas um percentual de acerto. Como fruto de estudos para este projeto foi
proposta uma nova metodologia para comparação de desempenho, baseada
não apenas no acerto simples, mas corrigindo-se o índice de acertos por
uma média ponderada dos erros, subdivididos em classes segundo sua
dificuldade e/ou conseqüência, e associados pesos a estes erros. Em
resumo, não se escolhe a configuração que tem apenas melhor acerto, mas
também a que erra menos na média ou cujos erros tem menor conseqüência
[RAMALHO,03].
Abre-se um leque de possibilidades para pesquisas serem
continuadas na área, buscando estudar cada detalhe e possível
melhoramento tanto na estimulação quando no equipamento em si e nos
programas de tratamento de imagens e nos de estimulação, conforme
descrito na seção seguinte. Um resumo das configurações atuais e algumas
possíveis melhorias encontram-se listadas na Tabela 12.
128
Tabela 12. Configuração atual e de possíveis alterações futuras Funções Prototipo1 Prototipo2 Opção Captura de imagem Webcam Sensor Sensor CCD ou MOS PROCESS.IMAGEM 1.Simplificação (difusão) 2.Tons de cinza 3.Detectar Borda 4.Binarizar 5.Baixar resolução 6.Segmentar (encontrar letras) 7.OCR
PC (7 ainda não)
8052 (7 ainda não)
FPGA ou 8051 ou 320C55 (8051 é lento para itens 6 e 7)
Envio da imagem para µcontrolador
Serial Nele mesmo Nele mesmo
Endereçar/ativar taxels
8051 8051 8051 MAX na placa de coluna
Flex na PM
Endereçar coluna 7486 7486 7486 MAX Flex na PM Endereçar linha 74573 74373 =x2 MAX Flex na PM Endereço do Slot Bus
comum Bus comum Bus comum Bus comum Slot individual
Chaveamento SSR Ponte+opto Ponte+opto Oscilador Placa ou
µC Só µC Só µC
Ampliação V Trafo+TIP DC-DC (Trafo+TIP) ou (DC-DC +TIP) Flex=família de FPGA mais complexo, da Altera
MAX=família de FPGA mais simples, da Altera
PM = placa-mãe
SSR = relê de estado sólido
No protótipo 2 eliminou-se o PC e da Webcam, trocando-os por um
sensor de imagem C328 com saída serial da Comtech, que usa sensor da
OmniVision. Interfacear o sensor diretamente ao microcontrolador implicou
trabalho, mas permitiu uma real independência do usuário, tornando o
protótipo 2 transportável, apesar de ainda ser grande (tamanho aproximado
de um videocassete), e de suas baterias contribuírem com a maior parte do
peso do sistema. Este peso poderá diminuir à medida que se utilizar
componentes de menor consumo requerendo assim baterias menores.
O fato de melhores resultados terem sido obtidos com o uso do
método de estimulação por taxel individual possibilita ainda diminuir o
número de canais e a complexidade dos circuitos, possibilitando uma maior
miniaturização. Porém, para uso em pesquisas poderia ser mantido o
129
sistema atual, maior e com mais canais, que possibilite a realização de
experimentos do sistema somestésico. Isto resultaria em 2 sistemas a partir
do atual, um mais flexível para pesquisas, e outro mais limitado para
eventualmente chegar ao mercado e às pessoas deficientes visuais que
possam utilizar-se da substituição sensorial.
Existe também a possibilidade e o interesse de alguns pesquisadores
de fonoaudiologia em substituir o canal de entrada, usando microfone em
vez de câmera, para permitir testes de substituição sensorial no auxílio a
deficientes auditivos.
É bom destacar que foram estudadas outras opções de
implementações do processador no lugar do PC. Entre eles destacam-se
hand-helds ou PDAs como o Palm Zyre, que já vem com câmera embutida,
mas seu alto custo implicaria um custo final alto do sistema todo, e placas de
PCs embarcados industriais, padrão PC104, para facilitar a interface e uso
de driver de software padrão, mas que também apresentam custo alto e
performance inferior a processadores DSP.
130
9.1 SUGESTÕES PARA TRABALHOS FUTUROS
Apesar de testes realizados indicarem resultados promissores, a
quantidade de voluntários foi pequena, não se teve pretensão de fazer uma
análise estatística exaustiva, apenas de provar a viabilidade da idéia e
apontar caminhos de estudos futuros.
Existem possíveis melhoras de hardware e software, tanto de
processamento das imagens quanto o de chaveamento de estímulo gerados,
que poderiam agregar novas funcionalidades ou melhorar desempenho do
sistema atual.
9.1.1 Melhorias de Hardware
Podem ser buscadas melhorias de hardware, tentando incrementar
seu desempenho, adicionar novas funcionalidades e minimizar o tamanho
para torná-lo um produto disponível à grande massa de deficientes visuais
do país, usando-se placas multicamadas e dispositivos SMD (montagem de
superfície), mais compactos. Um possível estudo seria implementar toda a
lógica de seleção e distribuição de sinais usando-se trilhas na placa-mãe
individuais para cada placa de estimulação. Uma outra idéia ainda é fazer a
seleção de endereços por protocolo serial I2C, mas isto tornaria o sistema
mais lento.
Vale destacar que a tecnologia do microcontrolador usado, compatível
com 8051, continua a evoluir, existindo alguns modelos de fornecedores
como Atmel e Dallas Semiconductors que tendo desenvolvido melhorias no
seu núcleo de processamento conseguem executar cada instrução em um
único ciclo de máquina, permitindo processamento até 33 vezes mais rápido
que o processador usado no protótipo 1, um Atmel de 12 MHz.
Considerando-se que a latência para reconhecimento de uma imagem é da
ordem de minutos, existe tempo suficiente para realizar o processamento
necessário mesmo usando-se um processador mais lento como um 8051-
compatível.
131
Contudo, se forem adicionadas novas rotinas de processamento tais
como reconhecimento óptico de caracteres, morfologia matemática e síntese
de voz, detalhados na seção de melhorias de software, eles exigiriam muito
mais poder computacional. Provavelmente então seria necessário alterar o
processador para um de maior capacidade computacional, por exemplo um
processador DSP (processamento digital de sinais), tal como o TMS320C55
da Texas instruments. Neste caso, rotinas desenvolvidas em MatLab podem
ser portadas diretamente a ele por meio de toolbox fornecido com o starter
kit da Texas, evitando a recodificação dos algoritmos em outra linguagem.
Outra opção a ser verificada no futuro é usar estimuladores
vibratórios, ou mesmo células Braille como as usadas nos equipamentos da
empresa Freedom Scientific e Pulse Data International.
Além disso, vale a pena estudar a utilização de micro-dispositivos
(MEMS, micro electro-mechanical systems) e outras tecnologias como ligas
de memória de forma (shape memory alloy, SMA) , e atuadores piezo-
elétricos podem ser experimentados.
Novas áreas de estimulação poderiam ser tentadas, como estão
tentando em Madison e Japão, usando micro-eletrodos no dedo, língua e
palato (céu-da-boca) [KACZMAREK,02], [SHINODA,00].
Para viabilizar a construção de sistemas menores, contatos com
professores do PSI (Departamento de Sistemas Eletrônicos da Escola
Politécnica da USP) envolvidos na área de microeletrônica já foram
iniciados, e também com professores da UFMS (Universidade Federal de
Mato Grosso do Sul) que trabalham com micro-fabricação, tendo sido
submetido um projeto ao CNPq.
Para melhorar autonomia das baterias, pela diminuição do consumo e
novos tipos de bateria, como células de combustível seriam interessantes.
Outra idéia é usar um detector de luz para ocasiões em que haja
baixa luminosidade, disparando-se automaticamente um flash ao “bater” a
foto. Ou pelo menos acender um conjunto de leds infravermelhos, afinal
apenas a câmera é que tem que “enxergar” a luz.
132
9.1.2 Melhorias de Software
Conforme mencionado anteriormente, talvez seja possível utilizar
fenômenos de integração para gerar eletrodos virtuais e aumentar a
resolução do sistema. Os programas de chaveamento dos estímulos
gerados entre os eletrodos podem ser alterados para serem realizados
testes de integração, ajustando-se a seqüência de eletrodos e temporização
de estímulos destes eletrodos de maneira a acionar dois eletrodos vizinhos
para que o usuário possa perceber uma sensação entre os dois. Ou seja,
provavelmente seriam acionados dois receptores nervosos próximos
fazendo-se com que seja interpretada pelo cérebro como se existisse um
receptor extra entre os dois, melhorando em muito a resolução,
aumentando-a de 15x20 para 29x39, ou indo de 300 eletrodos reais para
1131 eletrodos, entre reais e “virtuais”.
Dentre os possíveis efeitos de software que podem ser
implementados estão a melhoria da segmentação de letreiros, talvez incluir
reconhecimento de caracteres e síntese de voz (ou desenhando caracteres
Braille), que agilizasse a leitura de letreiros e sinais, reconhecimento hoje
tendo de ser feito pelo próprio usuário a partir da estimulação destes
letreiros em sua pele. Mas são necessárias técnicas de reconhecimento de
padrões para reconhecer caracteres, requerendo um poder computacional
muito maior, talvez exigindo processadores do tipo DSP, de 400 MIPS ou
mais.
Para compensar a pequena resolução, poderia ser adicionado um
botão de zoom in e out, aproximação ou afastamento da imagem, permitindo
que se use o sistema como se fosse uma lupa sobre uma imagem, focando
em áreas de interesse para aumentar os detalhes da imagem. Seria
suficiente não reduzir a resolução da imagem, parando em uma etapa
anterior. Poderia ser criada uma rotina de scroll (deslizamento da tela) sobre
a pequena janela feita pela matriz de eletrodos.
No processamento de imagem, foram implementadas rotinas de
simplificação usando difusão anisotrópica por espaço de escala, e no futuro
poderão ser tentados métodos baseados em morfologia matemática.
133
Como já mencionado anteriormente, para cegos-surdos talvez seja
mais prático usar programas de reconhecimento óptico de caracteres (OCR,
optical character recognition) e convertendo-os para caracteres Braille. Mas
para pessoas apenas com deficiência visual, poderiam ser implementados
algoritmos de síntese de voz no processador DSP para que possa
efetivamente ler em voz alta os letreiros e sinais. O hardware adicional seria
mínimo, apenas um conversor D/A, filtro analógico e alto-falante. O algoritmo
contudo seria bem complexo, pois envolveria OCR, síntese de voz,
entonação, conexão das palavras e problemas semelhantes, com alta
exigência computacional, requerendo processadores de alto desempenho,
tipo DSP (digital signal processing).
Melhores técnicas de detecção de bordas e de simplificação de
imagem podem ser estudadas, usando além das propostas anteriormente,
técnicas com wavelets, b-splines e linearização dos segmentos das bordas,
por exemplo.
Para fornecer ao usuário a idéia de tons de cinza, algoritmos
semelhantes às técnicas de half-toning usadas em impressoras laser
poderiam ser testados.
Pode-se pensar em tentar informar cor por meio de diferentes
intensidades ou até mesmo usando algum atuador de temperatura para cada
cor.
Para melhorar o reconhecimento das imagens, poderia ser tentado
um sistema ajustado a cada usuário, em que ele poderia treinar o sistema
mostrando qual sua técnica de escrever letras ou desenhar, de maneira que
se dependa mais do usuário para se relacionar com o equipamento, caso o
sistema consiga desenhar da mesma maneira que ele. Isto requer técnicas
adaptativas, que demandam muito poder computacional, e deve ser adiado
para um futuro mais distante, após os demais testes e idéias mencionados.
Um melhoramento a ser feito seria na velocidade de reconhecimento,
não apenas pelo treinamento, mas realizar e acompanhar novos estudos de
resposta da pele a diferentes formas de estimulação elétrica. Eventualmente
poderia ser criado mais de uma matriz de eletrodo posicionadas sobre a
134
pele, talvez 3 ou 4 no abdome, e imagens sucessivas serem transferidas de
uma a outra, para dar a sensação de movimento.
Uma outra idéia levantada foi criar um sistema de reconhecimento
baseado em um banco de imagens e síntese de voz para dizer ao paciente a
forma e localização do objeto, o que poderia eventualmente deixar o tempo
de resposta mais curto. Isto poderia envolver técnicas adaptativas para este
banco ir sendo melhorado com o transcorrer do tempo. No projeto atual a
idéia foi abandonada para limitar a complexidade do circuito, e na crença de
que as redes neurais naturais do usuário fariam um trabalho de
reconhecimento mais bem feito, pelo menos em um primeiro instante.
Poderia ser tentado novamente adaptar uma câmera no dedo e
adaptar os programas de OCR para poder ler textos normais. Para revistas
com fonte pequena seria necessário desenvolver um programa de zoom
eficiente.
De qualquer modo, o equipamento como está já pode ser usado com
sucesso por pesquisadores de psicologia experimental em estudos de
cognição e aprendizagem.
9.1.3 Possíveis testes futuros
Para melhorar o conforto da estimulação elétrica cutânea, alguns
autores indicam que seria possível usar uma envoltória para aumentar
gradativamente o trem de pulsos até a amplitude máxima desejada, e depois
cair novamente gradativamente. No futuro poderia ser feita uma alteração na
geração dos estímulos para testar esta possibilidade [NOHAMA97],
[CASTRO,00].
De acordo com Nohama [97] baseando-se em fenômenos estudados
por Geldard [75] e outros autores, seria possível utilizar fenômenos de
integração, descritos anteriormente no capítulo de estimulação tactil e
fisiologia da pele, para tentar gerar eletrodos virtuais e aumentar a resolução
do sistema. A idéia é adequar os programas de distribuição do estímulo
gerado, permitindo acionar dois eletrodos vizinhos de maneira a fazer o
usuário perceber uma sensação entre os dois, ou seja, provavelmente
seriam acionados dois receptores nervosos próximos fazendo-se com que
135
seja interpretada pelo cérebro como se existisse um receptor extra entre os
dois. Isto poderia melhorar em muito a resolução, aumentando-a de 15x20
para 29x39, ou indo de 300 eletrodos reais para 1131 eletrodos, entre reais
e “virtuais”. Assim, testes também poderão ser feitos no futuro para checar
esta possibilidade.
Usando-se fMRI (functional magnetic ressonance imaging), ou
imagem de ressonância magnética funcional, Calvert [97] observou que
deficientes auditivos ao realizarem leitura labial tinham seu córtex auditivo
estimulado, da mesma maneira que ocorre quando uma pessoa comum
utiliza sua audição normal. Além disso, em estudos de substituição sensorial
feitos na Universidade de Heildelberg, em imagens enviadas à pele de
usuários por meio de estimuladores mecânicos, foram observadas também
imagens da ativação do córtex visual usando-se fMRI [STOLLE,01],
[MAUCHER,00], [MAUCHER,01].
Portanto, existe a expectativa de que possa ocorrer o mesmo para o
córtex visual ao usar o sistema aqui descrito, com o córtex sendo cada vez
mais ativado à medida que o treinamento for sendo realizado. Para isso
seria ideal usar imagens por ressonância magnética antes, após cada etapa
de treinamento e ao final dele. Contudo, fMRI requer um campo magnético
intenso para obter as imagens, e o equipamento utiliza metal em seus
eletrodos e cabos, isso sem mencionar os próprios componentes do
equipamento e suas baterias. Isto inviabiliza atualmente a tentativa de fazer
estas medições. Além disso, o campo magnético intenso poderia também
interferir nos estímulos, podendo inviabilizar a estimulação táctil.
No futuro, se forem usados estimuladores mecânicos em vez de
elétricos, seria possível realizar tais medições, desde que não tenham
metais, isto é, sejam do tipo pneumático e não micro-motores ou atuadores
piezoelétricos.
Uma alternativa para usar o equipamento atual seria utilizar-se EEG
para medir a atividade do córtex visual antes e depois do treinamento para
verificar sua possível ativação durante a aplicação de estímulos tácteis com
o equipamento.
136
LLIISSTTAA DDEE RREEFFEERRÊÊNNCCIIAASS
ABNT. NBR IEC 601-1 Equipamento eletromédico – Prescrições gerais para segurança. Associação Brasileira de Normas Técnicas. São Paulo: 1997.
ABNT. NBR 6533 Estabelecimento de segurança aos efeitos da corrente elétrica percorrendo o corpo humano. Associação Brasileira de Normas Técnicas. São Paulo: 1981.
AGARWAL, A.K.; NAMMI K.; KACZMAREK, K. A.; TYLER, M.E.; BEEBE, D.J. A hybrid natural/artificial electrostatic actuator for tactile stimulation In: 2nd Annu. Int. IEEE Eng. Med. Biol. Soc. Special Topic Conf. on Microtech. Med. & Biol., p.341, 2002.
ALVES, R.L.et al. Uma alternativa mais acessível para transdutores táteis. IV Congresso Iberoamericano de Tecnologias para Discapacitados, Vitória,ES., 2006.
AMIRALIAN, M.L.T.M. A reorganização perceptiva dos deficientes visuais e sua implicação na aprendizagem. Caderno de didática num.6, Educação especial, depto de metodologia do ensino e educação comparada da Faculdade de Educação da USP. 1985.
ANDERSON, G.B.; ROGERS, D.W. An inexpensive Braille terminal device COMMUNICATIONS OF THE ACM, vol. 11, n.6, p.417, 1968.
ANTONINO, P.H.D. “Estudo preliminar para o desenvolvimento de um sistema de visão através da sensação tátil, utilizando estimulação eletrocutânea” Tese de Mestrado, UNICAMP, 1993.
ASAMURA, N. YOKOYAMA, N, SHINODA, H. Selectively Stimulating Skin Receptors for Tactile Display IEEE Computer Graphics and Applications Nov/Dec, 1998.
BACH-Y-RITA, P.; COLLINS, C.C.; SAUNDERS, F.A.; WHITE, B; SCADDES, L. Vision substitution by tactile image projection, NATURE , vol. 221 p.963, 1969.
BACH-Y-RITA, P. “Neurophysiological Basis of a Tactile Vision-Substitution System”, IEEE Transactions on Man-Machine System, MMS-11,(1):108-110, March, 1970.
BACH-Y-RITA, P. Brain Mechanisms in Sensory Substitution. New York: Academic Press, 1972.
BACH-Y-RITA, P. Nonsynaptic Diffusion Neurotransmission and Late Brain Reorganization. New York: Demos. 1995.
BACH-Y-RITA, P.; KACZMAREK, K. A.; TYLER, M.E.; GARCIA-LARA, M. Form perception with a 49-point electrotactile stimulus array on the tongue: A technical note; J. Rehab. Res. Dev. , vol. 35, p.427, 1998.
137
BANON, G.J.F., BARREIRA, J. Bases da Morfologia Matemática para a Análise de Imagens Binárias. Recife: UFPE-DI, 1994.
BARRAGA, N. e HOLLIS, J. 0 Development of efficiency in visual functionings: A literature Analysis. Journal of visual impairment and Blindness, 1977, 71, 387-391.
BEAR, M.F.;CONNORS, B.W.; PARADISO, M.A. Neurociências - desvendando o sistema nervoso Porto Alegre: Artmed. 2002.
BEEBE, D.J.; HYMEL, C.M.; KACZMAREK, K. A.; TYLER, M. E. A polyimide-on-silicon electrostatic fingertip tactile display IEEE-EMCB and CMBEC Theme 7: Instrumentation, p.1545, 1995.
BLACK,J.B.; SAPIRO,G.; MARIMONT,D.H.; HEEGER,D. Rrobust anisotropic diffusion. IEEE Transactions on Image Processing. p.421, No3. Mar.1998.
BLAZIE Engineering. Product Catalog. Fall 1995.
BRABYN, J.A. New developments in mobility and orientation aids for the blind, IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, vol. BME-29, NO. 4, p.285, 1982.
BROESCH, J. Digital signal processing desmistified. Eagle Rock, VI: J. HighText Publications (LLH).1997.
BURDEA, G.C. Force and Touch Feedback for Virtual Reality. New York: John Wiley & Sons, Inc., 1996.
CALVERT, G.A.; BULLMORE, E.T., BRAMMER, M.J., CAMPBELL, R.;WILLIAMS, S.C.R.; McGUIRE, P.K., WOOODRUFF, P.W.R; IVERSEN, S.D.; DAVID, A.S. Activation of Auditory Cortex During Silent Lipreading Science. V.276, N. 5312, p.593-596. Abril 1997.
CARVALHO, A.A.; REBELLO, J.M.A.; VIANA, A.F. O Mundo das Imagens Digitais. Matéria, Vol 8, Nº 2 p.167, 2003. <http://www.materia.coppe.ufrj.br/sarra/artigos/artigo10297> Acesso em 15 Nov. 2005.
CASEY, R.; LECOLINET, E. A Survey Of Methods And Strategies In Character Segmentation. IEEE TRANSACTIONS IN PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol.18, No.7, p.690, Jul. 1996.
CASTRO, M.C.F. Desenvolvimento e aplicação de uma sistema para reabilitação sensoriomotora de membros usperiores paralisados. Tese de doutorado. Unicamp. 2000.
CHOW, A.Y. et al “Implantation of silicon chip microphotodiode arrays into the cat subretinal space”. IEEE Transactions on Rehabilitation Engineering, Vol. 9 No 1, p.86. Março 2001.
CLARK, L.L. International Guide to Aids and Appliances for Blind and Visually Imapired Persons. American Foundation For The Blind, New York, 1977.
138
CONDE, A.J.M. Definindo a Cegueira e a Deficiência Visual. Instituto Benjamin Constant. Disponível em: <http://www.cesec.org.br/deficiência/cegueira.htm> Acesso em 10 mar. 2002.
CONSULARO, L.A., COELHO, R.C. Visão Natural e Artificial. Escola de Informática da SBC Sul. Passo Fundo, RS: 2001.
DE SOUZA, F.P.C. Localização e Leitura Automática de Caracteres Alfanuméricos – Uma Aplicação na Identificação de Veículos. Dissertação de Mestrado, Universidade Federal do Rio Grande do Sul, RS, 2000.
COOK, D. Robot building for beginners. New York: Apress, 2002.
DAY, R.H. - Psicologia da Percepção, São Paulo: Livraria José Olympio - EDUSP, 1969.
DIETTERICH, T.G. Approximate Statistical Tests for Comparing Supervised Classification Learning Algorithms. - Neural Computation, Department of Computer Science, Oregon State University, EUA. 1997 ftp://ftp.cs.orst.edu/pub/tgd/papers/nc-stats.ps.gz Acesso em 15 out. 2002.
DIETTERICH, T.G. Experimental Methodology for Benchmarking – Department of Computer Science, Oregon State University, EUA. 2000 <http://wwwipd.ira.uka.de/~prechelt/nipsbench/expmeth.ps.gz> Acesso em 15 out. 2002.
DINIZ, S.S. Uso de Técnicas Neurais para o Reconhecimento de Comandos à Voz Dissertação de Mestrado em Engenharia Elétrica - Rio de Janeiro: Instituto Militar de Engenharia, Julho/1997.
DOBELLE, W.H. "Artificial Vision for the Blind by Connecting a Television Camera to the Brain" American Society of Artificial Internal Organs (ASAIO) Journal. Vol.46. p.3-9. 2000.
EMILIANI, P.L. Development of Electronic Aids for the Visually Impaired. Dordrecht: Martinus Nijhoff / Dr W.Junk Publishers, 1986.
FELIPPE, J.A.M. Caminhando juntos: manual das habilidades básicas de orientação e mobilidade. São Paulo: Laramara - Associação Brasileira de Assistência ao Deficiente Visual, 2001.
FELIPPE, J.A.M.; FELIPE, V.L.R. Orientação e Mobilidade São Paulo: Laramara - Associação Brasileira de Assistência ao Deficiente Visual, 1997.
FERREIRA, V.T. IBGE Censo 2000: mudam os índices oficiais da deficiência. Revista Sentidos. Vol.1 nº6. p.22-26. Junho,2002.
FLEXER, A. Statistical Evaluation of Neural Network Experiments: Minimum Requirements and Current Practice. The Austrian Research Institute For Artificial Intelligence – Vienna, Austria. 1996. ftp://ftp.ai.univie.ac.at/papers/oefai-tr-95-16.ps.gz
139
FRAIBERG, S. Insights from the blind, New York: Basic Books, Inc. Publishers, 1977.
GATES ENERGY PRODUCTS, Technical Staff. Rechargeable batteries: application handbook. Stonehgam,MA: Butterwoth-Heinamann/EDN, 1992.
GEDDES, L.A. Medical device accidents and illustrative cases. Tucson,AZ: Lawyers&Judges Publ.Co. 2002.
GELDARD, F.A Sensory saltation: matastability in the perceptual word. Hilsdale: Lawrence Erlbaum Associates Pub., 1975.
GOLDBERG, S. Descomplicando a Fisiologia. Porto Alegre: Artes Médicas, 1997.
GONZALEZ, R.C.; TOU, J.T. Pattern Recognition Principles. Reading, MA: Addison Wesley, 1981.
GONZALEZ, R.C.; WINTZ,P. Digital Image Processing. 2ed. Reading, MA: Addison Wesley, 1987.
GONZALEZ, R.C.; WOODS, R.E. Digital Image Processing. 3ed. Reading, MA: Addison Wesley, 1992.
GUEDES, L.A. Handbook of Electrical Hazards and accidents. Boca Raton: CRC, 1995.
KOLB, H, FERNÁNDEZ, E., NELSON, R., Webvision – the Organization of the Retina and Visual System <http://webvision.med.utah.edu/> Acesso em 13 setembro 2004.
HAYKIN, S. Redes Neurais, princípios e prática. Porto Alegre: Bookman, 2002.
HELLER, M.A.; SCHIFF,W. The psychology of touch. Hillsdale: Lawrence Erlbaun Associates, 1991.
HUBEL, Eye, Brain and Vision, Scientific American Library, New York 1995. apud: CONSULARO, L.A., COELHO, R.C. Visão Natural e Artificial, Escola de Informática da SBC Sul. Passo Fundo, RS: 2001.
IOVINE, J. Robots, Androids and animatronics. 2 ed. New York: MCGrawHill, 2002.
JOLION, J.M. e ROSENFELD, A. A Pyramid framework for early vision, Kluwer Academic Publ. Dordrecht:1994.
JONES, J.L.; FLYNN, A.M.; SEIGER, B.A. Mobile Robots. 2 ed. 1999
KACZMAREK, K. A. Electrotactile adaption on the abdomen: Preliminary results IEEE TRANS. REHAB. ENG. vol. 8 , p.499, 2000.
KACZMAREK, K. A.; KRAMER, K.M.; WEBSTER, J.G. ; RADWIN R.G. A 16-channel 8-parameter waveform electrotactile stimulation system IEEE TRANS. BIOMED. ENG. vol 38 p.933, 1991.
140
KACZMAREK, K. A.; WEBSTER, J.G. ; RADWIN R.G. Maximal dynamic range electrotactile stimulation waveforms IEEE TRANS. BIOMED. ENG. vol. 39 , p.701, 1992.
KACZMAREK, K. A.; WEBSTER, J.G. ;BACH-Y-RITA, P. ; TOMPKINS, W.J. Electrotactile and vibrotactile dsiplays for sensory substitution systems IEEE TRANS. BIOMED. ENG. vol 38 p.1, 1991.
KACZMAREK, K. A.; BACH-Y-RITA, P. Tactile displays In: BARNFIELD, W. ; FURNESS, T. Virtual environments and advanced New York ; Oxford Univeersity Press p.349, 1995.
KACZMAREK, K. A.; BACH-Y-RITA, P. ; TOMPKINS, W.J.; WEBSTER, J.G. A time-division multiplexed tactile vision substitution system IEEE ENG. MED. BIOL. SOC. p.101, 1984.
KACZMAREK, K. A.; BACH-Y-RITA, P. ; TOMPKINS, W.J.; WEBSTER, J.G. A tactile vision substitution system for the blind IEEE TRANS. BIOMED. ENG. vol BME-32 p.602, 1985.
KACZMAREK, K. A.; HAASE, S.J. Pattern identification and perceived stimulus quality as a function of stimulation waveform on a fingertip-scanned electrotactile display In: IEEE Trans. Neural Sys. Rehab. Eng. 11, p.9, 2003.
KACZMAREK, K. A.; HAASE, S.J. Pattern identification as a function of stimulation current on a fingertip-scanned electrotactile display In: IEEE Trans. Neural Sys. Rehab. Eng. 11, p.269, 2003.
KACZMAREK, K. A.; TYLER, M.E.; BACH-Y-RITA, P. Eletrotactile haptic display on the fingertips: Preliminary results In: Proc. 16th Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Baltimore. p.940, 1994.
KACZMAREK, K. A.; TYLER, M.E.; BACH-Y-RITA, P. Pattern identification on a fingertip-scanned electrotactile display In: Proc. 19th Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Chicago p.1694, 1997.
KACZMAREK, K. A.; TYLER, M.E.; BRISBEN, A.; JOHNSON, K.O. The afferent neural response to electrotactile stimuli: Preliminary results IEEE TRANS. REHAB. ENG. vol. 8 , p.268, 2000.
KACZMAREK, K. A.; WEBSTER, J.G. ; RADWIN, R.G. Periodic variations in the electrotactile sensation In: Proc. Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Philadelphia. p.1060, 1990.
KACZMAREK, K. A.; WEBSTER, J.G. Voltage-current characteristics of the electrotactile skin electrode interface In: Proc. Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Seattle. p.1526, 1989.
KACZMAREK, K.A.; WEBSTER, J.G.; BACH-Y-RITA, P.; TOMPKINS, W.J. “Electrotactile and Vibrotactile Display for Sensory Substitution Systems Neurophysiological Basis of a Tactile Vision-Substitution System”, IEEE Transactions on Biomedical Engineering, BME-38, (1): 1-16, January, 1991.
141
KANDEL, E.R.; SCHWARTZ, J.H. Principles of Neural Science. 4ed. New York: Prentice Hall, 1991.
KARA-JOSE, N. (Eds.) Auxiliar de Oftalmologia. São Paulo: Roca. 2000.
KAY, L. Auditory perception of objects by blind persons, using a bioacoustic high resolution air sonar. JASA 107, p.3266-3285. June 2000.
KETELAARS, N. Automated LicensePlate Recognition. AIMe Magazine p.9. Jan. 2002.
KIM, H.Y. Notas de aula de PEE5796 - Algoritmos para Processamento, Análise e Síntese de Imagens. São Paulo. EPUSP, 2001.
KINDERMANN, G. Choque elétrico. Porto Alegre: Sagra Luzzatto, 2000.
KOO, I. Wearable Tactile Display and Braille Display. Intelligen Robotic and Mechatronic System Lab, Sung Kyun Kwan University. http://mecha.skku.ac.kr/researchset.htm Acessado em 25 fev 2005.
LE CUN, Y. Página pessoal <http://yann.lecun.com/exdb/mnist/index.html> Acesso em 15 out. 2002.
LENAY, C., et al La Substitution Sensorielle: Limites Et Perspectives Université de Technologie de Compiègne, COSTECH - BIM, 2000.
LINDENBERG, T. Scale-Space Theory in Computer Vision. New York: Kluwer Academic Publishers, 1997.
LOOSE, M. A Tactile Vision Substitution System in: Handbook of Computer Vision and Applications, Vol.3 (Systems and Applications). B. Jähne, (Ed). Boston: Academic Press, 1999.
LOWENFELD, B. Psychology Problems of Children With Impaired vision. In Cruicckshanch, W.M. - Psychology of Exceptional Children and Youth. New York: Prentice Hall, 1971.
MARANTES, C.R. Medida da Acuidade Visual cap.13 In: OLIVEIRA, R.C.S.; Kara-Jose, N. (Eds.) Auxiliar de Oftalmologia. São Paulo: Roca. 2000.
MARR, D. Vision: A Computational Investigation into the Human Representation and Processing of Visual Information. New York: W.H.Freeman and Co, 1982.
MARVEN, C.; EWERS, G. A simple approach to digital signal processing. New York: Wiley Interscience. 1996.
MAUCHER, T., MEIER, K., SCHEMMEL, J. An Interactive Tactile Graphics Display Sixth International Symposium on Signal Processing and its Applications ISSPA 2001.
MAUCHER, T., SCHEMMEL, J., MEIER, K. The Heidelberg Tactile Vision Substitution System Proceeding of the 7th International Conference on "Computer Helping People with Special Needs", (ICCHP 2000).
142
MAUCHER, T., SCHEMMEL, J., MEIER, K. The Heidelberg Tactile Vision Substitution System Proceeding of the sixth International Conference on Tactile Aids, Hearing Aids and Cochlear Implants (ISAC2000).
MAYNARD, E.M. Visual Prosthesis. p.141-168. In: YARMUSH, M.L.; DILLER, K.R.; TONER, M. Ed. Annual Review of Biomedical Engineering, vol.3. Palo Alto, CA: Annual Reviews, 2001.
MAYNARD, E.M.; Annual Review of Biomedical Engineering, vol.3. Palo Alto, CA: Annual Reviews, 2001.
MEIJER, P.B.L. An Experimental System for Auditory Image Representations. IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, vol. BME-39, NO.2, p.112, 1992
MELEN, R.D.; MEINDL J.D. Electrocutaneous stimulation in a reading aid for the blind, IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, vol. BME-18, NO.14, p.1, 1971.
MELO, M.A.A.; KIM,H.Y. Filtragem de sinais do acelerometro pela difusao anisotropica, SIBGRAPI 2004.
MICROVISION página da empresa, com informações sobre projetores e displays usáveis. <http://www.microvision.com/> Acesso em 20 março, 2005.
MYKLEBUST, H.R. - The psychology of deafness. New York: Grune & Stratton, 2nd edition, 1966. apud. AMIRALIAN, M.L.T.M. A reorganização perceptiva dos deficientes visuais e sua implicação na aprendizagem. Caderno de didática num.6, Educação especial, depto de metodologia do ensino e educação comparada da Faculdade de Educação da USP. 1985.
MORI, S. SUEN,C.Y. YAMAMOTO, K. Historical review of OCR Research and Development. PROCEEDINGS OF THE IEEE, vol.80, No7, p.1029, Jul. 1992.
NOHAMA, P. “Investigação em Propriocepção Artificial” Tese de Doutorado, UNICAMP, 1997.
NURION Pagina da empresa Nurion-Raycal Inc, fabricante da Laser Cane e Polaron. http://www.nurion.net/Acessado em 10 de janeiro de 2006.
OLIVEIRA, R.C.S.; KARA-JOSE, N. Anatomia e Fisiologia do Globo Ocular cap.3 In: OLIVEIRA, R.C.S.; KARA-JOSE, N. (Eds.) Auxiliar de Oftalmologia. São Paulo: Roca. 2000.
ONCE Catálogo de Material Tiflotécnico. Organizacion Nacional de Ciegos de España. Madrid, 2000.
OSTROM, N.P.; KACZMAREK, K. A.; BEEBE, D.J. A microfabricated electrocutaneous tactile display In: Proc. 21th Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Atlanta p.838, 1999.
143
PALMA, D.M.C. Extração Automática de Texto em Seqüências de Vídeo. Dissertação de Mestrado, Universidade Técnica de Lisboa. Lisboa, 2004.
PALMER, S.E. Vision Science: photons to phenomology Bradford-MIT Press, Cambridge, MA: 1999
PARKER, J.R. Algorithms for image processing and computer vision. New York: Wiley, 1997.
PASQUERO, J., HAYWARD, V., STReSS: A Practical Tactile Display System with One Millimeter Spatial Resolution and 700 Hz Refresh Rate, Proc. Eurohaptics 2003, Dublin, Ireland, July 2003.
PAVLIDS, T. Algorithms for Graphics and Image Processing, Springer Verlag, Berlin: 1982
PEREIRA, M.C., CLIQUET Jr, A., KASSAB Jr, F. Substituição Sensorial para Auxílio à Mobilidade de Deficientes Visuais via Eletroestimulação Táctil. III Congresso Iberoamericano de Tecnologias para Discapacitados, Costa Rica, 2004.
PEREIRA, M.C., CUNHA,F.L.; CLIQUET Jr, A., KASSAB Jr, F. Estudo comparativo dos meios de alimentação de uma prótese multifunção para membros superiores. III Congresso Iberoamericano de Tecnologias para Discapacitados, Costa Rica, 2004.
PEREIRA, M.C., CLIQUET Jr, A., KASSAB Jr, F. Eletroestimulador para uso em substituição sensorial. IV Congresso Iberoamericano de Tecnologias para Discapacitados, Vitória,ES., 2006.
PEREIRA, M.C., Processo e equipamento para experimentos somestésicos e para substituição sensorial para auxílio a deficeintes via técnicas de processamento digital de sinais e estimulação cutânea. Pedido de privilégio de patente de invenção nº PI 0600724-4, protocolado em 16/02/2006 sob o nº0075 junto ao INPI – Instituto Nacional de Propriedade Industrial.
PEREIRA, M.C., KASSAB, Jr. F. An Electrical stimulator for Sensory Substitution, aceito no 28th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, EMBC2006, a reazlizar-se de 30agosto a 3 de setembro de 2006, New York, NY.
PERONA,P.; MALIK, J. Scale space and Edge Detection using Anisotropic diffusion. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol.12, No.7, p.629, Jul.1990.
PRECHELT, L. Proben 1 A set of Neural Network benchmark problems and benchmark rules Fakultat für Informatik von Karlsuhe, Alemanha. 1994. <http://www.poli.usp.br/d/pmr5406/Download/Metodologia/proben.ps> Acesso em 20 out. 2002.
144
PULSE DATA INT. Ltda KOO, I. Braille Displays. Pulse Data Internat. Ltd. <http://www.humanware.com/Products/Braille_Display/Braille_Display_index.asp> Acessado em 25 fev 2005.
PUN, T. Segmentation of images for scene simplification IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, vol. BME- 29, No.4, p.293, 1982.
RAMALHO, J.P.; ISSA, F.M.R., PEREIRA, M.C., et al. Uma proposta para comparação de performance entre redes neurais artificiais. 6º SBAI. Bauru: Unesp. 2003.
RESOURCES FOR REHABILITATION. Vision, Rehabilitation Resource Manual Lexington, MAC Resources for Rehabilitation, 1993.
ROSSI, H.P., CASTRO, M.C.F. Interface De Comunicação Para Deficientes pôster no IV Congresso Iberoamericano de Tecnologias para Discapacitados, Vitória,ES., 2006.
RUSS, J.C. The Image Processing Handbook. Boca Raton: CRC Press, 4ed. 2002.
SALEM, A.-B. M., SEWISY, A. A., AND ELYAN, U. A. A vertex chain code approach for image recognition. ICGST International Journal on Graphics, Vision and Image Processing, 2005.
SAMPAIO, E.; MARIS, S.; BACH-Y-RITA, P. Brain plasticity: 'visual' acuity of blind persons via the tongue BRAIN RESEARCH, n.908, p.204, 2001.
SAMPAIO, M.W.; CIBILS, C.A. Visão subnormal. cap.26 In: OLIVEIRA, R.C.S.; Kara-Jose, N. (Eds.) Auxiliar de Oftalmologia. São Paulo: Roca. 2000.
SAUNDERS, I.R. Tactile aids for the hearing impaired. Londres: Whurr, 1992.
SCHEMMEL, J., LOOSE, K., MEIER, K. A 66 x 66 pixels analog edge detection array with digital readout Proceedings of the 25th European Solid-State Circuits Conference, 1999.
SCHIFF, W.; FOULKE,E.Tactual Perception: a sourcebook . Cambridge: Cambridge University Press, 1982.
LEUTWYLER, K. Hope for Restoring Sight. Scientific American, 27 de setembro de 2000.
SHIRAI, A.; SATO, M.; KUME, Y.; KUSAHRA, M. Fantastic Phantom Slipper. Tokyo Institute of Polytechnics, Faculty of Engineering. <http://laplace.photo.t-kougei.ac.jp/slipper/slipper-E.html> Acessado em 25 set. 2003.
SILVA, E.; OLIVEIRA, A.C. Dicas para a configuração de Redes Neurais. Rio de Janeiro. Outubro 2001. <http://www.nce.ufrj.br/labic/downloads/dicas_cfg_rna.pdf> Acesso em 15 out. 2002.
145
STOLLE, A. et al. Functional mapping of the somatosensory cortex with a new pneumatically driven tactile display matrix Human Brain Mapping HBM2001.
SZETO, A.Y.J.; LYMAN, J. Comparison of Codes for sensory feedback using electrocutaneous tracking. Annals of Biomedical Engineering. Vol.5 p.367-383. 1977. apud: NOHAMA, P. Investigação em Propriocepção Artificial. Tese de Doutorado, UNICAMP, 1997.
SZETO, A.Y.J., RISO, R.R., Sensory Feedback using Electrical Stimulation of the Tactile Sense. In Rehabilitation Engineering, R.V. Smith and J.H. Leslie, Jr. (eds), p.28-78. CRC Press, 1990.
SZETO, A.Y.J.; SAUNDERS, F.A., Electrocutaneous stimulation for sensory communication in rehabilitation engineering. IEEE Transactions on Biomedical Engineering, vol. BME-29, p.300., Abr. 1982.
SOLOMONOW, M. PRADOS, D. Further evidence on learning in the tactile sense. AIEE Frontiers of Engineering and Computing in Health Care, pp.39-42. 1982.apud NOHAMA, P. Investigação em Propriocepção Artificial. Tese de Doutorado, UNICAMP, 1997.
SOLOMONOW, M. LYMAN, J. FREEDY, A. Electrotactile two point discrimination as a function of frequency, body site, laterality, and stimulation codes. Annals of Biomedical Engineering, vol.5 m.1, pp.47-60. 1977.apud NOHAMA, P. Investigação em Propriocepção Artificial. Tese de Doutorado, UNICAMP, 1997.
TALAN, J. Scientists trigger visual perceptions in blind. The Seattle Times. 4 de Janeiro de 2000.
TANG,H., BEEBE, D.J. “An ultra-flexible electrotactile display for the roof of the mouth” Proceedings of the First Joint BMES/EMBS Conference Advanced Technology Serving Humanity, Oct.13-16, 1999, Atlanta, GA, USA.
TEXAS INSTRUMENTS. Curso de Introdução a sistemas digitais de vídeo. São Paulo, Texas Instruments, 2003.
TIRESIAS. Personal Electronic Mobility devices. <http://www.tiresias.org/equipment> Acesso em 30 mar. 2003.
TYLER, M.; HAASE, S.; KACZMAREK, K. ;BACH-Y-RITA, P. Development of an electrotactile glove for display of graphics for the blind: Preliminary results In: 2nd Joint Conf. IEEE EMBS and Biomed. Eng. Soc., p.2439, 2002.
UMBAUGH, S.E. Computer Vision and Image Processing: A Practical Approach using CVIP Tools. New York: Prentice Hall, 1997.
VASCONCELOS, C.A.D.; PEREIRA, T.C. Implementação de um módulo localizador de placas em imagens digitalizadas de veículos. Monografia de Graduação em Engenharia de Computação. Campo Grande,MS: UCDB, 2001.
146
WANDELL, B.A.Foundations of Vision. Sundereland, MA: Sinauer Associates, Inc. 1995.
WANET-DEFALQUE, M.C.; VERAART,C.; DEVOLDER, A.; METZ,R.; MICHEL, C.; DOOMS, G.; GOFFINET,A. High metabolic activity in the visual cortex of early blind human subjects. Brain Research, 446, p.368-373. 1988. apud. BACH-Y-RITA, P. Nonsynaptic Diffusion Neurotransmission and Late Brain Reorganization. New York: Demos. 1995.
WAY, T.P.; BARNER, K.E. Automatic visual to tactile translation - Part I: Human factors, acess methods, and image manipulation, IEEE TRANSACTIONS ON REHABILITATION ENGINEERING, vol. 5, NO.1, p.81-94, 1997.
WAY, T.P.; BARNER, K.E. Automatic visual to tactile translation - Part II: Evaluation of the TACTile image creation system, IEEE TRANSACTIONS ON REHABILITATION ENGINEERING, vol. 5, NO.1, p.95-104, 1997.
WEBSTER, John J., et al., Medical Instrumentation: Application and Design. New York: John Wiley, 1998
WHO. Oragnização Mundial da Saúde. Blindness: Major causes worldwide. <http://www.who.int/health_topics/blindness/en/> Acesso em 10 jul. 2003.
WICAB Inc. Sistema Brain Port de Susbstituicao Sensorial<http://www.wicab.com> Acessado em 20 abril de 2006.
WISE, E. Applied Robotics. Indianapolis, IN: Promp Publications/SAMS, 1999.
YARMUSH, M.L.; DILLER, K.R.; TONER, M. Ed. Annual Review of Biomedical Engineering, vol.3. Palo Alto, CA: Annual Reviews, 2001.
147
AAPPÊÊNNDDIICCEESS
148
A1. FORMULÁRIOS DE TESTES
Usuário: Sexo: Idade:
Horário: início: termino: total descontadas as pausas: Vidente [ ] cego congênito [ ] cego adquirido [ ]. Acuidade visual: Causa: Orientador do teste:
1.Teste preliminar:
Espaçamento de eletrodos min [ ]. max [ ]. Tamanho de eltrodos min [ ]. max [ ].
Largura do pulso min [ ]. max [ ]. Quantidade de pulsos na rajada min [ ]. max [ ].
Intervalo entre rajadas Nível DC Nulo [ ]. Não nulo [ ].
Descrição da sensação:________________________________________________________________ ________________________________________________________________________
Desenho da figura Carimbo [ ]. Coluna mantendo [ ]. Coluna apagando [ ]. Ponto a ponto [ ].
Criou Eletrodo virtual Sim [ ]. Não [ ]. Intensidade dos pulsos Envoltória[ ]. Constante [ ].
Comentários:______________________________________________________________ _________________________________________________________________________ Teste de ajuste de eletrodos: resolução horizontal e vertical # # # # # # # # _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
# # # # # # # # # _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ # _ _ _ _
# # # # # # # # # # # # # # # # _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ _ _ _ _
149
Usuário: Sexo: Idade:
Horário: início: termino: total descontadas as pausas: Vidente [ ] cego congênito [ ] cego adquirido [ ] Acuidade visual: Causa: Orientador do teste:
2.Teste de treinamento de usuários:
Qtde de horas anteriores Opcional: desenhar a figura reconhecida: início final Tempo total Reconhecido como Certo? Reta horiz. Reta vert. Diag.p/baixo Diag.p/cima Letra ELE Quadrado Triang.direita Triang.esq. Círculo início final Tempo total Reconhecido como Certo? Reta horiz. Reta vert. Diag.p/baixo Diag.p/cima Letra ELE Quadrado Triang.direita Triang.esq. Círculo início final Tempo total Reconhecido como Certo? Reta horiz. Reta vert. Diag.p/baixo Diag.p/cima Letra ELE Quadrado Triang.direita Triang.esq. Círculo
150
3.Análise de resultados: Totalização/consolidação e gráficos
Média dos tempos p/reconhecer, por sessões, e ao final dos padrões do PC
Sessões => 0 1 2 3 4 5 6 7 8 9 10 11 12 média PC Vidente 1 Vidente 2 Vidente 3 Vidente 4 Total videntes Adquirido 1 Adquirido 2 Adquirido 3 Adquirido 4 Tot. Adquiridos Congênito 1 Congênito 2 Congênito 3 Congênito 4 Tot.Congenitos
Média dos% de acerto p/reconhecer, por sessões, e ao final dos padrões do PC
Sessões => 0 1 2 3 4 5 6 7 8 9 10 11 12 média PC Vidente 1 Vidente 2 Vidente 3 Vidente 4 Total videntes Adquirido 1 Adquirido 2 Adquirido 3 Adquirido 4 Tot. Adquiridos Congênito 1 Congênito 2 Congênito 3 Congênito 4 Tot.Congenitos 1.Gráficos gerados para cada usuário e comparando os 3 grupos: vidente, congênito e adquirido tempo p/ reconhecimento percentual de acerto
| + | + + | + | + | + + + | + + |______________________ |_____________________ sessões de treinamento sessões de treinamento
2.Desenhar ambos juntos, para cada um dos 3 grupos percentual de acerto, tempo p/reconhecimento
| t | t a a | t a | t a | a a t t |______________________
sessões de treinamento
151
A2. TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO
I - DADOS DE IDENTIFICAÇÃO DO SUJEITO DA PESQUISA OU RESPONSÁVEL
LEGAL
1. NOME DO PACIENTE.......................................................................................................
DOCUMENTO DE IDENTIDADE Nº : ........................................ SEXO : M ? F ?
DATA NASCIMENTO: ......../......../......
ENDEREÇO ............................................................................... Nº ............. APTO:............
BAIRRO: .......................................................... CIDADE......................................................
CEP:......................................... TELEFONE: DDD (..............)..............................................
2.RESPONSÁVEL LEGAL ....................................................................................................
NATUREZA (grau de parentesco, tutor, curador etc.) ...........................................................
DOCUMENTO DE IDENTIDADE :.............................................SEXO: M ? F ?
DATA NASCIMENTO.: ....../......./......
ENDEREÇO ............................................................................... Nº ............. APTO:............
BAIRRO: .......................................................... CIDADE......................................................
CEP:......................................... TELEFONE: DDD (..............)..............................................
II - DADOS SOBRE A PESQUISA CIENTÍFICA
1. TÍTULO DO PROTOCOLO DE PESQUISA ..Tato remoto: sistema de substituição sensorial para
auxílio a deficientes visuais via técnicas de processamento de imagens e eletro-estimulação cutânea
(provisório).................................
PESQUISADOR: .Mauro Conti Pereira...................................................................................
CARGO/FUNÇÃO: ...doutorando.....INSCRIÇÃO CONSELHO REGIONAL Nº ....................
UNIDADE : .....EPUSP – Depto de Telecomunicações e Controle................
3. AVALIAÇÃO DO RISCO DA PESQUISA:
SEM RISCO ? RISCO MÍNIMO X RISCO MÉDIO ?
RISCO BAIXO ? RISCO MAIOR ?
(probabilidade de que o indivíduo sofra algum dano como conseqüência imediata ou tardia do estudo)
4.DURAÇÃO DA PESQUISA : ..setembro de 2003 a março de 2007..................................
III - REGISTRO DAS EXPLICAÇÕES DO PESQUISADOR AO PACIENTE OU SEU
REPRESENTANTE LEGAL SOBRE A PESQUISA, CONSIGNANDO:
1.justificativa e os objetivos da pesquisa;
Pessoas com baixa acuidade visual têm maior dificuldade de inserção na sociedade, com
problemas para usufruir uma vida completamente autônoma.
O presente estudo tem por finalidade auxiliar o deficiente visual em sua familiarização de
ambientes desconhecidos, para sua orientação e mobilidade, permitindo uma maior autonomia de
locomoção. Propõe-se substituição sensorial da visão pelo tato, permitindo que imagens sejam
capturadas e tratadas em um computador, para simplificá-las e detectar o contorno de objetos.
Posteriormente estas imagens simplificadas são enviadas ao usuário por meio de eletro-estimulação
cutânea no abdome.
152
Em uma segunda etapa, o estudo tem também por finalidade permitir capturar as
informações contidas em cartazes e letreiros.
2.procedimentos que serão utilizados e propósitos, incluindo a identificação dos
procedimentos que são experimentais;
A estimulação é feita por meio de uma matriz de eletrodos externa, colocada sobre a pele, fixada
temporariamente durante o uso, por meio de uma faixa elástica abdominal. Não há necessidade de
cortes para o uso do equipamento. É como se fosse sendo desenhado na pele do usuário o contorno
dos objetos da imagem capturada.
Para dar noção de profundidade da imagem, permitindo diferenciar entre um objeto grande e distante,
de um objeto pequeno que esteja próximo, será usado um sistema auxiliar adicional, com sensor de
ultra-som para medir a distância. Esta informação de distância será inforamda por meio de um
vibrador externo, estilo vibracall de telefone celular, que vibrara mais quanto mais perto estiver do
objeto da imagem.
Em uma segunda etapa, o programa que trata a imagem será melhorado para encontrar na imagem
letreiros e sinais, focando nas letras e aproximando a imagem, transferndo esta informação ao usuário
através da mesma matriz de eletrodos.
3. desconfortos e riscos esperados;
A estimulação elétrica deverá ser sentida como um formigamento ou leve vibração. Em
alguns casos poderão ser sentidas como se fossem pequenas agulhadas, bastando então diminuir a
intensidade do choque para evita-las. Se houver um tempo excessivo de uso poderá ocorrer
vermelhidão na área estimulada.
Apesar de não haver indicações de perigo, não é recomendável que pessoas com problemas
cardíacos, marca-passo ou grávidas se submetam a eletro-estimulação cutânea.
As medidas a serem tomadas em caso de ocorrência do descrito acima é levar ao pronto
atendimento do Hospital Universitário da UFMS ou da Santa Casa de Campo Grande, através do
SUS.
4. benefícios que poderão ser obtidos;
Maior autonomia do individuo quando entra em ambientes desconhecidos para criar um mapa
mental deste ambiente. Sem o equipamento, se não houver uma pessoa para descrever o local
desconhecido, o deficiente visual precisa usar técnicas de orientação e mobilidade para familiarização,
que levam tempo e podem ser constrangedoras.
Na segunda parte do trabalho, letreiros e sinais poderão ser “lidos”, isto é, os contornos das
letras e números poderão ser desenhados na pele do usuário. Isto facilitaria para tomar ônibus ou
encontrar uma sala especifica em uma escola ou prédio publico.
5.procedimentos alternativos que possam ser vantajosos para o indivíduo.
Existem atualmente no mundo grupos de pesquisadores tentando desenvolver próteses
visuais que visam criar uma retina artificial ou mesmo estimular diretamente o cérebro. Mas isto requer
cirurgias e seus riscos inerentes, além de não poderem ser usados em todos os casos, e demorarem
muito tempo.
153
As vantagens do sistema de substituição sensorial proposto, externo, são diversas, entre elas:
• risco zero de infecção (ao contrário de implantes);
• aplicação em pacientes com visão subnormal e cegueira por qualquer causa, seja por
problemas na retina, nervo óptico, parte de visão do cérebro, pois usa a parte do tato (ao
contrário da retina artificial e estimulação direta do córtex cerebral);
• não requer iluminação especial, ao contrário do que seria necessário para retinas artificiais,
que tem baixo aproveitamento da luz (e ainda estão em testes)
• menor custo e facilidade de implantação, resultando em uma maior acessibilidade;
• pode ser retirado para exercícios e nadar, por exemplo.
Além disso, não se visa aqui a recuperação completa da visão perdida, mas sim criar um auxílio
que melhore as condições de vida resolvendo problemas práticos da vida diária, e que em um espaço
mais curto de tempo se obtenham resultados.
No Brasil um sistema mais barato, acessível e de rápida implantação e treinamento seria mais
apropriado às condições econômicas locais.
IV - ESCLARECIMENTOS DADOS PELO PESQUISADOR SOBRE GARANTIAS DO SUJEITO DA
PESQUISA:
1. acesso, a qualquer tempo, às informações sobre procedimentos, riscos e benefícios
relacionados à pesquisa, inclusive para dirimir eventuais dúvidas.
2. liberdade de retirar seu consentimento a qualquer momento e de deixar de participar do
estudo, sem que isto traga prejuízo à continuidade da assistência.
3. salvaguarda da confidêncialidade, sigilo e privacidade.
4. disponibilidade de assistência pelo SUS, por eventuais danos à saúde, decorrentes da
pesquisa
V. INFORMAÇÕES DE NOMES, ENDEREÇOS E TELEFONES DOS RESPONSÁVEIS PELO
ACOMPANHAMENTO DA PESQUISA, PARA CONTATO EM CASO DE INTERCORRÊNCIAS
CLÍNICAS E REAÇÕES ADVERSAS.
Mauro C.Pereira – (67)9981-7050
Fuad Kassab Jr – (11)9900-8525
VI. OBSERVAÇÕES COMPLEMENTARES:
1.Os usuários serão voluntários, sem remuneração alguma, mas com o equipamento podendo
ser levado até onde for mais conveniente ao voluntário para aplicar o treinamento e testes, seja
em seu domicílio, local de trabalho ou mesmo na UCDB ou ISMAC(Instituto Sul-Matogrossense
para Cegos Florisvaldo Vargas), em Campo Grande, MS.
VII - CONSENTIMENTO PÓS-ESCLARECIDO
Declaro que, após convenientemente esclarecido pelo pesquisador e ter entendido o que me foi
explicado, consinto em participar do presente Protocolo de Pesquisa. Assim, assino 2 vias deste
documento e recebo uma delas.
Campo Grande, de de .
__________________________ ______________________________
assinatura do sujeito da pesquisa assinatura do pesquisador
ou responsável legal (carimbo ou nome Legível)
154
A3 ALGUMAS INSTITUIÇÕES DE AUXÍLIO AO DEFICIENTE
VISUAL E SEUS LINKS Fundação Dorina Nowill (antiga Fundação do Livro do Cego)
Rua Doutor Diogo de Faria, 558 Cep 04037-001. São Paulo.
Fone: 5087-0999 Fax: 5087-0977.
Doações: 0800 770 1047
<http://www.fundacaodorina.org.br/br/inicio.asp>
Laramara – Associação Brasileira de Assistência ao Deficiente Visual
Rua Conselheiro Brotero 338, São Paulo, SP – 01154-000
(11)3660-6400 fax (11)3662-0551
http://www.laramara.org.br
Instituto Benjamin Constant (IBC) - órgão do MEC
O IBC é a maior entidade parceira do projeto DOSVOX. No IBC todos os produtos gerados
pelo projeto DOSVOX são testados, usados e ensinados. A parceria com o IBC propiciou
também o desenvolvimento de grande parte da tecnologia de impressão braille usada hoje
no Brasil.
Instituto Sul-Matogrossense para Cegos "Florisvaldo Vargas" ISMAC, Rua 25 de
dezembro 262 - Campo Grande, MS – 79002-060
(67) 3325-0997, 3325-0996
ABEDEV - Associação Brasileira de Educadores de Deficientes Visuais
Rua Rui Barbosa, 1961 - Ap. 13 - Bl. "B" - Centro - Campo Grande - MS
Fone/Fax: (67) 382-1581
E-mail: [email protected]
Rede SACI - estimula a inclusão social e melhoria da qualidade de vida por meio da difusão
de informações sobre deficiência. Av. Prof.Luciano Gualberto trav.J 374, térreo sala 10
Cidade Ujiversitaria – Cão Paulo, SP - 05508-900
(11)3091-4155 / 4370
http://www.saci.org.br/
SENAI: Curso de escrita Braille para docentes do SENAI
http://www.senai.br/braille/
155
Projeto DOSVOX – projeto para criação de ferramentas para permitir o uso de
computadores por pessoas cegas, iniciado no Núcleo de Computação Eletrônica da UFRJ.
http://caec.nce.ufrj.br/dosvox/index.html
MEC – Projeto CAP - visa criar uma infraestrutura nacional para apoio ao deficiente visual,
provendo locais para geração de material didático e impressão Braille. Os Centros de Apoio
Pedagógico (CAP) se espalham por todo Brasil, e cada um atua com uma visão
regionalizada, atendendo às especificidades das diversas regiões. A tecnologia utilizada nos
CAP é baseada nos programas criados pelo projeto DOSVOX, em especial o programa
Braille Fácil, que se tornou o padrão para impressão Braille no Brasil, uma parceria entre o
DOSVOX, ABEDEV e Instituto Benjamin Constant com apoio da Secretaria de Educação
Especial do Ministério da Educação.
Tiresias - International Information on Visual Disability
Information resource for people working in the field of visual disabilities
http://www.tiresias.org/
American Council of The Blind (ACB) - www.acb.org/
American Foundation for the Blind (AFB) - www.afb.org
Braille Institute of America for the blind and visually-impaired - www.brailleinstitute.org
National Eye Institute (NEI) of the National Institutes of Health - www.nei.nih.gov
National Federation of the Blind (NFB) - www.nfb.org/
Canadian National Institute for the Blind (CNIB)
www.cnib.ca/ http://www.icomm.ca/cnib/
Council of Citizens with Low Vision International (CCLVI)
www.cclvi.org/
156
A4 GRUPOS DE PESQUISA DE SUBSTITUIÇÃO SENSORIAL
Aqui estão listados diversos grupos que trabalham com SS em geral,
inclusive para aplicações auditivas, propriocepção, e outras, não são todos
em SS para visão, inclusive diversos trabalham com os aspectos cognitivos
ou fisiológicos da área. Os que realmente publicaram trabalho na área de
visão por tato estão marcados com **. Alguns como Eliana Sampaio e
G.Aielo usam tecnologia desenvolvida na Universidade de Maddison, tendo
sido pesquisados visitantes.
**Neural Rehabilitation Engineering Laboratory University of Louvain
(UCL) - Brussels, Belgium
Patricia Arno, Maire-Chantal Wanet Defalque, Claude Veraart, Annick
Vanlierde, Anne Raxhon
**Electronic Vision(s) Group Heidelberg University
Karlheinz Meier, Andreas Breidenassel,Thorsten Maucher,
Johannes Schemmel
**Laboratoire de Psychologie du Developpement - Strasbourg, France
Eliana Sampaio
Institut de Physique Biologique - Universite Louis Pasteur, Strasbourg,
France
Laurence Lemaire, Christian Scheiber
Costech (EA 2223) and BIM (UMR 6600, CNRS), Compiegne University of
Technology - Compiègne Cedex
Charles Lenay, Sylvain Hanneton, John Stewart, Olivier Gapenne, Catherine
Marque, Clotilde Vanhoutte, Pierre Villon, François Sebbah, Armen
Akatchakourov, Gaetan Dhayer
157
EHESS - Maison des Science de l'Homme, Paris
Marc Relieu
***Department of Physical Medicine and Rehabilitation - University of
Wisconsin
Paul Bach-y-Rita, Kurt Kaczmarek
**Dept of Biomedical Engineering, Un. Of Winsconsin Maddison
John Webster, David Beebe
IPO-Centre for Research on Human System Interaction - Eindhoven
University of Technology
Dominic G. Bouwhuis
Laboratory for Integrated Advanced Robotics (LIRA-Lab) Dist, University
of Genoa, Italy
Riccardo Manzotti, Giorgio Metta, Giulio Sandini, Xavier M. Sauvan
LPPA (UMR 9950) - College de France
Chantal Milleret
Medical Physics Group, School of Physics - University of Exeter
Ian summers
Laboratoire de Psychologie Expérimentale,CNRS
Kevin O’Regan
Associated and/or interested partners :
**Gaetano Aiello da Unipa, Italia
Peter Meijer da Philips
Sabine Ploux da Isernm, França
François Langevin, da UTC, França
Sandrine Russier, Serge Portalier, de Lyon
Scania de Schonen, de Paris5.
158
Dept of Engineering Science – Oxford University
N. Molton, D.Lee, P.Probert,S.Se.J.M.Brady
Department of Information Science, University of Tokio
Ken Sakamura
**Dept of Electrical Engineering, Univ.of Missouri
Hui Tang
Haptics Laboratory, a part of the Center for Intelligent Machines at
McGill University , Montreal, Canadá.
Vincent Hayward
Jerome Pasquero
http://www.laterotactile.com/
Intelligen Robotic and Mechatronic System Lab, Sung Kyun Kwan
University, Korea.
Igmo Koo
http://mecha.skku.ac.kr/researchset.htm
159
A5.CIRCUITO ELÉTRICO DO PROTOTIPO 1
Fig.66. Esquema da placa de cada coluna, com oscilador, amplificação, endereçamento e potência
160
A6.JUMPERS DE CONFIGURAÇÃO DA PLACA DE POTÊNCIA
CONECTORES CN1: para eletrodos Pino/descrição Pino/Descrição 1: pino 3 6: pino 7 2: pino 2 7: pino 6 3: pino1 8: pino 5 4: retorno 9: pino 4 5: retorno 10: retorno Na placa Opto1 Opto2 Opto3 Opt4 Opto5 Opto6 Opt7 CN2: pinos de coluna e linha vindos do microcontrolador
O pino1 faz via JP1 com que o controle OE do 74573 seja via bus ou aterrado local. CN3: sinais de alta voltagem indo para ou vindo do barramento Pino/descrição Pino/Descrição 1: Hi Va 5: Hi Va 2: Hi Va 6: Hi Va 3: Hi Vb (retorno) 7: Hi Vb (retorno) 4: Hi Vb (retorno) 8: Hi Vb (retorno) CN4: pinos de oscilação indo para ou vindo do barramento Pino/descrição Pino/Descrição 14:+VDD 13:+VDD (p/555 e TIP122) 12:+VDD 11:+VDD
10: GND 9: GND 8: GND 7: GND 6: +Vcc 5: +Vcc=5V 4: =3 3: oscilação em BT (bx tensão) 2: =1 1: ground dos LEDs GLed OSC Vcc Gnd Gnd Vdd Vdd
Pino Descrição 1 OE opcional* 2 Linha 7 3 L6 4 L5 5 L4 6 L3 7 L2 8 L1 9 Coluna B0 10 Col. B1 11 Col. B2 12 Col. B3
161
JUMPERS JP1: conecta o OE do latch 74573 em terra local ou em pino vindo do bus(barramento), i.e., do microcontrolador. Assim, pode-se desabilitar as saídas das placas via comando do uCtr. OBS: o terra do kit de desenvolvimento do microcontrolador deve se conectar ao terra das placas através do terra e +5 do backplane vindos pelo barramento do oscilador, isto é, via conector do backplane ao kit (CN4) Pino/descrição Pino/Descrição 2 GND local 3: OE do
74573 1: GND do uC 3: = Se conectar: pinos Nome Descrição Apenas 2-3 BACKPLANE 1 OE ao terra local, latch funciona sempre Apenas 1-3 BAKCPLANE 2 OE ao barramento, se conectado no barramento
do backplane, latch funciona apenas sob comando do uCtrl
1-3, 2-3 TESTE SEM BACKPLANE
OE ao terra e ao barramento, conecta OE(573) aos 2 terras, interconectando-os – serve quando testar placa sem o backplane, conectado direto ao kit
JP2: seletor de endereços da placa Se fechar cada jumper, leva o sinal do endereço a nível alto; reserva 0000 p/alteracoes de endereço B3,B2,B1,B0 endereco 0000 0 ... ... 1111 15
JP3a e JP3b: seleção de alta voltagem local ou do barramento Formato e conexões: JP3a Pino/descrição Pino/descrição 2: anodo 1 do MOC/RSS (p/eletrodo) 3=4: trafo secundário A 1: pinos 1256 do CN3 (bus: Hi Va) 4=3: trafo secundário A JP3b Pino/descrição Pino/descrição 2: pino de retorno do CN4 (para eletrodo) 3=4: trafo secundário B 1: pinos 3478 do CN3 (bus:Hi Vb:retorno)
4=3: trafo secundário B
Configuração pinos nome Descrição Apenas 2-3 INDEPENDENTE usa sinal do trafo local, não exporta (cada placa
com o seu) 2-3, 1-4 MESTRE usa trafo local e exporta (1 sinal p/todas as placas) Apenas 1-2 ESCRAVO importa o sinal do trafo do barramento, vindo de
uma placa mestre ou de um circuito externo OBS: DEIXAR APENAS UMA PLACA COMO MESTRE PARA NÃO DAR CONFLITO
162
JP4: seleção de sinal do oscilador, de baixa tensão (antes do ajuste de tensão e do trafo); Formato e conexões Pino/descrição Pino/descrição Pino/descrição 1: NC: não conectado 5: à base do transistor de
ajuste de amplitude (OBS: o primário do trafo esta conectado no coletor do transistor)
4: pino 3 (saída) do oscilador local
NC: não conectado 2=3 3=2: ao pino 3 e 4 do CN4 (oscilação das placas)
Configuração: pinos Nome Descrição Apenas4-5 INDEPENDENTE usa sinal do oscilador local, não exporta (cada
placa com o seu) 4-3, 5-2 MESTRE usa oscilador local e exporta (1 sinal p/todas as
placas) Apenas 2-5 ESCRAVO 1 importa o sinal do oscilador do barramento, vindo
de uma placa mestre ou de um circuito externo OBS: DEIXAR APENAS UMA PLACA COMO MESTRE PARA NÃO DAR CONFLITO
163
A7.PLACA DE MEDIÇÃO DE CORRENTE E SIMULADOR DE
PELE
Fig.67. Foto da placa de medição de corrente RMS conectada ao simulador de pele
164
A8. PROTÓTIPO 2: PLACAS DE ESTÍMULO DE 20
ELETRODOS, CPU, FONTE E PLACA-MÃE
Fig.68. Layout da nova placa de estimulação, de 20 eletrodos
Fig.69. Foto da placa de microcontrolador incluída no prototipo2
165
Fig.70. Foto da placa de geração de alta tensão do protótipo 2
Fig.71. Fotos da placa-mãe e dela com as placas de estímulos, de fonte e de micrcontrolador montadas
166
Fig.72. Esquema da nova placa de estímulos, que aciona 20 eletrodos (taxels)
167
Fig.73. Esquema da placa de microcontrolador incluída no prototipo2A10.Protótipo 2: placa FONTE
168
Fig.74. Fsquema elétrico da placa de geração de alta tensão do prototipo2
169
Fig.75. Esquema elétrico da placa-mãe do prototipo2
170
A9.PLACA DE TESTES PARA GERAÇÃO DE TENSÃO OU
CORRENTE DE ESTIMULAÇÃO
Para testes iniciais, antes dos protótipos, foi gerado um circuito para
se definir a possibilidade de uso de estimulação por tensão versus por
corrente. A partir destes resultados se pode projetar o circuito dos protótipos
1 e 2.
O circuito da foto na Fig.76, cujo esquema elétrico é mostrado na
Fig.77, é constituído por duas fontes de alimentação independentes, uma
para o pulso positivo e outra para o negativo, sendo ambas controladas
pelas suas respectivas realimentações da etapa de alta tensão das suas
saídas respectivas. Quando a tensão na saída diminui, a fonte tenta
compensar aumentando a tensão na entrada do transformador.
Quando configurada para ter controle por corrente, quando a queda
de tensão sobre o resistor shunt aumenta, a tensão da fonte diminui,
mantendo uma corrente constante.
Fig.76. Foto do circuito de testes para configuração da estimulação por corrente ou por tensão constante, depois simplificado
171
Fig.77. Circuito de testes para configuração da estimulação
172
A10.EVOLUÇÃO DO PROJETO
Neste apêndice são descritos a evolução dos circuitos do projeto, bem
como as decisões de projeto que determinaram como se chegou até a
configuração atual. São apresentadas ainda idéias descartadas, explicando-
se por que não foram aproveitadas. Visa-se com este apêndice facilitar a
replicação de resultados por outros pesquisadores que trilhem a mesma
área.
Captura e processamento de imagens
Inicialmente pensou-se em utilizar câmeras de segurança baseadas
em sensores CCD de baixo custo e baixa luminosidade necessária. Foi
adquirida uma placa de captura de imagens da empresa Pixel View e duas
câmeras de segurança com infravermelho, para poder detectar praticamente
no escuro, já que o deficiente visual normalmente não teria como identificar
a necessidade de luz ambiente.
Posteriormente, foi verificado que com a existência de bibliotecas de
Java e de toolbox de MATLAB para acessar diretamente uma webcam
padrão USB (universal serial bus), a placa de captura foi abandonada, com o
intuito de chegar a um resultado concreto evitando usar uma tecnologia que
viesse a ser causa de mais depuração. Podem ser usadas também webcam
de interface paralela no caso de se usar notebooks antigos que não tenham
porta USB.
Contudo, para interfacear uma webcam USB a um microcontrolador
seria necessário chip adicional e criação de drivers de software para acionar
a porta, requerendo mais poder de processamento do microcontrolador.
Portanto para o Protótipo 2 o ideal seria interfacear diretamente o sensor de
imagem ao microcontrolador do sistema.
Contatos iniciais com a Motorola, atual ON Semiconductors,
fabricante de sensores de imagem IMMOS, que tem bom suporte técnico no
Brasil, se mostrou promissor, mas depois foi descontinuada esta linha.
Outros fabricantes como Kodak e OmniVision existem, mas para construir
um protótipo as dificuldades logísticas seriam grandes, até mesmo para
173
obter os componentes. Assim optou-se por sistemas em kit, semelhantes a
câmeras de segurança.
A maioria dos sensores disponíveis no mercado possui saída em sinal
de vídeo composto, o que iria requerer o desenvolvimento de um sistema de
aquisição de dados para amostrar e digitalizar esta imagem, comumente
denominados frame grabber ou placa de captura. O projeto foi iniciado, mas
isto se mostrou inconveniente, pois aumentaria muito o tempo do projeto,
consumo de energia e tamanho do protótipo.
Assim, foram buscados sensores com interface paralela, como o da
Comtech C40188, mas ele ainda iria requerer muitos pinos de IO do
microcontrolador, que seriam mais bem utilizados no controle do maior
número de placas de estímulos e de mais eletrodos controlados por cada
placa do protótipo 2. Finalmente, em 2005 foi encontrado o kit serial C328
também da Comtech, que integra um sensor de imagem OV7640 da
OminiVision, integrado a um chip de controle de comunicação serial e
compactação JPEG, que no caso deste projeto não foi necessário.
Circuito de geração
No prototipo1, de 5x7, ainda se testou a geração do trem de pulsos
por hardware, com dois temporizadores 555, um modulando o outro, ou seja,
um gerava a rajada, outro a envoltória de quando a rajada podia acontecer.
Esta solução por hardware foi importante no início para se testar os
tipos de sensação antes de se começarem os treinamentos propriamente
ditos.
Uma vez que o programa de controle do 8952 estava funcional, foi
possível gerar também o trem de pulsos por software via um pino de controle
do microcontrolador, possibilitando maior flexibilidade e repetibilidade dos
ajustes.
Mas no protótipo 2, de 15x20, isto mudou para apenas por software,
pois era mais flexível e liberava espaço para a placa poder ativar mais
eletrodos, agora 20 em cada placa.
174
Endereçamento dos eletrodos
Inicialmente pensou-se em fazer uma placa para selecionar linha e
coluna usando multiplexadores, que enviaria o sinal de controle de cada
eletrodo a uma matriz de leds, para visualizar o padrão sendo estimulado e
conferir as respostas do usuário. O sinal de controle deveria ir para uma
placa de potência e também para uma placa de leds. Chegou-se a construir
e testar a placa de seleção, mas ao iniciar o projeto das demais placas,
especialmente a de controle de potência, notou-se que ficariam muito
grandes, e talvez fosse requerer placas multicamadas, encarecendo o custo
do protótipo, já que foi feito sem apoio de órgãos de fomento.
Além disso, usando multiplexador de coluna permitiria acionar apenas
1 de 5 multiplexadores, um para cada coluna. Assim apenas um eletrodo de
cada vez poderia ser ativado, selecionando uma só coluna e uma só linha, o
que ia contra a flexibilidade desejada.
E mais, a placa de leds ficaria muito grande, com os leds muito
espaçados tornando-se difícil reconhecer os padrões estimulados nos
eletrodos.
Assim, chegou-se à solução de slots e placa-mãe, semelhante à
arquitetura de PC. Cada placa fica responsável por uma coluna, tendo seção
de endereçamento da placa e eletrodos, geração de trem de pulsos,
amplificação por transformador de pulso e chaveamento por relés de estado
sólido (SSR), além dos leds de visualização dos eletrodos que forem
ativados.
O endereçamento é feito por meio do comparador do endereço da
placa, um 7486, que por sua vez ativa um latch dos eletrodos, um 74573,
para poder ativar várias placas simultâneas se necessário.
Chaveamento da potência
Foram descartadas logo de início as idéias de MOSFET como estava
nos circuito de Antonino [93], pois não operava em corte/saturação
consumindo muito mais energia. Seria necessário usar algum tipo de
transistor em ponte H, chaveando alternadamente em X com a carga no
175
meio. Mas isto ficaria caro e complexo, pois teriam 4 x 300 eletrodos, ou
seja, 1200 transistores. Mesmo que usasse CIs coolmos, estudados, haveria
muitos deles.
Os transformadores de pulso então ocupariam um espaço muito
grande, decidindo-se mantê-los apenas na geração de sinal por canal.
A opção seguinte foi usar circuitos integrados que tivessem embutidas
estas pontes, mas ainda ficaria caro e grande.
Foi pensado em usar matrizes de comutação telefônica, que
antigamente existiam em 48 Volts, na era anterior às CPA (centrais por
programa armazenado). Em vez de ter um circuito de endereçamento
separado do circuito de chaveamento de potência, seriam todos integrados
em uma única pastilha de 16x16, que poderia ser associada para dar mais
conexões. Foram consultados sites e data sheets de vários fabricantes,
inclusive a SGS-Thomson, fabricante original, e encontraram-se matrizes
que baseadas em tecnologia MOS que poderiam servir. Seria uma ótima
solução, pratica e compacta, mas não se fabricam mais estas matrizes em
tensões acima de 16 volts.
Uma opção seria usar chaves MOS tipo 4066, mas de tensão
superior, a MAXIM tem uma que vai acima de 50 volts. Mas não é uma
matriz, são CIs com conjunto de chaves analógicas. Seriam necessárias
muitas delas combinadas, pareceu demasiadamente complexo.
Uma nova tecnologia chamada FPAA (Field Programmable Analog
Array) da Anadigm também pareceu promissora. É composta de células
programáveis de amplificadores operacionais com circuitos RC internos,
podendo-se combinar as conexões para gerar circuitos analógicos mais
complexos, da mesma maneira que os FPGA atuam interconectando células
de circuitos digitais. O problema é que aqui no Brasil nenhum distribuidor
possuía o kit ou amostras, seria necessário importar e, pior, os CIs atuais
ainda estão nas primeiras famílias, cabem apenas 20 células. Ou seja, não
resolveria o problema.
176
Visando então resolver 2 problemas de uma vez, o chaveamento e o
isolamento, foi tentado usar MOC, isto é, acopladores ópticos com saída em
TRIAC de baixa potência. Eles normalmente são usados em disparo de
TRIACs maiores. Mas devido à baixa corrente que percorreria por cada
eletrodo, foi observado que poderia funcionar.
Ao testar em circuitos montados em protoboard e alimentando com
sinal vindo de gerador de funções, ele cortava e comutava o sinal
exatamente como previsto. O gatilho permanecia acionado por um pino de
saída do latch que alimentava o led interno do MOC, e quando a corrente
invertia, ele cortava. Quando se cortava o sinal de comando, a saída ficava
em aberto.
Os circuitos com 555 gerando o sinal também estavam funcionando
então a placa foi construída, incluindo alguns jumpers caso fosse necessário
alterar algo sem desperdiçar o projeto.
Ao testar depois em laboratório, usando os MOC alimentados pelo
gerador de funções ou pela saída do 555, ampliada pelo TIP122, o
funcionamento ficou errático. Algumas vezes cortava o sinal ao fechar o sinal
de comando, mas muitas vezes mantinha a condução do MOC. Após muitos
testes, achou-se que poderia ser um dv/dt muito rápido que estivesse
mantendo disparado o circuito, e a placa havia previsto um circuito snubber
(RC para eliminar este problema), bastando soldá-los. Mas em testes não
chegou a funcionar, e além disso, estes testes foram interrompidos porque
se fosse colocado um RC em paralelo com os anodos do TRIAC, haveria
condução sempre ao eletrodo, não sendo chaveado pelo sinal vindo do
latch.
Outra solução se fazia necessária. Foi pensado colocar 2
optoacopladores como o 4N38 ou semelhantes em contraposição (anodo de
um com catodo do outro), e realmente em testes com baixa tensão (< 5 V)
funcionou, apenas com uma pequena queda de 0.7 V.
Porém ao se colocar um opto de alta tensão, ele suporta tensão de
até 350 V apenas no sentido direto. No sentido reverso a limitação se daria
177
pela V reversa máxima, que mesmo para estes optos especiais era da
ordem de 7.5 V. Foi outra idéia que teve de ser abandonada.
Fig.78. Circuito de chaveamento do sinal de alta tensão
Finalmente, foi usado circuito da Fig.78, após descoberto que SSR
(solid state relays) ou relés de estado sólido que tinham na entrada um led,
tal qual um MOC, mas com chaves MOS na saída. Assim, funciona
exatamente como um relé, mas com resposta rápida e mais compacto.
Contudo no Brasil são difíceis de encontrar, tendo um tempo de entrega
demorado, de mais de 3 semanas, se tudo correr bem.
Foram encontrados alguns fabricantes que atendiam, e por sorte,
existem algumas famílias que tem inclusive a mesma pinagem dos
MOC3022 utilizado no desenho da placa. A Aromat tem o AQY210, que no
Brasil a Metaltex encapsula e vende como TM210. A Fairchild é outra que
tem algo semelhante, o HRS312L, que inclusive tem um limitador de
corrente de 100 mA incorporado. Apesar de que este limitador ainda assim é
muito grande para o sinal que se deseja estimular no usuário.
Para testes, foi comprado um lote de SSR da Metaltex, que provaram
sua eficiência não tendo nem mesmo queda de tensão quando em
condução. Eles foram testados até 10 KHz sem problemas, apesar da
freqüência de operação usada ter sido no máximo de cerca de 5 kHz (pulsos
de largura de 100 µs em nível alto e 100 µs em nível baixo). Além disso, um
mesmo neurônio não consegue responder em freqüências acima disto
devido a seu período refratário, mas outros neurônios vizinhos podem
responder, permitindo a estimulação até cerca desta freqüência.
A desvantagem está nos preços. Um FET IRF510 mencionado no
começo custa cerca de 2 reais, se fosse montar em ponte ficaria 8 reais por
178
eletrodo. O MOC fica perto de 2 reais por eletrodo, mas não resolveu o
problema. O SSR funcionou, mas custou cerca de 7 reais cada (cerca de 2,5
dólares americanos).
Outra idéia surgiu então, tendo sido testada em protoboard e
implementada no circuito do protótipo 2. Baseia-se no funcionamento de
retificadores de onda completa baseada em ponte de diodos. O princípio é
simples, basta tomar o secundário de um transformador e alimentar quatro
diodos em ponte. Dois dos terminais são conectados à tensão alternada, e
dois alimentam a carga que recebe então um sinal pulado que se pode
melhorar usando um capacitor que diminui o ripple em paralelo à carga, que
começa a receber então praticamente tensão DC. Se no lugar da carga for
colocado um elemento de chave (um FET ou bipolar simples) e em um dos
ramos entre o secundário e a ponte se colocar o eletrodo, com uma só
chave será possível ligar e desligar uma tensão alternada no eletrodo.
A implementação do tempo morto para diminuir consumo de potência
foi feita na geração do sinal estimulador do protótipo 2, usando 2 pinos de
controle vindos do microcontrolador.
O circuito de chaveamento de cada eletrodo também precisava ser
revisto, pois seriam repetidos 300 vezes, pois são 15 colunas de 20
eletrodos, quantidade essa limitada pelo tamanho dos eletrodos e espaço do
abdome para posicionar a matriz de eletrodos. Assim, foi definido que seria
necessário um circuito diferente, de preferência pequeno e barato. Para o
protótipo 1, para testar idéias e manter o custo baixo foi definida uma matriz
pequena, de 5 colunas de 7 eletrodos cada.
Como o circuito deveria permitir testar estimulação também com sinal
médio nulo, foi necessário criar um circuito de amplificação e de
chaveamento que pudesse conduzir nos dois sentidos. Isto implica de
alguma maneira usar ponte de transistores (bipolar ou FET), tiristores
(TRIAC), relê de estado sólido ou algo semelhante.
No protótipo 2 também se alterou o SSR para uso de optoacoplador
normal mais ponte, visando diminuir custos.
179
Também se trocou o ajuste da tensão feito por LM317 para melhorar
a eficiência das baterias, passando a usar conversor DC-DC tipo flyback,
com ajuste da tensão máxima, por volta de 60 a 70 Volts, fornecido pela
Tecnotrafo de São Paulo.
O conversor DC-DC também serviu para eliminar o transformador de
pulso mais um TIP que eram usados na amplificação e causavam distorções
na onda. Passou-se a usar 2 opto-acopladores em ponte para gerar o pulso
positivo e negativo do trem de pulsos, acionado por 2 pinos de IO do
microcontrolador.
Alimentação e amplificação
A bateria original era de chumbo-ácido 6 V e 1.3 Ah, mas não estava
mantendo carga por muito tempo. Portanto foi trocada por conjuntos de
pilhas recarregáveis que se alternam, de 8 pilhas de NiMH, 1,8 AH ou mais,
e depois por conjunto com 12 pilhas de NiMH. Além de ter aumentado sua
autonomia, o equipamento acabou ficando mais leve. Para testes fixos no
laboratório, também se suou algumas vezes bateria de chumbo acido
externa, de 7AH, durando para mais de 20 sessões de teste. O tipo de
bateria interna ideal foi escolhido após estudo, com as de níquel metal
hidreto (NiMH) sendo escolhida por ter efeito memória menor e maior
capacidade de corrente que níquel cádmio. As de Lítio-ion não apresentam
efeito memória e tem densidade de corrente maior, mas seus carregadores
são especiais, seu custo é muito maior e seu formato não segue padrão de
tamanho habitual (A, AA) por ter a voltagem de sua célula praticamente o
dobro, 3 V, enquanto as de NiMH ficam próximas, em 1,2 V. Esta diferença
não se nota, pois pilhas normais têm tensão nominal de 1,5 V, mas que
caem rapidamente [PEREIRA,04].
Na documentação dos circuitos usados em eletro-estimulação neuro-
muscular (EENM) de pesquisadores do Laboratório de Biocibernética
(LabCiber) da USP de São Carlos, coordenado pelo co-orientador deste
trabalho, costuma-se usar um circuito baseado em transformador de pulso
180
para amplificar, e um MOSFET para controlar o acesso desse sinal ao sinal
amplificado [ANTONINO,93].
Contudo, estes circuitos ao serem analisados indicavam falha de
funcionamento ou inadequação às necessidades deste projeto, o que se
comprovou em laboratório.
Fig.79. Etapa de potência típica do circuito estimulador de Antonino [ANTONINO,93].
O circuito da Fig.79 é o que consta na dissertação de Antonino, e só
funcionaria com o transformador em modo flyback. Para poder ajustar o nível
de tensão de estimulação o MOSFET está operando fora de corte/saturação,
portanto consumindo muita potência, drenando rapidamente as baterias.
Também requer um transformador de pulso que eleve a tensão em muitas
vezes, o que não havia disponível comercialmente em produtos de
prateleira, como os transformadores da Thornton e Semikron que tem
relação de espiras de no máximo 1:3. Finalmente, por ter um diodo e um
LED no secundário, não é capaz de fornecer sinal bidirecional, resultando
em nível DC não nulo. Em resumo, não atende às especificações.
Nohama usou um tipo diferente de circuito, baseado em estimulador
de corrente, que chaveava um sinal de alta tensão gerado por conversor DC-
DC. (saída de 100 volts). Mas este tipo de circuito era muito caro, cerca de
80 dólares o chip para cada canal estimulador. Como o equipamento deve
ter 15 placas (=linhas ou colunas), um canal com conversor DC para cada
placa ficaria muito caro, então outra solução foi buscada [NOHAMA,97].
Os circuitos 555 aceitavam até 16 V, e os circuitos lógicos de
endereçamento e latches, TTL da família HCMOS podem receber tensão
181
entre 4 e 6 V. Assim, entre a bateria e o circuito das placas havia uma chave
liga/desliga, um conector para carregamento das baterias que desliga o
circuito quando se está conectado, e um diodo para garantir a não inversão
da fonte. Este diodo acarretava uma pequena queda da tensão da bateria
original, mas ainda suficiente para funcionar os 74HCXX e os 555 e o TIP,
conforme mostrado na Fig.80 do circuito de alta tensão. O diodo foi depois
eliminado ao se a usar conectores que impediam conectar a bateria
invertida, e assim eliminando a perda de energia, que era considerável:
0,7/12 significa quase 6%, influenciando a tensão máxima que se podia
obter.
Fig.80. Etapa de amplificação com TIP e transformador de pulso
Porém, o sinal do estimulador estava baixo, e como não haviam
fornecedores adequados de transformador de pulso, acabou-se optando por
aumentar a alimentação do TIP e dos 555. Foi preciso fazer um retrofit nas
placas para separar a alimentação da parte de oscilador e potência da parte
de seleção do eletrodo.
Adicionou-se mais uma bateria de 6 V, totalizando 12 V, e incluiu-se
um jumper e um circuito regulador de tensão com 7805 na placa-mãe.
Quando o jumper está setado em alimentação por tensão maior, o regulador
entra em ação, gerando 5 volts para o HCMOS, e conectando um ventilador
para resfriá-lo. Caso contrário, o sinal da bateria menos a queda de tensão
do diodo é conectado em ambos os pinos do barramento de alimentação das
placas.
182
Posteriormente foi ainda adicionado um LM317 para ajustar a tensão
que chega ao circuito de amplificação, pois o circuito trabalha no
corte/saturação de um transistor Darlington, e quando começava a conduzir
o nível de tensão já era muito alto para alguns usuários.
No lugar do transistor Darlington TIP 122 também foi testado o L149 e
o IRF540. O que resutou onda quadrada com menor distorção foi o L149,
mas com o TIP o circuito fornecia sensação adequada, sendo então
adotado.
No protótipo 2 este ajuste por regulador linear LM317, de baixa
eficiência, foi trocado por um ajuste em conversor DC-DC desenvolvido pela
empresa Tecnotrafo sob encomenda. Isto serviu também para elimiar as
distorções devido ao uso do transformador de pulso, chegando onda
quadrada perfeita a cada eletrodo.
Matriz de eletrodos
Para os primeiros testes pensou-se na construção de eletrodos
individuais, por meio de algum tipo de material mecânico que posteriormente
poderia receber um banho eletroquímico apropriado. Porém isto seria
complicado devido ao grande número de eletrodos, 35 no protótipo 1, mas
seria impraticável para o circuito final de 300 eletrodos, pois havia o
problema de comunicação com os circuitos estimuladores, bem como a
fixação dos eletrodos em algum material que pudesse ser posto em contato
com a pele do usuário.
Pensou-se em usar algum tipo de arruela, ou botão de pressão fixado
em tecido, semelhante a alguns eletrodos de ECG (eletrocardiograma), mas
o circuito para 300 eletrodos resultaria em um grande emaranhado de fios.
Surgiu então a idéia de se conectar os eletrodos usando circuitos
flexíveis semelhantes aos usados em cabeças de impressoras matriciais.
Este material também é usado em teclados de membrana que precisam ser
baratos e resistir a líquidos, além de serem usados em conexão de peças
que tem necessidades especiais de movimentação, uma vantagem a mais,
já que circuitos com fios poderiam quebrar por fadiga do metal.
183
Observando-se o formato dos circuitos destes teclados de membrana,
normalmente feitos em forma de matriz, em que ao apertar a tecla fecha-se
um contato, percebeu-se que o CIF poderia não apenas servir de cabo, mas
também implementar o próprio eletrodo com ele. Bastaria fazer suas trilhas
em formato de eletrodo concêntrico, formato mais apropriado segundo a
literatura. A possibilidade foi confirmada em contatos com fabricantes desses
circuitos e seus fornecedores de matéria-prima, e assim foram testadas
algumas amostras de circuitos flexíveis projetados para outros fins,
apresentando desempenho aceitável aos propósitos deste projeto. Foi então
encomendada uma coluna, mostrado na Fig.54, que apresentou ao usuário
sensibilidade melhor que a PCI de fibra e anéis de níquel. Assim, a matriz
final foi encomendada.
Agora, contatos com professores que pesquisam a área de
microfabricação na UFMS resultou em um projeto junto ao CNPq para
criação de matrizes e eventual criação futura de micromotores para
estimulação mecânica.
Para a fixação no abdome foi tentada uma faixa abdominal cirúrgica,
mas afrouxava-se muito facilmente. Foram então comprados rolo de elástico
branco de 5 cm de largura, e rolo de velcro. A faixa foi costurada em 2 faixas
elásticas em paralelo sobrepostas, no total de 8 cm, costurando-se diversas
faixas transversais de velcro, a cada 5 cm, para permitir o ajuste em pessoas
de diferentes tamanhos, conforme mostra a Fig.44.
Para o protótipo com a matriz em CIF, maior, é necessário o uso de
uma faixa abdominal comercial, larga.
184
A11.PRODUÇÃO GERADA A PARTIR DA TESE
ARTIGOS EM CONGRESSOS
PEREIRA, M.C., CLIQUET Jr, A., KASSAB Jr, F. Substituição Sensorial para Auxílio à Mobilidade de Deficientes Visuais via Eletroestimulação Táctil. III Congresso Iberoamericano de Tecnologias para Discapacitados, Costa Rica, 2004.
PEREIRA, M.C., CUNHA,F.L.; CLIQUET Jr, A., KASSAB Jr, F. Estudo comparativo dos meios de alimentação de uma prótese multifunção para membros superiores. III Congresso Iberoamericano de Tecnologias para Discapacitados, Costa Rica, 2004.
PEREIRA, M.C., CLIQUET Jr, A., KASSAB Jr, F. Eletroestimulador para uso em substituição sensorial. IV Congresso Iberoamericano de Tecnologias para Discapacitados, Vitória,ES., 2006.
PEREIRA, M.C., KASSAB, Jr. F. An Electrical stimulator for Sensory Substitution, aceito no 28th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, EMBC2006, a reazlizar-se de 30agosto a 3 de setembro de 2006, New York, NY.
PRÊMIOS
Primeiro lugar na categoria pesquisadores do 1º Premio Werner Von
Siemens de Inovação Tecnológica, novembro de 2005.
PATENTE REQUERIDA
Processo e equipamento para experimentos somestésicos e para substituição sensorial para auxílio a deficeintes via técnicas de processamento digital de sinais e estimulação cutânea. Pedido de privilégio de patente de invenção nº PI 0600724-4, protocolado em 16/02/2006 sob o nº0075 junto ao INPI – Instituto Nacional de Propriedade Industrial.
NOVOS PROJETOS
Convênio com professores que pesquisam a área de microfabricação
na UFMS resultou em um projeto junto ao CNPq para criação de matrizes e
eventual criação futura de micromotores para estimulação mecânica.
185
Também foi submetido um projeto ao edital universal do CNPq
pleiteando um eletroencefalograma e equipamentos para viabilizar a medida
de EEG para verificar possíveis alterações de estimulação de córtex visual
antes e depois de treinamento com este sistema.
186
FICHA CATALOGRÁFICA
Pereira, Mauro Conti
Sistema de substituição sensorial para auxílio a deficientes visuais via técnicas de processamento de imagens e estimula-ção cutânea / M.C.Pereira. -- ed.rev. -- São Paulo, 2006.
202 p.
Tese (Doutorado) - Escola Politécnica da Universidade de São Paulo. Departamento de Engenharia de Telecomunicações e Controle.
1.Estimulação elétrica 2.Estimulação tátil 3.Visão 4.Proces- samento de imagens 5.Engenharia de reabilitação I.Universida-de de São Paulo. Escola Politécnica. Departamento de Engenha-ria de Telecomunicações e Controle II.t.
Este exemplar foi revisado e alterado em relação à versao original, sob
responsabilidade única do autor e com anuência de seu orientador.
São Paulo, 28 de agosto de 2006
Assinatura do autor:
Assinatura do orientador