Download - mauro conti pereira sistema de substituição sensorial para auxílio a

MAURO CONTI PEREIRA

SISTEMA DE SUBSTITUIÇÃO SENSORIAL PARA

AUXÍLIO A DEFICIENTES VISUAIS VIA TÉCNICAS DE

PROCESSAMENTO DE IMAGENS E ESTIMULAÇÃO

CUTÂNEA

Tese apresentada à Escola

Politécnica da Universidade de São

Paulo para obtenção do Título de

Doutor em Engenharia

São Paulo

2006

MAURO CONTI PEREIRA

SISTEMA DE SUBSTITUIÇÃO SENSORIAL PARA

AUXÍLIO A DEFICIENTES VISUAIS VIA TÉCNICAS DE

PROCESSAMENTO DE IMAGENS E ESTIMULAÇÃO

CUTÂNEA

Tese apresentada à Escola

Politécnica da Universidade de São

Paulo para obtenção do Título de

Doutor em Engenharia

Área de Concentração:

Engenharia de Sistemas

Orientador:

Fuad Kassab Jr

Co-orientador:

Alberto Cliquet Jr

São Paulo

2006

Aos meus filhos Ana Luiza e Bruno, e à minha irmã Siumara, com muitas saudades. Obrigado por tudo. Você faz falta.

AAGGRRAADDEECCIIMMEENNTTOOSS

Agradeço a Deus por tudo que consegui até hoje, principalmente

pelas amizades que fiz no caminho, pois acredito que o importante na vida é

a impressão que deixamos nas pessoas e vice-versa. Agradeço de coração

às pessoas que me possibilitaram chegar hoje à conclusão deste trabalho.

À minha família: minha esposa Cíntia pelos bons momentos, pela

paciência, especialmente nestas épocas em que tive de ser mais ausente do

que de costume, e por me proporcionar meus dois filhos maravilhosos, Ana

Luiza e Bruno, que nasceram no meio desta epopéia. Ao meu irmão Milton

que me ajudou a ir fazer o mestrado há muito tempo atrás, e à minha irmã

Siumara por ter me ajudado tanto em momentos de indecisão durante a

graduação. Aos meus pais Milton e Maria Gecilda pela formação e valores

que me passaram durante a formação do meu caráter. À minha avó Maria e

às tias Landa, Carmen e Marlene, pelo apoio constante, especialmente

durante minha graduação.

Obrigado à direção da Universidade Católica Dom Bosco por acreditar

em meu potencial e conceder meu afastamento durante este período de

estudos, em especial à professora Conceição.

Para a conclusão de tese tenho de agradecer ao apoio constante e

amizade de meu orientador, professor Fuad, e ao meu co-orientador,

professor Cliquet, pela sugestão de tema que deu origem ao trabalho.

Às pessoas maravilhosas da Fundação Dorina Nowill, obrigado por

sempre estarem à disposição, e pelo tanto que ajudaram no esclarecimento

de duvidas e na escolha o foco do trabalho, e por serem tão solícitos

inclusive para participar de testes do equipamento. Especialmente ao Minoru

e Maria Cristina Felippe. Obrigado também pela ajuda do pessoal de outra

instituição exemplar no auxílio aos cegos, Laramara, especialmente à Vera e

ao João Felippe e ao Robert Mortimer da Laratech. E obrigado ao pessoal

do ISMAC (Instituto Sul Matogrossense para Cegos Florisvaldo Vargas), que

conheci mais tarde no desenvolvimento deste projeto, mas que foram

cruciais nos testes com usuários.

Existem diversas pessoas sem as quais o presente trabalho teria sido

praticamente impossível de ser concluído. Especialmente aos professores

Kaiser e Wilson, do PEA, e amigos como Renato e Edson, de Rudge

Ramos, e Eduardo Rocha e Dimas Ramalho. Essencial foi o empréstimo do

kit de microcontrolador feito pelo Edmur, da CNZ, e apoio do Emilio Konishi,

da MDL, Membrana Digital Ltda, que fabricou os circuitos flexíveis da matriz

de eletrodos que projetei.

Agradeço ainda aos amigos Graça, Píer, Arnaldo, Giancarlo, Núncio,

Luiz Humberto, Fransérgio e Luis Carlos e ao Nicolau da Tecnotrafo, por

tantas trocas de idéias e colaborações, assim como aos professores

Ricardo, Jaime e Cláudio do LAC, André Khon do LEB e Roseli e Emílio do

LSI. E aos amigos Flávio e José Ramalho pelo agradável tempo em que

trabalhamos juntos em redes neurais. E aos amigos de Campo Grande,

Wanderlei, Edson e Tony, que por vezes me ajudaram quando não pude

cumprir alguma tarefa de coordenação de curso, bem como na troca de

idéias para o segundo protótipo. E aos professores Albert e Sandra, e

acadêmicos da UCDB Daniel e Vanessa, Anderson, Jonathan, e Bruno

Benante e Bruno Machado, que tanto ajudaram na parte de testes.

Para chegar até aqui, tive que completar graduação e mestrado,

obviamente. Aproveito para destacar a importância que tiveram alguns

amigos da FEI, como Irineu, Ronaldo, Paulo Takahashi, Luiz Humberto,

Fernando, Fabrizio, Dimas e tantos outros. Ao Fabrizio em especial obrigado

por me apresentar pessoas tão especiais como os professores do

Laboratório de Automação e Controle, a quem tanto devo também. E

obrigado aos amigos da época do mestrado em Atlanta, principalmente o

Jerônimo Travelho, Ronaldo L. D’Avila e Alejandro Hernandes, pelo apoio

mútuo durante um período difícil. E aos meus chefes e colegas da

BNR/Nortel, de Dallas e Montreal, com quem tanto aprendi, especialmente

Doug Millar, Matt Vea e Daniel Kornitzer.

RREESSUUMMOO

Este trabalho visou desenvolver e integrar técnicas, algoritmos e

equipamentos para o auxílio a deficientes visuais em sua familiarização para

orientação e mobilidade, permitindo uma maior autonomia de locomoção e,

em uma segunda etapa, a leitura de cartazes e sinais. Para tal, foi proposta

a substituição sensorial da visão pelo tato, permitindo que imagens sejam

capturadas, tratadas digitalmente para detecção de bordas, com

simplificação da imagem e diminuição de sua resolução. Estas imagens

simplificadas são posteriormente transmitidas ao usuário por meio de eletro-

estimulação cutânea no abdome. Foi desenvolvido um protótipo de

hardware, firmware para comandá-lo e software em um microcomputador

para tratar a imagem capturada, além de uma matriz de eletrodos e

estimação de distância por ultra-som, para compensar a falta de

estereoscopia. Este protótipo foi projetado para ser o mais flexível possível

para permitir o teste de diferentes maneiras de estímulo. Foram realizados

testes preliminares comprovando a viabilidade do conceito, e um segundo

protótipo maior foi então projetado e construído. Este sistema provou ser útil

também como equipamento para pesquisas em psicologia experimental, na

área de cognição e aprendizagem.

AABBSSTTRRAACCTT

This work intended to develop and integrate techniques, algorithms

and equipments to aid visually handicapped people with the familiarization of

unknown environments, as involved in orientation and mobility techniques,

making locomotion an easier task. In a second phase, it allowed the blind

user to receive signals corresponding to signs with letters, allowing them to

“read” these signs. In order to do that, it was proposed the sensory

substitution of vision by touch. Images were captured, processed digitally to

be simplified, have their edges detected (contours of objects) and have their

resolution reduced. This reduced image was then passed to the user by

cutaneous electro-stimulation on the abdomen. A hardware prototype was

developed, as well as firmware to control it, software to digitally process the

image, a flexible matrix of electrodes, and an ultrasonic distance estimation

system, to compensate for the lack of stereoscopy. The system was

designed to be as flexible as possible to allow several stimuli tests.

Preliminary tests were conducted that proved the feasibility of this concept. A

second prototype, larger, was then designed and built. This device proved

valuable also as a tool for research in experimental psychology, in cognition

and learning.

SSUUMMÁÁRRIIOO

1 INTRODUÇÃO....................................................................................... 1 1.1 OBJETIVOS ........................................................................................ 2 1.2 DESCRIÇÃO DO PROJETO .................................................................... 3 1.3 ORGANIZAÇÃO DO TRABALHO .............................................................. 7

2 ESTIMULAÇÃO TÁCTIL..................................................................... 12 2.1 SISTEMA NERVOSO ........................................................................... 13

2.1.1 Neurônio ................................................................................. 13 2.1.2 Potencial de ação ................................................................... 14 2.1.3 Cérebro................................................................................... 15 2.1.4 Plasticidade cerebral............................................................... 18

2.2 FISIOLOGIA DA PELE.......................................................................... 18 2.2.1 Tipos de receptores nervosos................................................. 19

2.3 ESTIMULAÇÃO ELETROTÁCTIL ............................................................ 24 2.3.1 Resposta sensorial ................................................................. 24 2.3.2 Mascaramento, lateralidade, adaptação................................. 27 2.3.3 Treinamento............................................................................ 28 2.3.4 Efeitos lesivos......................................................................... 28 2.3.5 Parâmetros do estímulo elétrico ............................................. 29 2.3.6 Fenômeno Saltatório............................................................... 30 2.3.7 Fenômeno Phi Visual e Táctil ................................................. 31 2.3.8 Fenômeno de sensação fantasma.......................................... 31

2.4 ESTIMULAÇÃO VIBROTÁCTIL............................................................... 31

3 VISÃO.................................................................................................. 33 3.1 ACUIDADE VISUAL............................................................................. 34 3.2 VISÃO SUBNORMAL X CEGUEIRA......................................................... 36 3.3 DADOS ESTATISTICOS SOBRE DEFICIÊNCIA VISUAL............................... 37 3.4 ASPECTOS PSICOLÓGICOS DA CEGUEIRA ............................................ 38 3.5 NOÇÕES DE ORIENTAÇÃO E MOBILIDADE (OM) .................................... 42

3.5.1 Proteção inferior e superior..................................................... 43 3.5.2 Rastreamento ......................................................................... 43 3.5.3 Enquadramento e a tomada de direção.................................. 43 3.5.4 Localização de objetos ........................................................... 44 3.5.5 Trincos e semelhantes............................................................ 44 3.5.6 Familiarização......................................................................... 44 3.5.7 Atividades da Vida diária (AVD).............................................. 46

4 EQUIPAMENTOS DE AUXÍLIO EXISTENTES ................................... 47 4.1 AUXÍLIOS USUAIS .............................................................................. 48 4.2 SOLUÇÕES TECNOLÓGICAS NÃO INVASIVAS......................................... 50 4.3 SOLUÇÕES QUE ENVOLVEM CIRURGIAS............................................... 59

5 PROCESSAMENTO DE IMAGENS .................................................... 60 5.1 PRINCÍPIOS GERAIS........................................................................... 60 5.2 CAPTURA......................................................................................... 62 5.3 DETECÇÃO DE BORDA ....................................................................... 64 5.4 DIFUSÃO ANISOTRÓPICA ROBUSTA .................................................... 67

5.5 TÉCNICAS DE SEQÜÊNCIA DE ELEMENTOS DE IMAGEM .......................... 68 5.6 DIMINUIÇÃO DE RESOLUÇÃO .............................................................. 68 5.7 SEGMENTAÇÃO PARA ENCONTRAR LETREIROS .................................... 69 5.8 RECONHECIMENTO DE CARACTERES .................................................. 70

6 PROJETO............................................................................................ 72 6.1 DESCRIÇÃO DOS EQUIPAMENTOS E PROGRAMAS ................................. 75 6.2 CAPTURA DE IMAGEM........................................................................ 76 6.3 MICROCONTROLADOR ....................................................................... 76 6.4 ELETRO-ESTIMULADOR ..................................................................... 77

6.4.1 Circuito de endereçamento..................................................... 79 6.4.2 Circuito de amplificação do sinal e chaveamento ................... 80 6.4.3 Alimentação ............................................................................ 82 6.4.4 Amplificação............................................................................ 83 6.4.5 Chaveamento.......................................................................... 85

6.5 MATRIZ DE ELETRODOS..................................................................... 86 6.6 PROGRAMA DE CONTROLE................................................................. 88 6.7 PROGRAMAS DE PROCESSAMENTO DE IMAGENS .................................. 91

6.7.1 Binarização ............................................................................. 91 6.7.2 Diminuição da resolução......................................................... 92 6.7.3 Simplificação........................................................................... 93 6.7.4 Letreiros.................................................................................. 93 6.7.5 Reconhecimento de caracteres .............................................. 95 6.7.6 Estimativa de Tempo de Processamento do protótipo 1......... 96 6.7.7 Processador escolhido............................................................ 98

6.8 PROTÓTIPO 2................................................................................... 99 6.8.1 Sensor de Imagem................................................................ 101 6.8.2 Chaveamento de potência.................................................... 103 6.8.3 Matriz de eletrodos ............................................................... 104 6.8.4 Estimativa de tempos para o protótipo 2............................... 107 6.8.5 Estimativa da distância por ultra-som ................................... 108

7 TESTES............................................................................................. 110 7.1 OBJETIVOS DOS TESTES.................................................................. 110

7.1.1 Testes de ajustes:................................................................. 110 7.1.2 Testes de treinamento .......................................................... 111 7.1.3 Questões para futuros testes:............................................... 111

7.2 TESTES PRELIMINARES PARA AJUSTE ............................................... 111 7.3 TESTES PARA TREINAMENTO DE USUÁRIOS ....................................... 113

7.3.1 Metodologia das sessões de treinamento............................. 114 7.4 TESTES COM IMAGENS GENÉRICAS................................................... 115

8 RESULTADOS .................................................................................. 116 8.1 SENSAÇÃO OBTIDA VERSUS AJUSTES INICIAIS.................................... 116 8.2 RESULTADOS DOS TESTES DE TREINAMENTO .................................... 119 8.3 RESULTADOS PARA IMAGENS CONTROLADAS..................................... 124 8.4 CONSUMO DE ENERGIA ................................................................... 124

9 CONCLUSÕES E TRABALHOS FUTUROS..................................... 126 9.1 SUGESTÕES PARA TRABALHOS FUTUROS .......................................... 130

9.1.1 Melhorias de Hardware......................................................... 130 9.1.2 Melhorias de Software .......................................................... 132 9.1.3 Possíveis testes futuros ........................................................ 134

LISTA DE REFERÊNCIAS ........................................................................ 136

APÊNDICES .............................................................................................. 147 A1. FORMULÁRIOS DE TESTES ................................................................... 148

1.Teste preliminar: ............................................................................. 148 2.Teste de treinamento de usuários:.................................................. 149 3.Análise de resultados: Totalização/consolidação e gráficos ........... 150

A2. TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO ............................... 151 A3 ALGUMAS INSTITUIÇÕES DE AUXÍLIO AO DEFICIENTE VISUAL E SEUS LINKS. 154 A4 GRUPOS DE PESQUISA DE SUBSTITUIÇÃO SENSORIAL ............................. 156 A5.CIRCUITO ELÉTRICO DO PROTOTIPO 1 ................................................... 159 A6.JUMPERS DE CONFIGURAÇÃO DA PLACA DE POTÊNCIA ............................ 160 A7.PLACA DE MEDIÇÃO DE CORRENTE E SIMULADOR DE PELE ....................... 163 A8. PROTÓTIPO 2: PLACAS DE ESTÍMULO DE 20 ELETRODOS, CPU, FONTE E PLACA-MÃE .............................................................................................. 164 A9.PLACA DE TESTES PARA GERAÇÃO DE TENSÃO OU CORRENTE DE ESTIMULAÇÃO........................................................................................... 170 A10.EVOLUÇÃO DO PROJETO .................................................................... 172

Captura e processamento de imagens .............................................. 172 Circuito de geração............................................................................ 173 Endereçamento dos eletrodos ........................................................... 174 Chaveamento da potência................................................................. 174 Alimentação e amplificação ............................................................... 179 Matriz de eletrodos ............................................................................ 182

A11.PRODUÇÃO GERADA A PARTIR DA TESE ............................................... 184 ARTIGOS EM CONGRESSOS........................................................................ 184 PRÊMIOS ................................................................................................. 184 PATENTE REQUERIDA................................................................................ 184 NOVOS PROJETOS .................................................................................... 184

LLIISSTTAA DDEE FFIIGGUURRAASS Fig.1. Visão geral do protótipo 1 do sistema ........................................... 4 Fig.2. Protótipo 2, com sensores conectados ao módulo processador,

dispensando o PC. ........................................................................ 7 Fig.3. Esquema do neurônio [BEAR, 02]............................................... 13 Fig.4. Esquema da propagação com e sem a capa de mielina

[BEAR,02].................................................................................... 15 Fig.5. Homúnculo de Penfield [BEAR, 02]............................................. 16 Fig.6. Localização das áreas do cérebro [BEAR,02]. ............................ 17 Fig.7. Vista em corte da pele, destacando seus receptores [BEAR,02].20 Fig.8. Os sistemas sensoriais codificam 4 atributos do estímulo:

modalidade, local, intensidade e temporização, manifestos na sensação [KANDEL,91]............................................................... 21

Fig.9. A base estrutural do campo receptivo dos receptores do sentido do tato [KANDEL,91] ................................................................... 23

Fig.10. Limiar de discriminação entre dois pontos (TPDT) em função da região do corpo [KANDEL,91]. .................................................... 25

Fig.11. Trem de pulsos com tempo morto: exemplo de BFM usando pulsos bipolares DC [NOHAMA,97]............................................. 30

Fig.12. Display Braille convencional: (a) uma celula Braille composta de 8 pontos, (b) display complleto formado por uma arranjo linear de células da Pulse Data International Ltd [PULSE,05].................... 32

Fig.13. Testes de Snellen mostrando a percepção do portador de acuidade visual de 20/20, 20/30, 20/50 e 20/80 [UMBAUGH, 97]..................................................................................................... 35

Fig.14. Bengala longa rastreando [FELIPPE,01]..................................... 43 Fig.15. Método de Localização [FELIPPE,01]. ........................................ 44 Fig.16. Métodos do perímetro e do cruzamento para familiarização

[FELIPPE,01]............................................................................... 45 Fig.17. Início da familiarização com guia vidente e com bengala longa

[FELIPPE,01]............................................................................... 45 Fig.18. Reglete importado com caneta correspondente .......................... 50 Fig.19. Optacon sendo utilizado [ONCE,00]............................................ 54 Fig.20. Demonstração da bengala laser e seu raio de ação [NURION,06]

.................................................................................................... 54 Fig.21. Matriz de eletrodos para estimular a língua, da Wicab................ 56 Fig.22. Modelo do Sonic PathFinder ....................................................... 57 Fig.23. Fotos do NavBelt e GuideCane, e seus esquemáticos

[BORENSTEIN,96]. ..................................................................... 58 Fig.24. Representação digital de uma imagem [CARVALHO,03]............ 61 Fig.25. Cores primarias aditivas e subtrativas [GONZALEZ,92].............. 62 Fig.26. Efeito da quantização dos níveis de cinza: imagem de 240x320

pixels, com níveis de cinza indo de 256 níveis a 2 níveis (imagem binária) ........................................................................................ 62

Fig.27. Mosaico de cores ou padrão Bayer de distribuição padrão de distribuição de cores dos sensores de imagem.[TEXAS,03]......... 63

Fig.28. Exemplos de detectores de bordas mais comuns ....................... 65

Fig.29. Equações de implementação do gradiente para filtro de Roberts [RUSS,02]. .................................................................................. 66

Fig.30. Exemplo de simplificação da imagem por difusão anisotrópica robusta [KIM,01] .......................................................................... 67

Fig.31. Padrões de vizinhança: 4 em cruz; 3x3 quadrado; 5x5 octogonal com 21 pixels; 5x5 com 25 pontos; 7x7 com 37 pontos; [RUSS,02]. .................................................................................. 68

Fig.32. Exemplo de imagem a ser usada, baixando de 240x320 original da Webcam até 15x20 da matriz de eletrodos ............................ 69

Fig.33. Visão geral do protótipo 1 do sistema ......................................... 73 Fig.34. Trem de pulsos antes da etapa de amplificação ......................... 78 Fig.35. Trem de pulsos antes da amplificação ........................................ 78 Fig.36. Trem de pulsos após a amplificação, com distorção devido à

saturação do núcleo do transformador de pulso. ........................ 78 Fig.37. Esquema de cada placa de estimulação do prototipo1 ............... 81 Fig.38. Placa para estimulação de cada coluna de eletrodos; os leds

ficam no topo, formando a imagem quando várias placas estão na vertical e em paralelo na placa-mãe............................................ 82

Fig.39. Montagem das 5 placas, faixa abdominal para fixação e matriz de eletrodos do protótipo1................................................................ 82

Fig.40. Etapa de amplificação com TIP e transformador de pulso .......... 83 Fig.41. Circuito de chaveamento do sinal de alta tensão ........................ 85 Fig.42. Circuito da matriz de eletrodos feita em fibra .............................. 87 Fig.43. Foto da placa da matriz de eletrodos em fibra ............................ 87 Fig.44. Placa de eletrodos em fibra, com a faixa de fixação, e instalada.88 Fig.45. Comparação da binarização tradicional, limiar global médio, com

limiar 0,3 e 0,6, e por Niblack (limiar regional) ........................... 92 Fig.46. Imagem simplificada por difusão anisotrópica com k = 0.02, ? =

0.25, 60 iterações, com k = 0.02, ? = 0.25, 60 iterações. ............ 93 Fig.47. exemplo`s de imagem processada para encontrar letreiro, usando

binarização por Niblack, segmentação do letreiro por desvio padrão de run length coding, e resultado da segmentação........ 95

Fig.48. Desvio padrão por linha da imagem da figura anterior: os menores indicam a linha com caracteres. .................................................. 95

Fig.49. Sensor serial C328, de fator de forma compacto (13 x 14 10 mm)................................................................................................... 103

Fig.50. Sensor montado sobre óculos para minimizar o impacto estético.................................................................................................. 103

Fig.51. Circuito de teste de interface do sensor de imagem a microcontrolador........................................................................ 103

Fig.52. Conectores de crimpagem para circuitos flexíveis, da Nicomatic................................................................................................... 105

Fig.53. Exemplos de conectores: Nicomatic (preto) e Berg/Dupont (azul);.................................................................................................. 105

Fig.54. Desenho de 2 colunas da matriz encomendada, com as camadas superpostas, e exemplo de uma linha da matriz final................ 106

Fig.55. Exemplo de matriz encomendada 7x7, com 3 camadas: anel externo de retorno por placa, anel central de estimulação e isolante do meio. (cerca de 10 x 10 cm) .................................... 106

Fig.56. Desenho da matriz final flexível, de 300 eletrodos, com suas diversas camadas para eletrodo central e retorno comum a cada linha........................................................................................... 106

Fig.57. Matriz flexível de 15x20 eletrodos, do tamanho aproximado de uma folha A4. ............................................................................ 107

Fig.58. Esquema de medição por ultra-som.......................................... 108 Fig.59. Sensor de ultra-som, motores excêntricos, e sistema de estimativa

de distância, e Sensor Max EZ1, de dimensões reduzidas (20 x 22 x 16.4 mm). ............................................................................... 109

Fig.60. Quadrado pequeno desenhado por diversos métodos: a.como carimbo (primeiro quadro), b.por coluna individual (quadros 2 a 4), c.por coluna mantendo a anterior (quadros 5 a 7), d.taxel a taxel (quadros de baixo) – em cinza são os taxels estimulados e depois apagados................................................................................... 112

Fig.61. Trem de pulsos com tempo morto: exemplo de BFM usando pulsos bipolares DC [NOHAMA,97]........................................... 112

Fig.62. Gráfico de %acerto e latência, média para grupo de videntes. . 121 Fig.63. Gráfico de %acerto e latência, média para grupo de cegos

adquiridos.................................................................................. 121 Fig.64. Gráfico de %acerto e latência, média para grupo de cegos

congênitos. ................................................................................ 122 Fig.65. Gráfico de %acerto e latência, comparando os 3 grupos. ......... 122 Fig.66. Esquema da placa de cada coluna, com oscilador, amplificação,

endereçamento e potência........................................................ 159 Fig.67. Foto da placa de medição de corrente RMS conectada ao

simulador de pele ...................................................................... 163 Fig.68. Layout da nova placa de estimulação, de 20 eletrodos............. 164 Fig.69. Foto da placa de microcontrolador incluída no prototipo2 ......... 164 Fig.70. Foto da placa de geração de alta tensão do protótipo 2............ 165 Fig.71. Fotos da placa-mãe e dela com as placas de estímulos, de fonte e

de micrcontrolador montadas .................................................... 165 Fig.72. Esquema da nova placa de estímulos, que aciona 20 eletrodos

(taxels)....................................................................................... 166 Fig.73. Esquema da placa de microcontrolador incluída no

prototipo2A10.Protótipo 2: placa FONTE .................................. 167 Fig.74. Fsquema elétrico da placa de geração de alta tensão do

prototipo2 .................................................................................. 168 Fig.75. Esquema elétrico da placa-mãe do prototipo2 .......................... 169 Fig.76. Foto do circuito de testes para configuração da estimulação por

corrente ou por tensão constante, depois simplificado.............. 170 Fig.77. Circuito de testes para configuração da estimulação ................ 171 Fig.78. Circuito de chaveamento do sinal de alta tensão ...................... 177 Fig.79. Etapa de potência típica do circuito estimulador de Antonino

[ANTONINO,93]......................................................................... 180 Fig.80. Etapa de amplificação com TIP e transformador de pulso ........ 181

LLIISSTTAA DDEE TTAABBEELLAASS Tabela 1. Comparação dos principais corpúsculos mecanoreceptores

[BEAR,02].................................................................................... 21 Tabela 2. Sumário de propriedades dos mecanoreceptores

[PASQUERO,03] ......................................................................... 23 Tabela 3. Valores de TPDT para diferentes locais do corpo [NOHAMA,97].

.................................................................................................... 26 Tabela 4. Pesquisas em estimulação eletrotáctil [NOHAMA,97]. ................ 27 Tabela 5. Resumo de definições de cegueira e visão subnormal ............... 37 Tabela 6. Lista não exaustiva de diferentes sistemas de SS (adaptada de

[Lenay,00].) ................................................................................. 51 Tabela 7. Características principais dos formatos analógicos..................... 64 Tabela 8. Resoluções comuns de imagem [TEXAS,03]. ............................. 64 Tabela 9. Configurações que resultaram sensação vibratória mais agradável

.................................................................................................. 117 Tabela 10. Evolução da latência e acerto%, por grupo e padrão

geométrico estimulado .............................................................. 123 Tabela 11. Sumário da evolução de cada grupo, media de todos os

padrões estimulados ................................................................. 123 Tabela 12.Configuração atual e de possíveis alterações futuras

.................................................................................................. 128

LLIISSTTAA DDEE AABBRREEVVIIAATTUURRAASS

AA tamanho padrão de pilha, de cerca de 1 cm de diâmetro e 4 cm de

comprimento

AC alternate current, ou corrente alternada

A/D analógico para digital (conversor)

ADC analog digital converter

ANN artificial neural networks

AP ar sob pressão

BPS bits por segundo (em comunicação serial)

CI circuito integrado

CIF circuito impresso flexível

CCD charge coupled device image sensor

CMOS complementary metal oxide semiconductor

CMY cyan, magenta, yellow

CONEP Comissão Nacional de Ética em Pesquisa

CPA central telefônica por programa armazenado, i.e., digital

CPU central processing unit

D/A digital para analógico (conversor)

DAC digital analog converter

DC direct current, ou corrente contínua

TPDT two point discrimination threshold, limiar de discriminação

DSP digital signal processing, processamento digital de sinais

ECG eletrocardiograma

EEG eletroencefalograma

EKG eletrocardiograma (sigla em inglês)

EENM eletro estimulação neuro muscular

EM eletromagnético

EMBS Engineering in Medicine and Biology Society, da IEEE

EPUSP Escola Politécnica da USP

ET electrotáctil

ETA “Electronic Travel Aid", sistema de ajuda eletrônica de locomoção.

FES functional electrical stimulation

FLOPS floating point operations per second, milhões de instruções de ponto

flutuante por segundo

FPAA (Field Programmable Analog Array)

FPGA (Field Programmable Gate Array)

fMRI functional magnetic ressonace imaging

GPS global positioning system

HSV hue, saturation, value (matiz, saturacao e intensidade)

IEEE Institute of Electrical and Electronical Engineers

IFESS International Functional Electrical Stimulation Society

IO input/output (entrada/saída)

JMF Java Multimídia Framework

LAC Laboratório de Automação e Controle, do PTC-EPUSP

LCD liquid cristal display

LD limiar de dor

LEB Laboratório de Engenharia biomédica do PTC-EPUSP

LED Ligth emitting diode

LS limiar de sensação

LSI Laboratório de sistemas Integráveis, do PSI-EPUSP

mA mili Ampere, unidade de corrente elétrica

MIPS milhões de instruções de ponto fixo por segundo, para instruções

MLP-BP rede neural tipo multi-layer perceptron, com treino por back-

propagation

MOS metal oxide semiconductor

NiCd níquel cádmio

NiMH níquel metal hidreto

NMES neuro muscular electrical stimulation

OCR Optical Character Recognition

OE output enable

OM orientação e mobilidade

PCB printed circuit board

PCI placa de circuito impresso

PDA personnal digital assistant

PE piezo-elétrico

PEA Poli Energia e Automação, departamento da EPUSP

PET positron emition tomography

Pixel picture element, elemento de imagem

PPD pessoas portadoras de deficiências

PPDV pessoa portadora de deficiência visual

PSI Poli Sistemas Eletrônicos

PTC Poli Telecomunicações e Controle

RGB red,green, blue (vermelho, verde, azul)

RMS root mean square (valor eficaz)

RNA redes neurais artificiais

RSD retinal scanning display

SG strain gage

SKI Smith Kettlewel Institute

SMA shape memory alloy (liga metálica com memória de forma)

SNC sistema nervoso central

SNP sistema nervoso periférico

SS susbstituição sensorial

SSS Sensory Substitution System, sistema de substituição sensorial.

Tactor tactile actuator, atuador táctil

Taxel tactile element, elemento da imagem desenhada por estimulação táctil

TPDT two point discrimination threshold

TVSS tactile vision substitution system, sistema tactil de substituição de

visão

USB universal serial bus

V volts, unidade de tensão elétrica

11 IINNTTRROODDUUÇÇÃÃOO

“Nós não enxergamos com os olhos,

enxergamos com o cérebro”

Paul Bach-Y-Rita, 1972

Técnicas de Substituição Sensorial (SS) são usadas em diversas

aplicações, destacando-se os usos de interfaces hápticas, em propriocepção

artificial para uso em telecirurgia e por lesados medulares, e em especial o

uso para auxílio na reposição de um ou mais sentidos humanos que tenham

sofrido alguma diminuição ou perda total.

A rigor, pode-se dizer que ocorre substituição sensorial até mesmo

quando um deficiente auditivo realiza leitura labial ou quando um cego lê a

escrita Braille, ao passar os dedos sobre o papel em alto relevo que a

contém. Esta substituição pode também ser feita por meios externos,

artificiais, como no caso de algumas pesquisas destacadas no capítulo 4,

sendo também o caso deste trabalho, em que se busca fornecer

informações visuais a deficientes visuais por meio de estimulação táctil.

Nesta tentativa de melhorar a vida diária de deficientes visuais

existem atualmente muitos grupos no mundo, citados no capítulo 4. Entre

eles podem ser citados projetos tais como desenvolver próteses visuais que

visam criar uma retina artificial [CHOW,01], [CHEN01], estimular diretamente

o córtex cerebral [DOBELLE,00], e outros grupos trabalhando com

equipamentos de SS, usando o tato [BACH-Y-RITA,70], [BACH-Y-RITA,72],

[SCHIFF,82], [BURDEA,96], [LENAY,00], [SHIRAI,03], [YARMUSH,01] ou

audição [MEIJER,92], e também sistemas para auxílio a deficientes auditivos

usando o tato [SUMMERS,92].

Apesar das técnicas de retina artificial e estimulação do córtex terem

objetivos em longo prazo mais ambiciosos, para auxílio a deficientes as

vantagens de um sistema de substituição sensorial (SS) táctil externo são

diversas, podendo-se destacar:

2

• Risco zero de infecção (ao contrário de implantes);

• Aplicação em pacientes com visão subnormal e cegueira por

qualquer origem, sem limitação (ao contrário da retina artificial e

estimulação direta do córtex), desde que se mantenha a

sensibilidade táctil em alguma área do corpo;

• Menor custo e facilidade de implantação, resultando em uma maior

acessibilidade.

No Brasil um sistema mais barato, acessível e de implantação e

treinamento rápidos seria mais apropriado às condições econômicas locais.

1.1 OBJETIVOS

Não se visou com este trabalho recuperação ou substituição completa

da visão perdida, mas sim criar um sistema auxiliar que melhore as

condições de vida do deficiente, resolvendo problemas práticos da sua vida

diária, com resultados que possam ser obtidos mais rapidamente.

Após diversos contatos com a Fundação Dorina Nowill de São Paulo,

antiga Fundação do Livro do Cego, foram levantados problemas reais

cotidianos do deficiente visual que poderiam ser solucionados no tempo

disponível, tornando-se o foco deste trabalho. O primeiro problema

solucionável por esta tecnologia proposta foi a familiarização em novos

ambientes, uma das técnicas usadas em Orientação e Mobilidade (OM)

[FELIPPE,97].

Na segunda etapa do trabalho, foi implementada uma versão

preliminar para realizar uma leitura de sinais e letreiros, por meio de

algoritmos de segmentação e no futuro há a possibilidade de se usar

reconhecimento de caracteres. Os funcionários e usuários da Fundação

Dorina foram sempre muito solícitos e colaboradores, tendo inclusive se

prontificado a ajudar nos testes com usuários. Isto acabou não se

concretizando devido à volta do autor para sua universidade de origem,

tendo então sido contatado o Instituto Sul-Matogrossense para Cegos

3

Florisvaldo Vargas, ISMAC, para a realização dos testes com deficientes

visuais.

Entre os objetivos específicos deste trabalho destaca-se a criação de

um equipamento de custo acessível que possa ser usado para resolver os

problemas citados, mas também que permita experimentos somestésicos de

psicologia experimental.

Procurou-se também criar um equipamento versátil que possibilitasse

a execução de testes para definir a melhor forma de estimulação elétrica,

sua forma de onda, seus parâmetros temporais e intensidade, bem como o

tempo mínimo que o usuário usa para reconhecer uma imagem simples.

1.2 DESCRIÇÃO DO PROJETO

Dois sistemas foram propostos e implementados. O primeiro consiste

de uma câmera, microcomputador, equipamento para eletro-estimulação e

matriz de eletrodos, e um sistema complementar de ultra-som e vibrador

para indicar a distância dos objetos, conforme representado na Fig.1.

O segundo é semelhante, apresentando maior resolução, mas com

interfaceamento direto do sensor de imagem ao processador do sistema,

dispensando o uso do computador e webcam.

O sistema da Fig.1 captura imagens por meio de uma webcam

conectada a um microcomputador PC compatível, tratando estas imagens

por software para transformar o original de 240 x 320 pixels (picture element)

coloridos em uma imagem simplificada binária (preto e branco apenas) de 15

colunas de 20 taxels (tactile element) cada, totalizando uma cadeia

seqüencial de 300 bits.

4

Fig.1. Visão geral do protótipo 1 do sistema

Legenda:

1.sensor de ultra-som – para definir distância 2.câmera – para capturar imagens 3.microcomputador – para processar a imagem 4.Kit de microcontrolador: controla quais eletrodos ativar 5.circuitos de estimulação:

placa-mãe com fonte e configuração placas de chaveamento e estimulação por coluna placa de conversão do sinal de ultra-som para emitir vibração

6.Matriz de eletrodos 7. Vibrador

Para tratar as imagens, foram usadas técnicas de processamento de

imagens encontradas em [GONZALEZ,87], [GONZALEZ,92], [BANON,94],

[KIM,01], [LINDERBERG,97]. Basicamente são feitas as seguintes etapas:

2

5

3

7

6

1 4

5

• converter em tons de cinza e binarizar a imagem,

• diminuir detalhes,

• detectar bordas,

• diminuir resolução,

• encontrar a seqüência de pixels da imagem e formar a seqüência de bytes correspondentes a serem enviados para estimulação, correspondentes aos 300 bits da imagem de 15x20.

Este conjunto de bits representando a imagem é enviado serialmente

a um microcontrolador para acionar o sistema de estimulação, composto por

diversas placas que acionam uma matriz de eletrodos posicionada sobre o

abdome, acionando apenas os eletrodos correspondentes aos pixels ativos

na imagem tratada. Cada eletrodo será doravante denominado de taxel, para

não confundir o elemento da imagem original com a imagem sendo

estimulada na pele do usuário. Não se podem ter níveis intermediários de

tons de cinza, pois o eletrodo atualmente permite apenas ser ativado ou não,

não há níveis intermediários. O hardware e matriz de eletrodos foram

baseados em princípios encontrados em [WEBSTER,98], [KACZMAREK,91],

[EMILIANI,86], [KINDERMANN,00], [GEDDES,02] obedecendo a restrições

das normas da Associação Brasileira de Normas Técnicas [ABNT,97].

Vale salientar que durante todo o desenvolvimento uma restrição de

projeto foi a otimização do custo do produto final, sempre procurando a

solução de hardware/software mais econômica e eficiente.

O protótipo final contém 15 colunas de 20 eletrodos (taxels), mas para

testar os princípios foi desenvolvido um protótipo reduzido, de 5 colunas de 7

eletrodos cada. Assim, foi possível fazer os primeiros testes e posterior

treinamento para reconhecimento de padrões geométricos simples, com

sujeitos divididos em grupos de videntes, cegos congênitos e cegos

adquiridos. O software de comunicação envia as imagens tratadas em

tamanho menor para o protótipo. Em uma etapa seguinte, o protótipo 2 e a

matriz de eletrodos correspondente foram construídos, possibilitando o uso

de imagens maiores. Vale lembrar que ainda assim, com apenas 300

6

pontos, as imagens transmitidas são simplificadas, “desenhando” apenas

contornos dos objetos.

O principal uso do sistema é em Orientação e Mobilidade, na etapa de

familiarização em ambientes desconhecidos, para agilizar a montagem do

mapa mental do ambiente. Como o usuário demora um tempo, da ordem de

minutos, para reconhecer uma imagem, e como não vai ser necessário um

envio contínuo de imagens, para diminuir consumo de baterias ele deverá

acionar o sistema apenas quando quiser, como se estivesse tirando uma

fotografia. O usuário só acionaria o sistema para criar um mapa mental de

um ambiente desconhecido ou procurar uma determinada mensagem, como

em um ponto de ônibus ou em um corredor procurando uma determinada

sala.

O equipamento final, mostrado na Fig.2 conta ainda com sensor de

distância por ultra-som para compensar a falta de estereoscopia pelo uso de

uma única câmera. Também foi desenvolvido um programa no PC para

segmentar a imagem já capturada e encontrar nela letreiros, aproximando a

imagem nesta região da imagem com caracteres. Apesar de terem sido

feitos estudos para uso de OCR (optical character recognition, ou

reconhecimento óptico de caracteres), inclusive usando redes neurais

artificiais [RAMALHO,03], em um primeiro momento conta-se com o

reconhecimento feito pelo próprio usuário após realizar treinamentos

previstos no capítulo 7.

Além disso, a intenção é diminuir o tamanho do sistema

posteriormente, tornando-o mais portátil e com maior autonomia de baterias.

Para efeitos de ilustração, na Fig.2 foi desenhada uma matriz de eletrodos

com apenas 5 colunas de 7 eletrodos cada, mas foi projetado e

implementado com 15 colunas de 20 eletrodos cada. Maiores detalhes são

mencionados no decorrer do trabalho.

7

Fig.2. Protótipo 2, com sensores conectados ao módulo processador, dispensando o PC.

1.3 ORGANIZAÇÃO DO TRABALHO

É interessante salientar a multi-disciplinaridade deste projeto, pois foi

necessário o estudo de diversas áreas do conhecimento para implementá-lo,

bem como diversas tecnologias de automação. Foram necessárias noções

de conhecimentos biológicos para definir as características que o

equipamento deveria possuir, decidir os parâmetros de estimulação, formas

de onda, de eletrodos e afins. Entre elas destaca-se a necessidade de se

conhecer um pouco de visão, fisiologia da pele e receptores nervosos,

condução nervosa, cognição e processos de aprendizagem do cego,

técnicas de orientação e mobilidade a deficientes visuais.

Para projetar e testar o equipamento foram necessários

conhecimentos de eletrônica analógica e de potência e transformadores para

o estimulador, bem como eletrônica digital e microprocessadores usados na

8

seleção dos eletrodos a serem ativados. Conhecimento de circuitos flexíveis

foi necessário para a confecção da matriz de eletrodos.

Para tratar a imagem capturada é preciso conhecer algoritmos de

processamento de imagem, que foram implementados em MATLAB, C e

Java, e conhecer informações sobre captura de vídeo e seus padrões.

Ainda foram necessários conhecimentos de comunicação de dados

via serial, e possível uso de lógica reconfigurável (FPGAs), sensores de

imagem (CCD e MOS) e processadores DSP para determinar projetos

futuros e dimensionamento do poder computacional para projetar o segundo

protótipo, feito para diminuir seu tamanho e torná-lo totalmente portátil.

E tudo isso teve de ser feito seguindo normas técnicas e de

segurança de aparelhos eletromédicos [ABNT,97].

Também foram estudadas técnicas de reconhecimento de padrões e

redes neurais artificiais para reconhecimento de caracteres de letreiros. A

implementação envolveu também o estudo de programas para layout de

placa, corrosão, seleção de componentes, contato com fornecedores e

montagem e depuração do hardware. A matriz de eletrodos teve de ser

desenhada com a ferramenta Corel Draw, exigência dos fornecedores de

circuitos flexíveis.

O planejamento dos experimentos com usuários exigiu

conhecimentos da área estatística, para evitar a necessidade de se fazer 2n

experimentos para determinar quais das n variáveis era preponderante. Esta

quantidade exponencial fornece todas as possibilidades de combinações

entre n variáveis que possam assumir dois valores diferentes. Devido ao

trabalho com seres humanos foi também necessário inteirar-se das regras

da Resolução 196 do CONEP (Comissão Nacional de Ética em Pesquisa) do

Ministério da Saúde e submeter projeto detalhado a um comitê de ética,

incluindo no apêndice 2 o Termo de Consentimento Livre e Esclarecido.

Por isto é que foi decidido simplificar depois de um estudo preliminar e

trabalhar apenas com estimuladores elétricos e não vibradores mecânicos,

9

pois seria necessário um estudo de miniaturização mecânica que não seria

factível no tempo disponível para execução de um programa de doutorado.

Assim, alguns tópicos que não são normalmente conhecidos de

engenheiros eletrônicos foram introduzidos em capítulos com o intuito de

fazer uma breve introdução aos assuntos e principalmente, normalizar a

nomenclatura.

No capítulo 1 o projeto é mostrado em linhas gerais. Como o trabalho

envolve várias áreas do conhecimento, algumas noções de outras áreas

foram incluídas.

Este trabalho se dispõe a desenvolver um equipamento para auxílio à

mobilidade de deficientes visuais, transferindo informações por meio de

estimulação táctil. Assim, é necessário ter uma compreensão mínima do

funcionamento do tato e estimuladores tácteis, da visão e possíveis

patologias, do processo cognitivo do deficiente visual e deve ser comparado

com outras opções disponíveis. Mas para tal, primeiramente é necessário

fazer-se uma breve revisão a respeito de neurônios, sistema nervoso e de

plasticidade cerebral.

Assim, o capítulo 2 cobre a estimulação táctil, iniciando por uma visão

breve do sistema nervoso e funcionamento de neurônios e propagação de

sinais elétricos, descreve brevemente o cérebro e define plasticidade

cerebral. A seguir, são mostrados os tipos de receptores tácteis, e tipos de

estimulação elétrica e vibratória. São mencionados ainda alguns fenômenos

de integração que no futuro podem ser aproveitados para aumentar a

resolução do sistema.

O capítulo 3 comenta em linhas gerais a visão humana, definição de

cegueira legal, estatísticas sobre cegueira, os aspectos psicológicos da

cegueira e as técnicas de orientação e mobilidade usadas pelo deficiente

visual. A motivação para estes estudos vem da necessidade de se projetar o

equipamento que substitui a visão pelo tato, bem como o treinamento de

voluntários para usá-lo. É preciso conhecer as limitações do tato em relação

à visão para projetar programas de pré-processamento que compensem

10

pelo menos parcialmente estas limitações. Além disso, é importante que se

saibam quais as principais patologias e quando se pode ou não usar uma

determinada solução ou equipamento de auxílio. O entendimento de como o

cego monta o mapa mental de ambientes desconhecidos ajudou a projetar

os modos de estímulo e os treinamentos e testes aplicados.

Em seguida, o capítulo 4 mostra equipamentos de auxílio existentes,

tanto comercialmente como em pesquisa, para possíveis colaborações

futuras.

A idéia básica deste projeto é usar estimulação táctil para transferir

informações visuais. Como o sistema somestésico humano tem uma

resolução muito baixa comparada à resolução do sistema visual, o projeto

prevê uma matriz de estimulador de apenas 300 eletrodos, divididos em 15

colunas de 20 eletrodos cada. Além disso, o sistema de visão humana

possui uma filtragem de bordas embutida. Assim, é necessário que o

sistema faça um pré-processamento dessas imagens para tentar contornar a

falta de um sistema semelhante no tato, requerendo que faça uma

diminuição da resolução da imagem e detecção de contornos das imagens.

Portanto, uma noção de processamento de imagens é inserida no capítulo 5,

apresentando algumas das técnicas estudadas e implementadas,

especialmente na detecção de bordas e segmentação e simplificação de

imagens, e noções básicas sobre reconhecimento de caracteres.

Finalmente, no capítulo 6 é descrito com detalhes o projeto, e como

os circuitos e programas atendem aos requerimentos de projeto. No

apêndice 10 são mostradas e discutidas as idéias que não foram

aproveitadas e as decisões tomadas, o que pode facilitar a reprodução e

continuidade deste trabalho por outros pesquisadores.

O capítulo 7 descreve os testes para ajuste de equipamento,

treinamento de usuários por padrões geométricos, aplicação do testes, e

finalmente estimulação das imagens capturadas e tratadas.

No capítulo 8 encontra-se um resumo dos dados coletados e alguns

gráficos que ajudam na obtenção de algumas conclusões.

11

O capítulo 9 contém as conclusões obtidas e também sugestões para

continuação do trabalho.

O trabalho é completado então com a lista de referências

bibliográficas e apêndices contendo material de apoio e alguma

documentação de circuitos e documentos necessários aos testes.

Como esta pesquisa envolveu seres humanos, foi necessário seguir a

resolução 196/96 do CNS (Conselho Nacional de Saúde) para experimentos

com seres humanos. Assim, nos apêndices encontram-se também

formulários de testes aplicados e termo de consentimento livre e esclarecido

que faziam parte do projeto para o comitê de Ética a que foi submetido o

projeto, da UFMS, Universidade Federal de Mato Grosso do Sul, pois os

testes foram aplicados após o autor voltar à cidade de Campo Grande em

que leciona.

Foram incluídos ainda dois apêndices com breve lista de instituições

de auxílio ao deficiente visual, no Brasil e exterior, e de grupos de

pesquisadores da área de substituição sensorial para possíveis

colaborações.

12

22 EESSTTIIMMUULLAAÇÇÃÃOO TTÁÁCCTTIILL

O sistema somatosensorial humano serve de canal de entrada para

informações sobre os acontecimentos na superfície e interior do corpo,

compondo-se pelos sentidos do tato (sentido cutâneo), cinestésico e

orgânico. É ele que percebe sensações, possibilitando identificar e localizar

no corpo a ocorrência de estímulos, bem como sua intensidade.

O sentido do tato envolve mecanoreceptores sob a pele, enquanto o

sistema cinestésico abrange informações de posição e movimento do corpo,

devido a sensores em articulações, tendões e músculos, originando o que se

chama de propriocepção, ou seja, a percepção de posicionamento mesmo

sem receber estímulos externos. O sistema orgânico fornece sensações

como dores de estômago ou de cabeça [BEAR,02].

O foco neste trabalho é a substituição do sentido da visão pelo tato,

portanto uma breve revisão é conveniente para entender-se o funcionamento

básico e como se pode estimulá-lo.

Para permitir o entendimento de alguns aspectos de fenômenos

tácteis e também da visão em capítulos posteriores, foi incluída uma breve

revisão do sistema nervoso, sem a pretensão de ser completa, incluída com

o objetivo maior de estabelecer a nomenclatura envolvida.

Posteriormente, uma introdução aos principais receptores nervosos

da pele é fornecida, para que se possa entender a que estímulos reagem e

de que forma.

Finalmente, são cobertos dois tipos de estimulação, eletrotáctil e

vibrotáctil. Acredita-se que a eletrotáctil atue diretamente sobre as fibras

nervosas aferentes, enquanto a vibrotáctil aja sobre os receptores tácteis da

pele [CASTRO,00], [KACZMAREK,91].

13

2.1 SISTEMA NERVOSO

O sistema nervoso é responsável pelo processamento das

informações e controle do corpo todo, sendo composto de sistema nervoso

central (SNC) e periférico (SNP).

O SNC é formado pela medula espinhal e encéfalo, este composto

por cérebro (com 2 hemisférios), cerebelo e tronco encefálico. O cérebro

pode ter suas regiões divididas em lobo frontal, parietal, occipital, temporal, e

sulcos central e lateral.

O SNP é composto pelas demais células nervosas do corpo, incluindo

os receptores e nervos aferentes e eferentes, que levam informação aos

SNC e trazem as respostas deste [BEAR, 02].

2.1.1 Neurônio

Neurônio é a célula nervosa que compõe todo tecido nervoso, sendo

formada pelo corpo celular ou soma, dendritos e um axônio, por onde envia

o sinal ao neurônio seguinte, como observado na Fig.3. A região em que o

axônio de um neurônio se conecta ao dendrito do neurônio seguinte é

denominada sinapse.

A propagação do sinal é elétrica dentro do axônio, e ao chegar à

região sináptica, a informação é levada por neurotransmissores químicos ao

próximo neurônio. Se houver problemas com estes neurotransmissores

podem ser desenvolvidas diversas patologias, por exemplo, miastenia

gravis, cujo sintoma é uma debilidade motora autoimune crônica.

Fig.3. Esquema do neurônio [BEAR, 02].

14

2.1.2 Potencial de ação

Potencial de ação é o processo interno na célula nervosa que

transporta sinal elétrico, baseando-se no funcionamento da bomba de Sódio

Potássio (NaK) que regula a porosidade das membranas celulares. Deve-se

destacar que um neurônio transmite sinais na forma tudo ou nada, ou seja,

conduz ou não conduz. Para estímulos de maior intensidade, maior é a

freqüência do potencial de ação. E deve-se notar que os potenciais de ação

viajam ao longo do neurônio, de seus dendritos para seu corpo celular e

axônio [GOLDBERG,97].

Verifica-se ainda que devido a uma capa de mielina que envolve o

axônio, o sinal elétrico se propaga aos saltos, entre pontos em que falham

esta capa, chamados Nodos de Ranvier, como visto na Fig.4. Isto agiliza o

sinal elétrico, e se esta capa contiver falhas, a propagação será mais lenta e

falha, podendo gerar problemas na sinapse. Um exemplo disto ocorre na

Esclerose Múltipla, em que o paciente vai perdendo o controle motor devido

à maior dificuldade de transmissão dos sinais nervosos.

É importante destacar que um neurônio tem um tempo mínimo de

espera entre um potencial de ação e o seguinte, não podendo ser disparado

seguidamente. Isto limita a freqüência de disparo de um mesmo neurônio em

cerca de 500 Hz a 1kHz [BEAR,02].

15

Fig.4. Esquema da propagação com e sem a capa de mielina [BEAR,02].

2.1.3 Cérebro

É no cérebro que ocorre a maioria do processamento de informações

coletadas pelo corpo todo, destacando-se como exemplo os dos processos

cognitivos e de memória.

Na Fig.5 e na Fig.6 observam-se as localizações de funções de

diferentes regiões do cérebro, notando-se a divisão do córtex

somatosensorial, em que foi levantada para cada região do corpo a sua área

correspondente no córtex. É chamado de mapa somatotópico ou Homúnculo

de Penfield, que de uma maneira simplificada, indica quais diferentes áreas

do corpo têm mais células nervosas no cérebro dedicadas ao

processamento dos estímulos vindos destas áreas.

16

Fig.5. Homúnculo de Penfield [BEAR, 02].

17

Fig.6. Localização das áreas do cérebro [BEAR,02].

18

2.1.4 Plasticidade cerebral

No início das pesquisas sobre o cérebro, acreditava-se que ele

tivesse suas funções localizadas e fixas, porém em décadas mais recentes,

resultados de alguns pesquisadores pouco a pouco mostraram que o

cérebro tem capacidade de moldar-se, adaptar-se e reorganizar-se [BACH-

Y-RITA,95]. Ficou claro que ele não ficava com áreas “desocupadas”, como

mostrado em experimentos como o de Merzenich, que inicialmente mapeou

os dedos da mão de um macaco coruja na região S1 do córtex. Ao remover

um dedo observou-se que com o transcorrer do tempo o córtex

reorganizava-se de modo que as áreas corticais dos dedos vizinhos se

expandiram. Os dedos mais distantes daquele que foi removido, se

estimulados, também tiveram suas áreas corticais expandidas [BEAR,02].

Pesquisas também mostraram a reorganização de córtex visual e

auditivo, por exemplo, Calvert comprovou por meio de imagens de

ressonância magnética funcional (functional magnetic ressonance imaging,

fMRI) que a leitura labial praticada por deficientes auditivos estimulava o

córtex auditivo, da mesma maneira que faria uma pessoa com audição

normal [CALVERT,97]. Também foi mostrado por Wanet-Defalque em

imagens PET (tomografia por emissão de pósitrons) que o córtex visual de

cegos congênitos era estimulado quando submetidos a estímulos auditivos

ou tácteis [WANET-DEFALQUE,88]. Em 2000, pesquisadores alemães da

University of Magdeburg Medical School liderados por Bernard Sabel

conseguiram disparar percepções visuais em cegos usando estímulos

magnéticos [TALAN,2000]. E pesquisadores de Heildeberg usando fMRI

mostraram a ativação de córtex visual quando usuários cegos usavam um

sistema de estimulação táctil pneumático [MAUCHER,00].

2.2 FISIOLOGIA DA PELE

Funcionando como uma capa de proteção aos órgãos internos, a pele

é composta de epiderme, derme e hipoderme. A epiderme é a camada mais

externa, formada por células mortas ou prestes a morrer. A derme,

imediatamente abaixo da epiderme, contém a raiz dos pelos, terminações

19

nervosas, vasos sangüíneos, e colágeno, que confere a elasticidade à pele.

A hipoderme é a região mais profunda, que apresenta as gorduras, veias e

músculos [BEAR,02].

Repleta de receptores nervosos, a pele é o maior órgão sensorial do

corpo humano. Extensa em área, altamente enervada e capaz de

discriminação precisa, a pele torna-se excelente superfície sensorial para

receber a saída de um receptor artificial [BACH-Y-RITA,72].

Faz-se necessário um entendimento básico dos seis principais

receptores tácteis (mecanoreceptores), e a que tipos de estímulos

respondem, reconhecendo intensidade, duração, posição e algumas vezes

direção [BEAR,02], [SUMMERS,92], [HELLER,91].

Por outro lado, o sistema nervoso central (SNC) interpreta a atividade

na rede de receptores e gera percepções coerentes. Sendo assim, um

estímulo na pele é convertido em sinal neural e encaminhado ao encéfalo

para processamento.

2.2.1 Tipos de receptores nervosos

Os mecanoreceptores divergem em suas características, de acordo

com afinidade pela variação do estímulo (freqüência, pressão, tamanho e

tipo do campo receptivo), com os principais destacados na Fig.7, em que se

pode observar que os receptores encontrados em pele glabra (sem pelos,

como a planta dos pés e palma das mãos) diferem dos encontrados nas

diversas partes do corpo.

20

Fig.7. Vista em corte da pele, destacando seus receptores [BEAR,02].

O corpúsculo de Pacini é o de maior tamanho, localiza-se mais

profundamente, e tem campo receptivo grande. Os superficiais são os

corpúsculos Meissner, conectados a fibras eferentes mielinizadas,

amplamente direcionada a estímulos mecânicos transitórios [GUYTON,89],

[SZETO,90], [NOHAMA97].

Os discos de Merkel são compostos por um terminal nervoso e uma

célula epitelial não-neural achatada, possibilitando por meio de uma união

sináptica com o terminal nervoso, um sistema mecanicamente sensível

[BEAR,02].

Os receptores de Ruffini, assim como o corpúsculo de Meissner e as

ramificações dos axônios em torno dos folículos pilosos, são

mecanoreceptores de pressão e tato.

Situado em regiões de conexão da pele com membranas mucosas

estão os bulbos terminais de Krause, como na boca e em órgãos genitais

[BEAR,02].

Por fim, há terminações nervosas livres encontradas em todos os

tecidos do corpo [SZETO,82].

Os receptores também variam com relação ao tempo de resposta e a

adaptação do estímulo, sendo sumarizados na Tabela 1. A Fig.8 resume a

21

localização, tamanho do campo receptivo e formato do estímulo dos 4

principais mecanoreceptores da pele. Existem também outros receptores,

para dor (nocireceptores) e para sensação térmica, que não são objeto deste

estudo.

Tabela 1. Comparação dos principais corpúsculos mecanoreceptores [BEAR,02] Tamanho do campo receptivo

Pequeno grande

Adaptação rápida Meissner Pacini

Adaptação lenta Merkel Ruffini

Fig.8. Os sistemas sensoriais codificam 4 atributos do estímulo: modalidade, local, intensidade e temporização, manifestos na sensação [KANDEL,91].

Os sistemas sensoriais codificam quatro atributos de estímulos:

modalidade, localização, intensidade e temporização, que se manifestam na

sensação, mostrados na Fig.8, e descritos a seguir: [KANDEL,91]

22

• A: na mão humana as sub-modalidades do tato são sentidas pelos

4 tipos de mecanoreceptores. Sensações tácteis específicas

ocorrem quando tipos distintos de receptores são ativados.

Disparando todos os quatro produz a sensação de contato com um

objeto. Ativação seletiva das células de Merkel e terminações de

Ruffini produz sensação de pressão constante na pele acima do

receptor. Quando os mesmos padrões de disparo ocorrem apenas

nos corpúsculos de Meissner e Pacini, uma sensação de

formigamento e vibração é percebida [KANDEL,91].

• B: Localização e outras propriedades espaciais dos estímulos são

codificadas na população de receptores ativados. Cada receptor

dispara potenciais de ação apenas quando a pele próxima aos

terminais sensoriais é tocada, ou seja, quando um estímulo atinge

o campo receptivo do receptor, que é a área marcada em

vermelho na ponta do dedo, diferindo em tamanho e resposta ao

toque. Corpúsculos de Merkel e Meissner fornecem a localização

mais precisa ao toque, já que possuem os menores campos

receptivos e são também mais sensíveis a pressão aplicada por

uma pequena ponta de prova [KANDEL,91].

• C: a intensidade do estímulo é sinalizada pela taxa de disparo dos

receptores individuais, e a duração da estimulação é sinalizada

pela evolução do tempo dos disparos. Trens de picos abaixo de

cada dedo indicam os potenciais de ação evocados pela pressão

de uma pequena ponta de prova no centro do campo receptivo. Os

corpúsculos de Meissner e Pacini se adaptam rapidamente à

estimulação constante, enquanto os demais adaptam-se

lentamente [KANDEL,91].

23

Tabela 2. Sumário de propriedades dos mecanoreceptores [PASQUERO,03] Mecanoreceptor Tipo Estímulo mais

importante Tipo de resposta

Funções principais

Corpúsculo de Meissner

AR 1 Vibração de baixa freqüência (toques)

Transitória Detectar movimentos de baixa freqüência e discriminar localização espacial

Corpúsculo de Pacini

AR 2 Vibração de alta freqüência

Transitória Detectar movimentos de alta freqüência e detectar deslocamento de vibrações mecânicas

Disco de Merkel AL 1 Indentação perpendicular (pressão)

Sustentada Distinguir magnitude de pressões e taxa de variação de pressões

Terminação de Ruffini

AL 2 Deslocamento tangencial (atrito e estiramento)

Sustentada Perceper estiramento da pele e discriminar localização espacial

Fig.9. A base estrutural do campo receptivo dos receptores do sentido do tato [KANDEL,91]

O campo receptivo do neurônio sensível ao toque na pele inclui

aparatos de tradução de sensação nos terminais nervosos e na pele ao

redor da qual os terminais estão localizados. Um trecho de pele contém

vários campos receptivos sobrepostos enervados por fibras nervosas

sensoriais individuais. Quando uma região é tocada, picos são iniciados no

nodo de Ranvier mais próximo da terminal nervoso na pele. Eles são

conduzidos através do corpo celular, localizada na gânglio raiz dorsal, até os

terminais sinápticos na medula.

24

2.3 ESTIMULAÇÃO ELETROTÁCTIL

Para estimular a sensação táctil é necessário que os picos de

corrente atravessem a epiderme, chegando aos receptores nervosos

descritos anteriormente, que são sensíveis a estímulos de diferentes

freqüências e intensidades.

Também são vistos alguns fenômenos que podem ser aproveitados

para tentar integração de receptores e tentar melhorar a resolução do

sistema proposto.

2.3.1 Resposta sensorial

Dos sistemas sensoriais, costuma-se dizer que a audição é

predominantemente temporal, a visão predominantemente espacial, ao

passo que o tato pode substituir a ambos, apesar de ter menor densidade de

receptores. O estímulo varia principalmente quanto à intensidade, duração e

localização [GELDARD,75].

A partir da estimulação elétrica, a sensação percebida varia muito

dependendo da intensidade, freqüência, forma de onda, incluindo se trem de

pulsos (rajadas) e largura de cada pulso, e se tem nível médio nulo ou não.

Os trens de pulso com presença ou ausência de nível médio são conhecidos

na literatura da área de eletro-estimulação como onda monofásica ou

bifásica, apesar de a terminologia não ser adequada do ponto de vista de

engenharia elétrica, pois é apenas um sinal, não dois diferentes com fases

diferentes. Estas características estão sumarizadas na Tabela 4.

Diferentes pesquisadores têm obtido grande variação de resultados, e

a descrição varia entre leve toque, roque firme, pressão profunda quando a

intensidade aumenta. O aumento da freqüência gera toques mais freqüentes

até atingir vibração por volta de 30 Hz. Para freqüências acima de KHz, pode

ser percebida como tensão muscular. Outras descrições envolvem calor, frio,

coceira, picada, agulhada (mais comum), dor, repuxo.

Em resumo, tudo depende de quais receptores nervosos estão sendo

ativados, se mais profundo ou menos, se responde mais rapidamente ou

não, e se perdura sua ativação por mais tempo.

25

Quanto mais profundo o receptor, maior o seu campo receptivo,

portanto menor a resolução espacial para fins de substituição sensorial.

Como existem nocireceptores em proximidade com os mecanoreceptores,

também é possível em situações limite obter sensação de dor, calor ou frio.

Dependendo da região do corpo, os receptores podem estar mais

próximos uns dos outros, havendo maior densidade. Costuma-se definir

então o limiar de discriminação, a distância entre dois pontos percebidos

como separados, ou TPDT (two point discrimination threshold), sumarizado

na Fig.10.

Fig.10. Limiar de discriminação entre dois pontos (TPDT) em função da região do corpo [KANDEL,91].

26

Tabela 3. Valores de TPDT para diferentes locais do corpo [NOHAMA,97]. Local do corpo Toque estático(mm) Vibroatáctil(mm) Eletrotáctil(mm)

Ponta dos dedos 3 2 <7

Palma da mão 10 8

Fronte 17

Abdome 36 10

Braço 38 9

Região lombar 39 11-18 5 – 10

Coxas 43 10

Antebraço 44 9

Panturrilha 46 9

Costuma-se definir ainda os limiares de sensação a partir da

intensidade mínima para perceber o estímulo (limiar de sensação ou LS) e a

intensidade mínima para sentir dor ou desconforto (limiar de dor ou LD).

Para facilitar a comparação, costuma-se dividir um pelo outro para saber a

faixa dinâmica em decibéis de cada tipo de região.

Pesquisadores que estimulam o dedo o fazem utilizando uma matriz

limitada a apenas 49 (7x7) pontos [KACZMAREK, 95] ou por meio de uma

matriz maior, mas com o dedo percorrendo esta matriz como se fosse um

livro Braille [MAUCHER,01]. Kaczmarek [98] também começou a testar há

alguns anos o uso de estimulação na língua, que tem a vantagem de reduzir

a amplitude necessária para cerca de 3 Volts, devido à ausência de

epiderme. Todavia, esta solução ainda tem o problema de limitação de

quantidade de eletrodos, em 12x12, além de ser de dimensões menores e

maior dificuldade de construção. Tang [99] também usou o palato, pela

mesma razão de menor tensão elétrica, mas com a vantagem de não sofrer

interferência das papilas gustativas.

Foi observado que um estímulo na forma de trem de pulsos gera uma

sensação percebida, ou intensidade subjetiva, que aumenta com o aumento

da amplitude ou da largura dos pulsos, e em menor grau com o aumento de

sua freqüência.[NOHAMA,97], [SUMMERS,92].

27

Tabela 4. Pesquisas em estimulação eletrotáctil [NOHAMA,97].

Legenda da Tabela 4:

Formas de onda: M:monofásica, + ou -; B: bifásica; PT: rajada de até 40 pulsos (duração de 10 µs, período de 100 µs, duração da rajada de 4 ms); LD/LS: razão entre os limiares de dor e de sensação; (a) melhor freqüência: 1-100 Hz; (b) melhor freqüência: 1-200 Hz; (c),(d) espaçamento entre eletrodos: 0,79 e 6,35 mm; (e) AI: aço inox. DADOS extraídos de Aiello&Valenza,1984 (A); Collins & Saunders, 1970 (B); Girvin et al, 1982 (C); Higashiyama & Tashiro, 1983 (D); Lin, 1984 (E); Melen & Meindl, 1971 (F); Pfeifer, 1968 (G); Rollman, 1973 (H); Saunders, 1973 (I); Saunders, 1977 (J); Saunders&Collins, 1971 (K); Solomonow & Preziosi, 1982 (L); (adaptada de Kaczmarek et al, 1991).

2.3.2 Mascaramento, lateralidade, adaptação

Existem alguns efeitos que afetam a resposta de um outro receptor

nervoso a um determinado estímulo.

28

Assim, mascaramento ocorre quando um receptor interfere com a

resposta do outro, por exemplo, quando uma estimulação mecânica mascara

uma sensação evocada eletricamente [NOHAMA,97].

Já a lateralidade é a influência do lado dominante na resposta aos

estímulos. No lado dominante o TPDT é menor, bem como os limiares de

dor e de sensação.[SOLOMONOW,77].

A adaptação é uma acomodação do receptor nervoso a um estímulo

prolongado, diminuindo sua resposta em relação à primeira resposta do

início deste estímulo, ou seja, seu Limiar de Sensação eleva-se com o

transcorrer do tempo. Segundo Kaczmarek [95], a elevação do Limiar de

Sensação segue uma função exponencial com constante de tempo entre 20

e 72 segundos. Ao aumentar a repetição das rajadas do trem de pulso usado

na estimulação elétrica, de 5 para 45 Hz, o Limiar de Sensação aumenta 7

vezes, retornando ao Limiar de Sensação inicial após 15 minutos. Para

impedir este efeito, ele recomenda rajadas de freqüência mais alta, entre

100 e 400 Hz.

2.3.3 Treinamento

Segundo Bach-Y-Rita [89], pode ocorrer uma plasticidade cerebral à

medida que se executa treinamento junto aos usuários, aprendendo da

mesma maneira que se aprende por exemplo uma língua estrangeira, ou um

cego aprendendo a ler caracteres Braille. Com o aumento do aprendizado, a

extração de informações se torna mais automática e inconsciente.

Ainda segundo Solomonow e Prados [82], após 14 dias de

treinamento o Limiar de Sensação diminui, ao passo que o Limiar de Dor

cresce de 1 a 3 vezes.

2.3.4 Efeitos lesivos

O choque elétrico classifica-se em alguns níveis:

• Limiar de sensação, da ordem de mA,

• Limiar de dor, da ordem de 100 mA,

• Limiar de fibrilação, da ordem de 0,5 A,

29

• Contração do coração, em cerca de 6A.

Estes testes foram realizados com animais desde a década de 1950,

e pressupõem freqüência de 60 Hz, e sinal atravessando o coração, ou seja,

na pior condição possível, entrando por uma mão e saindo pela outra.

Com relação à freqüência, o efeito do choque elétrico diminui com o

aumento e diminuição da freqüência, sendo o maior dano causado na

freqüência na faixa de 50 a 60 Hz, exatamente a freqüência adotada

mundialmente na rede elétrica [KINDERMAN,00], [GEDDES,95], [ABNT,81].

Para estimular a sensação táctil é necessário que os picos de

corrente atravessem a epiderme, com conseqüente aumento de tensão no

local, podendo exceder a tensão de ruptura da pele, causando dor. Podem

ocorrer três tipos de queimaduras a partir da eletro-estimulação:

[NOHAMA,97]:

• eletroquímicas, evitável com nível DC próximo a zero;

• térmicas, difícil em freqüências abaixo de 1 kHz, exceto quando a

intensidade excede o limiar de dor;

• pequenas pintas pretas ao se retirar o eletrodo, devido ao aumento de

densidade de corrente instantâneo na retirada.

2.3.5 Parâmetros do estímulo elétrico

Recomenda-se usar trem de pulsos em rajadas, ajustando-se a

freqüência e o ciclo de trabalho dos pulsos e da envoltória das rajadas, o

que equivale a ajustar o tempo superior e inferior de cada pulso, a

quantidade de pulsos e o intervalo entre rajadas, podendo ter pulsos apenas

positivos ou também negativos, conforme Fig.11 [NOHAMA,97],

[SUMMERS,92].

Alguns autores sugerem o uso de envoltórias que aumentam e

diminuem gradativamente o sinal para melhorar o conforto do usuário

[NOHAMA,97], [CASTRO,00].

30

Fig.11. Trem de pulsos com tempo morto: exemplo de BFM usando pulsos bipolares DC [NOHAMA,97].

2.3.6 Fenômeno Saltatório

A seguir são apresentadas algumas características do sistema

somestésico que poderão ser aproveitadas para melhoria futura do sistema

aqui apresentado, na busca de uma melhor resolução espacial.

Graças à bainha de mielina, o sinal elétrico parece saltar de um nodo

de Ranvier a outro, pois vai muito mais rápido do que se fosse apenas pela

propagação do potencial de ação. Porém, o fenômeno saltatório não tem

relação com esta condução de sinais elétricos entre nodos de ranvier.

O fenômeno na realidade foi descoberto por Geldard e tem a ver

também com a freqüência dos estímulos. Por exemplo, consiste na

estimulação do mesmo ponto no braço, próximo ao cotovelo, por vários

toques rápidos, com intervalo de cerca de 100 ms, e depois com um toque

próximo ao punho, resultando uma sensação esperada. Se aumentar o

intervalo entre os toques rápidos, sente-se na sensação de pontos

intermediários entre os pontos de estimulação, como se um pequeno animal

estivesse correndo sobre a pele. Também ficou conhecido como “cutaneous

rabbit”.

Este fato pode ser usado para criar eletrodos virtuais na matriz de

eletrodos do sistema desenvolvido, criando uma maior resolução, conforme

31

será discutido na seção do projeto. Este fenômeno também foi observado

nos sistemas auditivo e visual [GELDARD,75].

2.3.7 Fenômeno Phi Visual e Táctil

O fenômeno phi visual é conhecido e utilizado amplamente,

consistindo na percepção de movimento quando pontos próximos são

mostrados alternadamente, dependendo da distância dos pontos e da

freqüência em que são mostrados.

É ele que permite perceber imagens em movimento em filmes apesar

de serem na realidade fotografias em seqüência mostradas em velocidade

rápida.

De maneira semelhante, existe o fenômeno phi táctil, que permite

perceber pontos intermediários na pele [NOHAMA,97].

2.3.8 Fenômeno de sensação fantasma

Uma percepção comum entre amputados é a sensação oriunda do

membro ausente quando outras partes do corpo são tocadas. Isto ocorre

normalmente quando uma parte do corpo cuja representação somatotópica

margeia aquela do membro amputado. Por exemplo, alguém que perdeu o

braço pode “senti-lo” quando toca a face [BEAR,02].

Contudo alguns autores confundem o fenômeno do item 2.3.6 com

este de sensação fantasma, chamando o fenômeno saltatório (“saltation”) ou

o phi táctil de “phantom sensation”, chegando a descrevê-los exatamente da

mesma forma [SHIRAI,03]. Neste trabalho foi considerada a nomenclatura

médica usual, conforme descrita aqui nos itens anteriores.

2.4 ESTIMULAÇÃO VIBROTÁCTIL

A estimulação vibrotáctil é gerada a partir de estímulos mecânicos

sobre a pele atuando sobre os mesmos principais mecanoreceptores. As

formas mais usuais de estimulação mecânica a citar são:

32

• atuadores eletromecânicos, podendo ser pequenos motores excêntricos

que gerem vibrações, ou pequenos eletroímãs que acionam agulhas,

semelhante às cabeças de impressão de impressoras matriciais;

• atuadores piezoelétricos, que transformam uma tensão elétrica em um

pequeno movimento. Um exemplo pode ser visto na Fig.12 ;

• acionadores baseados em shape memory alloys (SMA), ou ligas

metálicas com memória de forma, que permitem manter o estímulo

mecânico sem manter a energia no estimulador, reduzindo o consumo de

bateria e aumentando a autonomia dos equipamentos.[KOO,06]

O problema com todas estas soluções de estimuladores mecânicos é

que elas são de dimensões maiores que os estimuladores elétricos, e

consomem muito mais energia, diminuindo a duração das baterias, sendo

recomendada apenas para pesquisa por enquanto. Heidelberg por exemplo

usa atuadores pneumáticos, mas o sistema que gera estes gráficos tácteis

precisa ficar posicionado sobre uma mesa, e o usuário a explora com sua

mão [MAUCHER,00].

Fig.12. Display Braille convencional: (a) uma celula Braille composta de 8 pontos, (b) display complleto formado por uma arranjo linear de células da Pulse Data

International Ltd [PULSE,05].

33

33 VVIISSÃÃOO

A visão é o principal canal de entrada de informações do exterior para

o ser humano, com o olho conectado diretamente ao sistema nervoso

central. Como este trabalho visa substituir a visão pelo tato, faz-se

necessário ter uma compreensão mínima da visão e de sua funcionalidade,

de maneira a se poder implementar possíveis processamentos que possam

ser feitos para compensar deficiências do tato em relação à visão.

Para a elaboração deste projeto não é necessário entender

profundamente o sistema de visão, as diversas camadas da retina, os

neurotransmissores envolvidos nos disparos, ângulos de incidência ou

especificidades de composição de cores e possíveis efeitos. Basta entender

em linhas gerais o que ocorre na recepção das imagens e a percepção

gerada no córtex, permitindo assim saber quais problemas podem ocorrer de

maneira a determinar quais das soluções propostas na literatura podem ser

aplicadas a quais casos de deficiência visual, seja parcial ou total.

Por exemplo, alguém que tenha tido uma lesão no nervo óptico não

poderá usar um implante de retina artificial [CHOW,01] ou sistema de laser

que projete no fundo do olho uma imagem [MICROVISION,05]. Contudo este

sistema de laser pode ser usado em uma pessoa com degeneração macular,

com problema de visão noturna, em que a quantidade de luz não excita

suficientemente os receptores visuais.

As patologias da visão podem ser congênitas ou adquiridas, ou seja,

por lesão ou por característica genética do paciente. Conforme mencionado

anteriormente, algumas delas podem ser corrigidas, e sua conseqüência

pode ser perda total da visão (cegueira) ou visão definida como subnormal.

Algumas ocorrem devido a problemas na parte anterior do olho, tais

como a córnea, íris e cristalino, e outras são geradas devido a problemas na

parte posterior, tais como a retina, mácula, fóvea, receptores visuais (cones

e bastonetes) e nervo óptico. Patologias mais simples, como a miopia e

hipermetropia, quando o foco da imagem se forma antes ou depois da fóvea,

34

requerendo apenas lentes corretivas. Elas podem ser causadas pelo

comprimento do globo ocular ser maior ou menor que o necessário, mas

também podem ocorrer devido a deformações do cristalino. Por isso que

pessoas de maior idade, que perdem a elasticidade do cristalino e dos

músculos ciliares não atuam mais adequadamente, normalmente começam

a necessitar de óculos para enxergar de perto. Isto pode ocorrer por volta

dos 45 anos.

É importante ainda saber que uma parte dos neurônios do sistema

visual desempenha papel de detectores de contornos e de movimentos,

ausentes no sistema somestésico. Assim, pode-se prever soluções de pré-

processamento das imagens a serem capturadas no sistema proposto que

implementem parte destas funções.

É importante destacar que a maneira mais efetiva e comum de se

estimar a profundidade de uma imagem é utilizando-se dois olhos Como

estão ligeiramente deslocados em relação ao seu eixo central, pode-se

calcular geometricamente a profundidade. O cérebro faz isto

automaticamente, mas o algoritmo para ser implementado artificialmente é

complexo. A dificuldade é determinar, no cruzamento dos raios, qual é o

correto.

Também são vistos aspectos psicológicos da cegueira, da mesma

maneira importante para definir e entender o projeto do sistema proposto.

Finalmente, noções das técnicas de orientação e mobilidade utilizadas

pelos deficientes visuais são cobertas, de maneira a entender como o cego

raciocina ao montar seu mapa mental, e assim ajudar a planejar o projeto e

os testes do sistema em questão.

3.1 ACUIDADE VISUAL

Acuidade visual (AV) é a medida do limiar de discriminação de dois

pontos separados espacialmente. A melhor acuidade visual ocorre na região

especializada da retina para a visão de detalhes, a fóvea [MARANTES,00].

35

A acuidade depende de diversos fatores, inclusive da região da retina

estimulada pela luz, intensidade da iluminação, tempo de exposição do

estímulo, movimento do objeto ou dos olhos e idade do paciente.

Pode-se indicar a acuidade visual por uma relação de valores ou por

um índice. Na notação mais utilizada, a de Snellen, 1,0 significa o mesmo

que 20/20, e 0,5 é o mesmo que 20/40. O primeiro número é a distância em

pés que o objeto a ser lido se encontra do olho que está sendo examinado.

O segundo refere-se ao tamanho do objeto, por exemplo uma letra. Assim,

quem tem 0,5 ou 20/40 significa que para conseguir ler as letras devem ter

seu tamanho dobrado.

A pessoa com acuidade 20/40 pode ver a 20 pés (6 metros) o que

uma pessoa de visão normal pode ver a 40 pés (12 metros). Pode-se ter

uma idéia da acuidade na Fig.13.

Fig.13. Testes de Snellen mostrando a percepção do portador de acuidade visual de 20/20, 20/30, 20/50 e 20/80 [UMBAUGH, 97].

36

Existem diversos tipos de testes para detectar diferentes patologias, e

o mais comum deles em consultórios é o teste de Snellen, sendo um deles

composto por padrões de letras E em diversas rotações

3.2 VISÃO SUBNORMAL X CEGUEIRA

A cegueira total ou AMAUROSE pressupõe completa perda de visão,

não havendo nem percepção luminosa. No jargão oftalmológico é conhecida

por visão “zero”.

O termo cegueira não é absoluto, reunindo diversos graus de visão

residual. Não significa total incapacidade para ver, mas limitações

incapacitantes para o exercício de tarefas rotineiras. Para fins de

classificação, divide-se a população em pessoas com cegueira legal, visão

subnormal e videntes.

Esta classificação é feita de acordo com sua acuidade visual, descrita

anteriormente, e o campo visual, definido como a amplitude da área

alcançada pela visão. Assim, uma pessoa tem cegueira legal se tiver pelo

menos um dos 2 critérios seguintes:

• se a visão corrigida do melhor dos seus olhos é de 20/200 ou menos, isto

é, se ela pode ver a 20 pés (6 metros) o que uma pessoa de visão normal

pode ver a 200 pés (60 metros),

• se o diâmetro mais largo do seu campo visual subentende um arco não

maior que 20 graus, ainda que sua acuidade visual nesse estreito campo

possa ser superior a 20/200 (o normal é 150º). Esse campo visual

pequeno também é chamado de “visão em túnel” ou em “ponta de

alfinete”.

Pessoas com cegueira legal, também denominada de cegueira

parcial, econômica ou profissional, são capazes no máximo de contar dedos

à curta distância e perceber vultos.

Existem ainda pessoas que só tem percepção luminosa de claro e

escuro, e projeção luminosa quando o individuo também é capaz de

identificar a origem da luz [CONDE,02].

37

A Tabela 5 resume a classificação de deficientes visuais, em que para

ser considerado portador de visão subnormal um ou dois dos 2 critérios

servem:

• acuidade visual de 6/60 e 18/60 (escala métrica)

• campo visual entre 20 e 50º.

Tabela 5. Resumo de definições de cegueira e visão subnormal Acuidade Campo

Normal --- 140º

Subnormal entre 20/200 e 60/200 Entre 20º e 50º

Cegueira < 20/200 < 20º

Pedagogicamente, delimita-se como cego aquele que, mesmo

possuindo visão subnormal, necessita de instrução em Braille, e como

portador de visão subnormal aquele que lê tipos impressos ampliados ou

com o auxílio de potentes recursos ópticos.

Observe que a visão subnormal, ou Baixa visão, leva à incapacidade

funcional e não pode ser corrigida com tratamento clinico, cirúrgico ou com a

utilização da correção óptica habitual (óculos ou lentes de contato),

acarretando dificuldades para atividades da vida diária, aprendizado,

atividade profissional, sociabilidade, sem considerar efeitos psicológicos e

familiares. Com treino e orientação pode ser desenvolvida eficiência em

tarefas que sem treinamento seriam impossíveis.

Mas do ponto de vista estritamente médico cego é apenas aquele que

não tem sensação de luz nenhuma [SAMPAIO,00].

3.3 DADOS ESTATISTICOS SOBRE DEFICIÊNCIA VISUAL

Na população brasileira, de acordo com o censo de 2000 do IBGE,

48,1% da população brasileira possui alguma deficiência visual, parcial ou

completa. Desses, 43% são homens, 57% são mulheres. É um grande

aumento em relação ao censo anterior, que acusa cerca de 2%. Isso deve-

se também ao fato de os critérios terem sido mudados, e de ter havido um

38

melhor treinamento dos recenseadores do que no censo de 1990. A

mudança foi provocada para utilizar os mesmos critérios utilizados pela OMS

(Organização Mundial da Saúde, ou WHO, World Health Organization) da

ONU [FERREIRA, 02].

Contudo, há quem discorde da metodologia, pois há aprofundamento

apenas por região, sexo, religião, e não por tipo de causa de doença, nem

se subdivide quem tem visão subnormal da pessoa que apenas requer uso

de lentes corretivas.

Segundo dados de 1994 da OMS, estima-se existirem no mundo 38

milhões de pessoas cegas e 110 milhões com baixa visão. Dos cegos, as

causas predominantes são 16 milhões devido à catarata (42%), 6 milhões

devido a tracoma (15%) e 5,2 milhões de pessoas devido a glaucoma (14%)

[WHO, 03].

3.4 ASPECTOS PSICOLÓGICOS DA CEGUEIRA

Como varia muito de pessoa para pessoa a época em que ocorre sua

perda de visão, bem como o percentual desta perda, é necessário adequar-

se a cada um o tratamento dedicado. Estes fatores têm implicações na

aprendizagem e ajustamento do individuo, pois a reorganização perceptiva

do deficiente visual tem implicações na sua aprendizagem [AMIRALIAN,85].

Se uma pessoa perde sua capacidade visual até o limite de 5 anos,

considera-se que é um cego congênito, pois até esta idade a visão não está

totalmente formada. Se ocorrer depois dessa idade, denomina-se como cego

adquirido. Assim, classificam-se os PPDV basicamente em quatro grupos,

portadores de:

• Cegueira congênita

• Cegueira adquirida

• Visão subnormal congênita

• Visão subnormal adquirida

39

As pessoas consideradas cegas são as que apresentam perda total

da visão ou que a têm abaixo de um nível que permita realizar a apreensão

do mundo circundante pela visão, bem como impedem a aprendizagem

acadêmica pelo método comum. Os portadores de visão subnormal podem

utilizar sua visão residual para complementar seus outros sentidos, e

atualmente são incentivados a fazê-lo, ao contrário do que ocorria no

passado.

Quem perde a visão após os 5 anos de idade não precisa depender

da audição e tato para adquirir conhecimentos e formar imagens mentais,

podendo reter imagens visuais e relacioná-las com imagens auditivas e/ou

tácteis [LOWENFELD,71].

Comum aos 4 grupos é o processo perceptivo do mundo que os

cercam. Semelhante a uma pessoa surda, o deficiente visual precisa de

modificações no papel dos sentidos restantes, ocasionando uma

reorganização perceptiva exigida pela perda visual [MYKLEBUST,66].

Para melhor estudar a situação, pode-se definir 2 categorias de

sentidos: os de distância e os de proximidade. Os primeiros apreendem o

ambiente externo sem a necessidade de contato direto com o objeto,

incluem a visão e audição. Os de proximidade requerem o contato direto,

sendo o tato, olfato e gustação [BAY, 1969].

Durante seu desenvolvimento onto e filogenético, o ser humano usou

uma organização sensorial em que os sentidos de distância são primordiais,

e os de proximidade são complementares, com todos definindo seu campo

ambiental [MYKLEBUST,66].

Assim, os sentidos de distância são bem desenvolvidos e flexíveis,

podendo cada um ser usado para exploração e aquisição de experiências. A

audição e visão podem se completar, mas não são interdependentes e nem

decorrem um do outro. Já os sentidos de proximidade não sevem em um

adulto como sentido dirigente, pois são mais primitivos e imaturos que os

sentidos de distância.

40

Contudo, quando o indivíduo é privado ou limitado em um dos

sentidos de distância, esta hierarquia muda.

No cego a audição torna-se o único sentido de distância atuante.

Contudo, a visão é direcional, focalizando apenas a área diante da pessoa,

enquanto a audição atua em todas as direções ininterruptamente. Pode-se

fechar os olhos e perder contato com um objeto, mas o mesmo não ocorre

com uma fonte sonora.

Assim, a audição é considerada como um sentido de fundo do ponto

de vista psicológico, ao passo que a visão é primordialmente um sentido do

primeiro plano, na maioria das vezes. Normalmente, usa-se a visão para

focalizar uma experiência após esta ter sido identificada pela audição

[AMIRALIAN,85].

Em casos raros, pode haver uma inversão, com a visão atuando como

um sentido de fundo e a audição como um sentido de primeiro plano, como

ao se ouvir um concerto musical.

Apesar de ambos os sentidos, visão e audição, serem consideradas

espaciais e temporais, as experiências visuais em geral são estáveis,

podendo uma imagem ser mantida, enquanto a audição é mais temporal.

Com a visão percebe-se de um objeto, de uma só vez, seu tamanho,

forma, disposição e distância no espaço, ao passo que a audição fornece

indicação do momento. Portanto, é comum usar-se a visão para confirmar

informações obtidas pelo tato ou audição.

Os demais sentidos, de proximidade, ou seja, tato, olfato e gustação,

são menos desenvolvidos. Apenas enquanto é bebê o ser humano depende

mais deles, e só volta a depender se um dos sentidos de distância for

prejudicado.

Uma experiência sensorial só é apreendida usando-se todos os

canais sensoriais, mesmo que em geral eles não sejam simultaneamente

estimulados. Caso falte um canal, a experiência é percebida de maneira

diferente.

41

Ao perder a visão, o cego começa a depender mais dos demais

sentidos, e até os sentidos de proximidade se tornam suplementares e

críticos para a aprendizagem.

O tato em especial se destaca, mas conforme descrito por Fraiberg

(1977), na ausência da visão, a seqüência de uso das mãos para exploração

ambiental cai. Em bebês cegos suas mãos ficavam paradas, enquanto em

bebês videntes elas estavam sempre buscando brinquedos e outros objetos

identificados pela visão. Observa-se que isto acaba prejudicando até o

aprendizado de Braille [AMIRALIAN,85].

O mesmo ocorre em portadores de visão subnormal, devendo ser

incentivado o uso do tato, caso contrário a apreensão do mundo ficará

restrita em conhecimento e experiências, ocasionada pela dificuldade de

discriminação e desmotivação. Contudo, não se deve descuidar do

treinamento da visão residual, apesar de ser apenas um complemento, e

não um substituto das técnicas especiais. Instrutores de técnicas de

Orientação e Mobilidade da Fundação Dorina Nowill apontaram que

antigamente o portador de baixa visão não era incentivado a complementar

seus esforços de OM usando sua visão residual, mas que isso tem mudado.

Porém, é importante destacar que não existe evidência cientifica de

que a ausência de um sentido implique na superativação dos outros, são

necessários aprendizagem e ajustamento para ocorrer a reorganização

perceptiva. Se o tato não for estimulado, pode até ocorrer um atraso no seu

desenvolvimento em crianças cegas congênitas [AMIRALIAN,85].

Deve-se lembrar ainda que cegos congênitos têm maior dificuldade na

aprendizagem, pois não tem algo a que referenciar. Uma maçã para um

cego adquirido tem a mesma imagem mental que de um vidente. Contudo

um cego congênito não tem esta imagem, ele vai se referenciar ao cheiro,

textura, formato, mas não a algo aproximadamente esférico e avermelhado.

Em conversas com instrutores da Fundação Dorina Nowill foi mencionado o

caso de um aluno vindo de uma fazenda que não conseguia compreender o

conceito de calçada, pois não tinha experiência prévia em seu ambiente

42

original. Foi necessário fazer uma analogia com margens de rios, conceito

que ele conhecia, para poder compreender o novo conceito.

Levando isso em conta, o critério de seleção para as pessoas que

testaram o equipamento deste trabalho é que fossem adultos que tenham

um mínimo conceito formado de padrões geométricos, para ter com o que

comparar. Como se pode ver na seção correspondente, foram 3 grupos de 3

ou 4 pessoas cada, um de cegos congênitos, um de cegos adquiridos e um

de videntes.

3.5 NOÇÕES DE ORIENTAÇÃO E MOBILIDADE (OM)

Orientação é capacidade de perceber o ambiente, saber aonde

estamos, enquanto que mobilidade é a capacidade de nos movimentarmos

neste ambiente.

O ensino de técnicas de OM para deficientes visuais visa ensiná-los a

usar os sentidos remanescentes, tais como audição, tato, cinestesia

(percepção de seus movimentos), olfato e visão residual, se houver, para se

orientar [FELIPPE,97].

Uma pessoa portadora de deficiência visual (PPDV) pode se

locomover usando ajuda de um guia vidente, seu corpo (autoproteções),

bengala longa, mostrada na Fig.14, cão-guia ou ajudas eletrônicas.

Estas ajudas eletrônicas também são conhecidas pela sigla em inglês

ETA (electronic travel aid), ou ajuda eletrônica para locomoção. Entre elas

pode-se adiantar bengala longa complementada por sistema de medição de

distância por laser ou ultra-som, e algumas destas são descritas adiante no

texto.

Não é o escopo deste trabalho revisar todas as técnicas de OM,

portanto não será visto como o guia vidente e o cão-guia devem atuar.

As técnicas de autoproteção ensinam a usar o corpo e alguns

equipamentos para locomoção e exploração do ambiente. Entre elas podem

ser listados procedimentos sistemáticos (algoritmos) para proteção inferior e

superior, rastreamento com a mão, enquadramento e tomada de direção,

43

localização de objetos, procedimentos com trincos e maçanetas, e

finalmente a familiarização.

As técnicas em geral consistem em uma seqüência de passos a

serem feitos, de maneira a exaurir as possibilidades.

Fig.14. Bengala longa rastreando [FELIPPE,01].

3.5.1 Proteção inferior e superior

Para se proteger a parte inferior ou superior do corpo, usa-se a mão

com o braço flexionado e o dorso da mão para frente, distante o suficiente

para que antecipe as pontas dos pés.

3.5.2 Rastreamento

No rastreamento com a mão procede-se de maneira semelhante, mas

mantendo contato com uma parede ou corrimão, procurando se antecipar à

ponta dos pés.

3.5.3 Enquadramento e a tomada de direção

O enquadramento permite à pessoa estabelecer uma linha de marcha

reta ou orientada. Para isso, ela deve encostar suas costas em algum objeto

de destaque do ambiente, e seguir uma linha perpendicular para sua

trajetória.

44

3.5.4 Localização de objetos

Para se localizar objetos deve-se realizar uma busca sistemática

adequada, segura e eficiente. Para objetos caídos, deve-se parar e procurar

ouvir aonde caiu, voltando-se para a origem do som e caminhando em

direção ao ponto em que se julga estar o objeto. Deve-se então procurar de

duas formas: em movimentos circulares (leque) ou em linhas verticais e

horizontais (grade), rastreando a área com o dorso dos dedos.

Para objetos sobre móveis (mesas,

balcões, prateleiras) a pessoa deve estar

sentada ou de pé frente ao móvel, e movimenta

as mãos com o dorso pra frente até contatar a

borda do móvel. A partir do contato, usando a

linha média como referência, a pessoa começa

a aplicar um modelo de busca (leque ou grade),

como ilustrado na Fig.15.

Fig.15. Método de Localização [FELIPPE,01].

3.5.5 Trincos e semelhantes

Para trincos, maçanetas, e semelhantes, novamente a pessoa de

frente para a porta movimenta as mãos com o dorso para frente até tocar o

objeto. Então deve deslizar as mãos horizontalmente à direita e à esquerda

até encontrar os batentes. Basta então acompanhar os batentes ou

molduras em movimentos de deslize vertical das mãos até encontrar a

maçaneta.

3.5.6 Familiarização

A familiarização é a mais complexa e demorada das técnicas, pois

depende do tamanho do ambiente. A técnica é semelhante a todas as

anteriores, mas aplicada em escala bem maior. Aliás, o uso da bengala

também é semelhante, usando-se modelos de busca de leque ou grade,

ilustrado na Fig.16 e na Fig.17.

45

Fig.16. Métodos do perímetro e do cruzamento para familiarização [FELIPPE,01].

No método do perímetro, a pessoa escolhe um ponto de partida,

geralmente a porta principal, e faz o enquadramento paralelo à parede ou a

um objeto. Faz o rastreamento, circundando o perímetro até retornar ao

início. A seguir, pode fazer o rastreamento em sentido contrário. O número

de repetições depende do ambiente, situação e necessidades individuais.

O método dos cruzamentos é semelhante, parte-se de um ponto

escolhido, mas agora fazendo o cruzamento em linha reta a partir do

enquadramento na parede. É semelhante ao algoritmo de se visitar uma

feira de exposições, fazendo zig-zag pelos corredores do evento.

Fig.17. Início da familiarização com guia vidente e com bengala longa [FELIPPE,01].

46

Oportunidades de atuação deste projeto:

Como este trabalho visa facilitar a vida do deficiente visual, as

técnicas de localização de objetos e familiarização são as que mais podem

ser afetadas positivamente. Todo o trabalho está voltado para aplicações de

familiarização, mas é possível usar os equipamentos e programas

desenvolvidos para localização com a mesma facilidade. Basta ajustar o

zoom (aproximação ou afastamento) implementado.

A partir desta rápida descrição, pode-se observar a importância que

um sistema que agilize o processo de familiarização pode ter na vida de uma

PPDV.

Além disso, a bengala longa, instrumento inseparável de um

deficiente visual, não pode descobrir obstáculos altos, como galhos de

arvores e “orelhões” (cabines telefônicas).

Outra dificuldade é ler letreiros e sinais, como quando se precisa

encontrar uma determinada sala em um prédio vazio ou tomar ônibus

quando se está sozinho no ponto. Neste caso é necessário parar todos os

ônibus e perguntar aos motoristas. Em um prédio desconhecido, a PPDV

procura se informar primeiro, descobrir como as salas são numeradas, e

contar os passos, por exemplo, o que é difícil, demorado e trabalhoso.

Este trabalho visa facilitar estas dificuldades. Em resumo, ajuda o

cego a montar o mapa mental de suas redondezas.

3.5.7 Atividades da Vida diária (AVD)

Apenas a título ilustrativo, é interessante salientar que também faz

parte da adaptação e aprendizagem do deficiente visual descobrir como

fazer coisas que no dia-a-dia os videntes não dão valor. Cozinhar, tomar

banho, vestir-se (escolher cores é um problema), barbear-se, trocar as

fraldas de um filho, todas são coisas que o videntes acham simples, mas

que devido à falta de visão podem se tornar difíceis e até perigosas. Estas

compõem as atividades da vida diária.

47

44 EEQQUUIIPPAAMMEENNTTOOSS DDEE AAUUXXÍÍLLIIOO EEXXIISSTTEENNTTEESS

De acordo com a norma ISO 9.999 e a CIF 2001 da OMS

(Organização Mundial de Saúde), define-se “tecnologia assistiva” ou “ajuda

técnica” a "Qualquer produto, instrumento, estratégia, serviço e prática,

utilizado por pessoas com deficiência e pessoas idosas, especialmente

produzido ou geralmente disponível para prevenir, compensar, aliviar ou

neutralizar uma deficiência, incapacidade ou desvantagem e melhorar a

autonomia e a qualidade de vida dos indivíduos”.

Neste capítulo são listados alguns dos auxílios típicos usados no dia-

a-dia pelos deficientes visuais, e posteriormente também quais são as

pesquisas em andamento ao redor do mundo nesta área, mesmo algumas

que não seriam consideradas aplicações de tecnologia assistiva, mas cujos

frutos possam depois ser usados para estes fins.

Enquadra-se nessa situação uma aplicação usando estimuladores

tácteis para o fornecimento de informações complementares a pilotos de

aviões de combate, fornecendo-lhes roupas com tactors (tactile actuators) ou

atuadores tácteis.

Outro sistema mais ousado, não considerado um sistema de

substituição sensorial (SS), mas ainda assim digno de menção pois sua

tecnologia poderá no futuro criar possíveis auxílios a deficientes visuais

apesar de projetada originalmente para pilotos de combate, é a projeção de

imagens a laser sobre a retina, sobrepondo-se às imagens normais vistas.

Assim é possível projetar informações do painel do avião, fazendo com que

para qualquer lado que o piloto olhe o painel esteja sempre à sua frente. O

mesmo já existe usando projeção sobre o pára-brisa do avião, ou mesmo

sobre a viseira do capacete, mas esta tecnologia de projeção sobre a retina

seria mais natural e poderá também ajudar portadores de cegueira noturna,

pois ao se atribuir maior intensidade luminosa pode-se compensar a menor

sensibilidade à luz gerada por esta doença. O nome desta tecnologia é RSD,

48

ou Retinal Scanning Display, em desenvolvimento pela empresa americana

Microvision [MICROVISION,02 ].

Nesta tentativa de melhorar a vida diária de deficientes visuais

existem atualmente muitos grupos no mundo, com projetos tais como

desenvolver próteses visuais que visam criar uma retina artificial [CHOW,01],

[CHEN01], estimular diretamente o córtex cerebral [DOBELLE,00], e outros

grupos trabalhando com equipamentos de SS, usando o tato [BACH-Y-

RITA,70], [BACH-Y-RITA,72], [SCHIFF,82], [BURDEA,96], [LENAY,00],

[YARMUSH,01] ou audição [MEIJER,92].

4.1 AUXÍLIOS USUAIS

Entre os equipamentos de maior uso pelo deficiente visual encontram-

se alguns de baixo teor tecnológico como a bengala longa, bola com guizos

e guias para escrever em Braille e para assinar cheques. Outros

equipamentos são de maior tecnologia, como o Optacon e ampliadores de

vídeo. Alguns estão descritos a seguir [CLARK,77], [BLAZIE,95], [ONCE,00].

Disponível comercialmente ao consumidor não foi encontrado nenhum

equipamento que passe informações visuais por meio do tato, a um preço

acessível, apenas equipamento para pesquisas. Existe equipamento de

substituição sensorial para levar imagens ao deficiente por meio de sinais

audíveis como o “The Voice” e semelhantes, comentados mais à frente.

O que é amplamente difundido são os equipamentos que funcionam

como lupa, permitindo a ampliação de textos para deficientes visuais,

detalhado no decorrer deste texto. Antigamente existiram também

equipamentos como o Optacon, que ao ser passado por cima do texto ou de

figuras, transforma essa imagem em uma imagem em relevo por meio de

pinos que se elevam. Mas isto já existe há mais de uma década, e não tem

encontrado tanta receptvidade, devido aos custos altos e dificuldade de uso.

Em leitura de texto, por exemplo, é difícil para o deficiente visual, pois o

relevo que se forma é da letra normal, enquanto ele está acostumado com

Braille, exigindo muito tempo de treinamento para se acostumar.

49

Os sistemas ainda podem ser classificados em sistemas para

pessoas com baixa visão ou com perda total.

Para baixa visão encontram-se os ampliadores de vídeo por software

ou hardware. A versão por software em geral são programas que atuam

como uma lupa ao passar o mouse sobre um texto, mas tem ampliação

limitada. Outros aparelhos atuam como um circuito fechado de TV em que a

imagem capturada é projetada ampliada em uma TV. Existem diversos

fabricantes estrangeiros, e um nacional, a Terra Eletrônica, de São Bernardo

do Campo, SP, que faz a Lupa Eletrônica.

Entre os sistemas para cegos existem programas que lêem em voz

alta o texto do computador, e teclados com uma linha de células Braille

mecanizadas, com pinos que se elevam para mostrar o correspondente em

Braille de cada letra ou símbolo mostrado na tela. Contudo, esta linhas são

muito caras, na ordem de milhares de dólares por uma linha, e não são

muito difundidas no Brasil [BLAZIE,95].

Dos equipamentos habituais pode-se destacar ainda:

• bengala longa (white cane): instrumento básico para locomoção do

deficiente visual;

• Reglete (slate) e perfurador para escrever mensagens curtas,

semelhantes ao guia usado antigamente para perfurar cartão de loteria

em casas lotéricas, conforme Fig.18;

• Guia para assinar cheques;

• Bolas com guizos para jogar futebol;

• Roupas com marcadores para identificar cores;

• Rotulador em Braille;

• Diversos materiais em alto relevo, como bússolas, fitas métricas, relógios

de pulso (com tampa levantável);

• Diversos dispositivos falantes, como gravadores, calculadoras (até

científicas), leitor de cores capaz de distinguir matiz, brilho e intensidade.

50

Fig.18. Reglete importado com caneta correspondente

4.2 SOLUÇÕES TECNOLÓGICAS NÃO INVASIVAS

Nesta seção estão listados alguns equipamentos que utilizam maior

tecnologia, geralmente apenas eletrônicos, tanto comerciais como em

desenvolvimento nos diversos centros de pesquisa ao redor mundo.

Na Tabela 6, adaptada e ampliada a partir de [LENAY,00], estão

listados os principais sistemas em uso ou em desenvolvimento hoje no

mundo. Esta tabela engloba igualmente os dispositivos técnicos (sensores e

atuadores) possíveis de serem usados neste contexto. Note que certos

dispositivos de auxílio à locomoção podem igualmente ser considerados

como sistemas de SS. A tabela contém os sistemas de ETA (electronic travel

aid), de auxílio eletrônico para locomoção, e também os SSS propriamente

ditos (sensory substitution systems) ou sistemas de substituição sensorial.

Os estimuladores (atuadores) que enviam a informação ao usuário

podem ser de diversos tipos, destacando-se os tipos:

• EM: eletromagnético • ET: electrotáctil • SMA: shape memory alloy (liga metálica com memória de forma) • PE: piezo-elétrico • AP: ar sob pressão • SG strain gauge • EL: esticamento lateral

51

Tabela 6. Lista não exaustiva de diferentes sistemas de SS (adaptada de [Lenay,00].) Tipo Sensor Estimulador/

Atuador Referência

ETA1 5 de ultra-som Estereofônico Sonic Pathfinder (Heyes, 1984) ETA 2 de ultra-som Monofônico Ultrasonic Torch (Kay, 1965) ETA/SSS2 3 de ultra-som Estereofônico Sonic Glasses (Kay, 1974) ETA/SSS 3de ultra-som Estereofônico TriSensor (Kaspa) distribuído pela

SonicVison ETA/SSS 1 de ultra-som Táctil (EM) Mowat Sensor (Pulse Data Int Ltd) SSS Câmera vídeo Estereofônico The Voice (Meijer, 1992) SSS Câmera vídeo Táctil (EM) TVSS (20x20 tactors, Bach Y Rita 1969) SSS Câmera CCD Táctil (ET) Videotact (1996) Unitech Research Inc SSS Sonoro (micro) Táctil (EM) Tactile Sound Transducer (Clark

Synthesis) SSS Táctil (SG) Táctil (EM) EVTS (Orbitec, apenas 20

estimuladores) Táctil (PE) Exeter Fingertip Stimulator Array,

Sing & Summer, 1998 (10x10 em 1cm2) Táctil (EM) Tactile Feeling Display,

(Asamura,Shinoda et al, 1998) Táctil (SMA) Shape memory alloy (Grant and

Hayward, 1997) Táctil (AP) Estimulação usando ar sob pressão

(Asamura, Shinoda et al, 98) Téctil (EL) Esticamento lateral por efeito

piezoeletrico (Pasquero, 2003) Câmera CMOS Tecnologia barata permitindo

miniaturização de sensores Implante ocular Estimulação de células ganglionares da

retina (Wyatt e Rizzo, 1996) Implante cortical (Schimidt et al, 1996) 1 ETA significa "Electronic Travel Aid", sistema de ajuda eletrônica de locomoção. 2 SSS significa "Sensory Substitution System", sistema de substituição sensorial.

A maioria dos artigos segue a idéia original de Bach-y-Rita [72], de

substituição sensorial, montando um dicionário de objetos mais comuns e

testando diversas configurações de equipamentos. O equipamento original

utilizava vibradores mecânicos montados nas costas de uma cadeira de

dentista, estimulando o padrão visual nas costas do usuário. Depois o

resultado era comparado em pacientes cegos sem treino e após treinar,

versus a mesma imagem projetada em osciloscópio para voluntários com

visão poderem tentar reconhecer os mesmos objetos. O processamento

naquela época era todo analógico, o que dificultava muito a construção.

Ainda assim conseguiram fazer uma versão portável, com baterias

costuradas em um colete, mas ainda era todo de tecnologia analógica e

grade.

52

Bach-Y-Rita, Kaczmarek e seus colegas depois desenvolveram novos

equipamentos usando estimulação elétrica no abdome, e eles mesmos

tentaram inclusive de microatuadores para a ponta do dedo (década de 90) e

eletro-estimulação da língua [KACZMAREK,97]. Esta tecnologia da língua foi

transferida em 2005 à nova firma Wicab, criando um produto chamado

BrainPort, redirecionando-o para aplicações mais práticas e de resultado

mais imediato, como em tratamento de labirintite e para orientação de

mergulhadores em águas com pouca visibilidade. Este projeto foi anunciado

apenas recentemente, em 2006, pois está sendo desenvolvido sob

financiamento da marinha dos EUA [WICAB,06].

No Japão outros pesquisadores estão tentando algo semelhante,

usando o palato (céu da boca), usando aparelhos ortodônticos

[SHINODA,00]. A vantagem destes dois enfoques está na menor quantidade

de energia necessária para atingir os receptores nervosos, devido à

ausência de epiderme, usa-se tensão de 3 V em vez de 50 V. A

desvantagem é a baixa quantidade de receptores, gerando tamanhos

pequenos de matrizes de eletrodos. Outra vantagem segundo Kaczmarek

[97] é que a estimulação na língua que eles utilizam é por tensão constante,

enquanto nos demais estimuladores desenvolvidos por eles, para o bdomen

e dedo, a estimulação era feita por corrente constante.

Kaczmarek resumiu em dois artigos sobre estimulação abdominal em

2000, toda a área até então, citando mais de 70 artigos das décadas de 70,

80 e 90 [KACZMAREK,00].

No Brasil, Antonino em 1993 fez um estimulador em proto-board

conectado a um PC que enviava letras pela porta paralela. Mais tarde

Danielle Fonseca usou este protótipo para testá-lo com diversos pacientes,

bem como a adaptação deles ao sistema. Mas ela o usou sem resolver os

problemas do equipamento, feito em protoboard, que mais tarde foi

abandonado [ANTONINO,93], [FONSECA,95].

53

Em anos recentes, alunos da Faculdade de Engenharia Industrial

(FEI) replicaram as idéias de Antonino, com um protótipo mais elaborado,

montado em PCI.[ROSSI,06].

Na Universidade Federal de Campina Grande estão iniciando neste

ano de 2006 trabalho com uma luva com atuadores tácteis, para indicar a

existência de obstáculos a frente do usuário [ALVES,00].

Diversos trabalhos foram feitos para sistemas hápticos para uso em

telecirurgia ou robótica em geral, envolvendo realimentação táctil e de força,

bem como muitos artigos sobre estimulação táctil para wearable computers.

Existem vários trabalhos sobre ETA (Electronic Travel Aids – auxílio

eletrônico para mobilidade) baseados em técnicas de navegação robótica

usando ultra-som publicados em conferências, mas trabalhando com

substituição sensorial de visão para tato especificamente existem poucos

grupos, que estão listados nos apêndices. Basicamente, os grupos que

publicam regularmente são os de Madison, Louvain, Heildelberg, Strasbourg

e Tókio.

Até a proposta deste trabalho, ninguém havia focado em problemas

práticos mais imediatos, como orientação e mobilidade, e nem em

segmentação de sinais e reconhecimento de caracteres, com possível

estimulação táctil de caracteres Braille, com os quais o cego já está

acostumado.

Optacon

Era um equipamento formado por uma mini-câmera e uma matriz de

pinos. Passando-a por sobre um texto, elevam-se os pinos da matriz,

proporcional ao desenho das letras escritas, vonforme visto na Fig.19 . Saiu

do mercado por exigir grande treinamento e ser cansativo. Segundo

conversas com usuários, preferiam trabalhar com Braille mesmo, pois

estavam mais acostumados. Além de ter alto custo, na faixa de 4 mil

dólares.

54

Fig.19. Optacon sendo utilizado [ONCE,00]

Laser cane (bengala laser) e Polaron

Feita pela Nurion Industries, da Pensilvânia, é um sistema de bengala

longa normal, acoplada a um estimador de distância por laser, conforme

Fig.20. Semelhante a um sonar, envia um sinal e mede o tempo até ele

voltar e assim estima a distância baseado nesta medição de tempo. São 3

feixes de laser para detectar obstáculos no chão, no alto e na altura da

cintura. A mesma empresa desenvolve também o Polaron, do formato de

uma lanterna, com operação semelhante à bengala laser, mas sendo

baseado em ultra-som.

Fig.20. Demonstração da bengala laser e seu raio de ação [NURION,06]

MOWAT sensor

É um sensor que opera com o mesmo princípio anterior, mas é para

ser carregado como uma lanterna.

55

Sonic Guide

É um sistema composto de óculos com sensor de ultra-som acoplado

para ajudar na orientação. Originalmente feito por Leslie Kay, em 1974, ele

transfere informações visuais por meio de sons de diferentes freqüências e

com mais harmônicas quando o objeto não é plano. Ou seja, emite

diferentes harmônicas para diferentes distâncias medidas [KAY,00],

[BRABYN,82].

The Voice

É um sistema para cegos totais, em que se envia informações visuais

por meio de sons de diferentes freqüências, semelhante ao Sonic Guide,

porém mais portátil. Distâncias horizontais são passadas por meio de tons

de diferentes freqüências, veticais por meio de maior tempo de estimulação.

A literatura indica bons resultados para imagens simples de duas

dimensões, mas para imagens mais complexas torna-se uma cacofonia, de

difícil percepção. http://www.seeingwithsound.com/voice.htm

SonicVision’s KASPA

Este sistema utiliza o mesmo princípio do The Voice, enviando

informações visuais por meio de estimulação sonora. http://sonicvision.co.nz/

TalkingSigns

Foi um sistema desenvolvido pela equipe de John Brabin ,no SKI

(Smith Kettlewel Institute) da década de 70, composto por sinais e letreiros

que emitiam sons quando alguém com um emissor aproximava-se deste

letreiro, sendo então identificado, ativando uma mensagem pré-gravada

sobre o letreiro.

Ponto de ônibus e semáforos falantes

São projetos das prefeituras de Campinas e Porto alegre para facilitar

aos deficientes visuais escolher seus ônibus, baseando-se em tecnologia

semelhante ao Talking Signs, para pontos de ônibus, esquinas e semáforos.

56

Videotact e BrainPort

São sistemas baseados nos experimentos de Paul Bach-Y-Rita e Kurt

Kaczmarek nas três últimas décadas, foram criadas duas empresas para

disponibilizar comercialmente suas pesquisas.

A primeira comercializa um sistema que consiste em controle de

estimulador, que pode ser mecânico ou elétrico, e podendo usar matriz de

até de 32 x 24 eletrodos sobre o abdome. Só é usado em algumas poucas

universidades para pesquisa, devido ao altíssimo custo, de cerca de 70 mil

doláres.

Mostrada na Fig.21 esta a matriz de eletrodos usada pela segunda

empresa, Wicab, que abriu em 2005 e baseia-se nos trabalhos mais

recentes usando a língua como canal de estimulação elétrica. A empresa

mudou o enfoque para aplicações mais práticas, destacando-se o uso por

otorrinolaringologistas para tratamento de problemas do labirinto, e uma

aplicação para uso militar pela marinha dos EUA, para mergulhadores se

orientarem em água de baixa visibilidade.

Fig.21. Matriz de eletrodos para estimular a língua, da Wicab

EasyWalker

Feito pela Fame Electronics da Holanda. Usa infra-vermelho para

guiar o usuário para a direção escolhida em teclado, por meio de prédios

com sinais pré-instalados [TIRESIAS,03].

57

Electronic Guide Stick

Feito pela Hyderabad Science Society, da India. É uma bengala a

pilha com sensor para interagir com fio guia instalado na calçada.

Location Finder

Feito pela Maxi Aids de Nova Iorque. Ao pressionar um chaveiro

emissor, dispara um sinal no local que se quer chegar (um carro, por

exemplo).

Teletact

Feito pela New Technology for Blind People, da França. Fornece

sinais de distância, nos mesmos princípios do Polaron e semelhantes, do

formato de uma lanterna, usa ultra-som para estimar a distância a

obstáculos e fornece uma vibração como sinal de retorno.

Sonic PathFinder

Mostrado na Fig.22, é feito pela Perceptual Alternatives, da Austrália.

Usa os mesmos princípios anteriores, com estimativa de distâncias por ultra-

som, mas é feito no formato para se usar na cabeça.

Fig.22. Modelo do Sonic PathFinder

NavBelt e GuideCane

São dois equipamentos desenvolvidos pela equipe do professor

Johann Borenstein, da Universidade de Michigan, aproveitando sua

experiência no projeto de robôs móveis. Ele criou dois sistemas com

sensores de ultra-som, usando sensores da Polaroid modelo 6500 (atual

SensComp), para poder estimar a distância aos obstáculos. No NavBelt

ficam implantados em um cinto, enquanto no GuideCane simula-se um cão

58

guia, fazendo a bengala longa ficar conectada a um robô móvel, conforme

pode-se observar na Fig.23. Contudo, estes sistemas não servem para

detectar obstáculos altos como orelhões e árvores sem poda.

Fig.23. Fotos do NavBelt e GuideCane, e seus esquemáticos [BORENSTEIN,96].

E existem vários outros que medem distância por ultra-som ou infra-

vermelho, como o Walkmate da SaveMax de New Jersey, o DRO da Seal

Italiana, o GPS-talk da Sendero Group da Califórnia, o MiniGuide da GDP

Research, da Austrália, indica a distância por meio de tons audíveis.

Patente da Sony para estimulação direta não invasiva

A Sony Corporation registrou junto ao departamento de patentes dos

EUA um sistema de estimulação direta do cortex cerebral, que eles

denominam de “Method and system for generating sensory data onto the

human neural córtex”. Ela requereu inicalmente em 2000, e recebeu a

patente em 2003, com continuações posteriores, a mais recente em

dezembro de 2004 (patente US 2004/267118).

Já existem pesquisas de estimulação direta não invasiva usando

estimulação magnética transcraniana, mas que no momento é incapaz de

59

estimular com feixes finos a ponto de ativar áreas especificas do córtex. A

Sony baseia sua patente em estímulos por ultra-som, alegando uma melhor

precisão de estímulos, mas ainda não estão comprovados seus efeitos a

longo prazo, e nem foram realizados experimentos [HOGAN,05].

4.3 SOLUÇÕES QUE ENVOLVEM CIRURGIAS

Existem outras pesquisas de fundo mais ambicioso, tentando

substituir a retina ou o conjunto olho-nervo estimulando diretamente o córtex,

mas são técnicas ainda em teste. A substituição da retina ainda não funciona

totalmente, primeiramente está sendo testado o problema de possíveis

infecções, com a limitação de não atender a todas as causas de cegueira,

servindo para quem tem retinose pigmentar e degeneração macular

[CHOW,01], [MAYNARD,01].

O segundo trabalho, de estimulação direta de córtex cerebral, já foi

implantado, mas ainda fornece apenas visão de túnel, formando imagens de

apenas 8x8 pixels. De acordo com Dobelle [00] já é possível a visualização

de manchas, mas a definição está muito baixa e envolve um custo muito

grande, além de um conector no crânio que pode servir de foco de

infecções, e que impede o paciente de praticar certos esportes como

natação.

Existem também pesquisas para recuperar algumas patologias do

olho utilizando células tronco, com resultados animadores, como Michael

Young no Schepens Eye Research Institute, mas não são o foco deste

trabalho [LEUTWYLER,00].

60

55 PPRROOCCEESSSSAAMMEENNTTOO DDEE IIMMAAGGEENNSS

Algumas rotinas de pré-processamento são necessárias antes de se

enviar a imagem capturada para a pele do usuário, pois o tato tem

deficiências em relação à visão.

Como a retina tem uma camada de neurônios específicos para

detectar contornos, enquanto a pele não possui, é necessário usar técnicas

de detecção de bordas em pré-processamento no PC.

Devido à menor quantidade de receptores nervosos na pele em

relação à visão, é necessário fazer uma redução desta resolução, caindo da

ordem de 240x320 pontos para 15x20.

Como a estimulação escolhida é elétrica, em um primeiro momento

não é possível estimular níveis de cinza nem cores na pele, assim se

procede a uma binarização da imagem, apenas ativando ou não um

eletrodo.

5.1 PRINCÍPIOS GERAIS

Comparada aos equipamentos de processamento de imagem, a

imagem que a visão humana recebe é praticamente contínua, pois há

milhões de receptores nervosos (cones e bastonetes) para rebecer esta

informação. Quando se faz processamento digital de imagens, captura-se

esta imagem analógica em uma matriz de pontos, cada ponto geralmente

representando a intensidade e cor, segundo a Fig.24.

Cada ponto da imagem é conhecido como pixel, abreviatura de

picture element, e pode ser representado por um byte equivalente a 256

níveis discretos de tons de cinza, ou 3 bytes representando as 3 cores, por

exemplo RGB (vermelho, verde e azul), sistema aditivo geralmente usado

em monitores.

Outros padrões de cores existem, por exemplo, para cores

subtrativas, usados em impressoras e gráficas, quando a luz incidente é

refletida pelo papel mas sem a componente da cor. Um exemplo é o padrão

61

CMY (cian, magenta e amarelo). Os padrões aditivo e subtrativo podem ser

visualizados na Fig.25

Fig.24. Representação digital de uma imagem [CARVALHO,03].

Um outro exemplo é o padrão HSV que representa separadamente o

matiz, saturação e intensidade, importante quando se quer trabalhar

independente do matiz. Serve, por exemplo, para detectar falhas em

imagens de couro bovino. Neste trabalho não é necessário se preocupar

com codificação de cores, pois todas as imagens finais são binárias. A partir

desta imagem capturada, é possível usar algoritmos e cálculos matemáticos

para processar esta imagem e alterar suas características, tais como

contraste, resolução, melhoria da qualidade e eliminação de ruídos, entre

outras.

62

Fig.25. Cores primarias aditivas e subtrativas [GONZALEZ,92].

5.2 CAPTURA

A imagem na natureza é continua, em todos os aspectos, temporal,

de intensidade e de espacial (quantidade de pontos).

Ao se capturar uma imagem, discretiza-se a quantidade de pixels no

espaço, na horizontal e na vertical, e também o valor da intensidade de cada

pixel. Um exemplo da discretização de níveis de cinza de uma imagem pode

ser vista na Fig.26.

Fig.26. Efeito da quantização dos níveis de cinza: imagem de 240x320 pixels, com níveis de cinza indo de 256 níveis a 2 níveis (imagem binária)

16 niveis (4 bits) 8 niveis (3 bits) 4 niveis (2 bits) 2 niveis (1 bit)

256 niveis (8 bits) 128 niveis (7 bits) 64 niveis (6 bits) 32 niveis (5 bits)

63

Existem diversas maneiras de se capturar uma imagem, tais como

placa de captura e sensores de imagem, sendo a primeira usada quando se

requer uma grande precisão e resolução, como em sistemas de vistoria em

indústria. Variam também com o tipo de radiação eletromagnética ao qual os

sensores são sensíveis, pois pode-se utilizar sistemas sensíveis a luz visível

ou até calor (infravermelho) caso seja necessário em usos industriais e

médicos, por exemplo.

Uma maneira mais simples é usar sensores de imagem desenvolvidos

para webcams e câmeras fotográficas digitais, largamente utilizados

atualmente, e devido a essa alta escala de produção, economicamente

muito mais baratos e viáveis.

Os principais tipos de sensores são os CCD (charged coupled devies)

e MOS (metal oxide semiconductor), siglas que se relacionam à tecnologia

construtiva utilizada. Contudo, para a aplicação deste trabalho não é

necessário conhecer os detalhes microeletrônicos profundamente, basta que

se saiba quando utilizar um ou outro. O CCD é mais sensível à luz, podendo

ser utilizado em ambientes quase completamente escuros, abaixo de 0,1 lux,

enquanto o sensor MOS é mais voltado para aplicações portáteis ou à

bateria, pois seu consumo é muitas vezes menor que o do sensor CCD.

Para câmeras mais caras costuma-se usar três sensores, um para

cada cor. Mas para diminuir custos, os sensores mais comuns são sensíveis

às três cores (RGB) segundo um padrão de distribuição chamado Padrão de

Bayer, ou Mosaico de Cores, ilustrado na Fig.27. O verde predomina por ser

a radiação a que o olho humano é mais sensível, mas pode-se interpolar

para atingir resoluções maiores.

R G R G

G B G B

R G R G

G B G B

Fig.27. Mosaico de cores ou padrão Bayer de distribuição padrão de distribuição de cores dos sensores de imagem.[TEXAS,03].

64

Com relação à resolução, existem classificações para vídeo analógico

e vídeo digital. O padrão de cores e resoluções para vídeo analógico está

resumido na Tabela 7, enquanto a Tabela 8 resume as resoluções

analógicas e digitais também. Observe que o padrão SIF equivale a ¼ de

D1, enquanto o pequeno padrão QCIF destina-se ao uso de equipamentos

portáteis como celulares.

Tabela 7. Características principais dos formatos analógicos Tamanho

Do quadro

Taxa de

Quadros

Por segundo

Relação de

Aspecto

(horiz x vert)

Tipo de linhas

por quadro

NTSC (EUA) 720 x 480 30 4:3 Entrelaçado

PAL 720x576 25 4:3 Entrelaçado

SECAM (França) 720x576 25 4:3 Entrelaçado

HD (alta definição) 1920x1080

1280x720

704x480

640x480

24,25,30,60 4:3 e 16:9 Entrelaçado

E progressivo

Tabela 8. Resoluções comuns de imagem [TEXAS,03]. Formato analógico Nome comum Resolução digital

HDTV HD 1920x1080

XGA 1024x768

SVGA 800x600

NTSC (~PAL) D1 720x480

704x4801

VGA 640x480

CIF 352x288

VHS2 SIF2 352x240

QCIF 176x144 2VHS e SIF resultam percepção semelhante176x144 1as primeiras 16 linhas são usadas para legendas e teletexto

5.3 DETECÇÃO DE BORDA

A detecção do contorno (borda) de objetos, em inglês edge detection,

consiste basicamente em buscar diferenças bruscas na imagem, ou seja,

componentes de alta freqüência.

65

Pode-se trabalhar com técnicas no domínio da freqüência, aplicando-

se filtros passa-alta para manter as componentes de alta freqüência.

Trabalhando-se com técnicas espaciais, uma das maneiras equivale à

busca de pontos de máximos de funções por meio de derivadas, mas feito

em cada direção da imagem. Como a imagem é discreta e não contínua, a

derivada se reduz a uma equação de diferenças em cada direção, com

diferentes técnicas tentando otimizar este cálculo para obter melhores

resultados sem comprometer demais os requerimentos de processamento e

tempo gasto nele.

Uma técnica simples é fazer o equivalente a uma convolução

bidimensional da imagem original com uma janela deslizante, e cada técnica

usa janelas de diferentes tamanhos com diferentes coeficientes.

Os filtros mais conhecidos são Sobel, Canny, Roberts, Hewitt e

Laplaciana da Gaussiana, com os resultados mostrados na Fig.28. Existem

também outras técnicas com resultados mais otimizados, porém são mais

exigentes do ponto de vista computacional, como a de Marr-Hildreth e

métodos iterativos como o Chen e Medioni, descritos a seguir.

Fig.28. Exemplos de detectores de bordas mais comuns

66

.

Fig.29. Equações de implementação do gradiente para filtro de Roberts [RUSS,02].

• L.G.Roberts: detecção de bordas por meio da simples implementação

da função gradiente, com janela 2x2, mostrada na Fig.29;

• Sobel: semelhante à Roberts, mas usando janela deslizante de 3x3,

com diferentes pesos podendo enfatizar as bordas em diferentes

direções;

• Canny: mostra que em 1-D o filtro ótimo, de acordo com seus

critérios, é uma combinação linear de 4 exponenciais bem

aproximadas pele 1a Derivada da Gaussiana;

• A.Rosenfeld &M.Thurston: inclusão de uma suavização antes da

diferenciação para solução da sensibilidade ao ruído;

• M.Hueckel: desenvolveu um procedimento para o ajuste e otimização

de bordas bidimensionais, no qual os pixels de um círculo são

expandidos em um arranjo de funções bidimensionais por meio da

Série de Fourier em coordenadas polares;

• Marr-Poggio & Marr-Hildreth: definiram um esquema de detecção de

bordas, adotado como padrão, o qual primeiro tomava a convolução

do sinal (imagem original) pelo filtro LoG (Laplaciano da Gaussiana)

e, em seguida fazia a localização dos cruzamentos de zero desta

convolução;

• Torre & Poggio: uso de filtros bidirecionais baseados em derivadas

direcionais especialmente na vizinhança de cantos (corners);

• Dickey & Shuningham: definem uma borda como sendo um degrau de

descontinuidade entre regiões de intensidade uniforme e mostram

que um filtro ideal é dado por uma função de onda esferoidal;

67

• Lunscher & Beddoes: mostram que o filtro de Marr-Hildreth é

aproximadamente igual ao de Dickey & Shuningham, só que mais

simples de estudar e de implementar;

• Haralick: localiza bordas nos cruzamentos de zero da 2a derivada na

direção do gradiente;

• Shen & Castan: Propõem um "filtro linear ótimo", no qual as imagens

são convoluidas com a função f(x) = -0.5 ln(b)b(x) antes da

diferenciação;

• Shen & Medioni:método iterativo para detecção de bordas próximas.

Deve-se notar que as diferenças nas imagens resultantes das

aplicações dos filtros Sobel, Prewitt e Roberts são pouco perceptíveis,

observando que poucas bordas foram detectadas, enquanto que os filtros

LoG, Zero-crossing e o de Canny detectam regiões densas de bordas por

toda a figura, sendo este último mais eficiente. No entanto, percebe-se

também nestes filtros muito ruído.

5.4 DIFUSÃO ANISOTRÓPICA ROBUSTA

É uma técnica usada para simplificar uma imagem ao fazer a

detecção de bordas. Surgiu de analogia com conceito de difusão de calor em

termodinâmica, gerando o que se chama de espaço de escala. Assim, cada

ponto é substituído por uma média ponderada de seus vizinhos, de acordo

com uma equação de propagação com coeficientes que determinam a

velocidade da difusão e seu resultado. Para não distorcer a imagem, usam-

se diferentes pesos em cada direção, daí o nome de anisotrópica

[PERONA,90], [BLACK,98], [KIM,01], [MELO,04]. Na Fig.30 pode-se ver um

exemplo de resultado da aplicação do método.

Fig.30. Exemplo de simplificação da imagem por difusão anisotrópica robusta [KIM,01]

68

5.5 TÉCNICAS DE SEQÜÊNCIA DE ELEMENTOS DE IMAGEM

Estas técnicas são conhecidas em inglês como edge tracking e chain

code, e são úteis para criar uma seqüência de desenho dos pixels de uma

imagem, ou seja, gerar a imagem como se estivesse desenhando em uma

plotter (traçador gráfico) ou à mão livre.

Edge tracking significa acompanhamento de borda, e chain code

significa código de encadeamento. Consistem em determinar a partir de um

ponto inicial qual o próximo ponto que deve ser desenhado. Ao atingir um

último ponto de uma linha, inicia-se uma busca por nova linha até se

encontrar ou exaurir os pontos da imagem [GONZALEZ,87], [SALEM,05].

5.6 DIMINUIÇÃO DE RESOLUÇÃO

A diminuição da resolução de uma imagem consiste basicamente em

substituir um ponto por um valor baseado nos valores de sua vizinhança,

podendo este valor ser a média aritmética, mediana, máximo ou mínimo do

grupo. Quando se faz média, é necessário manter cuidado para não

distorcer o histograma da imagem, ou seja, sua distribuição de freqüência de

pontos [GONZALEZ,87].

Pode-se variar principalmente a região de abrangência dos vizinhos a

serem considerados no cálculo da média, em geral considerando-se os 4

vizinhos em formato de cruz (vizinhança-4) ou os 8 imediatos (vizinhança-8),

conforme visto na Fig.31.

Fig.31. Padrões de vizinhança: 4 em cruz; 3x3 quadrado; 5x5 octogonal com 21 pixels; 5x5 com 25 pontos; 7x7 com 37 pontos; [RUSS,02].

69

Se for necessário diminuir mais a resolução, pode-se repetir a

operação várias vezes até atingir a resolução desejada, conforme Fig.32.

Fig.32. Exemplo de imagem a ser usada, baixando de 240x320 original da Webcam até 15x20 da matriz de eletrodos

Outro cuidado a ser tomado é quando se chega nas bordas da

imagem, podendo-se repetir os pontos da coluna ou linha vizinha, ou

considerá-los em um valor padrão qualquer, com valor máximo ou mínimo

da imagem.

5.7 SEGMENTAÇÃO PARA ENCONTRAR LETREIROS

Consiste em técnicas para demarcar regiões de interesse em uma

imagem, tal como encontrar uma placa de carro em uma fotografia de multa

em radar de alta velocidade.

Neste projeto preferiu-se implementar por alternância de contraste,

uma técnica mais simples e menos exigente computacionalmente que no

protótipo 2, sem o PC, pode ser implementada diretamente no

microcontrolador.

Esta última é uma técnica simples, que apresenta bom resultado para

letreiros, baseando-se em buscar na imagem alterações periódicas entre

próximo ao máximo e mínimo nos valores dos pixels, típico de letras e

algarismos [VASCONELOS,01], [CASEY,96], [PLAMA,04],[KETELAARS,02].

70

A partir da determinação da localização do letreiro, usam-se técnicas

descritas no item anterior, de código de encadeamento, para seguir as letras

e determinar a região completa do letreiro.

Existem outras técnicas mais otimizadas, mas o foco deste trabalho

era implementar algo completo, porém não exaustivo em cada item. Sendo

assim, esta técnica já apresentou resultados satisfatórios, podendo ser

objeto de estudo posterior melhorar tais técnicas. Uma técnica que se

mostra promissora é Watershed segmentation, que simula o escoamento de

água em relevos, outras mais também podem ser encontradas na literatura

[PALMA,04], [GONZALEZ,87].

5.8 RECONHECIMENTO DE CARACTERES

Como havia a idéia de eventualmente se reconhecer os letreiros e

passá-los por estimulação em letras Braille, foi feito um estudo dos

reconhecimentos de caracteres em reconhecimento de padrões,

especificamente voltados para OCR (Optical Character Recognition) ou

reconhecimento óptico de caracteres [MORI,92], [HAYKIN, 02],

[DIETTERICH,00], [DIETTERICH,97], [PRECHELT,94], [FLEXER,1996],

[DINIZ,97] e [SILVA,2001].

Foram implementadas rotinas em MatLab para reconhecimento de

caracteres usando redes neurais artificiais do tipo MLP-BP (multi-layer

perceptron), com treinamento por back-propagation, tendo sido usada uma

base de dados de 10 mil algarismos, com 8 mil para treinamento e 2 mil para

validação da rede. Como havia diversas possibilidades, foi desenvolvida

uma técnica de comparação de desempenho das diversas redes testadas

considerando-se não apenas o acerto, mas também a dificuldade e a

conseqüência dos erros [RAMALHO,03].

Contudo, para implementação no presente sistema, optou-se por

treinar o próprio usuário em reconhecer os desenhos das letras e

algarismos, pois seria computacionalmente intensivo, consumindo ciclos de

máquina importantes no tempo de processamento do microcontrolador. Além

disso, como mostrado nos capítulos de testes e resultados, os resultados

preliminares indicaram um aumento na margem de acerto no

71

reconhecimento de padrões de cerca de 30% para cerca 80%, após um

curto período de treinamento de algumas horas, resultando em um

desempenho superior ao que normalmente se consegue em OCR.

72

66 PPRROOJJEETTOO

Inicialmente a proposta foi que se tentasse criar um sistema de visão

artificial completo, operando em tempo real, com frame rate (quadros por

segundo) próxima à usada em vídeo e televisão, procurando substituir a

visão por estímulos tácteis, elétricos ou vibro-mecânicos.

Contudo, após verificação na literatura do estado da arte em

substituição sensorial, observou-se que esta era uma proposta muito

ambiciosa para a tecnologia atual, e impossível de ser feita em um prazo de

doutoramento por um único pesquisador, ao contrário de outras

universidades e centros de pesquisa no exterior que contam com equipes

multidisciplinares.

Para focar o projeto de maneira a ser realizável no prazo disponível,

bem como de real utilidade, foram feitas diversas reuniões em instituições

para cegos, como a Fundação Dorina Nowill. Assim, definiu-se a real

necessidade dos deficientes visuais a partir das sugestões apresentadas

pelos instrutores e funcionários. Muitos deles sendo deficientes visuais

puderam descrever os problemas diários mais simples, que poderiam ser

resolvidos com um pouco mais de esforço, mas que não demorassem

décadas e nem exigissem uma equipe multidisciplinar.

O interessante é que pessoas de outra instituição de cegos chegaram

a recusar marcar reuniões, pois reclamaram que não se deviam dar falsas

esperanças ao cego fazendo tentativas para voltar a enxergar, e sim

procurar adaptá-lo cada vez mais à sua condição. É exatamente isso a que

se propõe o presente projeto.

A partir das situações levantadas durante as entrevistas, foi feita uma

seleção de quais problemas deveriam ser atacados, ou seja, a familiarização

em ambientes desconhecidos e leitura de letreiros e sinais. Assim, foi

definido quais características um equipamento para desenvolver os

experimentos em questão deveria possuir, bem como sua velocidade de

processamento, sendo possível tentar resolver como restrição de projeto, o

73

desafio de fazer um equipamento de baixo custo. Foi verificada até mesmo a

possibilidade de se adquirir um equipamento desenvolvido pelos

pesquisadores de Madison, usado também em Strasbourg, mas o custo era

proibitivo, à época mais de 70 mil dólares pelo estimulador, interface e matriz

de eletrodos [KACZMAREK,92], [SAMPAIO,01].

Optou-se então por fazer algo complexo do ponto de vista técnico,

que resolvesse os problemas propostos, mas a um custo acessível.

O sistema então foi projetado para capturar uma imagem, simplifica-la

e passá-la ao usuário via estimulação táctil. Mas o estimulador é

suficientemente flexível para possibilitar diferentes testes iniciais, o que

possibilita atualmente seu uso não apenas para o fim inicialmente proposto,

mas também para pesquisas do sistema somestésico a serem realizadas por

psicólogos experimentais e fisiologistas. Na Fig.33 pode-se ter uma visão

geral do projeto.

Fig.33. Visão geral do protótipo 1 do sistema

2

5

3

7

6

1 4

74

Legenda:

1.sensor de ultra-som – para definir distância 2.câmera – para capturar imagens 3.microcomputador – para processar a imagem 4.Kit de microcontrolador: controla quais eletrodos ativar 5.circuitos de estimulação:

placa-mãe com fonte e configuração placas de chaveamento e estimulação por coluna placa de conversão do sinal de ultra-som para emitir vibração

6.Matriz de eletrodos 7. Vibrador

Foi definida a forma de capturar uma imagem, os algoritmos para

processá-la, a construção de uma matriz de eletrodos e o tipo de

estimulação (mecânica ou elétrica). No caso da estimulação elétrica foram

projetadas várias possibilidades de ajuste. O sistema é capaz de gerar

diferentes padrões, testar entre estimulação isolada por eletrodo individual

ou por vários eletrodos simultaneamente, com sinal elétrico com nível médio

zero (sinal Bifásico) ou não (Monofásico), e diversos outros quesitos. E tudo

isso da maneira mais portátil possível, e isolado da alimentação da rede por

medida de segurança, com o fator custo baixo como premissa básica.

A estimulação eletrotáctil tem vantagens claras sobre a vibrotáctil por

não ter partes móveis, por manter contato constante com a pele durante o

movimento, por ter maior eficiência energética e principalmente por ter maior

facilidade de fabricação [CASTRO,00].

Após a busca de fornecedores adequados para um possível uso de

estimuladores vibro-mecânicos, chegou-se à conclusão que estimulação

elétrica seria a escolhida, pois estimuladores por vibração mecânica

consumem muita energia e tem sua implementação mais demorada e difícil.

Optou-se por estimulação por tensão para não haver riscos de

queimar o paciente, pois em estimulação por corrente caso o eletrodo não

tenha uma plena aderência à pele, diminui-se a área de contato do eletrodo

e aumenta a potência a ponto de poder ferir o usuário. Isto poderia ocorrer

ainda mais, pois no sistema final são 300 eletrodos em uma matriz, ao passo

que em estimulação elétrica neuro-funcional costuma-se usar poucos

75

eletrodos, na ordem de unidades, sendo mais fácil seu controle e

possibilitando o uso de estimulação por corrente.

Foi feito um primeiro protótipo em escala menor para provar os

conceitos, e só então desenvolvido um equipamento maior. Portanto dois

protótipos foram feitos, um para acionar matriz de 5x7 e outro para matrizes

de 15x20. A descrição dos sistemas implementados pode ser encontrada

nos artigos do autor a respeito e fazem parte do pedido de patente requerido

junto ao INPI [PEREIRA,06], [PEREIRA,06a], [PEREIRA,06b].

Como os experimentos incluem seres humanos, por segurança

devem ficar isolados da alimentação AC, assim usaram-se baterias

recarregáveis, importante tanto para equipamentos portáteis como para os

de aplicações médicas. As baterias escolhidas foram as de NiMH, que

apresentaram a segunda melhor densidade energética, mas que tem fator

de forma compatível com baterias comuns, e pouco efeito memória

[PEREIRA,04a].

6.1 DESCRIÇÃO DOS EQUIPAMENTOS E PROGRAMAS

Como descrito no capítulo de introdução, o protótipo 1 implementado

consiste de câmera, PC (microcomputador), placa de microcontrolador,

equipamento estimulador e matriz de eletrodos.

Complementar a ele existe um circuito de ultra-som com sensor e

saída inversamente proporcional à distância do obstáculo, para acionar um

vibrador constituído de um motor excêntrico. Este sistema auxiliar serve para

estimar a distância, que não é obtida pela falta de estereoscopia. Por

exemplo, o usuário tem que saber discernir se à sua frente está uma mesa

pequena próxima ou uma mesa grande distante.

A imagem é capturada e enviada ao micro para processamento, que

consiste em transformar em tons de cinza, simplificar a imagem e detectar

contornos, diminuir resolução e transferir ao microcontrolador. Este é usado

por possibilitar um melhor controle da temporização do equipamento

76

estimulador do que programas em PC rodando algum sistema operacional

multitarefa que não seja de tempo real, tal como Windows ou Linux.

Devido à multidisciplinaridade do projeto, descrita no capítulo de

introdução, após um estudo preliminar, foi decidido simplificar os estímulos

trabalhar apenas com estimuladores elétricos e não com vibradores

mecânicos, pois seria necessário um estudo de miniaturização mecânica

que não seria factível no tempo disponível para execução de um programa

de doutorado. Contudo, se necessário o equipamento projetado para

controlar os estímulos também pode controlar o acionamento de vibradores

mecânicos em vez de enviar estímulos à uma matriz de eletrodos.

6.2 CAPTURA DE IMAGEM

No apêndice 10 pode ser encontrado um histórico das decisões de

projeto e sua evolução. Porém, pode-se resumir que a melhor opção foi usar

inicialmente no protótipo 1 uma webcam conectada a um PC, pois facilita a

depuração usar um hardware já funcionando, e porque existem bibliotecas

de acesso a essas câmeras nas duas ferramentas usadas para prototipar o

sistema, Java e MATLAB.

Para o segundo protótipo optou-se pelo uso do kit C328, que usa

interface serial. Ele inclui um sensor de imagem da OV6740 integrado a um

chip de controle de comunicação serial e compactação JPEG, que no caso

deste projeto não seria necessária.

6.3 MICROCONTROLADOR

Para agilizar o desenvolvimento e diminuir a quantidade de itens a

depurar no protótipo 1, foi decidido usar uma placa de microcontrolador

pronta. Foi escolhido um compatível com 8051 pelo fato do autor já ter

utilizado o componente previamente, diminuindo a curva de aprendizagem e

os fatores de erro, e por ser de velocidade suficiente para a aplicação,

conforme descrito no item 6.7.6. No protótipo 1 foi usada uma placa cedida

pela CNZ, e no protótipo 2 foi criada uma placa usando 8051 compatível da

Atmel.

77

6.4 ELETRO-ESTIMULADOR

O sistema para estímulos elétricos realiza 3 funções para cada

canal/coluna a ser estimulada:

• Gera a forma de onda,

• Amplia esse sinal para a tensão necessária para ativar os receptores

nervosos da pele,

• A partir de um sinal de controle, comuta esse sinal de maior nível de

tensão até cada um dos taxels (eletrodos) que deve ser ativado para o

correspondente pixel da imagem simplificada (ou letreiro) que estiver

ativo, baseado na informação recebida serialmente do PC.

Normalmente a segunda e terceira funções podem ser implementadas

em um mesmo circuito.

De acordo com a revisão da literatura, deve-se gerar um trem de

pulsos com intervalo entre as rajadas, conforme figura 9 do capítulo 2, com

os melhores resultados tendo sido alcançados com trens de pulso da ordem

de 200µs de duração e ciclo de trabalho de 50%, mas podendo-se ajustar.

Costuma-se usar 4 ou 5 pulsos em cada rajada, com espera de cerca de 20

a 25 ms até a próxima rajada [NOHAMA,97], [WAY,97], [KACZMAREK,91],

[KACZMAREK,00], [SUMMERS,92].

Nas Fig.34, Fig.35 e Fig.36 podem ser observados os resultados dos

circuitos desenvolvidos neste trabalho, quando a sensação de vibração mais

confortável foi obtida com pulsos de freqüência de 5 kHz e envoltória de 100

Hz, ou seja, pulsos de 200µs de período, ciclo de trabalho de 40% (80µs em

cima e 120µ nível baixo), com 5 a 10 pulsos por rajada e intervalo entre

rajadas de 8ms.

78

Fig.34. Trem de pulsos antes da etapa de amplificação

•

Fig.35. Trem de pulsos antes da amplificação

Fig.36. Trem de pulsos após a amplificação, com distorção devido à saturação do núcleo do transformador de pulso.

O nível médio do sinal pode ser nulo ou não. Alguns autores alegam

que o nível médio diferente de zero pode com o tempo ionizar a pele em

contato com o eletrodo, provocando queimaduras, e recomendam usar nível

médio nulo. Assim, os elementos de chaveamento devem conduzir nos dois

sentidos, e mais será comentado adiante [KACZMAREK,91].

79

Outros autores alegam que quando o sinal tem nível médio nulo é

necessária uma intensidade maior do sinal, resultando em maior

desconforto. Por isso foi preferível deixar o hardware mais flexível e testar

este item também [KACZMAREK,91].

Além disso, foi descoberto mais tarde no decorrer dos testes que, se

for colocado um tempo morto entre os ciclos positivo e negativo, o circuito de

ampliação pode diminuir suas perdas e consumir menos bateria, podendo

aumentar sua duração ou mesmo usar transformadores e transistores

menores. Este é o tipo de modulação BFM, usado por Szeto e Rizzo

[SZETO,77].

A seguir são descritos alguns dos circuitos atuais. Uma descrição das

decisões tomadas durante o projeto, com outras idéias iniciais que foram

tentadas e descartadas estão descritas no apêndice 10. Elas foram incluídas

para facilitar a quem tiver interesse de replicar os resultados daqui, sem ter

que cometer os mesmos erros.

6.4.1 Circuito de endereçamento

Definiu-se uma arquitetura parecida com a de microcomputadores e

barramentos padrão como STD BUS e NUBUS. Para permitir uma melhor

visualização dos leds indicativos dos eletrodos ativados, e para permitir uma

maior flexibilidade e escalabilidade, foi definido que seriam feitas placas de

estímulo, uma para cada coluna da matriz de eletrodos. Estas placas são

colocadas sobre uma placa-mãe verticalmente, como em um PC. No

protótipo 1, de 5x7 foram 5 placas de 7 eletrodos, no protótipo 2, de 15x20,

foram 15 placas de 20 eletrodos.

O endereço do eletrodo é definido enviando-se primeiramente o

endereço da placa, que consiste de 4 bits, e depois o padrão de quais

eletrodos devem ser ativados simultaneamente por meio de um latch.

Assim, a seleção de coluna é feita por comparação de endereços

codificados com pinos vindos diretamente do microcontrolador sendo

comparados com 4 jumpers locais em um 7486. Isto permitiria até 16

endereços, mas um fica reservado para que ao ativar as colunas de

80

eletrodos, exista um endereço vago para mudança de colunas, permitindo

manter uma coluna enquanto vai endereçar outra; isto pode ser visto no

esquema elétrico do apêndice 5, mas analisado em detalhes adiante no

texto.

A seleção de eletrodos era feito inicialmente com multiplex permitindo

acionar apenas um eletrodo, mas depois foi alterado para usar um latch

74573, permitindo ativar até todos os eletrodos de uma coluna; e com o OE

(output enable) é possível desligar todos os eletrodos de uma vez; usou-se o

74573 por ter entradas e saídas alinhadas e facilitar o layout da PCI.

6.4.2 Circuito de amplificação do sinal e chaveamento

O circuito tem uma placa para controlar cada coluna da matriz de

estímulos, todas colocadas em um barramento comum de placa-mãe. Cada

placa pode servir de mestre (gerar e enviar), escravo (receber) ou

independente (gerar apenas para si) tanto o sinal de baixa tensão (cerca de

6 V) ou de alta tensão (cerca de 30 a 70 V). Assim, a placa do protótipo 1 de

5x7 tem os seguintes itens:

• Seleção de coluna, com o comparador 74HC86 que aciona a trava (latch;

• 4 Jumpers para configurar o endereço de cada placa;

• Seleção do eletrodo na placa, via 74HC573;

• Oscilador para geração dos pulsos por hardware, usado inicialmente,

baseado em dois 555 e potenciômetros para ajuste de freqüência de

rajada (burst), freqüência de modulação (para limitar o número de pulsos)

e o ciclo de trabalho dos 2, permitindo ajuste. No protótipo 2 isto foi

eliminado, deixando a geração apenas por software;

• Jumpers para permitir que o sinal de oscilação possa ser transferido para

a seção de amplificação, ou receber o sinal de oscilação de fora;

• Amplificador inicialmente baseado em transistor Darlington e

transformador de pulso, com ajuste de nível de tensão, mas que

apresentava problemas de sensibilização dos usuários. A tensão no

transformador era fixa, e ao ajustar a corrente de base transistor, ao sair

do corte o início do estímulo era repentino, com tensão já relativamente

81

alta. Para ir ajustando o nível de intensidade da tensão, o transistor

operava na região linear, consumindo mais bateria. Em uma segunda

etapa, mudou-se para o transistor operar na região de corte/saturação de

uma tensão ajustada por um regulador LM317, aumentando a autonomia

e melhorando a sensibilidade do usuário. No protótipo 2 é adotado

conversor DC-DC de maior eficiência para ajuste da tensão;

• Leds para indicar qual padrão de estimulação o usuário esta recebendo,

servindo para depurar possíveis falhas e problemas. Mas existe um

jumper para opcionalmente cortar a alimentação dos leds e economizar

bateria;

• Jumpers para configurar cada placa para servir de mestre, escravo ou

independente para os sinais de oscilação tanto de baixa como de alta

tensão, conforme visto na Fig.37 e detalhado no apêndice 6. Ou seja, a

placa pode receber de fora o sinal de baixa tensão, gerar apenas para si

ou gerar e exportar para as demais placas, o mesmo valendo para o sinal

amplificado.

Fig.37. Esquema de cada placa de estimulação do prototipo1

Foi feita também uma placa-mãe em que as outras se encaixariam,

contendo jumpers de configuração e circuitos de alimentação, chave de

pânico (liga-desliga), conectores para acessar o microcontrolador e

regulador de tensão. Tudo foi colocado em uma caixa plástica, junto com um

mini-ventilador, para resfriamento dos reguladores de tensão, e bateria

recarregável, conforme mostrado na Fig.38 e na Fig.39.

82

Fig.38. Placa para estimulação de cada coluna de eletrodos; os leds ficam no topo, formando a imagem quando várias placas estão na vertical e em paralelo na placa-mãe.

Fig.39. Montagem das 5 placas, faixa abdominal para fixação e matriz de eletrodos do protótipo1.

6.4.3 Alimentação

Utiliza-se conjunto de pilhas recarregáveis 12 pilhas de NiMH, 1,8 AH

ou mais, permitindo autonomia para cerca de 2 horas de uso. Em estudo

específico foram escolhidas a de níquel metal hidreto (NiMH) por ter efeito

memória menor e maior capacidade de corrente que níquel cádmio. As de

Lítio-ion não apresentam efeito memória e tem densidade de corrente maior,

mas seus carregadores são especiais, seu custo é muito maior e seu

formato não segue padrão de tamanho habitual (AA) por ter a voltagem de

sua célula praticamente o dobro, 3 V, enquanto as de NiMH ficam próximas,

em 1,2 V. Esta diferença não se nota, pois pilhas normais têm tensão

nominal de 1,5 V, mas que caem rapidamente PEREIRA,04a].

83

A alimentação percorre dois reguladores, um 7805 para alimentar a

parte digital de endereçamento, e um LM317 cujo ajuste é feito pelo usuário,

permitindo uma variação continua da tensão máxima que chega ao primário

do transformador da etapa da amplificação e, por conseguinte a tensão

máxima do secundário que chega ao eletrodo.

6.4.4 Amplificação

Na Fig.40 é mostrado o circuito de amplificação do trem de pulsos,

consistindo basicamente de um transistor Darlington chaveando sob controle

do microcontrolador, e transformador de pulso para elevar a tensão. O diodo

é apenas para descarregar a energia armazenada no núcleo do trafo e

proteger o transistor. Não é mostrado na figura, mas no secundário do trafo

há em série uma associação paralela de jumper e diodo. Quando o jumper

está colocado, o eletrodo recebe sinal bidirecional, quando o jumper está

retirado, o diodo é inserido no circuito e o sinal vira monofásico, circulando

em apenas uma direção.

Fig.40. Etapa de amplificação com TIP e transformador de pulso

O barramento tem pinos duplos por facilitar a montagem e aumentar a

rigidez mecânica, usando barras de pinos paralelos e conectores latch. Na

realidade são 3 grupos de pinos em 3 conectores separados e sua

configuração pode ser consultada no apêndice 6:

84

• Endereço de linha e coluna:

o 4 pinos duplos para coluna codificados;

o 7 pinos duplos, um para cada linha da coluna;

o 1 pino duplo de OE do latch, para desligar todos juntos por

software;

• Barramento de alimentação de baixa tensão e pulsos

o 2 pinos duplos para +V e 4 pinos duplos para –V para 555 e TIP;

o 1 pino duplo para sinal de saída de oscilador. Deve-se configurar

as placas para apenas uma ser configurada como mestre: podem

ser configuradas como um mestre e os outros escravos, ou todos

independentes ou todos escravos para quando o sinal vem de um

pino do microcontrolador;

o 1 pino duplo para +5 V, para os 74XX;

o 1 pino duplo vago para expansão;

o 1 pino duplo para o terra dos leds, permitindo que todos sejam

desligados quando se faz testes em videntes ou se queira

economizar energia das baterias;

• Barramento para alta tensão (AT), mas deve-se configurar as placas para

haver no máximo só uma placa mestre exportando sinal. Podem ser

configuradas como todas escravas, todas independentes, ou uma mestre

e o resto escravo. São 8 pinos, 4 para ida e 4 para retorno. (2 duplos

cada).

Assim, são 3 conectores, 26 pinos para endereço, 10 pinos para

oscilação de baixa tensão, e 8 para alta tensão.

Na placa-mãe existem trilhas e jumpers para configurar se todas as

placas receberão o mesmo sinal de AT, ou se cada placa receberá um sinal

individualizado, permitindo o uso de uma placa externa opcional como fonte

para experimentos não previstos. Foi desenvolvida uma placa para testes

85

iniciais, inclusive com fonte de corrente, cujo circuito está no apêndice 12,

mas depois não foi necessário usar permanentemente, pois em testes

preliminares verificou-se que o circuito de estimulação por tensão projetado

em cada placa fornecia sensibilidade adequada;

6.4.5 Chaveamento

O sinal de trem de pulsos gerado é amplificado em cada canal de

estimulação, e o sinal então de alta tensão (cerca de 30 a 70 V) de cada

placa, que corresponde a uma coluna da matriz, deve ser chaveado para

cada eletrodo que deva receber este sinal.

Como o equipamento se destina também a pesquisas do sistema

somestésico, era desejável que pudesse ser testado com sinais monofásicos

e bifásicos. O chaveamento para ser bifásico (nível DC não nulo) deveria ter

um elemento que pudesse conduzir sinal em ambos os sentidos.

Foram testadas diversas opções descritas no apêndice 10, tais como

transistores MOSFET, pontes H, pontes integradas em CIs, optoacopladores

em contraposição, matrizes de comutação telefônica, MOCs

(optoacopladores com saída em TRIAC) e finalmente relés de estado sólido

(solid state relays - SSR) e optos mais pontes de diodos.

A solução com melhor desempenho foi a do SSR, pois permite

condução em ambos os sentidos e um isolamento necessário para

segurança do usuário, separando a parte de comando da parte de potência.

Cada placa do protótipo 1 foi feita com 7 SSR, um para cada eletrodo,

conforme visto na Fig.41

Fig.41. Circuito de chaveamento do sinal de alta tensão

86

O SSR tem na entrada um led emissor, tal qual um MOC ou 4N25 ou

4N38, mas com chaves MOS na saída. Assim, funciona exatamente como

um relé, mas apresentando resposta rápida e sendo mais compacto.

Usam-se os SSR da Metaltex, que não apresentam queda de tensão

quando conduzem, tendo sido testado até 10 KHz sem problemas, apesar

da freqüência de operação ser no máximo por volta de 5KHz. Um mesmo

neurônio não consegue responder em freqüências acima disto devido a seu

período refratário, mas outros neurônios vizinhos podem responder,

permitindo a estimulação até cerca desta freqüência.

6.5 MATRIZ DE ELETRODOS

Para estimular os mecanoreceptores da pele, fez-se uso de matriz de

eletrodos concêntricos, cujo tamanho e espaçamento dos eletrodos está de

acordo com sugestões da literatura, revisadas em [NOHAMA,97],

[SUMMERS,92] e [KACZMAREK,91], sendo mais indicado para este caso os

eletrodos concêntricos de estimulação cutânea.

Após alguns testes e idéias descritas no apêndice 10, chegou-se à

conclusão de fazer dois tipos de matrizes: uma de fibra para o prototipo1 e

outra de circuito impresso flexível para o protótipo 2.

A primeira, de 5x7 para o protótipo 1 foi feita usando placa de circuito

impresso (PCI) rígida de fibra, com eletrodos feitos de níquel, soldados

sobre a placa. Os 35 eletrodos são organizados em 5 colunas de 7 eletrodos

cada, resultando em um tamanho aproximado de um maço de cigarros.

O anel externo e o pino central de cada eletrodo foram feitos de níquel

soldado sobre a placa. A conexão é feita por meio de soldagem de barra

paralela de pinos, em que se encaixam 5 conectores latch de 10 pinos cada,

um para cada coluna, conectando-se à placa correspondente por meio de

flat cable (cabo multivias). São 7 pinos centrais e 1 pino de retorno comum

por coluna, mas usou-se conector de 10 pinos porque não se encontrou o de

8 pinos. O desenho do circuito está na Fig.42, e uma foto da placa em fibra

pode ser vista na Fig.43.

87

Fig.42. Circuito da matriz de eletrodos feita em fibra

Fig.43. Foto da placa da matriz de eletrodos em fibra

Foram feitas algumas placas em dupla face, uma para soldar os anéis

para o eletrodo e seu uso em estimulação dos usuários, fixado por faixa

abdominal conforme mostrado na Fig.43. Uma outra placa maior, com mais

espaçamento e eletrodos maiores foi feita para realizar testes específicos,

mas será visto no capítulo de resultados que a menor resultou em melhor

eficiência.

Uma placa foi também utilizada para realizar testes de circuito com

carga sem precisar estar usando a faixa, usando resistores de 2.5W e 1KΩ,

e capacitor de 10nF no lugar dos eletrodos para simular a pele, mostrado na

88

figura 59 do apêndice 7. Nesta mesma figura é mostrada uma placa feita

para facilitar a medição de corrente de estimulação, usando conector tipo

Jack P1 para interromper o fluxo de corrente. A placa conecta-se por cabos

multivias entre as placas de estímulo e a da matriz de eletrodos, contendo

40 conectores P1 fêmea, um para cada coluna, e mais um para cada um dos

35 eletrodos, permitindo medir com um multímetro “true-RMS” (Fluke87) com

pontas de prova adaptadas a um conector P1 macho. Quando se quer medir

a corrente, basta inserir o P1 para ele entrar em série com o circuito.

Fig.44. Placa de eletrodos em fibra, com a faixa de fixação, e instalada.

6.6 PROGRAMA DE CONTROLE

Este programa é executado no kit de microcontrolador compatível

com 8051, sendo feito em linguagem C. É o responsável principalmente pela

ativação dos taxels (eletrodos) que devem ser ativados, correspondentes

aos pixels que estão acionados na imagem simplificada vinda do PC.

Efetua ainda mais duas tarefas: faz a comunicação serial com o PC,

lendo um buffer gerado pelo programa que trata a imagem, e faz os ajustes

de configuração do estímulo gerado no sinal de controle em um pino de IO

do microcontrolador. Estes ajustes envolvem:

• Largura de cada pulso positivo;

• Ciclo de trabalho (equivale a ajustar a freqüência do pulso);

• Quantidade de pulsos por rajada (burst);

• Intervalo entre rajadas de pulsos;

• Padrão geométrico ou imagem recebida pelo PC

89

Por hardware são feitos os demais ajustes:

• por um potenciômetro multivoltas com o qual o próprio usuário pode ajustar a amplitude do sinal,

• por jumper a escolha entre sinais com média DC nula ou não (bifásico ou monofásico),

• por jumper a geração de pulsos positivos e negativos com tempo morto entre eles.

Este último é gerado na placa mãe a cada 2 pulsos sendo alternado

por meio de um divisor de freqüências implementado com flip-flop tipo D.

Este tempo morto na realidade é usado para diminuir as perdas no circuito

de ampliação do sinal (transformador de pulso e transistor), e, por

conseguinte o consumo de bateria.

No futuro poderão ser feitas melhoras para testar mais idéias,

algumas adiantadas a seguir:

• Nível de tensão do estímulo, não apenas on-off como hoje, para que

possam ser implementados testes:

o Usar envoltórias entre elípticas no trem de pulsos, melhorando o

conforto dos estímulos (hoje poderia ser feito usando um circuito

modulador externo), de acordo com Nohama [95].

o Usar o fenômeno de integração para toda a matriz, para criação

de eletrodos virtuais intermediários entre cada 2 colunas (limitação

do desenho da matriz, com um retorno por coluna) [NOHAMA,97],

[TAN,97], [SHIRAI,00]. Relembrando, o fenômeno ocorre quando 2

eletrodos vizinhos estão ativos. Se tiverem a mesma intensidade,

fica no meio, se não a sensação é percebida perto do eletrodo

com sinal mais intenso. Isto vai envolver uma mudança no

hardware, incluindo um ou dois conversores D/A ligados ao

microcontrolador (ou DSP, se for mudado o processador). O

problema é que os microcontroladores e processadores DSP, em

geral, podem ser encontrados com opções de conversores A/D

embutidos, mas não D/A. Até porque em geral é necessário um

90

circuito de condicionamento de sinal na saída de um sistema de

DSP para acertar ao nível externo de onde for atuar, e com filtro

passa-baixa para eliminar harmônicas e suavizar o sinal.

A interface de configuração é composta de três teclas, semelhante a

ajuste de relógio de pulso, sendo duas para ajuste da seleção atual subindo

ou descendo, e uma terceira para aceitar o ajuste escolhido e partir para o

ajuste da próxima característica da estimulação.

A atual opção default dos ajustes foi fixada no código fonte, após

testes com alguns usuários, sendo escolhida a configuração que forneceu

melhor sensibilidade à maioria.

Além disso, nos testes de padrões geométricos, utilizados para

treinamento dos usuários, o equipamento pode ser operado independente do

PC, usando um menu para seleção do tipo de padrão geométrico a ser

gerado. No teste ligado ao PC, recebendo a imagem da Webcam após

tratamento digital, deve-se usar a opção default, que equivale a usar o menu

de escolha de padrões geométricos e selecionar o recebimento da imagem

via porta serial do PC.

Maiores detalhes sobre os testes estão no capítulo 7, mas pode-se

resumir que os padrões de treinamento e testes usados incluem reta

horizontal, vertical, inclinada para cima e para baixo (diagonais), quadrado

pequeno e grande, retângulo pequeno e grande, triângulos em 4

orientações, círculo, letra E em 4 orientações, várias letras e algarismos.

Permite-se ainda ajustar o método de estimulação, em coluna

individual, coluna mantendo a anterior, carimbo (todas as colunas ao mesmo

tempo), e taxel individual (semelhante à escrita manuscrita), que resultou na

melhor taxa de reconhecimento.

Finalmente, ajusta-se também o tempo de permanência aceso para

cada coluna ou taxel, e o tempo apagado ao final de cada imagem

estimulada até iniciar a próxima.

91

6.7 PROGRAMAS DE PROCESSAMENTO DE IMAGENS

Todos os programas de processamento de imagens foram

desenvolvidos inicialmente em MATLAB 6.5 por permitir prototipação rápida,

incluindo diversas rotinas de detecção de bordas e diminuição de resolução.

Depois os algoritmos desenvolvidos foram portados para Java, pois

para capturar imagem vinda da webcam usa-se a a biblioteca JMF da Sun,

Java Multimídia Framework, que já traz alguns programas de exemplos. Por

exemplo, rotinas para converter padrão RGB de 24 bits para tons de cinza,

rotina de binarização, com escolha do limiar de corte (threshold), e

implementação de um filtro detector de borda espacial na forma de matriz

3x3, em que se pode alterar os pesos e simular diferentes filtros.

Posteriormente, a partir do MATLAB 7.0, o lançamento do Image

Acquisition Toolbox facilitou o desenvolvimento de algoritmos e testes em

tempo real da imagem da câmera. Uma toolbox é uma biblioteca de

programas que rodam em MATLAB, neste caso criada para capturar

imagens por meio da API Vídeo for Windows, que acessa webcams e outros

dispositivos de imagens como scanners.

Simulou-se diversos algoritmos, com o melhor resultado sendo

alcançado com a seguinte seqüência de operações:

• conversão para tons de cinza,

• simplificação da imagem,

• detecção de bordas,

• binarização,

• diminuição de resolução.

Testou-se vários tipos de detecção de borda, com o melhor resultado

obtido pelo LOG (laplaciana da gaussiana).

6.7.1 Binarização

Na binarização foi implementada uma solução de acordo com

NiBlack, em que se faz determinação de limiares regionais em vez de global,

92

útil quando a iluminação não é uniforme por toda a imagem. A Fig.45 mostra

claramente a vantagem do método.

Fig.45. Comparação da binarização tradicional, limiar global médio, com limiar 0,3 e 0,6, e por Niblack (limiar regional)

6.7.2 Diminuição da resolução

Na resolução foram testadas diminuições progressivas de 240x320

até 15x20, caindo a ¼ de cada vez. Assim, foi-se de 240x320 para 120x160,

60x80, 30x40 e finalmente 15x20, conforme ilustrado na Fig.32.

Ressalta-se que a diminuição feita nesta ordem requer que se use

ponto de mínimo em vez de média, para manter as bordas encontradas na

93

etapa anterior. A média suavizaria o sinal, tendendo a apagar as retas das

bordas.

Até a resolução de 30x40 visualmente ainda é possível reconhecer a

imagem original, mas com 15x20 torna-se difícil o reconhecimento.

Porém, pode-se implementar com esta resolução sem baixar a

quantidade de informações, apenas usar uma janela deslizante sobre a

imagem maior de 30x40.

Existem planos para no futuro também ser utilizado fenômenos de

integração espacial para gerar uma resolução maior, por meio de “eletrodos

virtuais”.

6.7.3 Simplificação

Foram implementadas rotinas de simplificação usando difusão

anisotrópica por espaço de escala, mostrada na Fig.46, e algoritmos para

espessar as linhas dos contornos são baseados em morfologia matemática.

Fig.46. Imagem simplificada por difusão anisotrópica com k = 0.02, ? = 0.25, 60

iterações, com k = 0.02, ? = 0.25, 60 iterações.

6.7.4 Letreiros

Também foram implementadas em MATLAB rotinas básicas de

segmentação de imagem para encontrar letreiros, fazendo um zoom in

94

(aproximação) sobre este letreiro, enviando o desenho do contorno dos

caracteres ao equipamento para estimulação.

Existem vários algoritmos de extração de letreiros, especialmente

usados em placas de veículos, mas estes têm sua aplicação mais restrita,

pois já se sabe de antemão a quantidade de caracteres, distância do solo e

tamanho da placa [VASCONCELOS,01], [KETELAARS,02], [DESOUZA,00].

Para este trabalho foi implementado um algoritmo de segmentação de

caracteres baseado em “run length encoding”, que codifica a imagem

usando o comprimento de seqüências de zeros e uns em cada linha. Faz-se

então a média e desvio padrão destes segmentos para cada linha.

A linha que tiver maior quantidade de pixels pretos e menor desvio

padrão tem maior probabilidade de conter caracteres. Quanto menor o

desvio padrão, mais uniforme são os segmentos desta linha. Assim, cria-se

um índice da divisão de quantidade de pixels pretos pelo desvio padrão da

linha. As linhas que estiverem com este índice bem baixo são as melhores

candidatas, sendo separadas. Repete-se o processo para separar as

colunas dentro das linhas previamente separadas, e assim o contorno dos

letreiros é separado do resto da imagem.

É importante destacar que pensou-se em desenvolver síntese de voz,

mas isto limitaria o uso do equipamento por pessoas surdo-cegas. Alem

disso, implicaria implementar técnicas de reconhecimento óptico de

caracteres (OCR), para separar e reconhecer cada caractere do letreiro.

95

Fig.47. exemplo`s de imagem processada para encontrar letreiro, usando binarização por Niblack, segmentação do letreiro por desvio padrão de run length coding, e resultado da

segmentação

Fig.48. Desvio padrão por linha da imagem da figura anterior: os menores indicam a linha com caracteres.

6.7.5 Reconhecimento de caracteres

Foi estudada a possibilidade de uso de redes neurais artificiais para o

reconhecimento de caracteres, comparando resultados de diferentes

implementações, funções e parâmetros diversos de RNAs de caracteres

obtidos em [LE CUN, 02], usando técnicas descritas em [HAYKIN, 02],

[DIETTERICH,00], [DIETTERICH,97], [DINIZ,97], [FLEXER,1996],

96

[PRECHELT,94] e [SILVA,2001]. Aliás, o cálculo do índice usado para

comparar RNAs (e outros aproximadores de funções) é normalmente o

método dos mínimos quadrados. Como fruto de estudos para este projeto foi

proposta uma nova metodologia para comparação de desempenho de redes

neurais, baseada não apenas no acerto simples, mas corrigindo-se o índice

de acertos por uma média ponderada dos erros, subdivididos em classes

segundo sua dificuldade e/ou conseqüência, e associados pesos a estes

erros [RAMALHO,03].

Com os resultados preliminares obtidos pelos reconhecedores de

caracteres por RNAs, foi definido que seria mais rápido e seriam obtidos

resultados melhores se o próprio usuário fosse treinado para reconhecer os

padrões dos caracteres, em vez de se treinar uma RNA, já que este não era

o foco principal do trabalho.

6.7.6 Estimativa de Tempo de Processamento do protótipo 1

No protótipo 1, no PC a imagem é recebida da webcam em formato

RGB e resolução de 240x320 pixels, requerendo conversão em tons de

cinza, binarização e diminuição de resolução, além da detecção de borda e

segmentação de letreiros. O processador escolhido deve ser capaz de fazer

as funções abaixo:

• Recepção da imagem do PC ou do sensor de imagem, serialmente;

• Geração do trem de pulsos da estimulação;

• Endereçamento de cada eletrodo da matriz;

• Processamento da imagem (apenas no protótipo 2).

Um microcontrolador compatível com o 8051, tal como o 8952 da

Atmel, executa cada instrução na média de 12 ciclos de máquina. Operando

com clock de cerca de 12 MHz, então cada instrução demora

aproximadamente um microssegundo para ser executada.

Para a escolha do microcontrolador do protótipo 1 foram consideradas

apenas as três primeiras tarefas, já que o processamento digital de imagens

no protótipo 1 é feito no PC, portanto não influencia qual processador usar,

permitindo o uso de kit pronto de 8051. No entanto, no protótipo 2 há uma

97

limitação nos tipos de algoritmos implementados, descritos com mais

detalhes anteriormente.

Nos testes executados chegou-se à conclusão que a melhor resposta

ocorre quando estimulado taxel a taxel, sequencialmente como se estivesse

desenhado com uma caneta. Assim, envia-se a imagem tratada digitalmente

pelo PC na forma dos dados necessários para o microcontrolador ativar os

eletrodos em suas respectivas placas. Se configurado para testes

somestésicos, poderiam ser enviados códigos para ativar até uma coluna

inteira de eletrodos de cada vez.

Desta maneira, o método de enviar a imagem consiste em enviar três

bytes para cada taxel: dois para indicar as máscaras usadas para endereçar

a coluna e um para indicar o taxel a ser ativado na coluna. Na pior das

hipóteses, a imagem completa ativaria todos os 35 taxels, mas isso não faz

sentido, em geral uma imagem não ativa nem 30% deles.

À taxa de 9600 bits por segundo pode-se então enviar 1/3 dos 35

pixels em 0,03 segundos, conforme o cálculo:

12 taxels/imagem x 3 bytes/taxel x 8 bits/byte /9600 bps = 0,03 segundos.

Sistemas semelhantes da literatura indicam que um usuário demora

mais de um minuto para reconhecer imagens, o que foi confirmado pelos

resultados obtidos com este sistema, descritos no capítulo 8. Portanto, neste

intervalo sobra muito tempo para o resto do processamento.

A geração do trem de pulsos se dá por interrupção ativada pelo timer

interno, sendo de rápida execução, bastando apenas alternar pinos de IO

quando entra na interrupção a cada poucos milisegundos. Definindo-se as

rajadas de trem de pulsos de 5 kHz, ativadas em 100 Hz, resulta cerca de 10

interrupções a cada rajada, ou 1000 alternâncias por segundo. Como cada

interrupção demora cerca de 10 µs, utliza-se 10 x 1000 = 10 ms para gerar o

trem de pulsos em cada segundo, ou menos de 1%. Em testes realizados

com o código da rotina de timer implementado em assembly, o pulso mais

estreito possível com 8952 a 12MHz foi de cerca de 20 µs, o que é bem

mais rápido que a capacidade dos neuroreceptores da pele.

98

Foi visto na descrição do hardware que o circuito projetado usa placas

individuais para controlar cada coluna (ou linha se girado 90 graus) da matriz

de eletrodos. Para endereçar um eletrodo é necessário primeiro enviar o

padrão de eletrodos a serem estimulados naquela coluna e só então enviar o

endereço da respectiva coluna. Contudo, o endereçamento é feito com

poucas instruções, resultando poucos microssegundos entre o

endereçamento e envio de uma coluna e da seguinte. O endereçamento de

cada eletrodo é feito enviando os 3 bytes citados a cada imagem, resultando

alguns microssegundos para cada taxel. Para ser exato, cerca de 10 µs por

taxel, como são 35, ficaria uma imagem inteira enviada em cerca de 350 µs.

Mas para melhorar o reconhecimento, deve-se esperar um tempo

entre um taxel e outro, senão o usuário percebe como sendo ambos

ativados simultaneamente. Testes dos ajustes preliminares indicaram que o

melhor resultado obtido foi com espera entre ativação de eletrodos de cerca

de 500 ms. Também ao final de cada imagem é inserida uma pausa para

diferenciar entre o início e final de uma imagem, ajustado em

aproximadamente 1 segundo.

Conforme mencionado, está demonstrado no capítulo de resultados

que o usuário demora um tempo da ordem de um minuto ou mais para

reconhecer imagens simples. Considerando-se um tempo de um minuto, um

8952 pode executar 60 x 12 milhões de instruções neste intervalo, sendo

suficientemente rápido para viabilizar a escolha do método de estímulo,

podendo ser por eletrodo, por coluna ou até mesmo simular ativar todas as

colunas simultaneamente. Pode-se adiantar que nos resultados foi

observado que o melhor reconhecimento é alcançado quando se estimula

taxel a taxel.

6.7.7 Processador escolhido

Para o protótipo 1 foi usado um kit de desenvolvimento de

microcontrolador compatível com 8051, que contém um 8952 ATMEL, porta

serial, display de cristal líquido, 12 pinos de IO disponíveis e apenas 4

teclas, usadas para a escolha de parâmetros de estimulação e nos testes de

99

padrões geométricos, possibilitando que estes últimos fossem realizados

independentes do PC.

Devido à limitação de 4 teclas, foi implementada uma interface

homem-máquina simples, semelhante ao ajuste de relógios de pulso. Para

cada item a ser ajustado, uma tecla sobe a escolha da seleção, outra desce,

e uma terceira aceita a seleção, com o LCD então mostrando o próximo

ajuste a ser feito. Após todos os ajustes (largura do pulso, quantidade de

pulsos, tempo de pausa entre taxels e entre imagens, padrão a ser

estimulado, método de estímulo, entre outros) terem sido feitos duas vezes,

a estimulação é iniciada.

Para o protótipo 2 foi usado também microcontrolador 8051-

compatível mais rápido, mas desenvolvendo-se a placa de CPU

internamente, ligada na própria placa-mãe também.

6.8 PROTÓTIPO 2

Uma vez que os testes feitos com o protótipo 1, de 5x7, mostraram-se

promissores, foi iniciada a construção do protótipo 2, de 15x20 eletrodos. Ele

é baseado nos princípios comprovados com o primeiro, mas sem a parte de

geração de trem de pulsos por hardware de cada placa, usando-se apenas

os pinos do microcontrolador para gerar o trem de pulsos e seus ajustes.

A diferença básica é que agora tudo tem que ser maior para poder

criar 15 linhas de 20 eletrodos, concentrando-se as alterações nos itens

listados abaixo e descritos em detalhes nos parágrafos seguintes:

• Placa-mãe maior;

• Placa de estímulo com mais elementos de chaveamento;

• Geração da tensão de estimulação por conversor DC-DC e

optoacopladores, em vez de transformador de pulso;

• Placa de microcontrolador integrada à placa-mãe, com 8051–

compatível mais rápido;

• Sensor de imagem interfaceado serialmente ao microcontrolador,

dispensando o PC;

100

• Sensor de ultra-som e motor excêntrico vibratório testados e

incorporáveis ao sistema.

Assim, a placa-mãe é bem maior, capaz de acolher 15 placas de

estímulo, e cada placa de estímulo continua com circuito de seleção de

endereços da placa e de cada eletrodo por meio de comparadores e latches

TTL.

Agora, como mais sinais podem ser alimentados simultaneamente,

foram colocados circuitos integrados para aumentar a corrente fornecida, o

ULN2804. Isto permite que em vez de se utilizar latch transparente 74573 se

use latch sensível a borda, 74273, diminuindo a complexidade do software,

pois não se precisa mais usar um endereço inválido de coluna ao trocar de

coluna.

Cada placa não é mais configurável para amplificar seu próprio trem

de pulso ou receber de fora, ela apenas recebe o sinal de estimulação

pronto da placa-mãe, que o reebe da placa de geração de sinal.

Também foi projetada uma placa à parte para o microcontrolador

(CPU) e outra para a fonte de alimentação, ambas conectadas também ao

barramento da placa-mãe.

Anteriormente foi explicado que por segurança o sinal de estimulação

escolhido é gerado por tensão constante, da ordem de 40 a 60 Volts. Para a

geração desse sinal, no protótipo 1 usava-se em cada placa um

transformador de pulso chaveado por um transistor darlington, com a tensão

ajustada a partir de um regulador LM317 que alimentava o transformador e

circuito de chaveamento. Mas isto podia saturar e distorcer a onda no

secundário, tornando-a um trapézio em vez de exatamente um pulso

quadrado, caso a largura de pulso fosse maior que o previsto no projeto

deste do pulso.

Para garantir maior flexibilidade nos testes, a placa–mãe original

permitia até mesmo que se gerassem externamente os sinais dos 5 canais

101

de estimulação, o que permitiu que fosse testada a estimulação por corrente

e por tensão, utilizando um circuito amplificador ajustável por jumpers,

conforme se pode ver no Anexo 12. Como o sinal gerado com estimulação

por tensão constante, usando-se o circuito original, demonstrou nos testes

ser suficientemente bom para viabilizar a sensação de vibração do estimulo

em cada eletrodo, e assim permitir o reconhecimento dos padrões

geométricos usados nos testes do capítulo 7, decidiu-se continuar usando a

alimentação por tensão constante no projeto do circuito do protótipo 2.

No circuito do protótipo 2 manteve-se a estimulação por tensão

constante, mas buscou-se diminuir a distorção descrita anteriormente devida

ao transformador de pulso. Buscou-se então gerar a tensão mais alta por

conversor DC-DC tipo fly-back, com saída ajustável por um potenciômetro

multivoltas, chaveando-se esta tensão mais alta usando-se optoacopladores

do tipo H11D1, capaz de suportar tensão VCE de até 200 Volts (o 4N38

suporta apenas 30 V).

Outra diferença consiste no elemento chaveador do sinal que vai a

cada eletrodo. O primeiro protótipo usa SSR (relés de estado sólido), que

são opto acopladores com o receptor sendo capaz de conduzir em ambos os

sentidos. Mas seriam necessários 300 destes optoacopladores no protótipo

2, que devido ao custo individual se tornaria o maior custo do equipamento.

Assim, no protótipo 2 eles foram substituídos por um circuito com ponte de

diodos mais opto acoplador com saída comum, transistor bipolar. Assim, o

opto colocado nos terminais retificados da ponte permitem comutar um sinal

bidirecional nos outros 2 terminais da ponte. Esta solução custa cerca de um

terço por eletrodo, barateando em muito o circuito total, mas mantendo a

mesma funcionalidade.

6.8.1 Sensor de Imagem

Conforme previamente mencionado, para dispensar o uso do PC e

webcam, tornando o sistema mais portátil, foi definida a aquisição da

imagem por sensor de imagem e seu interfaceamento direto ao processador

central do sistema, atualmente um microcontrolador 8952 da Atmel.

102

Assim, algumas soluções foram buscadas, sempre usando um sensor

de imagem, de tecnologia CCD ou MOS, que pudesse ser montado em um

óculos para maior facilidade de uso.

Após algumas idéias, finalmente foi definido o uso do kit serial C328

da COMTECH, específico para câmeras fotográficas estáticas, que usa

sensor de imagem OV7640 da OMVISION e chip de interface serial e

compressão JPEG, este último não utilizado neste projeto.

Ele facilita a implementação, requerendo apenas 4 fios, 2 de

alimentação, e dois para comunicação serial, um de transmissão e outro de

recepção. Ou seja, enquanto um sensor paralelo exigiria 8 pinos do

microcontrolador, este usa a porta serial do controlador, requerendo apenas

a conversão dos sinais de 5 V do microcontrolador para 3,3 V do C328. Os

pinos liberados podem ser usados então para realizar a seleção dos

eletrodos a serem estimulados.

O microcontrolador pode então enviar serialmente um comando para

capturar a imagem do sensor escolhendo em qual de diversos padrões de

tamanho e cor, o que diminui o processamento posterior necessário. As

opções são diversas configurações de resolução (VGA, CIF, SIF, QCIF,

128x160, 64x80) e padrão de cores (4, 16 ou 256 niveis de cinza, ou cores

em 12-bit RGB ou 16-bit RGB).

A configuração escolhida para a imagem do sensor foi em quadros de

64x80 pixels, 4 tons de cinza, a menor resolução permitida, assim

requerendo menos memória no microcontrolador, mas ainda com resolução

suficiente para detecção de bordas e demais processamentos, antes de se

fazer a diminuição da resolução para posterior envio à matriz estimuladora e

seus taxels.

Este kit de sensor de imagem está mostrado na Fig.49, Fig.50 e

Fig.51, sendo mais prático de usar pelo seu pequeno tamanho, baixo

consumo, e alta integração, simplificando a interface ao processador.

103

Fig.49. Sensor serial C328, de fator de forma compacto (13 x 14 10 mm).

Fig.50. Sensor montado sobre óculos para minimizar o impacto estético

Fig.51. Circuito de teste de interface do sensor de imagem a microcontrolador

6.8.2 Chaveamento de potência

A desvantagem do protótipo 1 está no preço o SSR, que custa cerca

de 7 reais (2 dólares) cada um. Assim para o protótipo 2 foi criado um

circuito semelhante a um retificador de onda completa baseada em ponte de

diodos. O princípio é simples, basta tomar o secundário de um transformador

e alimentar 4 diodos em ponte. Dois dos terminais são conectados à tensão

alternada, e 2 alimentam a carga que recebe então um sinal pulsado que

pode ser melhorado usando um capacitor que diminui o ripple em paralelo à

carga, que começa a receber então tensão praticamente contínua (DC). Se

104

no lugar da carga for colocado um elemento de chave (um FET ou bipolar

simples) e em um dos ramos entre o secundário e a ponte se colocar o

eletrodo, com uma só chave será possível ligar e desligar uma tensão

alternada no eletrodo.

No protótipo 2, quando implementado o tempo morto para diminuir

consumo de potência, são usados na geração do sinal estimulador 2 pinos

de controle vindos do microcontrolador.

6.8.3 Matriz de eletrodos

Para o protótipo 2, desenvolveu-se uma matriz de 15x20 com circuitos

impressos flexíveis (CIF), encomendada junto à MDL, Menbrana Digital Ltda,

fabricante de teclados de membrana e circuitos deste tipo.

A vantagem desta segunda opção é que se adapta melhor à pele do

usuário, diminui o peso e melhora a condução, melhorando a sensibilidade

do usuário.

Os circuitos impressos flexíveis (CIF) podem ser feitos de 2 maneiras:

aditiva ou subtrativa. A tecnologia de construção é define algumas limitações

como em número de camadas, se aceita soldagem ou não, se aceita

colagem de componentes e o tipo de conector utilizado.

Na construção aditiva deposita-se camada de condutor metálico,

normalmente uma tinta à base de prata, sobre um filme de poliéster, usando

camadas isolantes para se poder fazer um circuito multicamadas. Para

aplicações médicas como em eletrodos de ECG (eletrocardiograma), EEG

(eletro-encéfalo-grama), ultra-som e outros, existe uma tinta de cloreto de

prata, para poder resistir melhor à corrosão do ataque do gel condutor e do

próprio suor do paciente. Como não aceita soldagem, requer conectores do

tipo crimpagem, como os da Nicomatic, mostrados na Fig.52 e Fig.53.

105

Fig.52. Conectores de crimpagem para circuitos flexíveis, da Nicomatic.

Fig.53. Exemplos de conectores: Nicomatic (preto) e Berg/Dupont (azul);

O método subtrativo usa um filme especial com camada de cobre de

fábrica e sofre processo semelhante ao da construção de placas de circuito

impresso convencionais. A película mais conhecida é a Pyralux da Dupont,

que é uma película de Kapton (poliimida) recoberta de cobre, que permite

corrosão e soldagem normal de componentes.

Para a matriz de 300 eletrodos foi encomendada junto à empresa

carioca MDL, Membrana Digital Ltda, a fabricação de matriz de eletrodos

baseada na tecnologia aditiva, conforme a Fig.54, Fig.55, Fig.56 e Fig.57.

106

Fig.54. Desenho de 2 colunas da matriz encomendada, com as camadas superpostas, e exemplo de uma linha da matriz final.

Fig.55. Exemplo de matriz encomendada 7x7, com 3 camadas: anel externo de retorno por placa, anel central de estimulação e isolante do meio. (cerca de 10 x 10 cm)

Fig.56. Desenho da matriz final flexível, de 300 eletrodos, com suas diversas camadas para eletrodo central e retorno comum a cada linha.

107

Fig.57. Matriz flexível de 15x20 eletrodos, do tamanho aproximado de uma folha A4.

6.8.4 Estimativa de tempos para o protótipo 2

No segundo protótipo o sensor de imagem do C328 já envia a

imagem em formato reduzido, 64x80, em apenas 4 tons de cinza. Isso

simplifica muito a área de memória requerida, bem como o tempo para

processamento. Porém, todo o processamento da imagem deve ser

implementado nele, limitando o tipo de processamento, a menos que se

usem processadores mais poderosos, como microcontroladores da Dallas

semiconductors compatíveis com 8051, 40 vezes mais rápidos, ou mesmo

processadores DSP da Texas Instruments, como TMS320C5510, cerca de

20 vezes mais rápidos que o microcontrolador 8952 utilizado.

Para a diminuição de resolução basta reduzir duas vezes, de 64x80

para 32x40 e depois para 16x20. Para manter as retas encontradas durante

a detecção de borda, faz-se a redução não pela média, mas pelo valor

mínimo, pois zero corresponde a preto. Assim, a diminuição de resolução é

feita apenas duas vezes, e sem precisar média fica ainda mais rápida.

Numa estimativa rápida, tem-se 64x80 /4 = 1280 cálculos de pixels

num primeiro momento, que envolvem 5120 comparações, a 1 µs por

comparação, leva cerca de 5 ms para a primeira redução. Na segunda, tem-

se 32x40 /4 =320 cálculos, com 1280 comparações, que equivalem a quase

1,3 µs. Portanto, para reduzir a resolução em menos de 10 ms um

microcontrolador 8952, lento, pode processar, pois há cerca de um minuto

até o usuário reconhecer a imagem. Porém, no futuro para processamentos

108

mais complexos, como difusão anisotrópica, um microcontrolador compatível

com 8051, mas mais rápido, ou processador DSP se faz necessário.

6.8.5 Estimativa da distância por ultra-som

Para compensar a falta de estereoscopia pelo uso de uma única

câmera, e poder diferenciar um obstáculo grande e distante de um pequeno

e mais próximo, foi projetado um sistema complementar de estimativa de

distância usando sensor de ultra-som.

Uma maneira típica de se usar a propagação de ondas acústicas

acima do limite de audição humana, cerca de 40 a 50 kHz, e por medição de

tempo de eco. Um transmissor emite um sinal de duração muito breve e

dispara um temporizador. Quando o receptor deste sinal recebe o sinal

refletido no obstáculo, mede o tempo que levou para ir e voltar. Sabendo-se

a velocidade do som no ambiente, aproximadamente constante para cada

meio, pode-se usar um microcontrolador para calcular a distância e

compensar qualquer não linearidade do modelo, conforme visto na Fig.58.

Deve-se tomar cuidado com esta implementação para garantir que a

duração do pulso seja menor que o mínimo de tempo do eco para prevenir

sobreposição. Costuma-se calibrar um sistema desses cada vez que ele for

usado em condições ambientais diferentes. Sem calibração, grandes

variações de temperatura e umidade podem gerar resultados errados devido

à variação da velocidade do som nestas condições [BORENSTEIN,96],

[SHOVAL,00].

Fig.58. Esquema de medição por ultra-som

No caso do sistema aplicado ao projeto de SS, a aplicação é mais

simples ainda, pois não é necessária uma medição precisa, e sim apenas

uma estimativa desta distância. Assim, usa-se um circuito para gerar um

sinal de tensão proporcional a esta distância, que por sua vez é invertido

109

para acionar um motor excêntrico para vibrar mais quanto mais perto de um

obstáculo o usuário estiver.

Foram usados sensores da Senix e motores excêntricos adquiridos

junto à Jameco americana, e o sensor MaxEZ1 da MaxBotix, adquirido junto

à Zagros Robotics, mostrados na Fig.59

Fig.59. Sensor de ultra-som, motores excêntricos, e sistema de estimativa de distância,

e Sensor Max EZ1, de dimensões reduzidas (20 x 22 x 16.4 mm).

Observe que o motor excêntrico plano, com formato de moeda,

poderia no futuro ser utilizado na montagem de uma matriz de estimulação

vibromecânica, mas isto esbarra no alto custo destes motores, atualmente

em cerca de 4 dólares cada. Para integrar 15x20 em uma matriz, o custo

destes atuadores ficaria proibitivo em um primeiro momento.

110

77 TTEESSTTEESS

Os testes foram conduzidos em três etapas, uma preliminar para

ajuste do equipamento, uma para treinamento dos usuários, e finalmente

uma para avaliar o envio ao usuário de imagens capturadas e tratadas no

PC. Os formulários usados neste treinamento estão listados no apêndice 1

deste trabalho.

7.1 OBJETIVOS DOS TESTES

Os principais objetivos dos procedimentos de testes desenvolvidos

foram definir a melhor maneira de utilizar o equipamento, e treinar três

grupos de sujeitos no reconhecimento de padrões geométricos, observando

seus acertos percentuais e tempos de reconhecimento.

As questões a seguir foram objeto dos testes realizados.

7.1.1 Testes de ajustes:

1. Qual o menor espaçamento entre eletrodos, entre dois extremos

sugeridos pela literatura;

2. Qual é o melhor tamanho de eletrodos dentre 2 extremos (mínimo e

máximo sugeridos pela literatura); faz sentido usar uma matriz com maior

número de pontos por área? Existe um tamanho ideal para a matriz?

3. Qual é o melhor lugar para a estimulação eletrotáctil: abdome, antebraço,

dedo, palma da mão? Não usar no abdome implicaria diminuir o tamanho

dos eletrodos para se adequar à fisiologia destas outras regiões do

corpo, gerando maior dificuldade na implementação da matriz;

4. Qual é a largura de pulso mais confortável e que resulta melhor

percentual de acerto?

5. Qual quantidade de pulsos em cada rajada?

6. Qual pulso resulta melhor sensação/conforto e segurança ao usuário

para não queimá-lo: pulsos bifásicos (com nível DC nulo) ou monofásicos

(nível DC não nulo)?

7. Deve-se usar padrão desenhado em carimbo, por coluna apagando a

anterior, por coluna mantendo todas acesas, ou apenas 1 taxel (eletrodo)

111

de cada vez? Os testes desenhando linha por linha foram eliminados

porque bastaria girar a matriz 90 graus e testar com o mesmo padrão;

7.1.2 Testes de treinamento

1. Qual o tempo necessário para reconhecer as figuras?

2. Existe uma diferença no acerto para o reconhecimento de padrões

geométricos entre os três grupos (cegos congênitos, cegos adquiridos e

videntes)?

3. Existe diferença no tempo para reconhecer padrões geométricos entre os

três grupos?

4. Quais formas são mais facilmente reconhecidas?

7.1.3 Questões para futuros testes:

1. É possível estimar corretamente relações de tamanho?

2. O uso de envoltória melhora o conforto do estímulo elétrico?

3. É possível usar fenômeno de integração para criar efeito de “eletrodos

virtuais” e melhorar a resolução da matriz de estimulação?

4. Até que ponto é possível reconhecer figuras em movimento e sua

trajetória?

7.2 TESTES PRELIMINARES PARA AJUSTE

Antes de começar os testes de treinamento com usuários, foi previsto

o ajuste dos equipamentos para os parâmetros a seguir:

1. forma de onda da estimulação (formato, repetição de pulsos, amplitude)

que forneça a melhor sensação ao usuário;

2. espaçamento e tamanho de eletrodos;

3. método de estimulação, ilustrados na Fig.60:

o por carimbo (todos os taxels da imagem simultaneamente),

o por coluna individual (acende uma coluna e apaga a anterior),

o por coluna mantendo as anteriores (ao acender uma coluna

manter as anteriores até gerar a imagem completa),

o por taxel individual (simulando uma escrita manual, ou desenho de

traçador gráfico, ou plotter).

112

Fig.60. Quadrado pequeno desenhado por diversos métodos: a.como carimbo (primeiro quadro), b.por coluna individual (quadros 2 a 4), c.por coluna mantendo a anterior (quadros

5 a 7), d.taxel a taxel (quadros de baixo) – em cinza são os taxels estimulados e depois apagados

Para ajustes de sensibilidade, foram gerados 2 grupos de testes com

três indivíduos, cada grupo com 32 possibilidades para os 5 parâmetros a

serem ajustados. Cada indivíduo testou um grupo com a matriz menor e

outro com a matriz maior, resultando melhor sensibilidade e conforto com a

matriz menor. Na Fig.61 mostra-se o formato do trem de pulsos, cujos

valores testados foram:

• Toff: Intervalo entre rajadas: 5 a 8 ms;

• Npulsos: Número de pulsos: 5 a 10;

• Thigh: Tempo no nível alto: 41 a 80 µs;

• Tlow: Tempo no nível baixo: 60 a 120µs;

• método de estimulação

Isto resultou em freqüência de envoltória entre 96 e 182 Hz,

freqüência dos pulsos entre 2 e 10KHz, ciclo de trabalho entre 20 e 57%, e

percentagem de sinal alto sobre tempo total entre 2,3% e 12.5%.

Fig.61. Trem de pulsos com tempo morto: exemplo de BFM usando pulsos bipolares DC [NOHAMA,97].

113

A amplitude do sinal foi ajustada pelo próprio usuário por meio de um

potenciômetro multi-voltas, ou seja, por hardware e não por software.

Destes 32 ajustes realizados com 3 usuários, os 4 melhores ajustes

foram escolhidos para os testes de treinamento da seção seguinte.

7.3 TESTES PARA TREINAMENTO DE USUÁRIOS

Depois de serem definidas as 4 melhores configurações do

equipamento, na primeira sessão de treinamento cada sujeito escolheu qual

das 4 lhe permitia melhor sensação vibratória, sendo esta configuração

então usada nos demais testes deste sujeito.

Foram realizados testes para treinamento com 3 grupos de usuários:

• videntes (com visão normal);

• cegos congênitos (de nascença ou que se tornaram cegos até os 5 anos

de idade);

• cegos adquiridos (após os 5 anos de idade) [ANTONINO,93],

[KACZMAREK,00].

Cada grupo foi composto por 4 a 5 voluntários adultos, de ambos os

sexos. Não foram incluídos neste estudo portadores de doenças cardíacas e

mulheres grávidas. O objetivo não foi fazer amostras estatisticamente

representativas, mas apenas demonstrar a viabilidade do projeto como um

todo e do hardware e software em especial, apenas apontando possíveis

caminhos para estudos posteriores com os grupos mencionados

anteriormente.

Estes três grupos foram treinados no reconhecimento destes padrões

geométricos: reta horizontal, reta vertical, reta inclinada para cima ou para

baixo, letra L, quadrado, triângulo para esquerda e direita, e círculo.

Neste estudo foi avaliada para cada individuo testado, o percentual de

acerto e o tempo despendido para reconhecer os padrões (latência), em

cada sessão de treino realizada.

Para cada grupo experimental foram calculadas as médias do

percentual de acertos e da latência para os reconhecimentos dos padrões

114

geométricos, para cada sessão, sendo apresentados na forma de gráficos

em função da quantidade de sessões de treinamento.

Também foram computadas as médias do percentual de acertos e

latência de reconhecimento dos padrões geométricos, subdivididos em

padrões simples (retas) e complexos (os demais), e gerados gráficos destes

resultados para cada um dos grupos.

No capítulo 8, de resultados, um sumário foi gerado numa tabela, com

a média de todas as sessões por grupo e tipo de padrão.

Estes padrões geométricos foram gerados diretamente no

equipamento via kit de microcontrolador, dispensando o uso do PC nestes

testes. Como o segundo protótipo tem maior resolução, os testes para

imagens mais complexas recebidas serialmente do PC foram feitos apenas

nele, conforme descrito na subseção 3. O sensor de ultra-som e a

segmentação de letreiros foram adicionados após estes testes, apenas no

protótipo 2.

7.3.1 Metodologia das sessões de treinamento

Na primeira sessão de treinamento, primeiramente o usuário

experimentou os quatro ajustes de estimulação previamente escolhidos, e

escolheu destas, aquela que lhe foi mais confortável.

Após isso, em cada sessão o usuário foi treinado inicialmente com

quatro padrões geométricos simples (reta horizontal, reta vertical, diagonal

para baixo e para cima). O usuário teve até 5 minutos para reconhecer cada

padrão estimulado, sendo anotado o que ele pensou ser o padrão, bem

como a latência (tempo que levou para reconhecer).

Para ensiná-lo a reconhecer cada um dos quatro padrões simples,

primeiro informou-se o que foi estimulado, e ao final da sessão informou-se

se acertou ou não, para possibilitar a aprendizagem.

Após o treinamento dos quatro padrões simples, iniciou-se o estímulo

de padrões um pouco mais complexos (letra L, quadrado, triângulo para

direita, triângulo para esquerda e círculo), variando-se a seqüência de uma

sessão para outra de maneira aleatória para evitar sua memorização.

115

Nesta segunda etapa de testes usou-se o mesmo procedimento

anterior, com exceção de que os erros e acertos foram informados apenas

ao final do conjunto de padrões.

Para os dois primeiros usuários inicialmente não se havia limitado a

quantidade de sessões seguidas de treinamento, porém notou-se que se

realizadas mais de duas seguidas, a terceira apresentava menor acerto. Os

sujeitos cegos envolvidos mencionaram que isto ocorre também quando se

faz leitura Braille, quando após leituras realizadas durante muito tempo

requerem um intervalo de descanso quando então retornam à velocidade

normal de leitura e acerto. Assim, foram feitos a partir daí no máximo duas

sessões seguidas de treinamento, preferencialmente duas por dia, em dias

seguidos. Quando se precisou fazer mais de duas por dia, um intervalo de

pelo menos 30 minutos entre a segunda e terceira sessões.

Cada sessão durou no máximo 45 minutos, composta pela

estimulação e reconhecimento de quatro padrões simples e cinco

complexos, cada um durando no máximo 5 minutos.

Cada sessão completa foi repetida até se atingir 10 sessões com

cada usuário.

Nos treinamentos dos videntes, para evitar que eles tivessem acesso

ao padrão estimulado, utilizou-se venda para os olhos, mas também havia a

opção de um jumper para desligar os leds de indicação do padrão luminoso

ao pesquisador.

7.4 TESTES COM IMAGENS GENÉRICAS

Após o usuário completar seu treinamento de padrões geométricos e

caracteres, foram realizados testes utilizando-se imagens controladas, como

mesa, meca e cadeira e duas mesas. Também era possível enviar as

imagens capturadas com a Webcam no PC, simplificadas e enviadas ao

equipamento, de modo a observar e quantificar os acertos.

116

88 RREESSUULLTTAADDOOSS

Nesta seção encontram-se dados coletados sobre o ajuste do

equipamento e treinamento dos usuários, bem como sobre o funcionamento

e consumo do equipamento.

8.1 SENSAÇÃO OBTIDA VERSUS AJUSTES INICIAIS

O objetivo de permitir que os estímulos elétricos fossem sentidos

como leves vibrações foi atingido por meio dos ajustes dos parâmetros de

software feitos pelo pesquisador, a partir da informação de sensação

fornecida pelo usuário, e por meio do ajuste da amplitude do sinal feita pelos

próprios usuários usando um potenciômetro multivoltas.

Foi usado gel condutor não salino para melhorar a condutibilidade e

interface entre a matriz de eletrodos e a pele. Inicialmente quando o gel não

havia sido usado, as sensações foram descritas como “agulhadas”. O uso de

gel condutor não salino é recomendado pela literatura quando o eletrodo

central tem área maior que 1 mm2, para preencher o espaço e distribuir

melhor a corrente. Como o pino central do eletrodo deste projeto tem 1 mm

de diâmetro, com área de 1,57 mm2, o gel é necessário [NOHAMA, 95].

A intensidade do estímulo não foi suficientemente grande para atingir

camadas mais internas e acionar placas motoras, portanto, não se observou

contrações musculares, com exceção dos testes realizados no antebraço,

onde as placas motoras estão mais próximas da superfície.

Este teste no antebraço foi um dos testes de sensibilidade realizados

em alguns locais do corpo de 3 indivíduos, como coxa, panturrilha,

antebraço, palma da mão e abdome. A melhor sensação, com melhor

resolução, foi obtida para todos os usuários no lado inferior do abdome,

confirmando dados da literatura.

O dedo não foi testado por implicar uso de matriz menor, com

eletrodos menores, devido à maior densidade de receptores nervosos, o que

seria mais difícil de implementar.

117

Devido à menor densidade e ao maior espaçamento dos receptores

nervosos, conforme visto na Fig.10, para o abdome foram testadas as duas

matrizes de estimulação de 5x7 criadas em tamanhos diferentes. Elas foram

construídas em placa de circuito impresso de fibra de vidro e eletrodos de

níquel, com dimensões sugeridas na literatura [KACZMAREK,91],

[NOHAMA,95]. Quatro indivíduos as testaram, identificando a menor delas

como melhor para identificação e tendo maior facilidade de uso, sendo

apenas esta matriz menor então usada para a etapa de treinamento.

O menor espaçamento entre eletrodos e tamanho menor de eletrodos

possibilitou criar a matriz de eletrodos final, usada na estimulação de

imagens mais complexas, em tamanho maior com 15x20 eletrodos. Ela foi

construída usando técnicas de circuitos impressos flexíveis, com tamanho

aproximado de uma folha de papel tamanho ofício, cobrindo totalmente o

abdome do usuário.

A Tabela 9 lista as quatro melhores configurações de ajustes de três

indivíduos dentre as 32 testadas. Posteriormente, estas 4 configurações

foram usadas no início da primeira sessão de treinamento de cada um dos

demais usuários para escolher qual delas seria mais adequada a cada um,

proporcionando-lhe melhor sensação e conforto.

Tabela 9. Configurações que resultaram sensação vibratória mais agradável Intervalo toff (µs)

Número pulsos

Thigh (µs)

Tlow (µs)

%ciclo de trab

%on s/total

fpulso (KHz)

fenvoltória (Hz)

5 10 41 160 20% 5.8% 5.0 143

5 10 41 60 41% 6.8% 9.9 166

8 5 80 60 57% 4.6% 7.1 115

8 5 120 80 40% 4.4% 5.0 111

A última configuração da Tabela 9 foi a que a maioria dos usuários (7

de 12) descreveu como mais agradável, sendo escolhida como default para

o aparelho. Mais dois parâmetros de tempo podiam ser ajustados por

software, waitcol, que representa o tempo que a coluna ou taxel permanece

estimulado; e waitimg, que representa o tempo de espera ao final da

estimulação de cada imagem completa, antes que fosse reiniciada a

118

estimulação. Após alguns testes preliminares, a melhor sensação obtida foi

ajustando-se o primeiro para 1000 ms e o segundo para 500 ms.

Seguindo orientação da literatura, foram utilizados pulsos bifásicos

(com nível DC nulo) na estimulação, para evitar a ionização da pele.

Contudo, o equipamento permite que testes futuros possam ser feitos

também com pulsos monofásicos, para permitir testes comparativos se for

necessário.

Como a matriz é muito grande, fica difícil manter contato perfeito com

a superfície da pele em toda a extensão da matriz. Caso fosse feita

estimulação por corrente constante, uma eventual diminuição na área de

contato ocasionaria uma maior potência elétrica no eletrodo em questão,

podendo lesar a pele do usuário. Este efeito foi evitado utilizando-se

estimulação por tensão constante, que em caso de diminuição da área de

contato, diminui a potência, não gerando o estímulo, mas protegendo o

usuário.

Nos ajustes iniciais, com os 3 primeiros usuários, ainda foi possível

verificar que o melhor reconhecimento foi obtido usando-se o método de

estimulação de taxel individual, em que o padrão geométrico era desenhado

em seqüência de eletrodos, como se fosse alguém escrevendo com uma

caneta. Os outros métodos confundiam os usuários, de tal maneira que eles

não conseguiam distinguir os padrões. Provavelmente o usuário relacionava

o padrão estimulado com a forma com que ele próprio desenha, ou seja, o

método de estimulação por carimbo ou colunas não é uma maneira intuitiva

de se escrever ou desenhar algo. Usando os métodos de estimulação por

carimbo, coluna mantendo ou coluna individual, nenhum dos 4 padrões

geométricos de treinamento inicial (reta horizontal, vertical, inclinada pra

cima e pra baixo) foi reconhecido por estes três primeiros usuários. Isto foi

diferente do que foi observado para o método de taxel individual, em que

desde a primeira estimulação os usuários foram capazes de reconhecer pelo

menos um dos padrões estimulados. Assim, o método de taxel individual foi

escolhido como único método para os demais treinamentos da etapa

seguinte.

119

8.2 RESULTADOS DOS TESTES DE TREINAMENTO

Os resultados obtidos nos testes de treinamento, realizados com

usuários do sistema, em três grupos (videntes, cegos adquiridos e cegos

congênitos), estão apresentados na Tabela 10 e Fig.62 a Fig.65.

O grupo de videntes começou com acerto em cerca de 50% a 65%,

variando para padrões geométricos simples (retas) e complexos, e com o

transcorrer das sessões não teve melhora no acerto, apesar de ter diminuído

sua latência de cerca de 110 segundos para algo em torno de 30 segundos.

Talvez deva-se à ansiedade de responder rapidamente, pois a latência caiu

muito sem ter melhorado o acerto.

O grupo de cegos adquiridos apresentou diminuição da latência, indo

de cerca de 100 segundos, inicialmente, para cerca de 45 segundos ao final,

enquanto seus acertos foram de 30% para mais de 80%.

O grupo de cegos congênitos apresentou o melhor resultado, com sua

latência semelhante à dos cegos adquiridos, mas com acertos indo de 50%

a praticamente 100% já a partir da sexta sessão de treinamento. Um deles

teve acerto próximo de 100% desde a primeira sessão.

De maneira geral, pode-se observar que o reconhecimento de

padrões geométricos simples é muito maior do que dos complexos, que só

melhoram com o transcorrer das sessões de treinamento.

Em resumo, foi observado que à medida que as sessões foram sendo

realizadas, o tempo de reconhecimento (latência) foi diminuindo e o

percentual de acerto foi aumentando em todos os grupos. Este mesmo tipo

de desempenho foi observado também por Maucher[00] e Kaczmarek[95]

em seus experimentos tácteis.

Como já mencionado anteriormente, o percentual de acerto só não

aumentou de uma sessão de treinamento para a seguinte em alguns casos

iniciais quando foram realizadas várias sessões seguidas no mesmo dia,

sem intervalo. Notou-se que após o uso contínuo por mais de uma hora,

durante os treinamentos, o usuário tinha seu percentual de acerto reduzido,

provavelmente devido a cansaço ou habituação nervosa, e a partir daí esta

condição foi evitada nos demais testes. Contudo, isto não inviabiliza o uso

120

do sistema, pois a idéia básica é que o sistema não seja para trabalhar como

visão artificial contínua, e sim como auxílio esporádico para reconhecimento

de ambientes desconhecidos e leitura de letreiros. Assim, o usuário não

deverá usar o sistema mais do que alguns minutos de cada vez. Vale

lembrar que a idéia é que o usuário ligue o equipamento disparando uma

captura, processamento e estimulação da imagem apenas sob seu

comando, não continuamente, também para que se possa maximizar a

duração da carga das baterias.

Uma observação feita pelos voluntários cegos adquiridos é que eles

tentavam fazer uma analogia com algo conhecido anteriormente antes de

ficarem cegos, e isto produzia uma maior latência e erros esporádicos. No

cego congênito isto não foi verificado, pois neste caso ele não tem

referência, qualquer novo treinamento é identificado imediatamente. Pode-se

observar nos gráficos que a média de acertos para os congênitos é maior e

a latência é menor. Contudo, como a quantidade de voluntários foi pequena,

isto mostra apenas uma possibilidade de estudo futura, não se teve

pretensão de fazer uma análise estatística exaustiva, apenas de mostrar a

viabilidade da idéia e apontar caminhos de estudos futuros.

Outro ponto a ser destacado foi o melhor desempenho dos usuários a

partir do momento que se passou a usar método de estimulação ponto a

ponto em vez dos outros três, de carimbo e por coluna (individual ou

mantendo as anteriores). Na estimulação ponto a ponto ao se ativar um novo

taxel se desativa o anterior, e com isso simula-se o mesmo método usado

quando se escreve com uma caneta, mais intuitivo ao usuário. Além disso, o

fato de se estimular um eletrodo de cada vez provavelmente reduz a

possibilidade de interferências entre os mecanoreceptores adjacentes.

121

VIDENTES: % acertos x sessões

0%

20%

40%

60%

80%

100%

1 2 3 4 5 6sessões

% d

e ac

erto

s

media simples

med.complexos

media videntes

VIDENTES: Tempo de reconhecimento x sessões de

treinamento

0

20

40

60

80

100

120

1 2 3 4 5 6sessões

tem

po (

s)

media simples

med.complexos

media videntes

Fig.62. Gráfico de %acerto e latência, média para grupo de videntes.

CEGOS ADQUIRIDOS: % acertos x sessões

0%10%20%30%40%50%60%70%80%90%

100%

1 2 3 4 5 6sessões

% d

e ac

erto

s

media simples

med.complexos

med.adquiridos

CEGOS ADQUIRIDOS:Tempo de reconhecimento x sessões de

treinamento

020406080

100120140160180

1 2 3 4 5 6sessões

tem

po (

s)

media simples

med.complexos

med.adquiridos

Fig.63. Gráfico de %acerto e latência, média para grupo de cegos adquiridos

122

CEGOS CONGENITOS: % acertos x sessões

0%10%20%30%40%50%60%70%80%90%

100%

1 2 3 4 5 6sessões

% d

e ac

erto

s

media simples

med.complexos

med.congenitos

CEGOS CONGENITOS:Tempo de reconhecimento x sessões de

treinamento

0102030405060708090

1 2 3 4 5 6sessões

tem

po (

s)

media simples

med.complexos

med.congenitos

Fig.64. Gráfico de %acerto e latência, média para grupo de cegos congênitos.

MEDIA DE TODOS: % acertos x sessões

0%

20%

40%

60%

80%

100%

1 2 3 4 5 6qdte de sessões

% d

e ac

erto

s

ccongenitos

c.adquiridos

videntes

MEDIA DE TODOS: Tempo de reconhecimento x sessões de

treinamento

020406080

100120140

1 2 3 4 5 6

sessões

tem

po (s

)

ccongenitos

c.adquiridos

videntes

Fig.65. Gráfico de %acerto e latência, comparando os 3 grupos.

123

Tabela 10. Evolução da latência e acerto%, por grupo e padrão geométrico estimulado EVOLUÇÃO: DA LATÊNCIA média dos usuários por grupo, por tipo de padrão

TEMPO(s) TEMPO(s) TEMPO(s)congenitos adquirido videntesincial final inicial final inicial final

Reta horiz. 43 29 49 20 36 17Reta vert. 37 29 116 80 40 30Diag.p/baixo 46 12 96 76 85 32Diag.p/cima 27 11 71 26 115 43Letra ELE 45 23 179 20 74 38Quadrado 56 17 104 67 55 62Triang.direita 73 47 102 49 174 68Triang.esq. 86 30 226 13 110 76Circulo 154 58 169 66 124 47media simples 38 20 83 50 69 31med.complexos 83 35 156 43 107 58media todos 63 28 123 46 90 46

EVOLUÇÃO do ACERTO%: média dos usuários por grupo, por tipo de padrãoACERTO ACERTO ACERTOcongenitos adquiridos videntesinicial final inicial final inicial final

Reta horiz. 100% 100% 75% 100% 80% 100%Reta vert. 50% 100% 25% 100% 80% 60%Diag.p/baixo 50% 100% 0% 50% 60% 60%Diag.p/cima 100% 50% 50% 25% 60% 60%Letra ELE 100% 100% 25% 100% 40% 60%Quadrado 50% 50% 25% 0% 60% 80%Triang.direita 100% 100% 50% 100% 0% 40%Triang.esq. 100% 50% 25% 50% 60% 40%Circulo 100% 100% 0% 50% 100% 0%media simples 75% 88% 38% 69% 70% 70%med.complexos 90% 80% 25% 60% 52% 44%media todos 83% 83% 31% 64% 60% 56%

Tabela 11. Sumário da evolução de cada grupo, media de todos os padrões estimulados SUMÁRIO DA MEDIA DE TODOS OS PADROES, POR GRUPO A CADA SESSAOTEMPOS sessao1 sessao2 sessao3 sessao4 sessao5 sessao6ccongenitos 63 46 31 34 20 28c.adquiridos 123 111 63 81 45 46videntes 90 57 45 38 40 46

%ACERTOS sessao1 sessao2 sessao3 sessao4 sessao5 sessao6ccongenitos 75% 88% 100% 88% 88% 88%c.adquiridos 38% 38% 56% 65% 56% 69%videntes 70% 90% 90% 70% 75% 70%

124

8.3 RESULTADOS PARA IMAGENS CONTROLADAS

Conforme mencionado, foram realizados testes com os usuários,

estimulando padrões de imagens controladas. Especificamente foram

desenhadas três imagens em três dimensões: mesa, mesa e cadeira, e duas

mesas, todas desenhadas utilizando-se o método de estimulação taxel a

taxel, estimulando os eletrodos sequencialmente.

Porém, o percentual de acerto se mostrou baixo nos três grupos,

abaixo de 30%. A principal reclamação é que torna-se difícil reconhecer uma

imagem a partir da seqüência de eletrodos estimulados. Em outras palavras,

o que se mostrou melhor para padrões geométricos simples e mais

complexos, tornou-se um problema para a estimulação de objetos.

Mais treinamento e testes precisarão ser feitos, inclusive tentando

mudar o método de estimulação. Para o caso de imagens de objetos seja

melhor utilizar estimulação como se fosse um carimbo.

8.4 CONSUMO DE ENERGIA

Conforme mencionado anteriormente, o aparelho foi projetado para

permitir diferentes métodos de estimulação, incluindo por carimbo, coluna

individual ou mantendo as anteriores, ou por seqüência de eletrodos

individuais.

O estímulo que teve melhor sensação de conforto por parte dos

usuários ocorreu para tensão de estimulação entre 40 e 60 Volts, variando

de paciente para paciente, mas com um consumo por eletrodo de corrente

da ordem de 10 mA por eletrodo.

Como o melhor reconhecimento e sensação foram obtidos usando-se

o método de estimulação por taxel individual, a corrente em um dado

instante foi sempre no máximo 10 mA.

Por questões de segurança não está previsto o uso simultâneo de

todos os eletrodos da matriz, mas foram realizadas medições com simulador

de pele que mostraram que o limite superior de consumo de todo o sistema

da matriz 5x7 foi de 300 mA quando todos os eletrodos e seus leds estão

ativos.

125

Outra forma de diminuir o consumo foi retirar um jumper que

desligava os leds de indicação do padrão luminoso ao pesquisador. Estes

leds em um equipamento comercial seriam desnecessários e sem utilidade

para um usuário cego, devendo ser suprimido.

126

99 CCOONNCCLLUUSSÕÕEESS EE TTRRAABBAALLHHOOSS FFUUTTUURROOSS

Destaca-se a multidisciplinaridade deste trabalho, pois para sua

implementação foi necessário conhecimento de diversas áreas, mesmo que

algumas mais superficialmente, tais como: fisiologia, visão, cognição,

técnicas de orientação e mobilidade, eletrônica digital, eletrônica analógica e

eletrônica de potência, transformadores, baterias recarregáveis, circuitos

impressos flexíveis, microprocessadores, processamento de imagens,

reconhecimento de padrões, redes neurais e normas técnicas eletro-

médicas.

Assim, a integração destas diversas técnicas foi o que possibilitou

buscar-se uma solução inédita para um problema de cunho social. Aliás,

talvez este tenha sido um dos fatores decisivos para o projeto ter sido

agraciado com o 1º lugar nacional na categoria pesquisadores para o 1º

Premio de Inovação Tecnológica Werner Von Siemens, no ano de 2005.

A implementação deste trabalho resultou em um circuito estimulador

flexível, com possibilidade de estudo de diferentes fenômenos tácteis, além

da criação de uma matriz de eletrodos inovadora.

Também mostrou-se viável o uso de conjunto ponte de diodos mais

optoacoplador simples usado para substituir relés de estado sólido 5 vezes

mais caro, com um funcionamento adequado a um custo muito menor,

principalmente porque se usam 300 destes elementos em cada

equipamento.

O custo de material do equipamento ficou bem acessível, abaixo do

valor de um PC de mercado, ou seja, menos de mil dólares. Isto leva em

conta os custos de várias PCI (700 reais), soquetes e componentes (900

reais) e baterias (100 reais), total cerca de 1700 reais.

O sistema apresentou resultados promissores, demonstrando a

viabilidade da implementação do envio de informações visuais por meio de

estimulação cutânea, no caso, estimulação elétrica, mas que no futuro pode

ser alterada para ativar estimuladores mecânicos.

127

As técnicas de processamento de imagem utilizadas mostraram-se

adequadas para começar as deficiências do tato em relação à visão,

especificamente a menor resolução e a falta de camadas detectoras de

contornos. Trabalhos mais aprofundados em cada área podem ser

desenvolvidos no futuro buscando melhorar este processamento de

imagens.

Notou-se que após o uso contínuo por mais de uma hora durante os

treinamentos o usuário tinha seu percentual de acerto reduzido. Contudo,

isto não inviabiliza o uso do sistema, pois a idéia básica não é para trabalhar

como visão artificial contínua, e sim como auxílio esporádico para

reconhecimento de ambientes desconhecidos e leitura de letreiros. Assim, o

usuário não usará o sistema mais do que alguns minutos de cada vez.

Na segmentação de padrões para reconhecer letreiros, foi criada uma

nova forma de comparação de reconhecedores de padrão. O cálculo do

índice usado para comparar redes neurais artificiais (e outros aproximadores

de funções) é normalmente o método dos mínimos quadrados, resultando

apenas um percentual de acerto. Como fruto de estudos para este projeto foi

proposta uma nova metodologia para comparação de desempenho, baseada

não apenas no acerto simples, mas corrigindo-se o índice de acertos por

uma média ponderada dos erros, subdivididos em classes segundo sua

dificuldade e/ou conseqüência, e associados pesos a estes erros. Em

resumo, não se escolhe a configuração que tem apenas melhor acerto, mas

também a que erra menos na média ou cujos erros tem menor conseqüência

[RAMALHO,03].

Abre-se um leque de possibilidades para pesquisas serem

continuadas na área, buscando estudar cada detalhe e possível

melhoramento tanto na estimulação quando no equipamento em si e nos

programas de tratamento de imagens e nos de estimulação, conforme

descrito na seção seguinte. Um resumo das configurações atuais e algumas

possíveis melhorias encontram-se listadas na Tabela 12.

128

Tabela 12. Configuração atual e de possíveis alterações futuras Funções Prototipo1 Prototipo2 Opção Captura de imagem Webcam Sensor Sensor CCD ou MOS PROCESS.IMAGEM 1.Simplificação (difusão) 2.Tons de cinza 3.Detectar Borda 4.Binarizar 5.Baixar resolução 6.Segmentar (encontrar letras) 7.OCR

PC (7 ainda não)

8052 (7 ainda não)

FPGA ou 8051 ou 320C55 (8051 é lento para itens 6 e 7)

Envio da imagem para µcontrolador

Serial Nele mesmo Nele mesmo

Endereçar/ativar taxels

8051 8051 8051 MAX na placa de coluna

Flex na PM

Endereçar coluna 7486 7486 7486 MAX Flex na PM Endereçar linha 74573 74373 =x2 MAX Flex na PM Endereço do Slot Bus

comum Bus comum Bus comum Bus comum Slot individual

Chaveamento SSR Ponte+opto Ponte+opto Oscilador Placa ou

µC Só µC Só µC

Ampliação V Trafo+TIP DC-DC (Trafo+TIP) ou (DC-DC +TIP) Flex=família de FPGA mais complexo, da Altera

MAX=família de FPGA mais simples, da Altera

PM = placa-mãe

SSR = relê de estado sólido

No protótipo 2 eliminou-se o PC e da Webcam, trocando-os por um

sensor de imagem C328 com saída serial da Comtech, que usa sensor da

OmniVision. Interfacear o sensor diretamente ao microcontrolador implicou

trabalho, mas permitiu uma real independência do usuário, tornando o

protótipo 2 transportável, apesar de ainda ser grande (tamanho aproximado

de um videocassete), e de suas baterias contribuírem com a maior parte do

peso do sistema. Este peso poderá diminuir à medida que se utilizar

componentes de menor consumo requerendo assim baterias menores.

O fato de melhores resultados terem sido obtidos com o uso do

método de estimulação por taxel individual possibilita ainda diminuir o

número de canais e a complexidade dos circuitos, possibilitando uma maior

miniaturização. Porém, para uso em pesquisas poderia ser mantido o

129

sistema atual, maior e com mais canais, que possibilite a realização de

experimentos do sistema somestésico. Isto resultaria em 2 sistemas a partir

do atual, um mais flexível para pesquisas, e outro mais limitado para

eventualmente chegar ao mercado e às pessoas deficientes visuais que

possam utilizar-se da substituição sensorial.

Existe também a possibilidade e o interesse de alguns pesquisadores

de fonoaudiologia em substituir o canal de entrada, usando microfone em

vez de câmera, para permitir testes de substituição sensorial no auxílio a

deficientes auditivos.

É bom destacar que foram estudadas outras opções de

implementações do processador no lugar do PC. Entre eles destacam-se

hand-helds ou PDAs como o Palm Zyre, que já vem com câmera embutida,

mas seu alto custo implicaria um custo final alto do sistema todo, e placas de

PCs embarcados industriais, padrão PC104, para facilitar a interface e uso

de driver de software padrão, mas que também apresentam custo alto e

performance inferior a processadores DSP.

130

9.1 SUGESTÕES PARA TRABALHOS FUTUROS

Apesar de testes realizados indicarem resultados promissores, a

quantidade de voluntários foi pequena, não se teve pretensão de fazer uma

análise estatística exaustiva, apenas de provar a viabilidade da idéia e

apontar caminhos de estudos futuros.

Existem possíveis melhoras de hardware e software, tanto de

processamento das imagens quanto o de chaveamento de estímulo gerados,

que poderiam agregar novas funcionalidades ou melhorar desempenho do

sistema atual.

9.1.1 Melhorias de Hardware

Podem ser buscadas melhorias de hardware, tentando incrementar

seu desempenho, adicionar novas funcionalidades e minimizar o tamanho

para torná-lo um produto disponível à grande massa de deficientes visuais

do país, usando-se placas multicamadas e dispositivos SMD (montagem de

superfície), mais compactos. Um possível estudo seria implementar toda a

lógica de seleção e distribuição de sinais usando-se trilhas na placa-mãe

individuais para cada placa de estimulação. Uma outra idéia ainda é fazer a

seleção de endereços por protocolo serial I2C, mas isto tornaria o sistema

mais lento.

Vale destacar que a tecnologia do microcontrolador usado, compatível

com 8051, continua a evoluir, existindo alguns modelos de fornecedores

como Atmel e Dallas Semiconductors que tendo desenvolvido melhorias no

seu núcleo de processamento conseguem executar cada instrução em um

único ciclo de máquina, permitindo processamento até 33 vezes mais rápido

que o processador usado no protótipo 1, um Atmel de 12 MHz.

Considerando-se que a latência para reconhecimento de uma imagem é da

ordem de minutos, existe tempo suficiente para realizar o processamento

necessário mesmo usando-se um processador mais lento como um 8051-

compatível.

131

Contudo, se forem adicionadas novas rotinas de processamento tais

como reconhecimento óptico de caracteres, morfologia matemática e síntese

de voz, detalhados na seção de melhorias de software, eles exigiriam muito

mais poder computacional. Provavelmente então seria necessário alterar o

processador para um de maior capacidade computacional, por exemplo um

processador DSP (processamento digital de sinais), tal como o TMS320C55

da Texas instruments. Neste caso, rotinas desenvolvidas em MatLab podem

ser portadas diretamente a ele por meio de toolbox fornecido com o starter

kit da Texas, evitando a recodificação dos algoritmos em outra linguagem.

Outra opção a ser verificada no futuro é usar estimuladores

vibratórios, ou mesmo células Braille como as usadas nos equipamentos da

empresa Freedom Scientific e Pulse Data International.

Além disso, vale a pena estudar a utilização de micro-dispositivos

(MEMS, micro electro-mechanical systems) e outras tecnologias como ligas

de memória de forma (shape memory alloy, SMA) , e atuadores piezo-

elétricos podem ser experimentados.

Novas áreas de estimulação poderiam ser tentadas, como estão

tentando em Madison e Japão, usando micro-eletrodos no dedo, língua e

palato (céu-da-boca) [KACZMAREK,02], [SHINODA,00].

Para viabilizar a construção de sistemas menores, contatos com

professores do PSI (Departamento de Sistemas Eletrônicos da Escola

Politécnica da USP) envolvidos na área de microeletrônica já foram

iniciados, e também com professores da UFMS (Universidade Federal de

Mato Grosso do Sul) que trabalham com micro-fabricação, tendo sido

submetido um projeto ao CNPq.

Para melhorar autonomia das baterias, pela diminuição do consumo e

novos tipos de bateria, como células de combustível seriam interessantes.

Outra idéia é usar um detector de luz para ocasiões em que haja

baixa luminosidade, disparando-se automaticamente um flash ao “bater” a

foto. Ou pelo menos acender um conjunto de leds infravermelhos, afinal

apenas a câmera é que tem que “enxergar” a luz.

132

9.1.2 Melhorias de Software

Conforme mencionado anteriormente, talvez seja possível utilizar

fenômenos de integração para gerar eletrodos virtuais e aumentar a

resolução do sistema. Os programas de chaveamento dos estímulos

gerados entre os eletrodos podem ser alterados para serem realizados

testes de integração, ajustando-se a seqüência de eletrodos e temporização

de estímulos destes eletrodos de maneira a acionar dois eletrodos vizinhos

para que o usuário possa perceber uma sensação entre os dois. Ou seja,

provavelmente seriam acionados dois receptores nervosos próximos

fazendo-se com que seja interpretada pelo cérebro como se existisse um

receptor extra entre os dois, melhorando em muito a resolução,

aumentando-a de 15x20 para 29x39, ou indo de 300 eletrodos reais para

1131 eletrodos, entre reais e “virtuais”.

Dentre os possíveis efeitos de software que podem ser

implementados estão a melhoria da segmentação de letreiros, talvez incluir

reconhecimento de caracteres e síntese de voz (ou desenhando caracteres

Braille), que agilizasse a leitura de letreiros e sinais, reconhecimento hoje

tendo de ser feito pelo próprio usuário a partir da estimulação destes

letreiros em sua pele. Mas são necessárias técnicas de reconhecimento de

padrões para reconhecer caracteres, requerendo um poder computacional

muito maior, talvez exigindo processadores do tipo DSP, de 400 MIPS ou

mais.

Para compensar a pequena resolução, poderia ser adicionado um

botão de zoom in e out, aproximação ou afastamento da imagem, permitindo

que se use o sistema como se fosse uma lupa sobre uma imagem, focando

em áreas de interesse para aumentar os detalhes da imagem. Seria

suficiente não reduzir a resolução da imagem, parando em uma etapa

anterior. Poderia ser criada uma rotina de scroll (deslizamento da tela) sobre

a pequena janela feita pela matriz de eletrodos.

No processamento de imagem, foram implementadas rotinas de

simplificação usando difusão anisotrópica por espaço de escala, e no futuro

poderão ser tentados métodos baseados em morfologia matemática.

133

Como já mencionado anteriormente, para cegos-surdos talvez seja

mais prático usar programas de reconhecimento óptico de caracteres (OCR,

optical character recognition) e convertendo-os para caracteres Braille. Mas

para pessoas apenas com deficiência visual, poderiam ser implementados

algoritmos de síntese de voz no processador DSP para que possa

efetivamente ler em voz alta os letreiros e sinais. O hardware adicional seria

mínimo, apenas um conversor D/A, filtro analógico e alto-falante. O algoritmo

contudo seria bem complexo, pois envolveria OCR, síntese de voz,

entonação, conexão das palavras e problemas semelhantes, com alta

exigência computacional, requerendo processadores de alto desempenho,

tipo DSP (digital signal processing).

Melhores técnicas de detecção de bordas e de simplificação de

imagem podem ser estudadas, usando além das propostas anteriormente,

técnicas com wavelets, b-splines e linearização dos segmentos das bordas,

por exemplo.

Para fornecer ao usuário a idéia de tons de cinza, algoritmos

semelhantes às técnicas de half-toning usadas em impressoras laser

poderiam ser testados.

Pode-se pensar em tentar informar cor por meio de diferentes

intensidades ou até mesmo usando algum atuador de temperatura para cada

cor.

Para melhorar o reconhecimento das imagens, poderia ser tentado

um sistema ajustado a cada usuário, em que ele poderia treinar o sistema

mostrando qual sua técnica de escrever letras ou desenhar, de maneira que

se dependa mais do usuário para se relacionar com o equipamento, caso o

sistema consiga desenhar da mesma maneira que ele. Isto requer técnicas

adaptativas, que demandam muito poder computacional, e deve ser adiado

para um futuro mais distante, após os demais testes e idéias mencionados.

Um melhoramento a ser feito seria na velocidade de reconhecimento,

não apenas pelo treinamento, mas realizar e acompanhar novos estudos de

resposta da pele a diferentes formas de estimulação elétrica. Eventualmente

poderia ser criado mais de uma matriz de eletrodo posicionadas sobre a

134

pele, talvez 3 ou 4 no abdome, e imagens sucessivas serem transferidas de

uma a outra, para dar a sensação de movimento.

Uma outra idéia levantada foi criar um sistema de reconhecimento

baseado em um banco de imagens e síntese de voz para dizer ao paciente a

forma e localização do objeto, o que poderia eventualmente deixar o tempo

de resposta mais curto. Isto poderia envolver técnicas adaptativas para este

banco ir sendo melhorado com o transcorrer do tempo. No projeto atual a

idéia foi abandonada para limitar a complexidade do circuito, e na crença de

que as redes neurais naturais do usuário fariam um trabalho de

reconhecimento mais bem feito, pelo menos em um primeiro instante.

Poderia ser tentado novamente adaptar uma câmera no dedo e

adaptar os programas de OCR para poder ler textos normais. Para revistas

com fonte pequena seria necessário desenvolver um programa de zoom

eficiente.

De qualquer modo, o equipamento como está já pode ser usado com

sucesso por pesquisadores de psicologia experimental em estudos de

cognição e aprendizagem.

9.1.3 Possíveis testes futuros

Para melhorar o conforto da estimulação elétrica cutânea, alguns

autores indicam que seria possível usar uma envoltória para aumentar

gradativamente o trem de pulsos até a amplitude máxima desejada, e depois

cair novamente gradativamente. No futuro poderia ser feita uma alteração na

geração dos estímulos para testar esta possibilidade [NOHAMA97],

[CASTRO,00].

De acordo com Nohama [97] baseando-se em fenômenos estudados

por Geldard [75] e outros autores, seria possível utilizar fenômenos de

integração, descritos anteriormente no capítulo de estimulação tactil e

fisiologia da pele, para tentar gerar eletrodos virtuais e aumentar a resolução

do sistema. A idéia é adequar os programas de distribuição do estímulo

gerado, permitindo acionar dois eletrodos vizinhos de maneira a fazer o

usuário perceber uma sensação entre os dois, ou seja, provavelmente

seriam acionados dois receptores nervosos próximos fazendo-se com que

135

seja interpretada pelo cérebro como se existisse um receptor extra entre os

dois. Isto poderia melhorar em muito a resolução, aumentando-a de 15x20

para 29x39, ou indo de 300 eletrodos reais para 1131 eletrodos, entre reais

e “virtuais”. Assim, testes também poderão ser feitos no futuro para checar

esta possibilidade.

Usando-se fMRI (functional magnetic ressonance imaging), ou

imagem de ressonância magnética funcional, Calvert [97] observou que

deficientes auditivos ao realizarem leitura labial tinham seu córtex auditivo

estimulado, da mesma maneira que ocorre quando uma pessoa comum

utiliza sua audição normal. Além disso, em estudos de substituição sensorial

feitos na Universidade de Heildelberg, em imagens enviadas à pele de

usuários por meio de estimuladores mecânicos, foram observadas também

imagens da ativação do córtex visual usando-se fMRI [STOLLE,01],

[MAUCHER,00], [MAUCHER,01].

Portanto, existe a expectativa de que possa ocorrer o mesmo para o

córtex visual ao usar o sistema aqui descrito, com o córtex sendo cada vez

mais ativado à medida que o treinamento for sendo realizado. Para isso

seria ideal usar imagens por ressonância magnética antes, após cada etapa

de treinamento e ao final dele. Contudo, fMRI requer um campo magnético

intenso para obter as imagens, e o equipamento utiliza metal em seus

eletrodos e cabos, isso sem mencionar os próprios componentes do

equipamento e suas baterias. Isto inviabiliza atualmente a tentativa de fazer

estas medições. Além disso, o campo magnético intenso poderia também

interferir nos estímulos, podendo inviabilizar a estimulação táctil.

No futuro, se forem usados estimuladores mecânicos em vez de

elétricos, seria possível realizar tais medições, desde que não tenham

metais, isto é, sejam do tipo pneumático e não micro-motores ou atuadores

piezoelétricos.

Uma alternativa para usar o equipamento atual seria utilizar-se EEG

para medir a atividade do córtex visual antes e depois do treinamento para

verificar sua possível ativação durante a aplicação de estímulos tácteis com

o equipamento.

136

LLIISSTTAA DDEE RREEFFEERRÊÊNNCCIIAASS

ABNT. NBR IEC 601-1 Equipamento eletromédico – Prescrições gerais para segurança. Associação Brasileira de Normas Técnicas. São Paulo: 1997.

ABNT. NBR 6533 Estabelecimento de segurança aos efeitos da corrente elétrica percorrendo o corpo humano. Associação Brasileira de Normas Técnicas. São Paulo: 1981.

AGARWAL, A.K.; NAMMI K.; KACZMAREK, K. A.; TYLER, M.E.; BEEBE, D.J. A hybrid natural/artificial electrostatic actuator for tactile stimulation In: 2nd Annu. Int. IEEE Eng. Med. Biol. Soc. Special Topic Conf. on Microtech. Med. & Biol., p.341, 2002.

ALVES, R.L.et al. Uma alternativa mais acessível para transdutores táteis. IV Congresso Iberoamericano de Tecnologias para Discapacitados, Vitória,ES., 2006.

AMIRALIAN, M.L.T.M. A reorganização perceptiva dos deficientes visuais e sua implicação na aprendizagem. Caderno de didática num.6, Educação especial, depto de metodologia do ensino e educação comparada da Faculdade de Educação da USP. 1985.

ANDERSON, G.B.; ROGERS, D.W. An inexpensive Braille terminal device COMMUNICATIONS OF THE ACM, vol. 11, n.6, p.417, 1968.

ANTONINO, P.H.D. “Estudo preliminar para o desenvolvimento de um sistema de visão através da sensação tátil, utilizando estimulação eletrocutânea” Tese de Mestrado, UNICAMP, 1993.

ASAMURA, N. YOKOYAMA, N, SHINODA, H. Selectively Stimulating Skin Receptors for Tactile Display IEEE Computer Graphics and Applications Nov/Dec, 1998.

BACH-Y-RITA, P.; COLLINS, C.C.; SAUNDERS, F.A.; WHITE, B; SCADDES, L. Vision substitution by tactile image projection, NATURE , vol. 221 p.963, 1969.

BACH-Y-RITA, P. “Neurophysiological Basis of a Tactile Vision-Substitution System”, IEEE Transactions on Man-Machine System, MMS-11,(1):108-110, March, 1970.

BACH-Y-RITA, P. Brain Mechanisms in Sensory Substitution. New York: Academic Press, 1972.

BACH-Y-RITA, P. Nonsynaptic Diffusion Neurotransmission and Late Brain Reorganization. New York: Demos. 1995.

BACH-Y-RITA, P.; KACZMAREK, K. A.; TYLER, M.E.; GARCIA-LARA, M. Form perception with a 49-point electrotactile stimulus array on the tongue: A technical note; J. Rehab. Res. Dev. , vol. 35, p.427, 1998.

137

BANON, G.J.F., BARREIRA, J. Bases da Morfologia Matemática para a Análise de Imagens Binárias. Recife: UFPE-DI, 1994.

BARRAGA, N. e HOLLIS, J. 0 Development of efficiency in visual functionings: A literature Analysis. Journal of visual impairment and Blindness, 1977, 71, 387-391.

BEAR, M.F.;CONNORS, B.W.; PARADISO, M.A. Neurociências - desvendando o sistema nervoso Porto Alegre: Artmed. 2002.

BEEBE, D.J.; HYMEL, C.M.; KACZMAREK, K. A.; TYLER, M. E. A polyimide-on-silicon electrostatic fingertip tactile display IEEE-EMCB and CMBEC Theme 7: Instrumentation, p.1545, 1995.

BLACK,J.B.; SAPIRO,G.; MARIMONT,D.H.; HEEGER,D. Rrobust anisotropic diffusion. IEEE Transactions on Image Processing. p.421, No3. Mar.1998.

BLAZIE Engineering. Product Catalog. Fall 1995.

BRABYN, J.A. New developments in mobility and orientation aids for the blind, IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, vol. BME-29, NO. 4, p.285, 1982.

BROESCH, J. Digital signal processing desmistified. Eagle Rock, VI: J. HighText Publications (LLH).1997.

BURDEA, G.C. Force and Touch Feedback for Virtual Reality. New York: John Wiley & Sons, Inc., 1996.

CALVERT, G.A.; BULLMORE, E.T., BRAMMER, M.J., CAMPBELL, R.;WILLIAMS, S.C.R.; McGUIRE, P.K., WOOODRUFF, P.W.R; IVERSEN, S.D.; DAVID, A.S. Activation of Auditory Cortex During Silent Lipreading Science. V.276, N. 5312, p.593-596. Abril 1997.

CARVALHO, A.A.; REBELLO, J.M.A.; VIANA, A.F. O Mundo das Imagens Digitais. Matéria, Vol 8, Nº 2 p.167, 2003. <http://www.materia.coppe.ufrj.br/sarra/artigos/artigo10297> Acesso em 15 Nov. 2005.

CASEY, R.; LECOLINET, E. A Survey Of Methods And Strategies In Character Segmentation. IEEE TRANSACTIONS IN PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol.18, No.7, p.690, Jul. 1996.

CASTRO, M.C.F. Desenvolvimento e aplicação de uma sistema para reabilitação sensoriomotora de membros usperiores paralisados. Tese de doutorado. Unicamp. 2000.

CHOW, A.Y. et al “Implantation of silicon chip microphotodiode arrays into the cat subretinal space”. IEEE Transactions on Rehabilitation Engineering, Vol. 9 No 1, p.86. Março 2001.

CLARK, L.L. International Guide to Aids and Appliances for Blind and Visually Imapired Persons. American Foundation For The Blind, New York, 1977.

138

CONDE, A.J.M. Definindo a Cegueira e a Deficiência Visual. Instituto Benjamin Constant. Disponível em: <http://www.cesec.org.br/deficiência/cegueira.htm> Acesso em 10 mar. 2002.

CONSULARO, L.A., COELHO, R.C. Visão Natural e Artificial. Escola de Informática da SBC Sul. Passo Fundo, RS: 2001.

DE SOUZA, F.P.C. Localização e Leitura Automática de Caracteres Alfanuméricos – Uma Aplicação na Identificação de Veículos. Dissertação de Mestrado, Universidade Federal do Rio Grande do Sul, RS, 2000.

COOK, D. Robot building for beginners. New York: Apress, 2002.

DAY, R.H. - Psicologia da Percepção, São Paulo: Livraria José Olympio - EDUSP, 1969.

DIETTERICH, T.G. Approximate Statistical Tests for Comparing Supervised Classification Learning Algorithms. - Neural Computation, Department of Computer Science, Oregon State University, EUA. 1997 ftp://ftp.cs.orst.edu/pub/tgd/papers/nc-stats.ps.gz Acesso em 15 out. 2002.

DIETTERICH, T.G. Experimental Methodology for Benchmarking – Department of Computer Science, Oregon State University, EUA. 2000 <http://wwwipd.ira.uka.de/~prechelt/nipsbench/expmeth.ps.gz> Acesso em 15 out. 2002.

DINIZ, S.S. Uso de Técnicas Neurais para o Reconhecimento de Comandos à Voz Dissertação de Mestrado em Engenharia Elétrica - Rio de Janeiro: Instituto Militar de Engenharia, Julho/1997.

DOBELLE, W.H. "Artificial Vision for the Blind by Connecting a Television Camera to the Brain" American Society of Artificial Internal Organs (ASAIO) Journal. Vol.46. p.3-9. 2000.

EMILIANI, P.L. Development of Electronic Aids for the Visually Impaired. Dordrecht: Martinus Nijhoff / Dr W.Junk Publishers, 1986.

FELIPPE, J.A.M. Caminhando juntos: manual das habilidades básicas de orientação e mobilidade. São Paulo: Laramara - Associação Brasileira de Assistência ao Deficiente Visual, 2001.

FELIPPE, J.A.M.; FELIPE, V.L.R. Orientação e Mobilidade São Paulo: Laramara - Associação Brasileira de Assistência ao Deficiente Visual, 1997.

FERREIRA, V.T. IBGE Censo 2000: mudam os índices oficiais da deficiência. Revista Sentidos. Vol.1 nº6. p.22-26. Junho,2002.

FLEXER, A. Statistical Evaluation of Neural Network Experiments: Minimum Requirements and Current Practice. The Austrian Research Institute For Artificial Intelligence – Vienna, Austria. 1996. ftp://ftp.ai.univie.ac.at/papers/oefai-tr-95-16.ps.gz

139

FRAIBERG, S. Insights from the blind, New York: Basic Books, Inc. Publishers, 1977.

GATES ENERGY PRODUCTS, Technical Staff. Rechargeable batteries: application handbook. Stonehgam,MA: Butterwoth-Heinamann/EDN, 1992.

GEDDES, L.A. Medical device accidents and illustrative cases. Tucson,AZ: Lawyers&Judges Publ.Co. 2002.

GELDARD, F.A Sensory saltation: matastability in the perceptual word. Hilsdale: Lawrence Erlbaum Associates Pub., 1975.

GOLDBERG, S. Descomplicando a Fisiologia. Porto Alegre: Artes Médicas, 1997.

GONZALEZ, R.C.; TOU, J.T. Pattern Recognition Principles. Reading, MA: Addison Wesley, 1981.

GONZALEZ, R.C.; WINTZ,P. Digital Image Processing. 2ed. Reading, MA: Addison Wesley, 1987.

GONZALEZ, R.C.; WOODS, R.E. Digital Image Processing. 3ed. Reading, MA: Addison Wesley, 1992.

GUEDES, L.A. Handbook of Electrical Hazards and accidents. Boca Raton: CRC, 1995.

KOLB, H, FERNÁNDEZ, E., NELSON, R., Webvision – the Organization of the Retina and Visual System <http://webvision.med.utah.edu/> Acesso em 13 setembro 2004.

HAYKIN, S. Redes Neurais, princípios e prática. Porto Alegre: Bookman, 2002.

HELLER, M.A.; SCHIFF,W. The psychology of touch. Hillsdale: Lawrence Erlbaun Associates, 1991.

HUBEL, Eye, Brain and Vision, Scientific American Library, New York 1995. apud: CONSULARO, L.A., COELHO, R.C. Visão Natural e Artificial, Escola de Informática da SBC Sul. Passo Fundo, RS: 2001.

IOVINE, J. Robots, Androids and animatronics. 2 ed. New York: MCGrawHill, 2002.

JOLION, J.M. e ROSENFELD, A. A Pyramid framework for early vision, Kluwer Academic Publ. Dordrecht:1994.

JONES, J.L.; FLYNN, A.M.; SEIGER, B.A. Mobile Robots. 2 ed. 1999

KACZMAREK, K. A. Electrotactile adaption on the abdomen: Preliminary results IEEE TRANS. REHAB. ENG. vol. 8 , p.499, 2000.

KACZMAREK, K. A.; KRAMER, K.M.; WEBSTER, J.G. ; RADWIN R.G. A 16-channel 8-parameter waveform electrotactile stimulation system IEEE TRANS. BIOMED. ENG. vol 38 p.933, 1991.

140

KACZMAREK, K. A.; WEBSTER, J.G. ; RADWIN R.G. Maximal dynamic range electrotactile stimulation waveforms IEEE TRANS. BIOMED. ENG. vol. 39 , p.701, 1992.

KACZMAREK, K. A.; WEBSTER, J.G. ;BACH-Y-RITA, P. ; TOMPKINS, W.J. Electrotactile and vibrotactile dsiplays for sensory substitution systems IEEE TRANS. BIOMED. ENG. vol 38 p.1, 1991.

KACZMAREK, K. A.; BACH-Y-RITA, P. Tactile displays In: BARNFIELD, W. ; FURNESS, T. Virtual environments and advanced New York ; Oxford Univeersity Press p.349, 1995.

KACZMAREK, K. A.; BACH-Y-RITA, P. ; TOMPKINS, W.J.; WEBSTER, J.G. A time-division multiplexed tactile vision substitution system IEEE ENG. MED. BIOL. SOC. p.101, 1984.

KACZMAREK, K. A.; BACH-Y-RITA, P. ; TOMPKINS, W.J.; WEBSTER, J.G. A tactile vision substitution system for the blind IEEE TRANS. BIOMED. ENG. vol BME-32 p.602, 1985.

KACZMAREK, K. A.; HAASE, S.J. Pattern identification and perceived stimulus quality as a function of stimulation waveform on a fingertip-scanned electrotactile display In: IEEE Trans. Neural Sys. Rehab. Eng. 11, p.9, 2003.

KACZMAREK, K. A.; HAASE, S.J. Pattern identification as a function of stimulation current on a fingertip-scanned electrotactile display In: IEEE Trans. Neural Sys. Rehab. Eng. 11, p.269, 2003.

KACZMAREK, K. A.; TYLER, M.E.; BACH-Y-RITA, P. Eletrotactile haptic display on the fingertips: Preliminary results In: Proc. 16th Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Baltimore. p.940, 1994.

KACZMAREK, K. A.; TYLER, M.E.; BACH-Y-RITA, P. Pattern identification on a fingertip-scanned electrotactile display In: Proc. 19th Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Chicago p.1694, 1997.

KACZMAREK, K. A.; TYLER, M.E.; BRISBEN, A.; JOHNSON, K.O. The afferent neural response to electrotactile stimuli: Preliminary results IEEE TRANS. REHAB. ENG. vol. 8 , p.268, 2000.

KACZMAREK, K. A.; WEBSTER, J.G. ; RADWIN, R.G. Periodic variations in the electrotactile sensation In: Proc. Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Philadelphia. p.1060, 1990.

KACZMAREK, K. A.; WEBSTER, J.G. Voltage-current characteristics of the electrotactile skin electrode interface In: Proc. Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Seattle. p.1526, 1989.

KACZMAREK, K.A.; WEBSTER, J.G.; BACH-Y-RITA, P.; TOMPKINS, W.J. “Electrotactile and Vibrotactile Display for Sensory Substitution Systems Neurophysiological Basis of a Tactile Vision-Substitution System”, IEEE Transactions on Biomedical Engineering, BME-38, (1): 1-16, January, 1991.

141

KANDEL, E.R.; SCHWARTZ, J.H. Principles of Neural Science. 4ed. New York: Prentice Hall, 1991.

KARA-JOSE, N. (Eds.) Auxiliar de Oftalmologia. São Paulo: Roca. 2000.

KAY, L. Auditory perception of objects by blind persons, using a bioacoustic high resolution air sonar. JASA 107, p.3266-3285. June 2000.

KETELAARS, N. Automated LicensePlate Recognition. AIMe Magazine p.9. Jan. 2002.

KIM, H.Y. Notas de aula de PEE5796 - Algoritmos para Processamento, Análise e Síntese de Imagens. São Paulo. EPUSP, 2001.

KINDERMANN, G. Choque elétrico. Porto Alegre: Sagra Luzzatto, 2000.

KOO, I. Wearable Tactile Display and Braille Display. Intelligen Robotic and Mechatronic System Lab, Sung Kyun Kwan University. http://mecha.skku.ac.kr/researchset.htm Acessado em 25 fev 2005.

LE CUN, Y. Página pessoal <http://yann.lecun.com/exdb/mnist/index.html> Acesso em 15 out. 2002.

LENAY, C., et al La Substitution Sensorielle: Limites Et Perspectives Université de Technologie de Compiègne, COSTECH - BIM, 2000.

LINDENBERG, T. Scale-Space Theory in Computer Vision. New York: Kluwer Academic Publishers, 1997.

LOOSE, M. A Tactile Vision Substitution System in: Handbook of Computer Vision and Applications, Vol.3 (Systems and Applications). B. Jähne, (Ed). Boston: Academic Press, 1999.

LOWENFELD, B. Psychology Problems of Children With Impaired vision. In Cruicckshanch, W.M. - Psychology of Exceptional Children and Youth. New York: Prentice Hall, 1971.

MARANTES, C.R. Medida da Acuidade Visual cap.13 In: OLIVEIRA, R.C.S.; Kara-Jose, N. (Eds.) Auxiliar de Oftalmologia. São Paulo: Roca. 2000.

MARR, D. Vision: A Computational Investigation into the Human Representation and Processing of Visual Information. New York: W.H.Freeman and Co, 1982.

MARVEN, C.; EWERS, G. A simple approach to digital signal processing. New York: Wiley Interscience. 1996.

MAUCHER, T., MEIER, K., SCHEMMEL, J. An Interactive Tactile Graphics Display Sixth International Symposium on Signal Processing and its Applications ISSPA 2001.

MAUCHER, T., SCHEMMEL, J., MEIER, K. The Heidelberg Tactile Vision Substitution System Proceeding of the 7th International Conference on "Computer Helping People with Special Needs", (ICCHP 2000).

142

MAUCHER, T., SCHEMMEL, J., MEIER, K. The Heidelberg Tactile Vision Substitution System Proceeding of the sixth International Conference on Tactile Aids, Hearing Aids and Cochlear Implants (ISAC2000).

MAYNARD, E.M. Visual Prosthesis. p.141-168. In: YARMUSH, M.L.; DILLER, K.R.; TONER, M. Ed. Annual Review of Biomedical Engineering, vol.3. Palo Alto, CA: Annual Reviews, 2001.

MAYNARD, E.M.; Annual Review of Biomedical Engineering, vol.3. Palo Alto, CA: Annual Reviews, 2001.

MEIJER, P.B.L. An Experimental System for Auditory Image Representations. IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, vol. BME-39, NO.2, p.112, 1992

MELEN, R.D.; MEINDL J.D. Electrocutaneous stimulation in a reading aid for the blind, IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, vol. BME-18, NO.14, p.1, 1971.

MELO, M.A.A.; KIM,H.Y. Filtragem de sinais do acelerometro pela difusao anisotropica, SIBGRAPI 2004.

MICROVISION página da empresa, com informações sobre projetores e displays usáveis. <http://www.microvision.com/> Acesso em 20 março, 2005.

MYKLEBUST, H.R. - The psychology of deafness. New York: Grune & Stratton, 2nd edition, 1966. apud. AMIRALIAN, M.L.T.M. A reorganização perceptiva dos deficientes visuais e sua implicação na aprendizagem. Caderno de didática num.6, Educação especial, depto de metodologia do ensino e educação comparada da Faculdade de Educação da USP. 1985.

MORI, S. SUEN,C.Y. YAMAMOTO, K. Historical review of OCR Research and Development. PROCEEDINGS OF THE IEEE, vol.80, No7, p.1029, Jul. 1992.

NOHAMA, P. “Investigação em Propriocepção Artificial” Tese de Doutorado, UNICAMP, 1997.

NURION Pagina da empresa Nurion-Raycal Inc, fabricante da Laser Cane e Polaron. http://www.nurion.net/Acessado em 10 de janeiro de 2006.

OLIVEIRA, R.C.S.; KARA-JOSE, N. Anatomia e Fisiologia do Globo Ocular cap.3 In: OLIVEIRA, R.C.S.; KARA-JOSE, N. (Eds.) Auxiliar de Oftalmologia. São Paulo: Roca. 2000.

ONCE Catálogo de Material Tiflotécnico. Organizacion Nacional de Ciegos de España. Madrid, 2000.

OSTROM, N.P.; KACZMAREK, K. A.; BEEBE, D.J. A microfabricated electrocutaneous tactile display In: Proc. 21th Annu. Int Conf. IEEE Eng. Med. Biol. Soc., Atlanta p.838, 1999.

143

PALMA, D.M.C. Extração Automática de Texto em Seqüências de Vídeo. Dissertação de Mestrado, Universidade Técnica de Lisboa. Lisboa, 2004.

PALMER, S.E. Vision Science: photons to phenomology Bradford-MIT Press, Cambridge, MA: 1999

PARKER, J.R. Algorithms for image processing and computer vision. New York: Wiley, 1997.

PASQUERO, J., HAYWARD, V., STReSS: A Practical Tactile Display System with One Millimeter Spatial Resolution and 700 Hz Refresh Rate, Proc. Eurohaptics 2003, Dublin, Ireland, July 2003.

PAVLIDS, T. Algorithms for Graphics and Image Processing, Springer Verlag, Berlin: 1982

PEREIRA, M.C., CLIQUET Jr, A., KASSAB Jr, F. Substituição Sensorial para Auxílio à Mobilidade de Deficientes Visuais via Eletroestimulação Táctil. III Congresso Iberoamericano de Tecnologias para Discapacitados, Costa Rica, 2004.

PEREIRA, M.C., CUNHA,F.L.; CLIQUET Jr, A., KASSAB Jr, F. Estudo comparativo dos meios de alimentação de uma prótese multifunção para membros superiores. III Congresso Iberoamericano de Tecnologias para Discapacitados, Costa Rica, 2004.

PEREIRA, M.C., CLIQUET Jr, A., KASSAB Jr, F. Eletroestimulador para uso em substituição sensorial. IV Congresso Iberoamericano de Tecnologias para Discapacitados, Vitória,ES., 2006.

PEREIRA, M.C., Processo e equipamento para experimentos somestésicos e para substituição sensorial para auxílio a deficeintes via técnicas de processamento digital de sinais e estimulação cutânea. Pedido de privilégio de patente de invenção nº PI 0600724-4, protocolado em 16/02/2006 sob o nº0075 junto ao INPI – Instituto Nacional de Propriedade Industrial.

PEREIRA, M.C., KASSAB, Jr. F. An Electrical stimulator for Sensory Substitution, aceito no 28th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, EMBC2006, a reazlizar-se de 30agosto a 3 de setembro de 2006, New York, NY.

PERONA,P.; MALIK, J. Scale space and Edge Detection using Anisotropic diffusion. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol.12, No.7, p.629, Jul.1990.

PRECHELT, L. Proben 1 A set of Neural Network benchmark problems and benchmark rules Fakultat für Informatik von Karlsuhe, Alemanha. 1994. <http://www.poli.usp.br/d/pmr5406/Download/Metodologia/proben.ps> Acesso em 20 out. 2002.

144

PULSE DATA INT. Ltda KOO, I. Braille Displays. Pulse Data Internat. Ltd. <http://www.humanware.com/Products/Braille_Display/Braille_Display_index.asp> Acessado em 25 fev 2005.

PUN, T. Segmentation of images for scene simplification IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING, vol. BME- 29, No.4, p.293, 1982.

RAMALHO, J.P.; ISSA, F.M.R., PEREIRA, M.C., et al. Uma proposta para comparação de performance entre redes neurais artificiais. 6º SBAI. Bauru: Unesp. 2003.

RESOURCES FOR REHABILITATION. Vision, Rehabilitation Resource Manual Lexington, MAC Resources for Rehabilitation, 1993.

ROSSI, H.P., CASTRO, M.C.F. Interface De Comunicação Para Deficientes pôster no IV Congresso Iberoamericano de Tecnologias para Discapacitados, Vitória,ES., 2006.

RUSS, J.C. The Image Processing Handbook. Boca Raton: CRC Press, 4ed. 2002.

SALEM, A.-B. M., SEWISY, A. A., AND ELYAN, U. A. A vertex chain code approach for image recognition. ICGST International Journal on Graphics, Vision and Image Processing, 2005.

SAMPAIO, E.; MARIS, S.; BACH-Y-RITA, P. Brain plasticity: 'visual' acuity of blind persons via the tongue BRAIN RESEARCH, n.908, p.204, 2001.

SAMPAIO, M.W.; CIBILS, C.A. Visão subnormal. cap.26 In: OLIVEIRA, R.C.S.; Kara-Jose, N. (Eds.) Auxiliar de Oftalmologia. São Paulo: Roca. 2000.

SAUNDERS, I.R. Tactile aids for the hearing impaired. Londres: Whurr, 1992.

SCHEMMEL, J., LOOSE, K., MEIER, K. A 66 x 66 pixels analog edge detection array with digital readout Proceedings of the 25th European Solid-State Circuits Conference, 1999.

SCHIFF, W.; FOULKE,E.Tactual Perception: a sourcebook . Cambridge: Cambridge University Press, 1982.

LEUTWYLER, K. Hope for Restoring Sight. Scientific American, 27 de setembro de 2000.

SHIRAI, A.; SATO, M.; KUME, Y.; KUSAHRA, M. Fantastic Phantom Slipper. Tokyo Institute of Polytechnics, Faculty of Engineering. <http://laplace.photo.t-kougei.ac.jp/slipper/slipper-E.html> Acessado em 25 set. 2003.

SILVA, E.; OLIVEIRA, A.C. Dicas para a configuração de Redes Neurais. Rio de Janeiro. Outubro 2001. <http://www.nce.ufrj.br/labic/downloads/dicas_cfg_rna.pdf> Acesso em 15 out. 2002.

145

STOLLE, A. et al. Functional mapping of the somatosensory cortex with a new pneumatically driven tactile display matrix Human Brain Mapping HBM2001.

SZETO, A.Y.J.; LYMAN, J. Comparison of Codes for sensory feedback using electrocutaneous tracking. Annals of Biomedical Engineering. Vol.5 p.367-383. 1977. apud: NOHAMA, P. Investigação em Propriocepção Artificial. Tese de Doutorado, UNICAMP, 1997.

SZETO, A.Y.J., RISO, R.R., Sensory Feedback using Electrical Stimulation of the Tactile Sense. In Rehabilitation Engineering, R.V. Smith and J.H. Leslie, Jr. (eds), p.28-78. CRC Press, 1990.

SZETO, A.Y.J.; SAUNDERS, F.A., Electrocutaneous stimulation for sensory communication in rehabilitation engineering. IEEE Transactions on Biomedical Engineering, vol. BME-29, p.300., Abr. 1982.

SOLOMONOW, M. PRADOS, D. Further evidence on learning in the tactile sense. AIEE Frontiers of Engineering and Computing in Health Care, pp.39-42. 1982.apud NOHAMA, P. Investigação em Propriocepção Artificial. Tese de Doutorado, UNICAMP, 1997.

SOLOMONOW, M. LYMAN, J. FREEDY, A. Electrotactile two point discrimination as a function of frequency, body site, laterality, and stimulation codes. Annals of Biomedical Engineering, vol.5 m.1, pp.47-60. 1977.apud NOHAMA, P. Investigação em Propriocepção Artificial. Tese de Doutorado, UNICAMP, 1997.

TALAN, J. Scientists trigger visual perceptions in blind. The Seattle Times. 4 de Janeiro de 2000.

TANG,H., BEEBE, D.J. “An ultra-flexible electrotactile display for the roof of the mouth” Proceedings of the First Joint BMES/EMBS Conference Advanced Technology Serving Humanity, Oct.13-16, 1999, Atlanta, GA, USA.

TEXAS INSTRUMENTS. Curso de Introdução a sistemas digitais de vídeo. São Paulo, Texas Instruments, 2003.

TIRESIAS. Personal Electronic Mobility devices. <http://www.tiresias.org/equipment> Acesso em 30 mar. 2003.

TYLER, M.; HAASE, S.; KACZMAREK, K. ;BACH-Y-RITA, P. Development of an electrotactile glove for display of graphics for the blind: Preliminary results In: 2nd Joint Conf. IEEE EMBS and Biomed. Eng. Soc., p.2439, 2002.

UMBAUGH, S.E. Computer Vision and Image Processing: A Practical Approach using CVIP Tools. New York: Prentice Hall, 1997.

VASCONCELOS, C.A.D.; PEREIRA, T.C. Implementação de um módulo localizador de placas em imagens digitalizadas de veículos. Monografia de Graduação em Engenharia de Computação. Campo Grande,MS: UCDB, 2001.

146

WANDELL, B.A.Foundations of Vision. Sundereland, MA: Sinauer Associates, Inc. 1995.

WANET-DEFALQUE, M.C.; VERAART,C.; DEVOLDER, A.; METZ,R.; MICHEL, C.; DOOMS, G.; GOFFINET,A. High metabolic activity in the visual cortex of early blind human subjects. Brain Research, 446, p.368-373. 1988. apud. BACH-Y-RITA, P. Nonsynaptic Diffusion Neurotransmission and Late Brain Reorganization. New York: Demos. 1995.

WAY, T.P.; BARNER, K.E. Automatic visual to tactile translation - Part I: Human factors, acess methods, and image manipulation, IEEE TRANSACTIONS ON REHABILITATION ENGINEERING, vol. 5, NO.1, p.81-94, 1997.

WAY, T.P.; BARNER, K.E. Automatic visual to tactile translation - Part II: Evaluation of the TACTile image creation system, IEEE TRANSACTIONS ON REHABILITATION ENGINEERING, vol. 5, NO.1, p.95-104, 1997.

WEBSTER, John J., et al., Medical Instrumentation: Application and Design. New York: John Wiley, 1998

WHO. Oragnização Mundial da Saúde. Blindness: Major causes worldwide. <http://www.who.int/health_topics/blindness/en/> Acesso em 10 jul. 2003.

WICAB Inc. Sistema Brain Port de Susbstituicao Sensorial<http://www.wicab.com> Acessado em 20 abril de 2006.

WISE, E. Applied Robotics. Indianapolis, IN: Promp Publications/SAMS, 1999.

YARMUSH, M.L.; DILLER, K.R.; TONER, M. Ed. Annual Review of Biomedical Engineering, vol.3. Palo Alto, CA: Annual Reviews, 2001.

147

AAPPÊÊNNDDIICCEESS

148

A1. FORMULÁRIOS DE TESTES

Usuário: Sexo: Idade:

Horário: início: termino: total descontadas as pausas: Vidente [ ] cego congênito [ ] cego adquirido [ ]. Acuidade visual: Causa: Orientador do teste:

1.Teste preliminar:

Espaçamento de eletrodos min [ ]. max [ ]. Tamanho de eltrodos min [ ]. max [ ].

Largura do pulso min [ ]. max [ ]. Quantidade de pulsos na rajada min [ ]. max [ ].

Intervalo entre rajadas Nível DC Nulo [ ]. Não nulo [ ].

Descrição da sensação:________________________________________________________________ ________________________________________________________________________

Desenho da figura Carimbo [ ]. Coluna mantendo [ ]. Coluna apagando [ ]. Ponto a ponto [ ].

Criou Eletrodo virtual Sim [ ]. Não [ ]. Intensidade dos pulsos Envoltória[ ]. Constante [ ].

Comentários:______________________________________________________________ _________________________________________________________________________ Teste de ajuste de eletrodos: resolução horizontal e vertical # # # # # # # # _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

# # # # # # # # # _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ # _ _ _ _

# # # # # # # # # # # # # # # # _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ _ _ _ _

149

Usuário: Sexo: Idade:

Horário: início: termino: total descontadas as pausas: Vidente [ ] cego congênito [ ] cego adquirido [ ] Acuidade visual: Causa: Orientador do teste:

2.Teste de treinamento de usuários:

Qtde de horas anteriores Opcional: desenhar a figura reconhecida: início final Tempo total Reconhecido como Certo? Reta horiz. Reta vert. Diag.p/baixo Diag.p/cima Letra ELE Quadrado Triang.direita Triang.esq. Círculo início final Tempo total Reconhecido como Certo? Reta horiz. Reta vert. Diag.p/baixo Diag.p/cima Letra ELE Quadrado Triang.direita Triang.esq. Círculo início final Tempo total Reconhecido como Certo? Reta horiz. Reta vert. Diag.p/baixo Diag.p/cima Letra ELE Quadrado Triang.direita Triang.esq. Círculo

150

3.Análise de resultados: Totalização/consolidação e gráficos

Média dos tempos p/reconhecer, por sessões, e ao final dos padrões do PC

Sessões => 0 1 2 3 4 5 6 7 8 9 10 11 12 média PC Vidente 1 Vidente 2 Vidente 3 Vidente 4 Total videntes Adquirido 1 Adquirido 2 Adquirido 3 Adquirido 4 Tot. Adquiridos Congênito 1 Congênito 2 Congênito 3 Congênito 4 Tot.Congenitos

Média dos% de acerto p/reconhecer, por sessões, e ao final dos padrões do PC

Sessões => 0 1 2 3 4 5 6 7 8 9 10 11 12 média PC Vidente 1 Vidente 2 Vidente 3 Vidente 4 Total videntes Adquirido 1 Adquirido 2 Adquirido 3 Adquirido 4 Tot. Adquiridos Congênito 1 Congênito 2 Congênito 3 Congênito 4 Tot.Congenitos 1.Gráficos gerados para cada usuário e comparando os 3 grupos: vidente, congênito e adquirido tempo p/ reconhecimento percentual de acerto

| + | + + | + | + | + + + | + + |______________________ |_____________________ sessões de treinamento sessões de treinamento

2.Desenhar ambos juntos, para cada um dos 3 grupos percentual de acerto, tempo p/reconhecimento

| t | t a a | t a | t a | a a t t |______________________

sessões de treinamento

151

A2. TERMO DE CONSENTIMENTO LIVRE E ESCLARECIDO

I - DADOS DE IDENTIFICAÇÃO DO SUJEITO DA PESQUISA OU RESPONSÁVEL

LEGAL

1. NOME DO PACIENTE.......................................................................................................

DOCUMENTO DE IDENTIDADE Nº : ........................................ SEXO : M ? F ?

DATA NASCIMENTO: ......../......../......

ENDEREÇO ............................................................................... Nº ............. APTO:............

BAIRRO: .......................................................... CIDADE......................................................

CEP:......................................... TELEFONE: DDD (..............)..............................................

2.RESPONSÁVEL LEGAL ....................................................................................................

NATUREZA (grau de parentesco, tutor, curador etc.) ...........................................................

DOCUMENTO DE IDENTIDADE :.............................................SEXO: M ? F ?

DATA NASCIMENTO.: ....../......./......

ENDEREÇO ............................................................................... Nº ............. APTO:............

BAIRRO: .......................................................... CIDADE......................................................

CEP:......................................... TELEFONE: DDD (..............)..............................................

II - DADOS SOBRE A PESQUISA CIENTÍFICA

1. TÍTULO DO PROTOCOLO DE PESQUISA ..Tato remoto: sistema de substituição sensorial para

auxílio a deficientes visuais via técnicas de processamento de imagens e eletro-estimulação cutânea

(provisório).................................

PESQUISADOR: .Mauro Conti Pereira...................................................................................

CARGO/FUNÇÃO: ...doutorando.....INSCRIÇÃO CONSELHO REGIONAL Nº ....................

UNIDADE : .....EPUSP – Depto de Telecomunicações e Controle................

3. AVALIAÇÃO DO RISCO DA PESQUISA:

SEM RISCO ? RISCO MÍNIMO X RISCO MÉDIO ?

RISCO BAIXO ? RISCO MAIOR ?

(probabilidade de que o indivíduo sofra algum dano como conseqüência imediata ou tardia do estudo)

4.DURAÇÃO DA PESQUISA : ..setembro de 2003 a março de 2007..................................

III - REGISTRO DAS EXPLICAÇÕES DO PESQUISADOR AO PACIENTE OU SEU

REPRESENTANTE LEGAL SOBRE A PESQUISA, CONSIGNANDO:

1.justificativa e os objetivos da pesquisa;

Pessoas com baixa acuidade visual têm maior dificuldade de inserção na sociedade, com

problemas para usufruir uma vida completamente autônoma.

O presente estudo tem por finalidade auxiliar o deficiente visual em sua familiarização de

ambientes desconhecidos, para sua orientação e mobilidade, permitindo uma maior autonomia de

locomoção. Propõe-se substituição sensorial da visão pelo tato, permitindo que imagens sejam

capturadas e tratadas em um computador, para simplificá-las e detectar o contorno de objetos.

Posteriormente estas imagens simplificadas são enviadas ao usuário por meio de eletro-estimulação

cutânea no abdome.

152

Em uma segunda etapa, o estudo tem também por finalidade permitir capturar as

informações contidas em cartazes e letreiros.

2.procedimentos que serão utilizados e propósitos, incluindo a identificação dos

procedimentos que são experimentais;

A estimulação é feita por meio de uma matriz de eletrodos externa, colocada sobre a pele, fixada

temporariamente durante o uso, por meio de uma faixa elástica abdominal. Não há necessidade de

cortes para o uso do equipamento. É como se fosse sendo desenhado na pele do usuário o contorno

dos objetos da imagem capturada.

Para dar noção de profundidade da imagem, permitindo diferenciar entre um objeto grande e distante,

de um objeto pequeno que esteja próximo, será usado um sistema auxiliar adicional, com sensor de

ultra-som para medir a distância. Esta informação de distância será inforamda por meio de um

vibrador externo, estilo vibracall de telefone celular, que vibrara mais quanto mais perto estiver do

objeto da imagem.

Em uma segunda etapa, o programa que trata a imagem será melhorado para encontrar na imagem

letreiros e sinais, focando nas letras e aproximando a imagem, transferndo esta informação ao usuário

através da mesma matriz de eletrodos.

3. desconfortos e riscos esperados;

A estimulação elétrica deverá ser sentida como um formigamento ou leve vibração. Em

alguns casos poderão ser sentidas como se fossem pequenas agulhadas, bastando então diminuir a

intensidade do choque para evita-las. Se houver um tempo excessivo de uso poderá ocorrer

vermelhidão na área estimulada.

Apesar de não haver indicações de perigo, não é recomendável que pessoas com problemas

cardíacos, marca-passo ou grávidas se submetam a eletro-estimulação cutânea.

As medidas a serem tomadas em caso de ocorrência do descrito acima é levar ao pronto

atendimento do Hospital Universitário da UFMS ou da Santa Casa de Campo Grande, através do

SUS.

4. benefícios que poderão ser obtidos;

Maior autonomia do individuo quando entra em ambientes desconhecidos para criar um mapa

mental deste ambiente. Sem o equipamento, se não houver uma pessoa para descrever o local

desconhecido, o deficiente visual precisa usar técnicas de orientação e mobilidade para familiarização,

que levam tempo e podem ser constrangedoras.

Na segunda parte do trabalho, letreiros e sinais poderão ser “lidos”, isto é, os contornos das

letras e números poderão ser desenhados na pele do usuário. Isto facilitaria para tomar ônibus ou

encontrar uma sala especifica em uma escola ou prédio publico.

5.procedimentos alternativos que possam ser vantajosos para o indivíduo.

Existem atualmente no mundo grupos de pesquisadores tentando desenvolver próteses

visuais que visam criar uma retina artificial ou mesmo estimular diretamente o cérebro. Mas isto requer

cirurgias e seus riscos inerentes, além de não poderem ser usados em todos os casos, e demorarem

muito tempo.

153

As vantagens do sistema de substituição sensorial proposto, externo, são diversas, entre elas:

• risco zero de infecção (ao contrário de implantes);

• aplicação em pacientes com visão subnormal e cegueira por qualquer causa, seja por

problemas na retina, nervo óptico, parte de visão do cérebro, pois usa a parte do tato (ao

contrário da retina artificial e estimulação direta do córtex cerebral);

• não requer iluminação especial, ao contrário do que seria necessário para retinas artificiais,

que tem baixo aproveitamento da luz (e ainda estão em testes)

• menor custo e facilidade de implantação, resultando em uma maior acessibilidade;

• pode ser retirado para exercícios e nadar, por exemplo.

Além disso, não se visa aqui a recuperação completa da visão perdida, mas sim criar um auxílio

que melhore as condições de vida resolvendo problemas práticos da vida diária, e que em um espaço

mais curto de tempo se obtenham resultados.

No Brasil um sistema mais barato, acessível e de rápida implantação e treinamento seria mais

apropriado às condições econômicas locais.

IV - ESCLARECIMENTOS DADOS PELO PESQUISADOR SOBRE GARANTIAS DO SUJEITO DA

PESQUISA:

1. acesso, a qualquer tempo, às informações sobre procedimentos, riscos e benefícios

relacionados à pesquisa, inclusive para dirimir eventuais dúvidas.

2. liberdade de retirar seu consentimento a qualquer momento e de deixar de participar do

estudo, sem que isto traga prejuízo à continuidade da assistência.

3. salvaguarda da confidêncialidade, sigilo e privacidade.

4. disponibilidade de assistência pelo SUS, por eventuais danos à saúde, decorrentes da

pesquisa

V. INFORMAÇÕES DE NOMES, ENDEREÇOS E TELEFONES DOS RESPONSÁVEIS PELO

ACOMPANHAMENTO DA PESQUISA, PARA CONTATO EM CASO DE INTERCORRÊNCIAS

CLÍNICAS E REAÇÕES ADVERSAS.

Mauro C.Pereira – (67)9981-7050

Fuad Kassab Jr – (11)9900-8525

VI. OBSERVAÇÕES COMPLEMENTARES:

1.Os usuários serão voluntários, sem remuneração alguma, mas com o equipamento podendo

ser levado até onde for mais conveniente ao voluntário para aplicar o treinamento e testes, seja

em seu domicílio, local de trabalho ou mesmo na UCDB ou ISMAC(Instituto Sul-Matogrossense

para Cegos Florisvaldo Vargas), em Campo Grande, MS.

VII - CONSENTIMENTO PÓS-ESCLARECIDO

Declaro que, após convenientemente esclarecido pelo pesquisador e ter entendido o que me foi

explicado, consinto em participar do presente Protocolo de Pesquisa. Assim, assino 2 vias deste

documento e recebo uma delas.

Campo Grande, de de .

__________________________ ______________________________

assinatura do sujeito da pesquisa assinatura do pesquisador

ou responsável legal (carimbo ou nome Legível)

154

A3 ALGUMAS INSTITUIÇÕES DE AUXÍLIO AO DEFICIENTE

VISUAL E SEUS LINKS Fundação Dorina Nowill (antiga Fundação do Livro do Cego)

Rua Doutor Diogo de Faria, 558 Cep 04037-001. São Paulo.

Fone: 5087-0999 Fax: 5087-0977.

Doações: 0800 770 1047

<http://www.fundacaodorina.org.br/br/inicio.asp>

Laramara – Associação Brasileira de Assistência ao Deficiente Visual

Rua Conselheiro Brotero 338, São Paulo, SP – 01154-000

(11)3660-6400 fax (11)3662-0551

http://www.laramara.org.br

Instituto Benjamin Constant (IBC) - órgão do MEC

O IBC é a maior entidade parceira do projeto DOSVOX. No IBC todos os produtos gerados

pelo projeto DOSVOX são testados, usados e ensinados. A parceria com o IBC propiciou

também o desenvolvimento de grande parte da tecnologia de impressão braille usada hoje

no Brasil.

Instituto Sul-Matogrossense para Cegos "Florisvaldo Vargas" ISMAC, Rua 25 de

dezembro 262 - Campo Grande, MS – 79002-060

(67) 3325-0997, 3325-0996

ABEDEV - Associação Brasileira de Educadores de Deficientes Visuais

Rua Rui Barbosa, 1961 - Ap. 13 - Bl. "B" - Centro - Campo Grande - MS

Fone/Fax: (67) 382-1581

E-mail: [email protected]

Rede SACI - estimula a inclusão social e melhoria da qualidade de vida por meio da difusão

de informações sobre deficiência. Av. Prof.Luciano Gualberto trav.J 374, térreo sala 10

Cidade Ujiversitaria – Cão Paulo, SP - 05508-900

(11)3091-4155 / 4370

http://www.saci.org.br/

SENAI: Curso de escrita Braille para docentes do SENAI

http://www.senai.br/braille/

155

Projeto DOSVOX – projeto para criação de ferramentas para permitir o uso de

computadores por pessoas cegas, iniciado no Núcleo de Computação Eletrônica da UFRJ.

http://caec.nce.ufrj.br/dosvox/index.html

MEC – Projeto CAP - visa criar uma infraestrutura nacional para apoio ao deficiente visual,

provendo locais para geração de material didático e impressão Braille. Os Centros de Apoio

Pedagógico (CAP) se espalham por todo Brasil, e cada um atua com uma visão

regionalizada, atendendo às especificidades das diversas regiões. A tecnologia utilizada nos

CAP é baseada nos programas criados pelo projeto DOSVOX, em especial o programa

Braille Fácil, que se tornou o padrão para impressão Braille no Brasil, uma parceria entre o

DOSVOX, ABEDEV e Instituto Benjamin Constant com apoio da Secretaria de Educação

Especial do Ministério da Educação.

Tiresias - International Information on Visual Disability

Information resource for people working in the field of visual disabilities

http://www.tiresias.org/

American Council of The Blind (ACB) - www.acb.org/

American Foundation for the Blind (AFB) - www.afb.org

Braille Institute of America for the blind and visually-impaired - www.brailleinstitute.org

National Eye Institute (NEI) of the National Institutes of Health - www.nei.nih.gov

National Federation of the Blind (NFB) - www.nfb.org/

Canadian National Institute for the Blind (CNIB)

www.cnib.ca/ http://www.icomm.ca/cnib/

Council of Citizens with Low Vision International (CCLVI)

www.cclvi.org/

156

A4 GRUPOS DE PESQUISA DE SUBSTITUIÇÃO SENSORIAL

Aqui estão listados diversos grupos que trabalham com SS em geral,

inclusive para aplicações auditivas, propriocepção, e outras, não são todos

em SS para visão, inclusive diversos trabalham com os aspectos cognitivos

ou fisiológicos da área. Os que realmente publicaram trabalho na área de

visão por tato estão marcados com **. Alguns como Eliana Sampaio e

G.Aielo usam tecnologia desenvolvida na Universidade de Maddison, tendo

sido pesquisados visitantes.

**Neural Rehabilitation Engineering Laboratory University of Louvain

(UCL) - Brussels, Belgium

Patricia Arno, Maire-Chantal Wanet Defalque, Claude Veraart, Annick

Vanlierde, Anne Raxhon

**Electronic Vision(s) Group Heidelberg University

Karlheinz Meier, Andreas Breidenassel,Thorsten Maucher,

Johannes Schemmel

**Laboratoire de Psychologie du Developpement - Strasbourg, France

Eliana Sampaio

Institut de Physique Biologique - Universite Louis Pasteur, Strasbourg,

France

Laurence Lemaire, Christian Scheiber

Costech (EA 2223) and BIM (UMR 6600, CNRS), Compiegne University of

Technology - Compiègne Cedex

Charles Lenay, Sylvain Hanneton, John Stewart, Olivier Gapenne, Catherine

Marque, Clotilde Vanhoutte, Pierre Villon, François Sebbah, Armen

Akatchakourov, Gaetan Dhayer

157

EHESS - Maison des Science de l'Homme, Paris

Marc Relieu

***Department of Physical Medicine and Rehabilitation - University of

Wisconsin

Paul Bach-y-Rita, Kurt Kaczmarek

**Dept of Biomedical Engineering, Un. Of Winsconsin Maddison

John Webster, David Beebe

IPO-Centre for Research on Human System Interaction - Eindhoven

University of Technology

Dominic G. Bouwhuis

Laboratory for Integrated Advanced Robotics (LIRA-Lab) Dist, University

of Genoa, Italy

Riccardo Manzotti, Giorgio Metta, Giulio Sandini, Xavier M. Sauvan

LPPA (UMR 9950) - College de France

Chantal Milleret

Medical Physics Group, School of Physics - University of Exeter

Ian summers

Laboratoire de Psychologie Expérimentale,CNRS

Kevin O’Regan

Associated and/or interested partners :

**Gaetano Aiello da Unipa, Italia

Peter Meijer da Philips

Sabine Ploux da Isernm, França

François Langevin, da UTC, França

Sandrine Russier, Serge Portalier, de Lyon

Scania de Schonen, de Paris5.

158

Dept of Engineering Science – Oxford University

N. Molton, D.Lee, P.Probert,S.Se.J.M.Brady

Department of Information Science, University of Tokio

Ken Sakamura

**Dept of Electrical Engineering, Univ.of Missouri

Hui Tang

Haptics Laboratory, a part of the Center for Intelligent Machines at

McGill University , Montreal, Canadá.

Vincent Hayward

Jerome Pasquero

http://www.laterotactile.com/

Intelligen Robotic and Mechatronic System Lab, Sung Kyun Kwan

University, Korea.

Igmo Koo

http://mecha.skku.ac.kr/researchset.htm

159

A5.CIRCUITO ELÉTRICO DO PROTOTIPO 1

Fig.66. Esquema da placa de cada coluna, com oscilador, amplificação, endereçamento e potência

160

A6.JUMPERS DE CONFIGURAÇÃO DA PLACA DE POTÊNCIA

CONECTORES CN1: para eletrodos Pino/descrição Pino/Descrição 1: pino 3 6: pino 7 2: pino 2 7: pino 6 3: pino1 8: pino 5 4: retorno 9: pino 4 5: retorno 10: retorno Na placa Opto1 Opto2 Opto3 Opt4 Opto5 Opto6 Opt7 CN2: pinos de coluna e linha vindos do microcontrolador

O pino1 faz via JP1 com que o controle OE do 74573 seja via bus ou aterrado local. CN3: sinais de alta voltagem indo para ou vindo do barramento Pino/descrição Pino/Descrição 1: Hi Va 5: Hi Va 2: Hi Va 6: Hi Va 3: Hi Vb (retorno) 7: Hi Vb (retorno) 4: Hi Vb (retorno) 8: Hi Vb (retorno) CN4: pinos de oscilação indo para ou vindo do barramento Pino/descrição Pino/Descrição 14:+VDD 13:+VDD (p/555 e TIP122) 12:+VDD 11:+VDD

10: GND 9: GND 8: GND 7: GND 6: +Vcc 5: +Vcc=5V 4: =3 3: oscilação em BT (bx tensão) 2: =1 1: ground dos LEDs GLed OSC Vcc Gnd Gnd Vdd Vdd

Pino Descrição 1 OE opcional* 2 Linha 7 3 L6 4 L5 5 L4 6 L3 7 L2 8 L1 9 Coluna B0 10 Col. B1 11 Col. B2 12 Col. B3

161

JUMPERS JP1: conecta o OE do latch 74573 em terra local ou em pino vindo do bus(barramento), i.e., do microcontrolador. Assim, pode-se desabilitar as saídas das placas via comando do uCtr. OBS: o terra do kit de desenvolvimento do microcontrolador deve se conectar ao terra das placas através do terra e +5 do backplane vindos pelo barramento do oscilador, isto é, via conector do backplane ao kit (CN4) Pino/descrição Pino/Descrição 2 GND local 3: OE do

74573 1: GND do uC 3: = Se conectar: pinos Nome Descrição Apenas 2-3 BACKPLANE 1 OE ao terra local, latch funciona sempre Apenas 1-3 BAKCPLANE 2 OE ao barramento, se conectado no barramento

do backplane, latch funciona apenas sob comando do uCtrl

1-3, 2-3 TESTE SEM BACKPLANE

OE ao terra e ao barramento, conecta OE(573) aos 2 terras, interconectando-os – serve quando testar placa sem o backplane, conectado direto ao kit

JP2: seletor de endereços da placa Se fechar cada jumper, leva o sinal do endereço a nível alto; reserva 0000 p/alteracoes de endereço B3,B2,B1,B0 endereco 0000 0 ... ... 1111 15

JP3a e JP3b: seleção de alta voltagem local ou do barramento Formato e conexões: JP3a Pino/descrição Pino/descrição 2: anodo 1 do MOC/RSS (p/eletrodo) 3=4: trafo secundário A 1: pinos 1256 do CN3 (bus: Hi Va) 4=3: trafo secundário A JP3b Pino/descrição Pino/descrição 2: pino de retorno do CN4 (para eletrodo) 3=4: trafo secundário B 1: pinos 3478 do CN3 (bus:Hi Vb:retorno)

4=3: trafo secundário B

Configuração pinos nome Descrição Apenas 2-3 INDEPENDENTE usa sinal do trafo local, não exporta (cada placa

com o seu) 2-3, 1-4 MESTRE usa trafo local e exporta (1 sinal p/todas as placas) Apenas 1-2 ESCRAVO importa o sinal do trafo do barramento, vindo de

uma placa mestre ou de um circuito externo OBS: DEIXAR APENAS UMA PLACA COMO MESTRE PARA NÃO DAR CONFLITO

162

JP4: seleção de sinal do oscilador, de baixa tensão (antes do ajuste de tensão e do trafo); Formato e conexões Pino/descrição Pino/descrição Pino/descrição 1: NC: não conectado 5: à base do transistor de

ajuste de amplitude (OBS: o primário do trafo esta conectado no coletor do transistor)

4: pino 3 (saída) do oscilador local

NC: não conectado 2=3 3=2: ao pino 3 e 4 do CN4 (oscilação das placas)

Configuração: pinos Nome Descrição Apenas4-5 INDEPENDENTE usa sinal do oscilador local, não exporta (cada

placa com o seu) 4-3, 5-2 MESTRE usa oscilador local e exporta (1 sinal p/todas as

placas) Apenas 2-5 ESCRAVO 1 importa o sinal do oscilador do barramento, vindo

de uma placa mestre ou de um circuito externo OBS: DEIXAR APENAS UMA PLACA COMO MESTRE PARA NÃO DAR CONFLITO

163

A7.PLACA DE MEDIÇÃO DE CORRENTE E SIMULADOR DE

PELE

Fig.67. Foto da placa de medição de corrente RMS conectada ao simulador de pele

164

A8. PROTÓTIPO 2: PLACAS DE ESTÍMULO DE 20

ELETRODOS, CPU, FONTE E PLACA-MÃE

Fig.68. Layout da nova placa de estimulação, de 20 eletrodos

Fig.69. Foto da placa de microcontrolador incluída no prototipo2

165

Fig.70. Foto da placa de geração de alta tensão do protótipo 2

Fig.71. Fotos da placa-mãe e dela com as placas de estímulos, de fonte e de micrcontrolador montadas

166

Fig.72. Esquema da nova placa de estímulos, que aciona 20 eletrodos (taxels)

167

Fig.73. Esquema da placa de microcontrolador incluída no prototipo2A10.Protótipo 2: placa FONTE

168

Fig.74. Fsquema elétrico da placa de geração de alta tensão do prototipo2

169

Fig.75. Esquema elétrico da placa-mãe do prototipo2

170

A9.PLACA DE TESTES PARA GERAÇÃO DE TENSÃO OU

CORRENTE DE ESTIMULAÇÃO

Para testes iniciais, antes dos protótipos, foi gerado um circuito para

se definir a possibilidade de uso de estimulação por tensão versus por

corrente. A partir destes resultados se pode projetar o circuito dos protótipos

1 e 2.

O circuito da foto na Fig.76, cujo esquema elétrico é mostrado na

Fig.77, é constituído por duas fontes de alimentação independentes, uma

para o pulso positivo e outra para o negativo, sendo ambas controladas

pelas suas respectivas realimentações da etapa de alta tensão das suas

saídas respectivas. Quando a tensão na saída diminui, a fonte tenta

compensar aumentando a tensão na entrada do transformador.

Quando configurada para ter controle por corrente, quando a queda

de tensão sobre o resistor shunt aumenta, a tensão da fonte diminui,

mantendo uma corrente constante.

Fig.76. Foto do circuito de testes para configuração da estimulação por corrente ou por tensão constante, depois simplificado

171

Fig.77. Circuito de testes para configuração da estimulação

172

A10.EVOLUÇÃO DO PROJETO

Neste apêndice são descritos a evolução dos circuitos do projeto, bem

como as decisões de projeto que determinaram como se chegou até a

configuração atual. São apresentadas ainda idéias descartadas, explicando-

se por que não foram aproveitadas. Visa-se com este apêndice facilitar a

replicação de resultados por outros pesquisadores que trilhem a mesma

área.

Captura e processamento de imagens

Inicialmente pensou-se em utilizar câmeras de segurança baseadas

em sensores CCD de baixo custo e baixa luminosidade necessária. Foi

adquirida uma placa de captura de imagens da empresa Pixel View e duas

câmeras de segurança com infravermelho, para poder detectar praticamente

no escuro, já que o deficiente visual normalmente não teria como identificar

a necessidade de luz ambiente.

Posteriormente, foi verificado que com a existência de bibliotecas de

Java e de toolbox de MATLAB para acessar diretamente uma webcam

padrão USB (universal serial bus), a placa de captura foi abandonada, com o

intuito de chegar a um resultado concreto evitando usar uma tecnologia que

viesse a ser causa de mais depuração. Podem ser usadas também webcam

de interface paralela no caso de se usar notebooks antigos que não tenham

porta USB.

Contudo, para interfacear uma webcam USB a um microcontrolador

seria necessário chip adicional e criação de drivers de software para acionar

a porta, requerendo mais poder de processamento do microcontrolador.

Portanto para o Protótipo 2 o ideal seria interfacear diretamente o sensor de

imagem ao microcontrolador do sistema.

Contatos iniciais com a Motorola, atual ON Semiconductors,

fabricante de sensores de imagem IMMOS, que tem bom suporte técnico no

Brasil, se mostrou promissor, mas depois foi descontinuada esta linha.

Outros fabricantes como Kodak e OmniVision existem, mas para construir

um protótipo as dificuldades logísticas seriam grandes, até mesmo para

173

obter os componentes. Assim optou-se por sistemas em kit, semelhantes a

câmeras de segurança.

A maioria dos sensores disponíveis no mercado possui saída em sinal

de vídeo composto, o que iria requerer o desenvolvimento de um sistema de

aquisição de dados para amostrar e digitalizar esta imagem, comumente

denominados frame grabber ou placa de captura. O projeto foi iniciado, mas

isto se mostrou inconveniente, pois aumentaria muito o tempo do projeto,

consumo de energia e tamanho do protótipo.

Assim, foram buscados sensores com interface paralela, como o da

Comtech C40188, mas ele ainda iria requerer muitos pinos de IO do

microcontrolador, que seriam mais bem utilizados no controle do maior

número de placas de estímulos e de mais eletrodos controlados por cada

placa do protótipo 2. Finalmente, em 2005 foi encontrado o kit serial C328

também da Comtech, que integra um sensor de imagem OV7640 da

OminiVision, integrado a um chip de controle de comunicação serial e

compactação JPEG, que no caso deste projeto não foi necessário.

Circuito de geração

No prototipo1, de 5x7, ainda se testou a geração do trem de pulsos

por hardware, com dois temporizadores 555, um modulando o outro, ou seja,

um gerava a rajada, outro a envoltória de quando a rajada podia acontecer.

Esta solução por hardware foi importante no início para se testar os

tipos de sensação antes de se começarem os treinamentos propriamente

ditos.

Uma vez que o programa de controle do 8952 estava funcional, foi

possível gerar também o trem de pulsos por software via um pino de controle

do microcontrolador, possibilitando maior flexibilidade e repetibilidade dos

ajustes.

Mas no protótipo 2, de 15x20, isto mudou para apenas por software,

pois era mais flexível e liberava espaço para a placa poder ativar mais

eletrodos, agora 20 em cada placa.

174

Endereçamento dos eletrodos

Inicialmente pensou-se em fazer uma placa para selecionar linha e

coluna usando multiplexadores, que enviaria o sinal de controle de cada

eletrodo a uma matriz de leds, para visualizar o padrão sendo estimulado e

conferir as respostas do usuário. O sinal de controle deveria ir para uma

placa de potência e também para uma placa de leds. Chegou-se a construir

e testar a placa de seleção, mas ao iniciar o projeto das demais placas,

especialmente a de controle de potência, notou-se que ficariam muito

grandes, e talvez fosse requerer placas multicamadas, encarecendo o custo

do protótipo, já que foi feito sem apoio de órgãos de fomento.

Além disso, usando multiplexador de coluna permitiria acionar apenas

1 de 5 multiplexadores, um para cada coluna. Assim apenas um eletrodo de

cada vez poderia ser ativado, selecionando uma só coluna e uma só linha, o

que ia contra a flexibilidade desejada.

E mais, a placa de leds ficaria muito grande, com os leds muito

espaçados tornando-se difícil reconhecer os padrões estimulados nos

eletrodos.

Assim, chegou-se à solução de slots e placa-mãe, semelhante à

arquitetura de PC. Cada placa fica responsável por uma coluna, tendo seção

de endereçamento da placa e eletrodos, geração de trem de pulsos,

amplificação por transformador de pulso e chaveamento por relés de estado

sólido (SSR), além dos leds de visualização dos eletrodos que forem

ativados.

O endereçamento é feito por meio do comparador do endereço da

placa, um 7486, que por sua vez ativa um latch dos eletrodos, um 74573,

para poder ativar várias placas simultâneas se necessário.

Chaveamento da potência

Foram descartadas logo de início as idéias de MOSFET como estava

nos circuito de Antonino [93], pois não operava em corte/saturação

consumindo muito mais energia. Seria necessário usar algum tipo de

transistor em ponte H, chaveando alternadamente em X com a carga no

175

meio. Mas isto ficaria caro e complexo, pois teriam 4 x 300 eletrodos, ou

seja, 1200 transistores. Mesmo que usasse CIs coolmos, estudados, haveria

muitos deles.

Os transformadores de pulso então ocupariam um espaço muito

grande, decidindo-se mantê-los apenas na geração de sinal por canal.

A opção seguinte foi usar circuitos integrados que tivessem embutidas

estas pontes, mas ainda ficaria caro e grande.

Foi pensado em usar matrizes de comutação telefônica, que

antigamente existiam em 48 Volts, na era anterior às CPA (centrais por

programa armazenado). Em vez de ter um circuito de endereçamento

separado do circuito de chaveamento de potência, seriam todos integrados

em uma única pastilha de 16x16, que poderia ser associada para dar mais

conexões. Foram consultados sites e data sheets de vários fabricantes,

inclusive a SGS-Thomson, fabricante original, e encontraram-se matrizes

que baseadas em tecnologia MOS que poderiam servir. Seria uma ótima

solução, pratica e compacta, mas não se fabricam mais estas matrizes em

tensões acima de 16 volts.

Uma opção seria usar chaves MOS tipo 4066, mas de tensão

superior, a MAXIM tem uma que vai acima de 50 volts. Mas não é uma

matriz, são CIs com conjunto de chaves analógicas. Seriam necessárias

muitas delas combinadas, pareceu demasiadamente complexo.

Uma nova tecnologia chamada FPAA (Field Programmable Analog

Array) da Anadigm também pareceu promissora. É composta de células

programáveis de amplificadores operacionais com circuitos RC internos,

podendo-se combinar as conexões para gerar circuitos analógicos mais

complexos, da mesma maneira que os FPGA atuam interconectando células

de circuitos digitais. O problema é que aqui no Brasil nenhum distribuidor

possuía o kit ou amostras, seria necessário importar e, pior, os CIs atuais

ainda estão nas primeiras famílias, cabem apenas 20 células. Ou seja, não

resolveria o problema.

176

Visando então resolver 2 problemas de uma vez, o chaveamento e o

isolamento, foi tentado usar MOC, isto é, acopladores ópticos com saída em

TRIAC de baixa potência. Eles normalmente são usados em disparo de

TRIACs maiores. Mas devido à baixa corrente que percorreria por cada

eletrodo, foi observado que poderia funcionar.

Ao testar em circuitos montados em protoboard e alimentando com

sinal vindo de gerador de funções, ele cortava e comutava o sinal

exatamente como previsto. O gatilho permanecia acionado por um pino de

saída do latch que alimentava o led interno do MOC, e quando a corrente

invertia, ele cortava. Quando se cortava o sinal de comando, a saída ficava

em aberto.

Os circuitos com 555 gerando o sinal também estavam funcionando

então a placa foi construída, incluindo alguns jumpers caso fosse necessário

alterar algo sem desperdiçar o projeto.

Ao testar depois em laboratório, usando os MOC alimentados pelo

gerador de funções ou pela saída do 555, ampliada pelo TIP122, o

funcionamento ficou errático. Algumas vezes cortava o sinal ao fechar o sinal

de comando, mas muitas vezes mantinha a condução do MOC. Após muitos

testes, achou-se que poderia ser um dv/dt muito rápido que estivesse

mantendo disparado o circuito, e a placa havia previsto um circuito snubber

(RC para eliminar este problema), bastando soldá-los. Mas em testes não

chegou a funcionar, e além disso, estes testes foram interrompidos porque

se fosse colocado um RC em paralelo com os anodos do TRIAC, haveria

condução sempre ao eletrodo, não sendo chaveado pelo sinal vindo do

latch.

Outra solução se fazia necessária. Foi pensado colocar 2

optoacopladores como o 4N38 ou semelhantes em contraposição (anodo de

um com catodo do outro), e realmente em testes com baixa tensão (< 5 V)

funcionou, apenas com uma pequena queda de 0.7 V.

Porém ao se colocar um opto de alta tensão, ele suporta tensão de

até 350 V apenas no sentido direto. No sentido reverso a limitação se daria

177

pela V reversa máxima, que mesmo para estes optos especiais era da

ordem de 7.5 V. Foi outra idéia que teve de ser abandonada.

Fig.78. Circuito de chaveamento do sinal de alta tensão

Finalmente, foi usado circuito da Fig.78, após descoberto que SSR

(solid state relays) ou relés de estado sólido que tinham na entrada um led,

tal qual um MOC, mas com chaves MOS na saída. Assim, funciona

exatamente como um relé, mas com resposta rápida e mais compacto.

Contudo no Brasil são difíceis de encontrar, tendo um tempo de entrega

demorado, de mais de 3 semanas, se tudo correr bem.

Foram encontrados alguns fabricantes que atendiam, e por sorte,

existem algumas famílias que tem inclusive a mesma pinagem dos

MOC3022 utilizado no desenho da placa. A Aromat tem o AQY210, que no

Brasil a Metaltex encapsula e vende como TM210. A Fairchild é outra que

tem algo semelhante, o HRS312L, que inclusive tem um limitador de

corrente de 100 mA incorporado. Apesar de que este limitador ainda assim é

muito grande para o sinal que se deseja estimular no usuário.

Para testes, foi comprado um lote de SSR da Metaltex, que provaram

sua eficiência não tendo nem mesmo queda de tensão quando em

condução. Eles foram testados até 10 KHz sem problemas, apesar da

freqüência de operação usada ter sido no máximo de cerca de 5 kHz (pulsos

de largura de 100 µs em nível alto e 100 µs em nível baixo). Além disso, um

mesmo neurônio não consegue responder em freqüências acima disto

devido a seu período refratário, mas outros neurônios vizinhos podem

responder, permitindo a estimulação até cerca desta freqüência.

A desvantagem está nos preços. Um FET IRF510 mencionado no

começo custa cerca de 2 reais, se fosse montar em ponte ficaria 8 reais por

178

eletrodo. O MOC fica perto de 2 reais por eletrodo, mas não resolveu o

problema. O SSR funcionou, mas custou cerca de 7 reais cada (cerca de 2,5

dólares americanos).

Outra idéia surgiu então, tendo sido testada em protoboard e

implementada no circuito do protótipo 2. Baseia-se no funcionamento de

retificadores de onda completa baseada em ponte de diodos. O princípio é

simples, basta tomar o secundário de um transformador e alimentar quatro

diodos em ponte. Dois dos terminais são conectados à tensão alternada, e

dois alimentam a carga que recebe então um sinal pulado que se pode

melhorar usando um capacitor que diminui o ripple em paralelo à carga, que

começa a receber então praticamente tensão DC. Se no lugar da carga for

colocado um elemento de chave (um FET ou bipolar simples) e em um dos

ramos entre o secundário e a ponte se colocar o eletrodo, com uma só

chave será possível ligar e desligar uma tensão alternada no eletrodo.

A implementação do tempo morto para diminuir consumo de potência

foi feita na geração do sinal estimulador do protótipo 2, usando 2 pinos de

controle vindos do microcontrolador.

O circuito de chaveamento de cada eletrodo também precisava ser

revisto, pois seriam repetidos 300 vezes, pois são 15 colunas de 20

eletrodos, quantidade essa limitada pelo tamanho dos eletrodos e espaço do

abdome para posicionar a matriz de eletrodos. Assim, foi definido que seria

necessário um circuito diferente, de preferência pequeno e barato. Para o

protótipo 1, para testar idéias e manter o custo baixo foi definida uma matriz

pequena, de 5 colunas de 7 eletrodos cada.

Como o circuito deveria permitir testar estimulação também com sinal

médio nulo, foi necessário criar um circuito de amplificação e de

chaveamento que pudesse conduzir nos dois sentidos. Isto implica de

alguma maneira usar ponte de transistores (bipolar ou FET), tiristores

(TRIAC), relê de estado sólido ou algo semelhante.

No protótipo 2 também se alterou o SSR para uso de optoacoplador

normal mais ponte, visando diminuir custos.

179

Também se trocou o ajuste da tensão feito por LM317 para melhorar

a eficiência das baterias, passando a usar conversor DC-DC tipo flyback,

com ajuste da tensão máxima, por volta de 60 a 70 Volts, fornecido pela

Tecnotrafo de São Paulo.

O conversor DC-DC também serviu para eliminar o transformador de

pulso mais um TIP que eram usados na amplificação e causavam distorções

na onda. Passou-se a usar 2 opto-acopladores em ponte para gerar o pulso

positivo e negativo do trem de pulsos, acionado por 2 pinos de IO do

microcontrolador.

Alimentação e amplificação

A bateria original era de chumbo-ácido 6 V e 1.3 Ah, mas não estava

mantendo carga por muito tempo. Portanto foi trocada por conjuntos de

pilhas recarregáveis que se alternam, de 8 pilhas de NiMH, 1,8 AH ou mais,

e depois por conjunto com 12 pilhas de NiMH. Além de ter aumentado sua

autonomia, o equipamento acabou ficando mais leve. Para testes fixos no

laboratório, também se suou algumas vezes bateria de chumbo acido

externa, de 7AH, durando para mais de 20 sessões de teste. O tipo de

bateria interna ideal foi escolhido após estudo, com as de níquel metal

hidreto (NiMH) sendo escolhida por ter efeito memória menor e maior

capacidade de corrente que níquel cádmio. As de Lítio-ion não apresentam

efeito memória e tem densidade de corrente maior, mas seus carregadores

são especiais, seu custo é muito maior e seu formato não segue padrão de

tamanho habitual (A, AA) por ter a voltagem de sua célula praticamente o

dobro, 3 V, enquanto as de NiMH ficam próximas, em 1,2 V. Esta diferença

não se nota, pois pilhas normais têm tensão nominal de 1,5 V, mas que

caem rapidamente [PEREIRA,04].

Na documentação dos circuitos usados em eletro-estimulação neuro-

muscular (EENM) de pesquisadores do Laboratório de Biocibernética

(LabCiber) da USP de São Carlos, coordenado pelo co-orientador deste

trabalho, costuma-se usar um circuito baseado em transformador de pulso

180

para amplificar, e um MOSFET para controlar o acesso desse sinal ao sinal

amplificado [ANTONINO,93].

Contudo, estes circuitos ao serem analisados indicavam falha de

funcionamento ou inadequação às necessidades deste projeto, o que se

comprovou em laboratório.

Fig.79. Etapa de potência típica do circuito estimulador de Antonino [ANTONINO,93].

O circuito da Fig.79 é o que consta na dissertação de Antonino, e só

funcionaria com o transformador em modo flyback. Para poder ajustar o nível

de tensão de estimulação o MOSFET está operando fora de corte/saturação,

portanto consumindo muita potência, drenando rapidamente as baterias.

Também requer um transformador de pulso que eleve a tensão em muitas

vezes, o que não havia disponível comercialmente em produtos de

prateleira, como os transformadores da Thornton e Semikron que tem

relação de espiras de no máximo 1:3. Finalmente, por ter um diodo e um

LED no secundário, não é capaz de fornecer sinal bidirecional, resultando

em nível DC não nulo. Em resumo, não atende às especificações.

Nohama usou um tipo diferente de circuito, baseado em estimulador

de corrente, que chaveava um sinal de alta tensão gerado por conversor DC-

DC. (saída de 100 volts). Mas este tipo de circuito era muito caro, cerca de

80 dólares o chip para cada canal estimulador. Como o equipamento deve

ter 15 placas (=linhas ou colunas), um canal com conversor DC para cada

placa ficaria muito caro, então outra solução foi buscada [NOHAMA,97].

Os circuitos 555 aceitavam até 16 V, e os circuitos lógicos de

endereçamento e latches, TTL da família HCMOS podem receber tensão

181

entre 4 e 6 V. Assim, entre a bateria e o circuito das placas havia uma chave

liga/desliga, um conector para carregamento das baterias que desliga o

circuito quando se está conectado, e um diodo para garantir a não inversão

da fonte. Este diodo acarretava uma pequena queda da tensão da bateria

original, mas ainda suficiente para funcionar os 74HCXX e os 555 e o TIP,

conforme mostrado na Fig.80 do circuito de alta tensão. O diodo foi depois

eliminado ao se a usar conectores que impediam conectar a bateria

invertida, e assim eliminando a perda de energia, que era considerável:

0,7/12 significa quase 6%, influenciando a tensão máxima que se podia

obter.

Fig.80. Etapa de amplificação com TIP e transformador de pulso

Porém, o sinal do estimulador estava baixo, e como não haviam

fornecedores adequados de transformador de pulso, acabou-se optando por

aumentar a alimentação do TIP e dos 555. Foi preciso fazer um retrofit nas

placas para separar a alimentação da parte de oscilador e potência da parte

de seleção do eletrodo.

Adicionou-se mais uma bateria de 6 V, totalizando 12 V, e incluiu-se

um jumper e um circuito regulador de tensão com 7805 na placa-mãe.

Quando o jumper está setado em alimentação por tensão maior, o regulador

entra em ação, gerando 5 volts para o HCMOS, e conectando um ventilador

para resfriá-lo. Caso contrário, o sinal da bateria menos a queda de tensão

do diodo é conectado em ambos os pinos do barramento de alimentação das

placas.

182

Posteriormente foi ainda adicionado um LM317 para ajustar a tensão

que chega ao circuito de amplificação, pois o circuito trabalha no

corte/saturação de um transistor Darlington, e quando começava a conduzir

o nível de tensão já era muito alto para alguns usuários.

No lugar do transistor Darlington TIP 122 também foi testado o L149 e

o IRF540. O que resutou onda quadrada com menor distorção foi o L149,

mas com o TIP o circuito fornecia sensação adequada, sendo então

adotado.

No protótipo 2 este ajuste por regulador linear LM317, de baixa

eficiência, foi trocado por um ajuste em conversor DC-DC desenvolvido pela

empresa Tecnotrafo sob encomenda. Isto serviu também para elimiar as

distorções devido ao uso do transformador de pulso, chegando onda

quadrada perfeita a cada eletrodo.

Matriz de eletrodos

Para os primeiros testes pensou-se na construção de eletrodos

individuais, por meio de algum tipo de material mecânico que posteriormente

poderia receber um banho eletroquímico apropriado. Porém isto seria

complicado devido ao grande número de eletrodos, 35 no protótipo 1, mas

seria impraticável para o circuito final de 300 eletrodos, pois havia o

problema de comunicação com os circuitos estimuladores, bem como a

fixação dos eletrodos em algum material que pudesse ser posto em contato

com a pele do usuário.

Pensou-se em usar algum tipo de arruela, ou botão de pressão fixado

em tecido, semelhante a alguns eletrodos de ECG (eletrocardiograma), mas

o circuito para 300 eletrodos resultaria em um grande emaranhado de fios.

Surgiu então a idéia de se conectar os eletrodos usando circuitos

flexíveis semelhantes aos usados em cabeças de impressoras matriciais.

Este material também é usado em teclados de membrana que precisam ser

baratos e resistir a líquidos, além de serem usados em conexão de peças

que tem necessidades especiais de movimentação, uma vantagem a mais,

já que circuitos com fios poderiam quebrar por fadiga do metal.

183

Observando-se o formato dos circuitos destes teclados de membrana,

normalmente feitos em forma de matriz, em que ao apertar a tecla fecha-se

um contato, percebeu-se que o CIF poderia não apenas servir de cabo, mas

também implementar o próprio eletrodo com ele. Bastaria fazer suas trilhas

em formato de eletrodo concêntrico, formato mais apropriado segundo a

literatura. A possibilidade foi confirmada em contatos com fabricantes desses

circuitos e seus fornecedores de matéria-prima, e assim foram testadas

algumas amostras de circuitos flexíveis projetados para outros fins,

apresentando desempenho aceitável aos propósitos deste projeto. Foi então

encomendada uma coluna, mostrado na Fig.54, que apresentou ao usuário

sensibilidade melhor que a PCI de fibra e anéis de níquel. Assim, a matriz

final foi encomendada.

Agora, contatos com professores que pesquisam a área de

microfabricação na UFMS resultou em um projeto junto ao CNPq para

criação de matrizes e eventual criação futura de micromotores para

estimulação mecânica.

Para a fixação no abdome foi tentada uma faixa abdominal cirúrgica,

mas afrouxava-se muito facilmente. Foram então comprados rolo de elástico

branco de 5 cm de largura, e rolo de velcro. A faixa foi costurada em 2 faixas

elásticas em paralelo sobrepostas, no total de 8 cm, costurando-se diversas

faixas transversais de velcro, a cada 5 cm, para permitir o ajuste em pessoas

de diferentes tamanhos, conforme mostra a Fig.44.

Para o protótipo com a matriz em CIF, maior, é necessário o uso de

uma faixa abdominal comercial, larga.

184

A11.PRODUÇÃO GERADA A PARTIR DA TESE

ARTIGOS EM CONGRESSOS

PEREIRA, M.C., CLIQUET Jr, A., KASSAB Jr, F. Substituição Sensorial para Auxílio à Mobilidade de Deficientes Visuais via Eletroestimulação Táctil. III Congresso Iberoamericano de Tecnologias para Discapacitados, Costa Rica, 2004.

PEREIRA, M.C., CUNHA,F.L.; CLIQUET Jr, A., KASSAB Jr, F. Estudo comparativo dos meios de alimentação de uma prótese multifunção para membros superiores. III Congresso Iberoamericano de Tecnologias para Discapacitados, Costa Rica, 2004.

PEREIRA, M.C., CLIQUET Jr, A., KASSAB Jr, F. Eletroestimulador para uso em substituição sensorial. IV Congresso Iberoamericano de Tecnologias para Discapacitados, Vitória,ES., 2006.

PEREIRA, M.C., KASSAB, Jr. F. An Electrical stimulator for Sensory Substitution, aceito no 28th Annual International Conference of the IEEE Engineering in Medicine and Biology Society, EMBC2006, a reazlizar-se de 30agosto a 3 de setembro de 2006, New York, NY.

PRÊMIOS

Primeiro lugar na categoria pesquisadores do 1º Premio Werner Von

Siemens de Inovação Tecnológica, novembro de 2005.

PATENTE REQUERIDA

Processo e equipamento para experimentos somestésicos e para substituição sensorial para auxílio a deficeintes via técnicas de processamento digital de sinais e estimulação cutânea. Pedido de privilégio de patente de invenção nº PI 0600724-4, protocolado em 16/02/2006 sob o nº0075 junto ao INPI – Instituto Nacional de Propriedade Industrial.

NOVOS PROJETOS

Convênio com professores que pesquisam a área de microfabricação

na UFMS resultou em um projeto junto ao CNPq para criação de matrizes e

eventual criação futura de micromotores para estimulação mecânica.

185

Também foi submetido um projeto ao edital universal do CNPq

pleiteando um eletroencefalograma e equipamentos para viabilizar a medida

de EEG para verificar possíveis alterações de estimulação de córtex visual

antes e depois de treinamento com este sistema.

186

FICHA CATALOGRÁFICA

Pereira, Mauro Conti

Sistema de substituição sensorial para auxílio a deficientes visuais via técnicas de processamento de imagens e estimula-ção cutânea / M.C.Pereira. -- ed.rev. -- São Paulo, 2006.

202 p.

Tese (Doutorado) - Escola Politécnica da Universidade de São Paulo. Departamento de Engenharia de Telecomunicações e Controle.

1.Estimulação elétrica 2.Estimulação tátil 3.Visão 4.Proces- samento de imagens 5.Engenharia de reabilitação I.Universida-de de São Paulo. Escola Politécnica. Departamento de Engenha-ria de Telecomunicações e Controle II.t.

Este exemplar foi revisado e alterado em relação à versao original, sob

responsabilidade única do autor e com anuência de seu orientador.

São Paulo, 28 de agosto de 2006

Assinatura do autor:

Assinatura do orientador

Download - mauro conti pereira sistema de substituição sensorial para auxílio a

Top Related