folder bigdata issuu
DESCRIPTION
bigdataTRANSCRIPT
-
BLOCO A | 110h
ObtenO, Anlise e VisuAlizAO de dAdOs: VAlOr
CAses:Solues utilizadas em diversas reas: mdica, marketing, mercado financeiro, educao, redes sociais; Motores de Busca; Arquitetura de Solues Big Data; Correlao de Dados.
Big DAtA AnALytiCs:Analtica Descritiva, Preditiva e Prescritiva; Formulao de Problemas; Modelagem; Mensurao; Anlise de Resultados; Ferramentas Analticas; Anlises Quantitativa e Qualitativa; Formulao de questes; Estudos de Caso Aplicados (Marketing, Cadeia de Fornecimento, Finanas, RH, Pesquisa e Desenvolvimento); Visualizao de Resultados (data visualization).
PrOjetO De BLOCO:Com base no estudo de caso de uma grande rede de varejo, elaborar questes, coletar dados, realizar anlises e apresentar resultados que respondam s questes levantadas.
COmPetnCiAs ADquiriDAs:O aluno recebe uma viso geral sobre aplicaes de solues adotadas no mundo Big Data. Alm disso, desenvolve o raciocnio analtico e trabalha com a apresentao de resultados.
Bloco B | 110h
infrAestruturA pArA big dAtA: VOlume
mAP reDuCe/ HADOOP:Hadoop como framework; Papel desempenhado por servidores mster e slaves; Arquitetura: Map Reduce; HDFS e Ferramentas (Hive, HBase, Mahout, Pig, Oozie, Flume, Scoop, Spark/shark); Solues em Python; Papeis Task tracker, Data node, Job tracker e Name node; Tolerncia a falhas; Clusterizao; Transparncia de programao; Gerncia de usurios; Estudo de caso.
PrOgrAmAO:Rstudio; Lendo e gravando dados; Estruturas de processamento; Simulaes; Otimizao; Coleta e limpeza de dados (leitura, mescla, agregao); Grficos; Clusterizao de dados; Bases da Linguagem Python; Introduo ao Machine Learning.
PrOjetO De BLOCO:Modelar e projetar uma soluo composta por infraestrutura Hadoop e desenvolvida utilizando a linguagem Python, observando as prticas recomendadas no presente Bloco.
COmPetnCiAs ADquiriDAs:O aluno aprende a desenvolver solues simples envolvendo Hadoop e Map Reduce, assim como a criar pequenos programas utilizando RStudio ou Python.
Bloco C | 110h
ArmAzenAmentO HeterOgneO de dAdOs: VelOcidAde
gerenCiAmentO De DADOs:SGBDs Relacionais vs. NoSQL; Agregaes; No Schema; Bases Distribudas; Consistncia; Map-Reduce; Gerenciadores Key-Value (Redis, Memcached, Riak); Gerenciadores Orientados a Documento (MongoDb, CouchBase, RavenDB); Bancos InMemory (SAP HANA e VoltDB); Gerenciadores Relacionais para Big Data (Vertica, Pivotal). Neste mdulo teremos laboratrios prticos visando realizar comparaes entre os diversos produtos.
mOngODB:Instalao; Organizao de Dados; Trabalhando com Dados; GridFS; Consultas; Administrao; Otimizao; Replicao; Particionamento de dados (sharding). Integrao com Hadoop.
PrOjetO De BLOCO:Prova prtica em laboratrio envolvendo resoluo de problemas de administrao e otimizao com MongoDB.
COmPetnCiAs ADquiriDAs:O aluno recebe uma viso geral sobre os principais produtos NoSQL. Torna-se capaz tambm de realizar a instalao, configurao e otimizao de base NoSQL MongoDB.
Bloco D | 110h
indexAO e trAtAmentO de dAdOs HeterOgneOs: VAriedAde
meCAnismOs De BusCA:Indexao; Recuperao de Informao; Solr; elasticsearch.
minerAO De textO:Manipulao de dados brutos; Dados temporais; Algoritmos de busca; Anlise de resultados; Busca inferente em bases texto; Identificao de padres; Ferramentas; Web Mining; Text Mining; Algoritmos genticos; Anlise de sentimento.
PrOjetO De BLOCO:Prova prtica em laboratrio envolvendo resoluo de problemas de minerao de textos.
COmPetnCiAs ADquiriDAs:O aluno ser capaz de dominar conceitos relativos a predies de dados, construir, gerenciar e consultar modelos preditivos, e por fim, conhecer as principais ferramentas do mercado de minerao de texto.
tCC
Orientao para o desenvolvimento do Trabalho de Concluso de Curso individual.