Terça, 26. Novembro 2019, Green Treinamentos, Cloudera Data Scientist Training

A partir de 26. Novembro 2019 - 9:00
Até 29. Novembro 2019 - 17:00

Green Treinamentos

Visualizar mapa
0 Pessoas presentes
Descrição do evento
SOBRE O CURSO
Este workshop de quatro dias abrange fluxos de trabalho de data science e machine learning em escala usando Apache Spark 2 e outros componentes importantes do ecossistema Hadoop. O workshop enfatiza o uso de métodos de ciência dos dados e machine learning abordando os desafios de negócios do mundo real.
Usando cenários e conjuntos de dados de uma empresa de tecnologia fictícia, os estudantes descobrem insights para o embasamento de decisões críticas de negócios e desenvolver produtos de dados para transformá-lo. O material é apresentado através de uma sequência de breves palestras, demonstrações interativas, exercícios práticos e debates. As demonstrações e exercícios do Apache Spark são conduzidos em Python (com PySpark) e R (com sparklyr) usando o ambiente Cloudera Data Science Workbench (CDSW).
O QUE ESPERAR?
O workshop inclui breves palestras, demonstrações interativas, exercícios práticos e debates, abrangendo temas como:


Visão geral da ciência dos dados e do machine learning em escala.


Visão geral do ecossistema Hadoop.


Trabalhando com dados HDFS e tabelas Hive, utilizando Hue.


Mostrar mais

Introdução ao Cloudera Data Science Workbench.


Visão geral do Apache Spark 2


Leitura e inserção de dados.


Gestão de qualidade de dados.


Higienização e transformação de dados.


Sumarização e agrupamento de dados.


Combinação, divisão e remodelagem de dados.


Exploração de dados.


Configuração, monitoramento e solução de problemas de aplicações Spark


Visão geral de machine learning em Spark MLlib.


Extração, transformação e seleção de recursos.


Construção e avaliação de modelos de regressão.


Construção e avaliação de modelos de clusterização.


Criar e avaliar modelos de agrupamento


Modelos de validação cruzada e ajuste de hiperparâmetros


Construção de pipelines de machine learning.


Implementação de modelos de machine learning.


O QUE VOU APRENDER?
Os participantes adquirem habilidades práticas e experiência prática com ferramentas de ciência da dados, incluindo:


Spark, Spark SQL e Spark MLlib


PySpark e sparklyr


Cloudera Data Science Workbench (CDSW)


Hue


CARGA HORÁRIA


4 dias de 8 horas cada, totalizando 32 horas de treinamento


Treinamento sujeito a confirmação.


IDIOMA


O curso será ministrado em português.


PARA QUEM ESSE CURSO É INDICADO?
O workshop é direcionado para cientistas de dados que atualmente usam Python ou R para trabalhar com conjuntos de dados menores em uma única máquina e para aqueles que precisam ampliar suas análises e modelos de machine learning para grandes conjuntos de dados em clusters distribuídos. Engenheiros de dados e desenvolvedores com conhecimento em ciência e machine learning podem se interessar por este treinamento.
Para participar deste evento, o profissional necessita de um conhecimento básico de Python ou R e alguma experiência explorando e analisando dados e desenvolvendo modelos estatísticos ou de aprendizagem em máquina. Conhecimento em Hadoop ou Spark não é requerido.
FORMAS DE PAGAMENTO


Pagamento parcelado sem juros no cartão de crédito;


Para empresas, aceitamos transferência bancária ou boleto com emissão de nota fiscal eletrônica;


Descontos especiais para grupos.


Cloudera Data Scientist Training, Green Treinamentos evento

Encontre eventos mais interessantes
Obtenha recomendações de eventos com base em seu gosto Facebook. Apenas clique, é isso!Mostre-me os eventos adequados para mimAgora não