O curso Data4All é uma formação em ciência de dados oferecida pela Gerdau em parceria com a Ada Tech. O curso é gratuito e focado no empoderamento de pessoas autodeclaradas pretas e pardas. A formação abrange tópicos essenciais em Python, análise de dados, estatística e machine learning.
- Capacitar os alunos para trabalhar com análise de dados utilizando Python.
- Desenvolver habilidades práticas em programação, estatística e machine learning.
- Preparar os alunos para o mercado de trabalho, aplicando os conceitos em projetos reais.
- Fomentar a inclusão digital e a diversidade no setor de tecnologia.
O curso é dividido em módulos que abordam tanto conceitos teóricos quanto práticos. As aulas são realizadas online e incluem atividades interativas.
- Objetivo: Entender os fundamentos da programação e como utilizá-los para análise de dados.
- Conteúdo:
- Instalação e configuração do ambiente Python.
- Introdução ao Jupyter Notebook.
- Variáveis, tipos de dados e operadores básicos.
- Estruturas de controle: loops, condicionais.
- Funções em Python.
- Objetivo: Compreender como trabalhar com diferentes tipos de dados e estruturas em Python.
- Conteúdo:
- Listas, tuplas, dicionários e conjuntos.
- Manipulação de strings e arrays.
- Operações matemáticas e lógicas com dados.
- Objetivo: Aplicar Python para realizar análise de dados.
- Conteúdo:
- Leitura e manipulação de arquivos CSV e Excel.
- Bibliotecas principais:
pandas
,numpy
. - Processamento e limpeza de dados.
- Análise exploratória de dados (EDA).
- Objetivo: Introduzir conceitos de estatística para análise de dados.
- Conteúdo:
- Medidas de tendência central: média, mediana, moda.
- Desvio padrão e variância.
- Distribuições de probabilidade.
- Correlação e regressão linear.
- Objetivo: Aprender conceitos básicos de aprendizado de máquina.
- Conteúdo:
- Introdução a
scikit-learn
. - Algoritmos de classificação (KNN, Decision Trees).
- Avaliação de modelos (Matriz de confusão, Acurácia).
- Introdução a modelos de regressão.
- Introdução a
- Python: Linguagem de programação principal.
- Jupyter Notebook: Ambiente interativo para codificação.
- Pandas: Biblioteca para manipulação de dados.
- Numpy: Biblioteca para operações numéricas.
- Scikit-learn: Biblioteca para machine learning.