Skip to content

Latest commit

 

History

History
69 lines (50 loc) · 2.77 KB

README.md

File metadata and controls

69 lines (50 loc) · 2.77 KB

Curso Data4All - Análise de Dados com Python

O curso Data4All é uma formação em ciência de dados oferecida pela Gerdau em parceria com a Ada Tech. O curso é gratuito e focado no empoderamento de pessoas autodeclaradas pretas e pardas. A formação abrange tópicos essenciais em Python, análise de dados, estatística e machine learning.

Objetivos do Curso

  • Capacitar os alunos para trabalhar com análise de dados utilizando Python.
  • Desenvolver habilidades práticas em programação, estatística e machine learning.
  • Preparar os alunos para o mercado de trabalho, aplicando os conceitos em projetos reais.
  • Fomentar a inclusão digital e a diversidade no setor de tecnologia.

Estrutura do Curso

O curso é dividido em módulos que abordam tanto conceitos teóricos quanto práticos. As aulas são realizadas online e incluem atividades interativas.

Módulo 1: Introdução à Programação em Python

  • Objetivo: Entender os fundamentos da programação e como utilizá-los para análise de dados.
  • Conteúdo:
    • Instalação e configuração do ambiente Python.
    • Introdução ao Jupyter Notebook.
    • Variáveis, tipos de dados e operadores básicos.
    • Estruturas de controle: loops, condicionais.
    • Funções em Python.

Módulo 2: Tipos de Dados e Estruturas de Dados

  • Objetivo: Compreender como trabalhar com diferentes tipos de dados e estruturas em Python.
  • Conteúdo:
    • Listas, tuplas, dicionários e conjuntos.
    • Manipulação de strings e arrays.
    • Operações matemáticas e lógicas com dados.

Módulo 3: Análise de Dados com Python

  • Objetivo: Aplicar Python para realizar análise de dados.
  • Conteúdo:
    • Leitura e manipulação de arquivos CSV e Excel.
    • Bibliotecas principais: pandas, numpy.
    • Processamento e limpeza de dados.
    • Análise exploratória de dados (EDA).

Módulo 4: Estatística Básica

  • Objetivo: Introduzir conceitos de estatística para análise de dados.
  • Conteúdo:
    • Medidas de tendência central: média, mediana, moda.
    • Desvio padrão e variância.
    • Distribuições de probabilidade.
    • Correlação e regressão linear.

Módulo 5: Machine Learning

  • Objetivo: Aprender conceitos básicos de aprendizado de máquina.
  • Conteúdo:
    • Introdução a scikit-learn.
    • Algoritmos de classificação (KNN, Decision Trees).
    • Avaliação de modelos (Matriz de confusão, Acurácia).
    • Introdução a modelos de regressão.

Ferramentas Utilizadas

  • Python: Linguagem de programação principal.
  • Jupyter Notebook: Ambiente interativo para codificação.
  • Pandas: Biblioteca para manipulação de dados.
  • Numpy: Biblioteca para operações numéricas.
  • Scikit-learn: Biblioteca para machine learning.