Science Score: 44.0%

This score indicates how likely this project is to be science-related based on various indicators:

  • CITATION.cff file
    Found CITATION.cff file
  • codemeta.json file
    Found codemeta.json file
  • .zenodo.json file
    Found .zenodo.json file
  • DOI references
  • Academic publication links
  • Academic email domains
  • Institutional organization owner
  • JOSS paper metadata
  • Scientific vocabulary similarity
    Low similarity (5.1%) to scientific vocabulary
Last synced: 6 months ago · JSON representation ·

Repository

Basic Info
  • Host: GitHub
  • Owner: euemersonmendes
  • License: cc-by-sa-4.0
  • Language: Jupyter Notebook
  • Default Branch: main
  • Size: 329 MB
Statistics
  • Stars: 0
  • Watchers: 1
  • Forks: 0
  • Open Issues: 0
  • Releases: 0
Created over 2 years ago · Last pushed over 2 years ago
Metadata Files
Readme License Citation

README.md

Ciência de Dados

CC BY-SA 4.0 Open in Visual Studio Code Hits

Disciplina dos Cursos de Ciências da Computação e afins da UNINOVE.

backprop

Conteúdo

  • Python e Programação Orientada à Objetos
  • Álgebra Linear com NumPy
  • Análise de Dados com pandas
  • Visualização de Dados com pandas, matplotlib e seaborn
  • Machine Learning com Scikit-Learn
  • Redes Neurais com TensorFlow, Keras e PyTorch

Professores

Como usar esse conteúdo?

Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas.

Para configurar um ambiente local:

  1. Clone o repositório do GitHub: git clone https://github.com/storopoli/ciencia-de-dados.git
  2. Acesse o diretório: cd ciencia-de-dados
  3. Instale as bibliotecas necessárias: pip install -r .binder/requirements.txt ou conda env create -f .binder/environment.yml

Notebooks

  • Aula Especial - Curso Rápido de Python para Programadores Binder Open In Colab
  • Aula 0 - Jupyter Notebook Binder Open In Colab
  • Aula 1 - Operadores aritméticos, relacionais e lógicos Binder Open In Colab
  • Aula 2 - Desvio Condicional (IF) Binder Open In Colab
  • Aula 3 - Estruturas de Repetição (FOR e WHILE) Binder Open In Colab
  • Aula 4 - Estruturas de Dados (list e dict) Binder Open In Colab
  • Aula 5 - Funções Binder Open In Colab
  • Aula 5a - Classes e métodos Binder Open In Colab
  • Aula 6 - NumPy e Algebra Linear Binder Open In Colab
  • Aula 7 - pandas Binder Open In Colab
  • Aula 8 - pandas estatística Binder Open In Colab
  • Aula 9 - Gráficos com matplotlib e pandas Binder Open In Colab
  • Aula 10 - Machine Learning com Scikit-Learn Binder Open In Colab
  • Aula 11 - Regressão Linear com Scikit-Learn Binder Open In Colab
  • Aula 12 - Regressão Logística com Scikit-Learn Binder Open In Colab
  • Aula 13 - Support Vector Machines com Scikit-Learn Binder Open In Colab
  • Aula 14 - Árvores de Decisão com Scikit-Learn Binder Open In Colab
  • Aula 15 - Florestas Aleatórias com Scikit-Learn Binder Open In Colab
  • Aula 16 - Análise de Componentes Principais (PCA) com Scikit-Learn Binder Open In Colab
  • Aula 17 - Análise de Agrupamentos (Clusterização) com Scikit-Learn Binder Open In Colab
  • Aula 18a - Redes Neurais com TensorFlow e Keras Binder Open In Colab
  • Aula 18b - Redes Neurais com PyTorch Binder Open In Colab
  • Aula 19 - Redes Neurais Convolucionais com PyTorch Binder Open In Colab

Cheat Sheets

Algumas cheat sheets selecionadas para os temas e ferramentas da disciplina:

Proposta de Avaliação da Disciplina

A avaliação pode ser realizada por meio de trabalho final no qual cada grupo de alunos (3 a 6 integrantes) devem entregar um notebook contendo os seguintes tarefas:

  1. Leitura de dados com pandas
  2. Manipulação e limpeza de dados com pandas
  3. Descritivo e exploração de dados com pandas (groupbys)
  4. Figuras que mostrem insights sobre os dados com pandas e matplotlib
  5. Quebrar os dados em conjunto de treino e conjunto de teste
  6. Treinar um estimador do scikit-learn de aprendizagem supervisionada (regressor ou classificador) no conjunto de treino
  7. Verificar o desempenho do estimador do scikit-learn no conjunto de teste

A entrega pode ser via e-mail, mas é extremamente incentivado para que os alunos criem um repositório no GitHub aberto com um README.md bem escrito que explica o projeto. Isto pode já ser um incentivo para os alunos criarem os seus portfolio de projetos de ciências de dados no GitHub, algo que impulsionaria bastante a carreira deles.

A correção dos trabalhos deverá levar em conta o tamanho dos grupos. Grupos pequenos têm maior tolerância de erros e inconsistências do que grupos com um maior número de integrantes.

Como citar esse conteúdo

Para citar o conteúdo use:

plaintext Storopoli & Souza (2020). Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch. Disponível em https://github.com/storopoli/ciencia-de-dados

Ou em formato BibTeX para LaTeX:

bibtex @misc{storopolisouza2020cienciadedados, author = {Storopoli, Jose and Souza, Edson Melo de}, title = {Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch}, url = {https://github.com/storopoli/ciencia-de-dado}, year = {2020} }

Trabalhos Finais de Destaque

Licença

Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional (CC BY-SA 4.0).

CC BY-SA 4.0

Owner

  • Name: Emerson Mendes
  • Login: euemersonmendes
  • Kind: user

Estudante de Ciência da Computação e Data Science.

Citation (CITATION.cff)

# YAML 1.2
---
authors: 
  -
    family-names: Storopoli
    given-names: Jose
    orcid: "https://orcid.org/0000-0002-0559-5176"
  -
    family-names: Souza
    given-names: Edson Melo de  
    orcid: "https://orcid.org/0000-0002-5891-4767"
cff-version: "1.1.0"
date-released: 2020-02-01
identifiers: 
  - 
    type: url
    value: "https://github.com/storopoli/ciencia-de-dados"
license: "CC-BY-SA-4.0"
message: "Se você usa esse software, por favor cite-o com esses metadados."
repository-code: "https://github.com/storopoli/ciencia-de-dados"
title: "Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch"
version: 1.0.0
...

GitHub Events

Total
Last Year