ciencia_de_dados_uninove
Science Score: 44.0%
This score indicates how likely this project is to be science-related based on various indicators:
-
✓CITATION.cff file
Found CITATION.cff file -
✓codemeta.json file
Found codemeta.json file -
✓.zenodo.json file
Found .zenodo.json file -
○DOI references
-
○Academic publication links
-
○Academic email domains
-
○Institutional organization owner
-
○JOSS paper metadata
-
○Scientific vocabulary similarity
Low similarity (5.1%) to scientific vocabulary
Repository
Basic Info
- Host: GitHub
- Owner: euemersonmendes
- License: cc-by-sa-4.0
- Language: Jupyter Notebook
- Default Branch: main
- Size: 329 MB
Statistics
- Stars: 0
- Watchers: 1
- Forks: 0
- Open Issues: 0
- Releases: 0
Metadata Files
README.md
Ciência de Dados
Disciplina dos Cursos de Ciências da Computação e afins da UNINOVE.

Conteúdo
- Python e Programação Orientada à Objetos
- Álgebra Linear com
NumPy - Análise de Dados com
pandas - Visualização de Dados com
pandas,matplotlibeseaborn - Machine Learning com
Scikit-Learn - Redes Neurais com
TensorFlow,KerasePyTorch
Professores
Prof. Dr. Edson Melo de Souza - Currículo Lattes - ORCID
Como usar esse conteúdo?
Este conteúdo possui licença livre para uso (CC BY-SA). Caso queira utilizar o conteúdo para um curso ou estudos, por favor colabore nesse repositório quaisquer aprimorações que foram realizadas.
Para configurar um ambiente local:
- Clone o repositório do GitHub:
git clone https://github.com/storopoli/ciencia-de-dados.git - Acesse o diretório:
cd ciencia-de-dados - Instale as bibliotecas necessárias:
pip install -r .binder/requirements.txtouconda env create -f .binder/environment.yml
- Notebooks: Jupyter Notebooks das aulas
Notebooks
- Aula Especial - Curso Rápido de Python para Programadores
- Aula 0 - Jupyter Notebook
- Aula 1 - Operadores aritméticos, relacionais e lógicos
- Aula 2 - Desvio Condicional (
IF) - Aula 3 - Estruturas de Repetição (
FOReWHILE) - Aula 4 - Estruturas de Dados (
listedict) - Aula 5 - Funções
- Aula 5a - Classes e métodos
- Aula 6 -
NumPye Algebra Linear - Aula 7 -
pandas - Aula 8 -
pandasestatística - Aula 9 - Gráficos com
matplotlibepandas - Aula 10 - Machine Learning com
Scikit-Learn - Aula 11 - Regressão Linear com
Scikit-Learn - Aula 12 - Regressão Logística com
Scikit-Learn - Aula 13 - Support Vector Machines com
Scikit-Learn - Aula 14 - Árvores de Decisão com
Scikit-Learn - Aula 15 - Florestas Aleatórias com
Scikit-Learn - Aula 16 - Análise de Componentes Principais (PCA) com
Scikit-Learn - Aula 17 - Análise de Agrupamentos (Clusterização) com
Scikit-Learn - Aula 18a - Redes Neurais com
TensorFloweKeras - Aula 18b - Redes Neurais com
PyTorch - Aula 19 - Redes Neurais Convolucionais com
PyTorch
Cheat Sheets
Algumas cheat sheets selecionadas para os temas e ferramentas da disciplina:
- Pandas:
pandas.pydata.org - Matplotlib:
matplotlib/cheatsheets - Scikit-Learn: choosing the right estimator
- PyTorch:
pytorch.org - Git: português ou inglês
- Machine Learning: diversas linguas em
afshinea/stanford-cs-229-machine-learninge tambémremicnrd/ml_cheatsheet - Markdown: sintaxe geral e sintaxe GitHub
- RegEx:
regex101.com - GitHub: atalhos do teclado em português e inglês
Proposta de Avaliação da Disciplina
A avaliação pode ser realizada por meio de trabalho final no qual cada grupo de alunos (3 a 6 integrantes) devem entregar um notebook contendo os seguintes tarefas:
- Leitura de dados com
pandas - Manipulação e limpeza de dados com
pandas - Descritivo e exploração de dados com
pandas(groupbys) - Figuras que mostrem insights sobre os dados com
pandasematplotlib - Quebrar os dados em conjunto de treino e conjunto de teste
- Treinar um estimador do
scikit-learnde aprendizagem supervisionada (regressor ou classificador) no conjunto de treino - Verificar o desempenho do estimador do
scikit-learnno conjunto de teste
A entrega pode ser via e-mail, mas é extremamente incentivado para que os alunos criem um repositório no GitHub aberto com um README.md bem escrito que explica o projeto. Isto pode já ser um incentivo para os alunos criarem os seus portfolio de projetos de ciências de dados no GitHub, algo que impulsionaria bastante a carreira deles.
A correção dos trabalhos deverá levar em conta o tamanho dos grupos. Grupos pequenos têm maior tolerância de erros e inconsistências do que grupos com um maior número de integrantes.
Como citar esse conteúdo
Para citar o conteúdo use:
plaintext
Storopoli & Souza (2020). Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch. Disponível em https://github.com/storopoli/ciencia-de-dados
Ou em formato BibTeX para LaTeX:
bibtex
@misc{storopolisouza2020cienciadedados,
author = {Storopoli, Jose and Souza, Edson Melo de},
title = {Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch},
url = {https://github.com/storopoli/ciencia-de-dado},
year = {2020}
}
Trabalhos Finais de Destaque
Licença
Este obra está licenciado com uma Licença Creative Commons Atribuição-CompartilhaIgual 4.0 Internacional (CC BY-SA 4.0).
Owner
- Name: Emerson Mendes
- Login: euemersonmendes
- Kind: user
- Repositories: 1
- Profile: https://github.com/euemersonmendes
Estudante de Ciência da Computação e Data Science.
Citation (CITATION.cff)
# YAML 1.2
---
authors:
-
family-names: Storopoli
given-names: Jose
orcid: "https://orcid.org/0000-0002-0559-5176"
-
family-names: Souza
given-names: Edson Melo de
orcid: "https://orcid.org/0000-0002-5891-4767"
cff-version: "1.1.0"
date-released: 2020-02-01
identifiers:
-
type: url
value: "https://github.com/storopoli/ciencia-de-dados"
license: "CC-BY-SA-4.0"
message: "Se você usa esse software, por favor cite-o com esses metadados."
repository-code: "https://github.com/storopoli/ciencia-de-dados"
title: "Ciência de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch"
version: 1.0.0
...
