cdp

Repositório do curso "Ciência de Dados para Pesquisa".

https://github.com/tuliosg/cdp

Science Score: 39.0%

This score indicates how likely this project is to be science-related based on various indicators:

  • CITATION.cff file
  • codemeta.json file
    Found codemeta.json file
  • .zenodo.json file
    Found .zenodo.json file
  • DOI references
    Found 5 DOI reference(s) in README
  • Academic publication links
  • Committers with academic emails
  • Institutional organization owner
  • JOSS paper metadata
  • Scientific vocabulary similarity
    Low similarity (1.9%) to scientific vocabulary

Keywords

data-analysis data-manipulation data-science data-visualization google-colab jupyter-notebook python
Last synced: 6 months ago · JSON representation

Repository

Repositório do curso "Ciência de Dados para Pesquisa".

Basic Info
  • Host: GitHub
  • Owner: tuliosg
  • License: mit
  • Language: Jupyter Notebook
  • Default Branch: main
  • Homepage:
  • Size: 856 KB
Statistics
  • Stars: 4
  • Watchers: 1
  • Forks: 0
  • Open Issues: 0
  • Releases: 1
Topics
data-analysis data-manipulation data-science data-visualization google-colab jupyter-notebook python
Created 11 months ago · Last pushed 9 months ago
Metadata Files
Readme License Citation

README.md

Cincia de Dados para Pesquisa

Edio especial: Cincias Humanas

Sobre o curso

Este curso destinado a pesquisadores das Cincias Humanas que desejam aprender conceitos fundamentais de Cincia de Dados aplicados pesquisa acadmica. Utilizando uma abordagem prtica e acessvel, o curso trata das bases da cincia de dados, desde definies e conceitos tericos at exerccios e implementaes de cdigo, atravs da linguagem de programao Python.

Objetivos

  • Introduzir conceitos fundamentais de Cincia de Dados;
  • Desenvolver habilidades prticas de organizao, tabulao e limpeza de dados;
  • Apresentar noes bsicas de programao em Python focadas na soluo de problemas reais de pesquisa;
  • Explicar conceitos estatsticos comumente utilizados em pesquisa;
  • Criar visualizaes para comunicar resultados.

Estrutura do curso

O curso est organizado em trs mdulos principais:

Mdulo 1: Introduo cincia de dados e Python

  • Conceitos fundamentais sobre dados e sua importncia na pesquisa;
  • O que Cincia de Dados e como pode beneficiar pesquisas;
  • Introduo programao e conceitos bsicos (variveis, tipos de dados, estruturas);
  • Programao interativa com Google Colab;
  • Primeiros passos com Python.

Mdulo 2: Organizao e pr-processamento

  • Princpios de organizao de dados em planilhas;
  • Importao e exportao de dados com pandas;
  • Explorao inicial de conjuntos de dados;
  • Limpeza e transformao de dados.

Mdulo 3: Anlise e visualizao

  • Anlise exploratria de dados;
  • Estatstica descritiva;
  • Medidas de correlao;
  • Princpios de visualizao de dados;
  • Criao de grficos bsicos;
  • Unio entre anlise e visualizao.

Ferramentas e recursos

Ambientes de trabalho

  • Google Colab;
  • Google Planilhas.

Bibliotecas Python

  • pandas;
  • matplotlib/seaborn;
  • scipy.

Navegao pelo repositrio

  • Cada mdulo est contido em uma pasta. Clique na pasta correspondente para acessar o material completo;
  • Os materiais contidos em cada mdulo esto em pastas com suas respectivas descries: os Jupyter Notebooks na notebooks de cada mdulo, os conjuntos de dados na ** dados** e as planilhas na ** planilhas**;
  • O arquivo README de cada pasta corresponde ao material escrito completo relacionado quele mdulo;
  • As referncias citadas ao longo do material escrito e nos notebooks podem ser encontradas no arquivo bibliography.bib.

Agradecimentos

Agradeo Nayla Chagas (@nhawlao) por aceitar o convite para colaborar neste projeto e por contribuir de forma brilhante no Mdulo de Organizao e pr-processamento. Sua expertise em engenharia de dados foi essencial para a qualidade do material.

Este trabalho faz parte da minha atuao como Embaixador da Rede Brasileira de Reprodutibilidade (RBR) e s se tornou realidade graas ao apoio e infraestrutura do Laboratrio Multiusurio de Informtica e Documentao Lingustica (LAMID).

Atribuio e Citao

Se voc utilizar este material, agradecemos a atribuio adequada. Voc pode faz-lo das seguintes maneiras, dependendo do contexto:

  • Link para o repositrio e meno aos autores

Material baseado no curso "Cincia de Dados para Pesquisa" por Tlio Sousa de Gois e Nayla Sahra Santos das Chagas Disponvel em: https://github.com/tuliosg/CDP

  • Citao formal

@software{gois_2025_15384287, author = {Gois, Tlio Sousa and Chagas, Nayla Sahra Santos}, title = {Cincia de Dados para Pesquisa}, month = may, year = 2025, publisher = {Zenodo}, version = {v1.0}, doi = {10.5281/zenodo.15384287}, url = {https://doi.org/10.5281/zenodo.15384287}, swhid = {swh:1:dir:9aef7b4d4b890b410cc8e51b565bd15ea30e46c7 ;origin=https://doi.org/10.5281/zenodo.15384286;vi sit=swh:1:snp:56371c28e746ab411ad408be706b32a0fae7 f449;anchor=swh:1:rel:981843493a81f2b30c524b963522 0754bbdf30d1;path=tuliosg-CDP-1e0d845 }, }

Licena

Owner

  • Name: Túlio
  • Login: tuliosg
  • Kind: user
  • Company: Universidade Federal de Sergipe

Engenharia de Computação - UFS Pesquisador (CNPq-IT) no Laboratório Multiusuário de Informática e Documentação - @lamid-ufs

GitHub Events

Total
  • Release event: 2
  • Watch event: 3
  • Delete event: 1
  • Public event: 1
  • Push event: 2
  • Create event: 3
Last Year
  • Release event: 2
  • Watch event: 3
  • Delete event: 1
  • Public event: 1
  • Push event: 2
  • Create event: 3

Committers

Last synced: 7 months ago

All Time
  • Total Commits: 89
  • Total Committers: 2
  • Avg Commits per committer: 44.5
  • Development Distribution Score (DDS): 0.011
Past Year
  • Commits: 89
  • Committers: 2
  • Avg Commits per committer: 44.5
  • Development Distribution Score (DDS): 0.011
Top Committers
Name Email Commits
Túlio t****g@g****m 88
Nayla Chagas 5****o 1

Issues and Pull Requests

Last synced: 7 months ago

All Time
  • Total issues: 0
  • Total pull requests: 3
  • Average time to close issues: N/A
  • Average time to close pull requests: 1 minute
  • Total issue authors: 0
  • Total pull request authors: 1
  • Average comments per issue: 0
  • Average comments per pull request: 0.0
  • Merged pull requests: 3
  • Bot issues: 0
  • Bot pull requests: 0
Past Year
  • Issues: 0
  • Pull requests: 3
  • Average time to close issues: N/A
  • Average time to close pull requests: 1 minute
  • Issue authors: 0
  • Pull request authors: 1
  • Average comments per issue: 0
  • Average comments per pull request: 0.0
  • Merged pull requests: 3
  • Bot issues: 0
  • Bot pull requests: 0
Top Authors
Issue Authors
Pull Request Authors
  • tuliosg (3)
Top Labels
Issue Labels
Pull Request Labels