https://github.com/basedosdados/queries-basedosdados-projetos

https://github.com/basedosdados/queries-basedosdados-projetos

Science Score: 13.0%

This score indicates how likely this project is to be science-related based on various indicators:

  • CITATION.cff file
  • codemeta.json file
    Found codemeta.json file
  • .zenodo.json file
  • DOI references
  • Academic publication links
  • Academic email domains
  • Institutional organization owner
  • JOSS paper metadata
  • Scientific vocabulary similarity
    Low similarity (4.0%) to scientific vocabulary
Last synced: 10 months ago · JSON representation

Repository

Basic Info
  • Host: GitHub
  • Owner: basedosdados
  • Language: SQL
  • Default Branch: main
  • Size: 11.7 KB
Statistics
  • Stars: 0
  • Watchers: 3
  • Forks: 0
  • Open Issues: 0
  • Releases: 0
Created over 3 years ago · Last pushed over 3 years ago
Metadata Files
Readme

README.md

Queries template

Esse é um template para um pacote DBT a ser importado no cluster do projeto basedosdados-dev, que irá gerar um servidor RPC para execução dos projetos específicos de cada projeto GCP. Deve-se respeitar a seguinte nomenclatura: queries-<nome_do_projeto_gcp>.

Como usar esse template

  • Na criação de um novo repositório, selecione o template queries-template e crie um repositório com o nome queries-<nome_do_projeto_gcp>.
  • Configure o seguinte secret no repositório:
    • VAULT_TOKEN: token de acesso ao vault.

Este projeto necessita das variáveis de ambiente descritas abaixo. Tais valores são providos na action do arquivo cd.yaml, os valores possuem como origem o Vault.

  • GCP_SA_KEY_BASE64: credenciais para uma conta de serviço com pleno acesso ao GKE, GCR e GCS. Preencher com o resultado de cat sua-credencial.json | base64.
  • GCP_PROJECT_ID: identificador do projeto no GCP.
  • GKE_CLUSTER_NAME: nome do cluster no GKE.
  • GKE_CLUSTER_ZONE: zona do cluster no GKE.

Aplique as seguintes alterações no projeto:

  • Corrija o arquivo cd.yaml, onde todos os valores que estão como <GCP_PROJECT_NAME> devem ser substituídos pelo nome do projeto GCP;
  • Garanta que todos os valores recuperados do Vault existam e estejam corretos;
  • Modifique o nome do pacote em dbt_project.yml para o nome do seu projeto. Aproveite esse momento para ler, com calma, os comentários desse arquivo de configuração.
  • Crie contas de serviço para seus projetos de desenvolvimento e produção. Caso tenha somente um projeto, pode usar a mesma conta para ambos os propósitos. Nota: Jamais faça commit de suas credenciais.
  • Acesse o arquivo profiles.yml e se atente aos comentários, eles indicam os campos que devem ser alterados.
  • Usando os arquivos de credencial, crie os secrets credentials-dev e credentials-prod usando a flag --from-file.
  • Faça o upload das alterações realizadas em seu repositório.
  • Toda vez que houver uma alteração de código na branch master, uma instância atualizada do servidor RPC do DBT será criada em seu cluster, no devido namespace.

Resources:

  • Learn more about dbt in the docs
  • Check out Discourse for commonly asked questions and answers
  • Join the chat on Slack for live discussions and support
  • Find dbt events near you
  • Check out the blog for the latest news on dbt's development and best practices

Como desenvolver novos modelos

  1. Caso seja um dataset-id já existente, acesse models/<dataset-id> e pule para o passo 5.

  2. Caso seja um novo dataset-id, crie um novo diretório models/<dataset-id>.

  3. No arquivo dbt_project.yml registre o dataset-id junto aos já existentes, conforme exemplo abaixo:

yaml models: emd: dataset-id: +materialized: view # Materialization type (view, table or incremental) +schema: dataset-id # Overrides the default schema (defaults to what is set on profiles.yml)

  1. No diretório models/<dataset-id>, crie um arquivo schema.yml para preencher metadados de suas tabelas. Exemplo abaixo:

```yaml version: 2

models: - name: myfirstdbt_model description: "A starter dbt model" columns: - name: id description: "The primary key for this table" ```

  1. Desenvolva seus modelos (que corresponderão a tabelas) no diretório models/<dataset-id>.

Owner

  • Name: Base dos Dados
  • Login: basedosdados
  • Kind: organization
  • Email: contato@basedosdados.org
  • Location: Brazil

Universalizando o acesso a dados de qualidade

GitHub Events

Total
Last Year

Issues and Pull Requests

Last synced: over 1 year ago

All Time
  • Total issues: 0
  • Total pull requests: 0
  • Average time to close issues: N/A
  • Average time to close pull requests: N/A
  • Total issue authors: 0
  • Total pull request authors: 0
  • Average comments per issue: 0
  • Average comments per pull request: 0
  • Merged pull requests: 0
  • Bot issues: 0
  • Bot pull requests: 0
Past Year
  • Issues: 0
  • Pull requests: 0
  • Average time to close issues: N/A
  • Average time to close pull requests: N/A
  • Issue authors: 0
  • Pull request authors: 0
  • Average comments per issue: 0
  • Average comments per pull request: 0
  • Merged pull requests: 0
  • Bot issues: 0
  • Bot pull requests: 0
Top Authors
Issue Authors
Pull Request Authors
Top Labels
Issue Labels
Pull Request Labels

Dependencies

.github/workflows/cd.yaml actions
  • actions/checkout v2 composite
  • docker/build-push-action v3.1.1 composite
  • docker/login-action v2.0.0 composite
  • google-github-actions/get-gke-credentials v0.2.1 composite
  • google-github-actions/setup-gcloud v0.2.1 composite
  • hashicorp/vault-action v2.4.1 composite
.github/workflows/docs.yaml actions
  • JamesIves/github-pages-deploy-action v4.2.3 composite
  • actions/checkout v2 composite
  • actions/setup-python v2 composite
  • hashicorp/vault-action v2.4.1 composite
.github/workflows/lint_docker.yaml actions
  • actions/checkout v2 composite
  • reviewdog/action-hadolint v1 composite
.github/workflows/metadata_automation.yaml actions
  • actions/checkout v2 composite
  • actions/setup-python v2 composite
  • hashicorp/vault-action v2.4.1 composite
  • stefanzweifel/git-auto-commit-action v4 composite
Dockerfile docker
  • python 3.8-slim build
requirements-actions.txt pypi
  • arcgis ==1.9.1
  • gspread ==5.3.0
  • jinja2 ==2.11.3
  • markdown ==3.3.6
  • openpyxl ==3.0.9
  • pandas ==1.4.2
  • pyyaml ==6.0
  • requests ==2.27.1
  • ruamel.yaml ==0.17.21
requirements.txt pypi
  • dbt ==0.21.1
  • markupsafe ==2.0.1