DL 2.0 Novo Bucket 

bucket: Nome do bucket

environment: Ambiente (ex: Desenvolvimento(dev), Homologação(hml) e Produção(prod))

layer: Camada do datalake (ex: Stage, Bronze, Silver e Gold)

name_requester: Nome do solicitante (ex: linx, nielsen, neogrid)

name_process: Nome do processo | linx-dl-seqNumber-nome-processo (ex: linx-dl-02-search-cpf) Obs: Quando o processo tiver mais de uma palavra, separá-las por hífen "-".

date_source: Fonte de dado

date_process: Referência de data

sub_data_source: Sub nível da fonte de dado

DEV     = 018315387169

PROD = 007100180299

Função de governança de dados

def generate_path(bucket, environment, layer, name_requester, name_process, date_source, date_process, sub_data_source = None):
    if sub_data_source is None:
        path = f"s3a://{bucket}/data/{environment}/{layer}/{requester}/{name_process}/{date_source}/{date_process}"
    else:
        path = f"s3a://{bucket}/data/{environment}/{layer}/{requester}/{name_process}/{date_source}/{sub_data_source}/{date_process}"
    return path

Processos atuais:

número_processonome_processodescriçãocriador
1linx-dl-01-lojas-ativas-monitoramentoProcesso de monitoria de lojas ativas para prevenção de Churns e disparo de e-mailJoão Victor
2linx-dl-02-search-cpfProcesso para encontrar CPF´s no DatalakeJoão Victor
3linx-dl-03-faturamento-rede-cnaeProcesso para gerar o faturamento de redes por CNAE - Atualmente solicitado pela NeogridJoão Victor
4linx-dl-04-quantitivo-lojas-financeiroProcesso para contabilizar as lojas enviadas aos clientes para o financeiro utilizar como base na cobrançaLuciano Siqueira
5linx-dl-05-new-products-nielsenProcesso para gerar novo datashipping de nielsen convJoão Victor

6




7


8


Dicionário para padronização dos nomes colunas: 

Nomenclatura dos Prefixos: 

Nomenclatura dos Prefixos: 
número = nr_ (Inteiro)
valor = vl_ (Decimal/Float) 
descrição = dsc_ (Alfanumerico)
nome = nm_ (Alfanumerico)
codigo = cod_ (Alfanumerico)
data = dt_ (Alfanumerico/Datetime/Timestamp)
identificador = id_ (Alfanumerico)
flag = flg_ (Tipos) (Alfanumerico)
Booleano = bool_ (Booleano)
lista+dic = lsdic_ (lista[dicionário])
dicionário = dic_ (dicionário)
lista = ls_ (lista)
 
Exemplos:
customerCnpj  => cod_consumidor_cnpj
customerCpf   => cod_consumidor_cpf
customeremail => dsc_consumidor_email
customerphone => nr_consumidor_telefone

domain      => nm_automacao
datetime    => dt_transacao_venda
productCode => cod_produto  => Alfanumérico
ean         => cod_ean      => Alfanumérico
listPrice   => preco_tabela => vl_preco_tabela
 
OrderPayments => lsdic_pagamento_transacao_venda
 
webInfos => REMOVER COLUNA/não iremos usar este campo

  • Sem rótulos