Olá,
Tudo bem contigo?
Muito se fala em LGPD, Lei Geral de Proteção dos Dados, mas como implementarmos isso no nosso ETL, ou melhor como proteger dados sensiveis, como Nome, telefone, email.
Uma forma bastante simples de se fazer isso no Pentaho é utilizando o step: Add a checksum.
Iremos começar com duas colunas, o código e o nome.

Agora a ideia é poder normalizar esses dados, com o intuito de proteger o nome da pessoa.
Utilizando o step mencionado acima iremos escolher o tipo MD5 para criar o nosso hash.

Após executar o nosso pipeline, temos os nossos dados inciais e a nova coluna que foi criada pelo step.

Agora para finalizar adicionamos um Select Values para removermos a coluna nome, e assim iremos ter o nome e a coluna hash no etl.

Muito Obrigado.
E até o próximo artigo.

