Informativo

Nomes dos atributos como contratos

Em nosso dia-a-dia trabalhando com dados, muitas vezes nos deparamos com problemas causados por falta de burocracia e/ou processo na forma como lidamos com nossos conjuntos de dados. A Engenharia de Software, por exemplo, é uma disciplina focada em fornecer técnicas com o objetivo de produzir software de qualidade. Porém, na Ciência de Dados, muitas vezes o sistema não é o principal como na Engenharia de Software, e sim os dados resultantes.

Por ser uma área recente, ainda não temos padrões bem estabelecidos de como lidar com os diversos formatos de dados e isso acaba levando à má interpretação dos mesmos e, consequentemente, à sua má utilização.

Uma forma de mitigar problemas associados à má interpretação dos dados é incluir metadados nos conjuntos de dados. Informações como tipo, valores máximos, mínimos, entre outras. Em dados tabulares, por exemplo, muitas vezes os nomes das colunas podem ser utilizados de uma forma muito proveitosa para descrever o conjunto de dados.

Inspirado no Design por contratos, o artigo abaixo apresenta um processo para nomear as colunas para facilitar o gerenciamento dos dados.

Autor: Gabriel T. P. Coimbra

Referência: Link

© 2020 Universidade Federal de Viçosa - Todos os Direitos Reservados