L’Etica è parte della Qualità dei Dati?
Mentre le aziende, i governi e le organizzazioni scientifiche fanno sempre più affidamento sull’uso di massicce quantità di dati nei processi decisionali, notiamo che questi dati presentano diversi problemi di qualità. Incompletezza (dati parziali), ridondanza (più copie della stessa informazione), incoerenza (dati in conflitto) o inesattezze fino a poco tempo fa, erano considerate i principali problemi di qualità dei dati. Oggi sempre più prepotentemente si profila un altro aspetto: quello etico. In generale infatti: non vi è alcuna garanzia sul fatto che i dati di input rispettino principi etici, gli algoritmi sono scritti da esseri umani che non hanno tenuto conto di tali aspetti, e, problema ancor più critico, spesso i modelli di Machine Learning ottenuti dai dati sono opachi e difficili da interpretare. Discutiamo, anche con alcuni esempi, se e come sia possibile controllare e garantire il rispetto dei principali requisiti etici – quali per esempio l’equità o la protezione dei dati.