Saltar navegación

Depurar e imputar

Unha vez rematados os traballos de campo hai que gravar os datos recollidos no cuestionario dunha folla de cálculo ou base de datos para o seu tratamento estatístico.

A forma habitual de traballar, cando se gravan os datos nunha folla de cálculo é que cada fila corresponda a un individuo da mostra e cada columna sexa unha variable.

É aconsellable que exista unha columna na táboa que identifique de xeito único cada individuo da mostra.

Os cuestionarios poden conter erros que, no caso de non seren detectados durante a recollida, haberá que tratar de depurar a posteriori. Nalgún caso incluso pode ser  necesario volver a contactar coa persoa enquisada. Por exemplo, non é posible que unha persoa, nunha pregunta sobre coñecemento do galego, manifeste que non entende o galego e que despois, no apartado de uso, manifeste que habitualmente fala en galego. Unha das dúas variables é errónea.

Outro problema que pode aparecer é que algunhas das preguntas do cuestionario estean sen cubrir. Por exemplo, se preguntamos o número de horas semanais que ven televisión en galego, pode ocorrer que moitos alumnos non respondan a esta pregunta.¿Que se pode facer neste caso?

  • Non considerar estes alumnos á hora de explotar os resultados.
  • Se son moitos os alumnos que non responden poderíamos desbotar a idea de explotar esta variable.
  • Imputar o número de horas para os alumnos que non responderon, por exemplo asignándolle a media de horas dos alumnos que contestaron. Tamén se pode asignar a media dos alumnos que comparten certas características co alumno ao que se lle quere imputar as horas.

Hoxe en día, existen programas complexos que utilizan distintas técnicas estatísticas para a imputación de datos.

Cando se gravan os datos recollidos no cuestionario nunha base de datos ou nunha folla de cálculo é recomendable codificar as variables en lugar de utilizar literais.

Por exemplo, se queremos gravar o sexo do alumno podemos utilizar unha codificación do tipo:

  • 1 para os homes
  • 6 para as mulleres

Deste xeito evitamos que os valores aparezan mal escritos ou o fagan de forma distinta para unha mesma categoría: homes, home, H, varóns, varones, V, ...