Metodología

Todos los datos se introdujeron manualmente en un archivo de Excel, empezando por el año 1843 y precediendo cronológicamente. Al confeccionar la base de datos, el proyecto incluyó el mayor número posible de categorías, basándose en muchos casos en el conjunto de datos de 1843, ya que éste era, con mucho, el más amplio. A continuación se muestra el total de categorías de datos en la base de datos: nombre de la fábrica, año de los datos, estado, ubicación, propietario, tipo de fábrica, husos en funcionamiento, husos en construcción, husos inactivos, total de husos, telares, horas de trabajo, salario semanal, peso semanal del algodón (quintales), precio de compra del algodón (dólares españoles), mantas semanales producidas (piezas), potencia y nombre cambiado. Puede encontrar más información sobre cada categoría de datos en la sección de campos de datos de este sitio web.

Como se indica en la página de fuentes de datos, no todas las fuentes tenían las mismas categorías de datos ni estaban organizadas de la misma manera. La codificación de los datos comenzó con el conjunto de 1843. Cuando no existían datos, las celdas se dejaron completamente en blanco. Las nuevas categorías de husos inactivos y de cambio de nombre se incorporaron con los datos de 1844 y 1845, ya que en ellos se enumeraban los husos inactivos, en lugar de los husos en construcción que figuraban en el conjunto de datos de 1843. También se creó una categoría de husos totales para sumar los husos inactivos, en funcionamiento y en construcción, con la intención de utilizarla para comparaciones entre años. Una vez codificados los datos de 1843, se introdujeron los de 1844, 1845 y 1857, pero existían ligeros desajustes en los nombres de las fábricas, los propietarios y la ubicación de las mismas. Era necesario resolver estas incoherencias para que el conjunto de datos fuera comprensible para los estudiosos que compararan los datos entre años. Dado que los datos de 1843 eran los más completos y descriptivos, se hicieron pequeñas variaciones de los datos de 1844, 1845 y 1857, como estas diferencias en la ortografía de los nombres, para ajustarlos a los datos de 1843. Sin embargo, los ajustes fueron muy leves a lo sumo, cambiando sólo algunas letras o el acento de un nombre. Por ejemplo, una fábrica llamada "Molino de Teja" en Puebla en los datos de 1857 se cambió para alinearla con la misma fábrica, pero llamada "Molino de La Teja" de los datos de 1843. Todos los cambios en los datos se anotan en la categoría "cambio de nombre", para que los investigadores puedan volver a las fuentes y ver cualquier inconsistencia. Los nombres que se desajustaron por más de unas pocas letras o por la ortografía se mantuvieron como en la fuente original y los cambios se produjeron sólo si el nombre de la fábrica, la ubicación y la propiedad se alinearon. Además, se eliminó cualquier referencia a "Don", "Señor" o "D." de los nombres de los propietarios de las fábricas para que el conjunto de datos fuera más legible.

Un problema constante con los datos se encuentra en la categoría "tipo de fábrica", que combina tanto el tipo de fábrica de los datos de 1843-45 como el de los de 1857. En 1843-45, las fábricas aparecen como hilandería, tejeduría o ambas. En 1857, las fábricas figuran como de algodón o de lana. Se están llevando a cabo más investigaciones y comparaciones entre los datos para intentar aclarar cómo puede ser más específica esta categoría, o si es necesario eliminarla de la base de datos.

También se realizaron comprobaciones aleatorias de los datos para garantizar la integridad de los datos entre las fuentes y la información introducida. Una vez completada la entrada de datos, se cargó un archivo Excel en la base de datos utilizando WPtable, un plugin de WordPress.

Para el archivo de Excel de 1850-1854, todos los datos se introdujeron exactamente como figuran en las fuentes, y no se hicieron cambios en los números ni en la ortografía de los nombres.