Idea
del Proyecto
La idea de transcibir la lista de veteranos de la Guerra
de Independencia de Cuba a una base de datos accesible al publico por
medio del web fue inicialmente concebida por Maria de la Torre.
Comprobamos primero el estado del libro original de acuerdo
con las leyes de propiedad intelectual y concluimos que no habría
ningún obstáculo legal para poder hacer la transcripción.
Aunque al principio teníamos dudas de que podríamos terminar
un proyecto de tal envergadura (el total de nombres a ser transcriptos
llega a los 69,770), decidimos tratar de hacerlo.
Planeo
del Proyecto
Primero hicimos una serie de experimentos a ver si era posible leer y
captar la información directamente usando medios de reconocimiento
automático de caracteres mediante lectura óptica. Esto resultó
no ser posible por la mala calidad de las copias disponibles y por el
modelo y pequeño tamaño de la tipografía empleada.
(La lectura óptica si se mostró practica mas adelante cuando
transcribimos las defunciones, que fueron impresas con una tipografía
de mayor tamaño).
Brevemente consideramos la posibilidad de publicar las paginas individuales
como imágenes de reproducción. Esta idea también
se mostró no practica. Para poder reproducir la pequeña
tipografía empleada, se requerirían imágenes de alta
resolución, que a su vez requerirían archivos de gran tamaño.
El alto numero de paginas (1004 paginas en la lista de soldados mas 263
paginas en la lista de defunciones) hubiera requerido el alquiler mensual
de capacidad adicional de el servicio hogar, lo que hubiera aumentado
los gastos de mantenimiento de CubaGenWeb. También
tenia el grave inconveniente de no ser buscable por los nombres individuales.
Se llego rápidamente a la conclusión que tendríamos
que transcribir los datos manualmente. Esto requería que a) desarrolláramos
un método de transcribir los datos que fuera de fácil uso
por los voluntarios y b) desarrolláramos un método para
poner y encontrar los datos en el web que fuera de fácil uso y
que pusiera un mínimo de requerimientos adicionales a la compañía
hogar del sitio CubaGenWeb.
Una búsqueda fue realizada para encontrar un programa se motor
de búsqueda basado en el web que tuviera las características
deseadas. Afortunadamente, rápidamente encontramos un programa,
aunque imponía algunas restricciones en el numero de campos en
cada entrada y en el numero de entradas en cada archivo. Estas limitaciones
se encontraron aceptables. El programa fue adquirido, el aspecto presentado
al usuario fue desarrollado y pruebas fueron hechas para verificar la
operación y como mejor entrar los datos.
Un formato para los datos fue diseñado que seguía el orden
de los datos en cada entrada en el libro original y añadía
la información sobre el regimiento a cada entrada para que esta
se retuviera después de surtir las entradas. Se asignaron siglas
a cada regimiento para reducir la cantidad de caracteres por entrar y
para que todas las entradas tuvieran una nomenclatura uniforme.
El formato finalmente seleccionado retenía toda la información
en la entrada original con excepción de el volumen, folio y pagina
del documento original en los Archivos Nacionales de Cuba y las notas
que aparecían después de algunas entradas. Creemos que el
lugar donde las entradas originales se encuentran en el Archivo seria
de interés solo a personas con acceso directo al Archivo. Tales
personal podrían fácilmente localizar la información
buscando en los índices en el Archivo buscando en una copia del
libro de Roloff o un microfilm del libro.
Aunque algunas de las notas marginales en las entradas originales son
de interés histórico, indicando, por ejemplo, que tal individuo
trabajaba en un taller o que era un proveedor, la mayoría de las
notas consistía simplemente de la nota "grado por aclarar".
Creemos que estas notas hubieran aumentado significativamente la labor
de la Transcripción y en su mayoría serian de interés
genealógico limitado pues no había subsiguiente confirmación
del grado. Al final, se decidió omitir estas notas de la transcripción.
Se preparó entonces una lista de instrucciones indicando como
entrar los datos en la casa a un spreadsheet o un procesador de texto,
explicando también como resolver las preguntas y conflictos mas
comunes, así como transmitirnos los archivos transcriptos. Estas
instrucciones fueron actualizadas a medida que se recibían mas
preguntas de los primeros transcriptores. (ver las instrucciones pulsando
el enlace en el menú de la izquierda titulado "Instrucciones
para los Transcriptores")
Por el lado de recibo, también preparamos un programa para procesar
los archivos recibidos a el formato deseado por el motor de búsquedas
y también para corregir los errores mas comunes, tales como convertir
todas las fechas a las abreviaturas en Castellano, remover todas las comas
en las entradas, etc. También desarrollamos un programa para generar
reportes y comprobar errores, duplicados o faltas en los números
de secuencia de las entradas y para mantenernos al día en el progreso
del proyecto (ver el mas reciente ejemplo pulsando el enlace en el menú
de la izquierda titulado "Estado del Proyecto")
Al fin llego la hora de enlistar la ayuda de voluntarios para hacer la
transcripción de los datos.
Ejecución
del Proyecto
El aviso llamando a voluntarios fue puesto en la lista CUBA-L el 3 Abril 2000, con la primera transcripción de prueba recibida
de los voluntarios el 11 Abril 2000. Las transcripciones siguieron llegando
por seguido hasta Septiembre 2001, cuando cesaron de llegar casi por completo,
habiéndose terminado poco mas de la mitad (ver la Figura abajo).
Esto probablemente fue debido a otras demandas de tiempo a los voluntarios.
Casi nada sucedió en los próximos 9 meses
hasta la Conferencia de Genealogía que tuvo el Club de Genealogía
Cubana de Miami en Mayo 2002. En esta conferencia notamos que todavía
había gran interés por terminar el proyecto y también
supimos que una de las miembras del Club había logrado conseguir
una copia del libro original en eBay. Seguimos sus pasos y tuvimos suerte
en lograr conseguir una copia también. El tener el original en
nuestras manos hizo posible el poder hacer copias de mejor calidad de
las paginas para facilitar la transcripción (la legibilidad de
las copias siempre había sido un problema). También nos
facilitaba responder a las demandas de los voluntarios casi inmediatamente,
para si no perder el interés o el impulso.
Una nueva llamada para voluntarios fue publicada en la lista CUBA-L. Este ultimo grupo de voluntarios (que incluía
varios del grupo original) logro rápidamente completar casi todo
el proyecto. Nuevamente, sin embargo, la cantidad de transcripciones se
redujo después de unos meses y empezaba a parecer que íbamos
a demorarnos otra vez. Ona vez mas, se solicito un pequeño grupo
de voluntarios para terminar el proyecto. El proyecto quedo terminado
al fin el 13 de Abril de 2003, tres años despues de iniciado.

Lista de voluntarios de los cuales recibimos transcripciones:
Al final de cuentas, participaron un total de 34 transcriptores en el
proyecto, que duro tres años. Como era de esperar, por variaciones
en la habilidad de escribir en máquina y del tiempo libre disponible,
hubo una gran variación en el numero de nombres transcriptos por
cada individuo.
Le damos especiales gracias a Maria
de la Torre, la que produjo y distribuyo las copias a ser transcriptas
durante los dos primeros años del proyecto. Estamos agradecidos
y damos las gracias a los siguientes transcriptores voluntarios que
hicieron posible el proyecto:
Transcriptor |
# de nombres transcritos
(hasta el
08-Jun-2009
) |
C. Victor Hernandez |
6704 |
Ed Elizondo |
6495 |
Matt Perez |
5735 |
Norma Cabrera |
5106 |
Martha Ibañez Zervoudakis |
4381 |
Edward E. Baez |
4175 |
Mary Ann Garza |
3919 |
Mariela Fernandez |
3884 |
Donna Suarez |
3743 |
Susan Muzio Conner |
3556 |
Raclare Kanal |
2660 |
Andres Villalon |
2216 |
Jose A. Tavel |
2033 |
John Rogers |
1509 |
Cindy Braman |
1469 |
Stephen Barranco |
1434 |
Donna Costa |
908 |
Maria de la Torre |
817 |
Georgina McWherter |
812 |
Adriana Power |
780 |
Cecilia Vaillant-Yanes |
777 |
Jennifer Becker-Diaz |
768 |
Alan Perry |
715 |
Patricia Pulles |
690 |
Ben Diaz, Jr. |
690 |
Vicente Sanchez |
651 |
Nancy Padron |
623 |
Luly Del Pino |
601 |
Cheryl Sanders-Sivers |
436 |
Eddie Ramos |
410 |
Jorge Gregorisch |
369 |
Nidia Gonzalez |
348 |
Agueda Hernandez |
317 |
Hilda Pomares |
39 |
¡Gracias!
Archivo
de Transcripciones Recibidas
Aqui tienen una compilación detallada de todos los archivos de
transcripción recibidos:

|