Resultados del examen de Admisión 2015-I de la UNICA y tratamiento de datos: cometdocs, vba y zoho

La semana pasada fue el examen de Admisión 2015-I de la UNICA.

Los resultados se publicaron en la noche, y se pueden encontrar en PDF aquí sin mayor trámite.

He descargado el PDF, cuyo contenido página tras página tiene este forma:

Nostalgia...

Nostalgia…

El archivo consta de 303 páginas, las cuales albergan a los 6712 postulantes que se presentaron a este examen,junto a su calificación (de 0 a 2000), su condición (ingresó, no ingresó, ausente o anulado) y a la facultad y carrera profesional a la que se presentó.

Nostalgia

Este archivo es exactamente igual al que todos los años se pegaba afuera de todos los locales de la Universidad, y se leía una y otra vez desde su publicación hasta el día siguiente por todas las radios locales. El examen de Admisión era un acontecimiento en Ica, todos estábamos atentos a los resultados; si no éramos nosotros, siempre había un primo, amigo o vecino al cual felicitar o al cual colaborar con el corte de cabello de rigor. También había que estar atentos a quienes no había tenido suerte. “Ya será para la próxima, hay que seguir estudiando. El secreto está en no desanimarse”.

¿Qué podemos hacer con este archivo?

Mientras leía el archivo de pies a cabeza y recorría las facultades, carreras, ingresantes y notas, recordaba lo prácticas que son las herramientas de explotación de información, y vinieron a mi mente las tablas dinámicas de Excel y páginas de consulta tipo ponteencarrera.pe ya comentada en un post anterior.

¿No sería ideal tener estas 303 páginas a disposición para obtener información de interés de ellas? Es decir, convertir este reporte de PDF en gráficos y reportes dinámicos de donde podemos obtener información de interés ¿cómo conseguirlo? Con esta idea comencé a buscar en Google a ver qué se podía hacer. Lo que sigue del Post no es el resultado del tratamiento profesional de la información, sino de la curiosidad. Por ello verán seguramente cosas que se podrían hacer mucho mejor. Igual, allá vamos:

Paso 1: Cambiar de formato

Claro, en PDF mucho no se puede hacer. Encontré que hay todo tipo de herramientas para convertir el PDF a todo tipo de formatos. Luego de algunas pruebas, opté por CometDocs. Con esta herramienta gratuita, online y muy sencilla de usar, ya tenía el archivo PDF transformado en un archivo xslx de Excel.

Transformación en proceso

Transformación en proceso

Minutos después, te llega al correo un link al archivo transformado:

Done!

Done!

Entonces, Paso 1 completado: El archivo ya está en formato Excel.

Paso 2: Limpieza de datos

Al abrir el archivo de Excel, vemos que aún hay mucho por hacer:

Excel1

Aún mucho por hacer

¿Qué hacemos ahora? Tenemos que limpiar los datos para dejarlo, desde esta especie de “formato reporte” a una especie de tabla de registros. Pensando en alternativas con poco conocimiento, se me ocurrió usar VBA (Así es amigo; si no lo sabías, tienes una poderosa herramienta metida en tu Excel de siempre).

Así, preparé cuatro funciones al vuelto:

BorrarLin() para borrar todas las líneas que no necesito del reporte.

ArreglaNombre() para colocar el nombre del estudiante en la celda adecuada.

ArreglaNota() para colocar los campos de nota en las celdas correctas.

ArreglaModalidad() para leer la modalidad de las cabeceras de las páginas y colocarlas como dato de columna.

ArreglaCarrera() igual que la anterior, pero para el caso de carreras.

Luego de ejecutar dichas Macros, y ya, aplicando formato de tabla, me quedó esto:

Excel2

Se ve mejor

Con esto cierro el Paso 2. Ya puedo explotar esta información el cualquier herramienta de explotación de datos.

Paso 3: Generación de informes

Suena bien el término “herramienta de explotación de datos”. En realidad, soy un lego en estos temas, así que lo que se me ocurrió fue usar lo que uso siempre en el trabajo: Tablas dinámicas de Excel.

Excel3

No se ve “pro” ¿no?

No me convencía. Tendría que hacer las tablas dinámicas a manos ¿y qué más? ¿copiar las pantallas y publicarlas? Pedí ayuda a mi amigo y colega Germán Cayo, a quien planteé dos consultas: ¿Cómo obtener una mejor visualización de los datos? y ¿Cómo publicar dicha visualización?

Germán me dio algunas alternativas, y me recordó que se pueden usar herramientas colaborativas como Office 365 para publicar la información. Con este nuevo feedback, volví a Google, y encontré esta herramienta que se ve muy útil: Zoho. Wikipedia nos da una idea rápida de lo que es Zoho y de las herramientas colaborativas que ofrece. Como la herramienta tiene una opción de uso sin costo, me di de alta en el servicio.

A través de un asistente muy sencillo, Zoho tiene tres pasos: Crear una Base de Datos, Crear una tabla (o muchas de ellas) a partir de datos de texto, excel, integración con Drive, acceso a Base de Datos, etc. Aparece un asistente tipo la importación de archivos de texto a Excel y en pocos pasos ya tenermos la tabla creada. Al terminar de crear la tabla, nos ofrece cruzar la información y generar los reportes por uno.

Saca tu cuenta de Zoho. Se ve muy bueno.

Saca tu cuenta de Zoho. Se ve muy bueno.

Una vez se empieza a navegar por los reportes recién generados, se ve que se ha cruzado información de más o de menos, hay una variedad de cosas que podemos modificar y afinar: cambiar variables, añadir filtros, reordenar resultados, cambiar modo de cálculo, y un largo etcétera. La herramienta se ve muy útil.

¿Cómo cerrar el Paso 3 si estoy contando cosas que no se ven? Bueno, los reportes se pueden “Publicar”. La restricción de mi licencia gratuita, implica que quienes visiten estos reportes dinámicos, también se den de alta en Zoho. Lo recomiendo.

Entonces, he publicado tres paneles:

Postulante Análisis

panel2

Captura. Sigue el link de arriba.

Puntaje Análisis

panel1

Captura. Sigue el link de arriba.

Puntaje frente a Código

panel3

Captura. Sigue el link de arriba.

Con esto cierro el Paso 3.

Creo que no va a comentar los resultados del examen...

Creo que no va a comentar los resultados del examen…

¡Tranquilo! En el próximo post comentará sobre los resultados del examen, luego de haber ya tratado la información y a la vista de los cuadros y gráficos generados.

Nos vemos en la red.

Anuncios

2 comentarios en “Resultados del examen de Admisión 2015-I de la UNICA y tratamiento de datos: cometdocs, vba y zoho

  1. Pingback: Resultados del examen de Admisión 2015-I de la UNICA y lo que encontramos | Circunstancia digital

  2. Pingback: Resultados del examen de Admisión 2015-I de la UNICA | Circunstancia digital

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s