Al auge del Big Data en la Educación Superior
La revolución de las tecnologías de la información ha abierto un panorama grande en términos de soluciones para gestionar el actual volumen de estudiantes y cursos, pero también generan una gran cantidad de datos en bruto que son almacenados en línea sin mayor uso.
Mucha de esa información nos permite mejorar la calidad de la educación superior. Las instituciones deben tomar decisiones complejas, muchas veces en escenarios de incertidumbre al proyectar, distribuir y planificar la oferta educativa. Por otro lado, en muchos países la legislación obliga a entregar bastante información e indicadores de desempeño a los gobiernos, agencias de acreditación y a los mismos estudiantes a quienes educan.
A veces, los mismos indicadores que requieren estudiarse ya habían sido recopilados y están listos para ser analizados. Sin embargo nadie había encontrado una manera apropiada de realizar ese proceso.
El término “Big Data” – o “los grandes datos” – se refiere simplemente a contar con grandes cantidades de datos. En sí mismo, esto no tiene valor, pero la extracción de estos mismos datos puede entregar perspectivas nuevas e información de mucho interés. Buena parte de estos datos tiene tal densidad es tal que no puede revisarse con cualquier software de análisis de datos. El propósito de las nuevas herramientas de análisis del Big Data es transformar una gran cantidad de información inconclusa e ilegible en tendencias y estadísticas que pueden ayudar a la toma de decisiones, tanto en definiciones estratégicas como en la gestión de problemas diarios.
Hoy por hoy, la educación superior analiza y compara constantemente datos académicos, administrativos y del sector para poder analizar su desempeño y realizar procesos de mejora continua. De acuerdo a la University of Berkeley School of Information, el manejo del Big Data produce “vastas cantidades de datos sobre logros de aprendizaje, datos que en otro minuto no se encontraba disponible para los estudiantes y educadores. Puede permitir que las instituciones entreguen información específica y promuevan mejor sus programas a grupos más precisos y específicos de estudiantes, y permite personalizar la experiencia educativa para que mejor se ajuste a sus necesidades, aumentando las tasas de titulación.”
Por ejemplo, los expertos de Berkeley estiman que los datos de los programas de educación en línea pueden ayudar a monitorear el comportamiento y compromiso de un estudiante, y generar tendencias dentro de una institución para:
- Personalizar el proceso enseñanza-aprendizaje.
- Reducir la carga administrativa en la sala de clases.
- Ayudar a que los docentes adapten sus contenidos.
- Facilitar el desarrollo global y local de la comunidad universitaria.
- Medir el desempeño de los estudiantes mucho más allá de las actuales herramientas de evaluación, como exámenes o pruebas.
El día, el ingreso de información ha aumentado dramáticamente con el uso de plataformas de enseñanza e-learning o MOOCs, sitios de internet, interfaces internas en intranet y el uso de las redes sociales, tanto para labores académicas, acreditación, gestión y difusión. Con ello, las instituciones de la educación superior pueden obtener datos como
- Métricas de compromiso
- Listados
- Notas
- Información de asistencia
- Exámenes estandarizados
- Encuestas
El análisis de datos masivos puede ayudar a aumentar las tasas de retención, mejorar los servicios que provee la universidad y mejorar el desempeño académico, ya que la minería de datos hoy puede ayudar a encontrar información nueva.
A nivel interno, se puede analizar el orden en el que ciertas asignaturas son más efectivas en el marco de su malla curricular, cómo los profesores mejoran su desempeño de acuerdo a otro tipo de indicadores, o qué tipo de temas son más solicitados en línea y requieren de mayor inversión en la biblioteca.
Paralelamente, a nivel externo las distintas facultades tienen acceso a una gran cantidad de datos de acceso abierto acerca del ámbito educativo, entregada por los gobiernos, instituciones internacionales, agencias de investigación y empresas de software. El sector de la educación superior puede ahora mejorar el análisis y benchmarking de sus estudiantes, académicos, currículum y habilidades esperadas, en la medida que obtiene más indicadores de instituciones similares, la industria de la investigación y desarrollo (I&D), y el mercado laboral, para poder identificar tendencias y tomar decisiones mucho más informadas.
Como parte de sus agendas de transparencia, los gobiernos de países como Estados Unidos, el Reino Unido, Chile, México, Perú o Colombia, han abierto al público grandes cantidades de estadísticas y datos para que el mismo público lo analice de acuerdo a sus necesidades.
www.data.gov es el sitio oficial de datos abiertos del Gobierno de Estados Unidos, donde se puede encontrar información, herramientas y recursos para investigar.
https://data.gov.uk/ recopila grandes repositorios de información pública disponibles en distintos formatos para su análisis.
El Centro de Estudios del Ministerio de Educación de Chile entrega estadísticas de distintos niveles del sistema educativo como tasas de ingreso a la educación, estudiantes prioritarios, encuestas a profesores y análisis estadístico.
El Ministerio de Educación Pública de México ha abierto datos estadísticos como gráficos, proyecciones, simulaciones y mapeo georreferenciado para la planificación y desarrollo de proyectos.
El Ministerio de Educación de Perú posee una Oficina de Medición para la Calidad de los Aprendizajes, con bases de datos, indicadores y tendencias.
El Ministerio de Educación Nacional de Colombia hace un seguimiento comparativo de reportes públicos y entrega benchmarks respecto a tasas y estadísticas de instituciones como la Organización para la Cooperación y el Desarrollo Económico (OCDE).
Inquietudes sobre la privacidad
El uso de estas herramientas ha generado polémica respecto al uso de información privada y cuán legítimo es el uso indirecto de los datos por parte de terceros. En Estados Unidos, varios organismos de la sociedad civil firmaron una petición para la privacidad estudiantil, pidiéndoles a las autoridades que revisen la regulación sobre el uso de información estudiantil, el uso educativo de los datos, las políticas de privacidad, la autorización de padres y la rendición de cuentas acerca de cómo se recogen y usan los grandes datos.
Otra preocupación importante es el uso interno de datos como las evaluaciones docentes, notas, asistencia o tasas de deserción, así como la utilización de evidencias y registros de clases – que en muchos casos hoy requieren de la autorización escrita de los estudiantes – así como el aumento del flujo de información en línea de parte de las distintas facultades, todo lo cual requiere de desarrollo de nuevas habilidades por parte ingenieros de software y administradores de datos. Quizás el tema más sensible es el uso de la información que los mismos estudiantes incorporan al sistema, pues deberán estar informados de manera oportuna de cómo está siendo utilizada.
Cualquier ley de privacidad de datos debiera distinguir que tipo de información es pública y qué tipo de información es privada, pues los principales problemas surgen de esa frontera difusa. Por lo pronto, es labor propia de cada institución el diferenciar específicamente qué datos son de dominio privado – y no debieran formar parte de repositorios públicos – y qué tipo de información eventualmente se hará pública cuando sea subida a distintos sistemas online.
En la educación superior, los datos internos debieran ser privados, aunque por separado la información de cada institución no alcanza a tener un volumen para que se considere Big Data. Esto es distinto si se utilizan plataformas en línea como EdX, Udacity o Coursera, que pueden acumular mucha información como tiempo en línea, número de páginas visitadas así como tasas de aprendizaje y deserción.
Sin embargo, el análisis de los grandes datos pueden ayudar a revisar cursos y hacerlos más eficaces, pero el derecho a analizar o compartir ciertos datos en especial es lo que se cuestiona. Por ejemplo, ¿cómo se estima la demanda de MOOCs, calculan la tasa de deserción y el número de profesores necesarios para mediar una clase en particular?
¿Qué sucede al respecto en tu institución? ¿Dónde ves mejoras con el uso de ese tipo de datos? ¿Qué tipo de experiencias tienes? ¿Te preocupa este tipo de datos de alguna manera?