Machine Learning para la categorización de respuestas de preguntas abiertas
Date
2022-12Author
Perú. Ministerio de Educación. Secretaría de Planificación Estratégica. Oficina de Seguimiento y Evaluación Estratégica
Candela Rojas, Erik Carl
Cañari Huerta, Elsa Gabriela
Metadata
Show full item recordAbstract
La presente propuesta de innovación metodológica consiste en categorizar automáticamente las “respuestas de preguntas abiertas” provenientes de los instrumentos de recojo de información con el fin de reducir los costos que requiere una categorización manual. Las preguntas abiertas son utilizadas en los instrumentos de recojo de información que elabora las unidades de la Oficina de Seguimiento y Evaluación estratégica (OSEE) de la Secretaria de Planificación Estrategia (SPE) del Ministerio de Educación. Este tipo de preguntas son empleadas en los instrumentos cuando se busca explorar ciertos temas de interés a mayor profundidad, y no se usan categorías preestablecidas de respuestas. Las respuestas a estas preguntas corresponden a textos (datos no estructurados) que requieren de un tratamiento previo para transformarlas en datos estructurados, facilitando así su análisis. Actualmente, un tratamiento que viene realizando la OSEE es agrupar o categorizar las respuestas con contenido similar de forma manual. Sin embargo, este proceso suele ser muy costoso en términos de tiempo y dinero, especialmente cuando existen miles de respuestas que requieren categorización. Por tal motivo, se buscó alternativas para poder reducir el costo de categorizar las respuestas de preguntas abiertas provenientes de instrumentos de recojo de información. Específicamente, se busca categorizar las respuestas abiertas automáticamente, de forma total o parcial. En ese sentido, el equipo de la OSEE diseñó la innovación “Machine Learning para la categorización de respuesta de preguntas abiertas”. La innovación empleó técnicas analíticas de Machine Learning para poder procesar y categorizar todas las respuestas provenientes de una pregunta abierta, reduciendo así el costo que implica categorizarlas de forma manual.