Repository logo
Communities & Collections
All of DSpace
  • English
  • العربية
  • বাংলা
  • Català
  • Čeština
  • Deutsch
  • Ελληνικά
  • Español
  • Suomi
  • Français
  • Gàidhlig
  • हिंदी
  • Magyar
  • Italiano
  • Қазақ
  • Latviešu
  • Nederlands
  • Polski
  • Português
  • Português do Brasil
  • Srpski (lat)
  • Српски
  • Svenska
  • Türkçe
  • Yкраї́нська
  • Tiếng Việt
Log In
New user? Click here to register. Have you forgotten your password?
  1. Home
  2. Browse by Author

Browsing by Author "Padilla Pierola, Jim Harold"

Filter results by typing the first few letters
Now showing 1 - 1 of 1
  • Results Per Page
  • Sort Options
  • Loading...
    Thumbnail Image
    Item
    Modelo de aprendizaje supervisado basado en el algoritmo XGBoost para predicción de la incidencia del dengue
    (Universidad Nacional de San Martín. Fondo Editorial, 2024-01-12) Padilla Pierola, Jim Harold; Valles Coral, Miguel Angel; Gonzales Sánchez, Pedro Antonio
    La identificación prematura de los casos de dengue es importante para la realización de las acciones de prevención y control por parte de las entidades locales. Esta investigación, presenta una perspectiva haciendo uso de un modelo aprendizaje automático supervisado de regresión no lineal para predecir la incidencia del dengue. Se empleó un set de datos conformada por 272 periodos semanales, con datos históricos (AR) y de Google Trends (GT). El modelo fue entrenado con conjunto de datos perteneciente a 20 ciudades de Brasil con aspiración a su replicabilidad en la región San Martín, Perú. La segmentación del set de datos fue los primeros 258 periodos para entrenamiento y los 14 últimos para prueba. Se utilizó la regresión no lineal del algoritmo de “Extreme Gradient Boosting” (XGBoost), por su buen desempeño en casuísticas que no tienen proporcionalidad entre predictores y objetivo. Se emplearon técnicas para el preprocesamiento de datos, selección de características y elección de hiperparámetros para construir modelos generalizados para cada una de las 20 ciudades, en relación a solamente data histórica, Google Trends y la combinación de ambas. Los resultados obtenidos evidencian que los modelos entrenados pueden ser utilizados en 15 de las 20 ciudades. Los modelos que consumen datos de Google Trends y la combinación con datos históricos fueron los que mejores desempeños tuvieron, para la evaluación de los modelos se valió de las métricas de evaluación: RMSE, R-RMSE, R^2 y Correlación de Pearson. Evidenciando la capacidad del modelo en la predicción de la incidencia del dengue.

DSpace software copyright © 2002-2025 LYRASIS

  • Privacy policy
  • End User Agreement
  • Send Feedback