Los investigadores creen que esto permitirá a los turoperadores y todos los que están vinculados con el sector turístico pronosticar qué balnearios gozarán de mayor demanda en el período de vacaciones. Los resultados han sido publicados en la revista Journal of Ambient Intelligence and Humanized Computing.
Anteriormente, un enfoque similar se usó al analizar comentarios sobre los servicios ofrecidos en trenes de alta velocidad de la India.
"No solo usamos datos abiertos sobre los viajes, sino sobre las personalidades de los viajeros. Al inicio, sacamos de los datos todos los tuits con geodatos —tuits con la información sobre la ubicación geográfica— y los distribuimos en categorías. De las 5.000 páginas de usuarios de varios países europeos elegidos de forma aleatoria (Francia, Alemania, Suecia, España, Italia, Suiza, Polonia, Grecia, etc.) se sacaron más de 800.000 tuits. Tras la elección de datos, resultó que las categorías más vistas en viajes son 'Comida', 'Clubes nocturnos', 'Estaciones', 'Iglesias', 'Playas'. Para cada categoría preparamos un grupo especial de datos", señala la autora de investigación y presidenta del Instituto de Sistemas de Información Profesionales de la NUST MISIS, Marina Nezhurina.
"Para cualquier pronóstico, el parámetro más importante y obligatorio es la precisión. Si el pronóstico no garantiza la precisión, no se puede decir que es seguro. Por eso usamos el método de clasificación combinada que mezclan los resultados de todos los clasificadores básicos", destaca el autor de la investigación, empleado de la NUST MISIS, Sachin Kumar.
Según los científicos, se puede obtener un pronóstico más concreto recogiendo parámetros tales como la nacionalidad, el sexo y la edad de los usuarios. En la siguiente fase de la investigación se llevará a cabo un análisis y se construirán modelos con el uso de métodos combinados de aprendizaje automático.