Фото: Reuters
Статистика Twitter оказалась близка к реальным данным
Ученые первый раз проанализировали сообщения с включенной геолокацией в Twitter, чтобы определить закономерности зарубежных поездок. Суть исследования изложена в материале, опубликованном в электронной библиотеке Корнелльского университета.
"Геолокации в Twitter - один из первых открытых и доступных источников глобальных данных, в котором хранятся миллионы цифровых полностью реальных записей об активности человека в пространстве и времени. В нашем исследовании мы показали, что во многих случаях геолокации в Twitter можно и нужно рассматривать как важный показатель перемещений человека, особенно из страны в страну", - отмечают авторы статьи, Бартош Хавелка из Зальцбургского университета и его коллеги.
Они исследовали миллиарды твитов с включенной геолокацией, которые были отправлены 1 января по 31 декабря 2012 года, убрав из списка те, что были написаны роботами, рекламные месседжи, а также твиты, где информация о местонахождении менялась слишком часто. Впоследствии они определили, где каждый пользователь живет - из какой страны он делал твиты чаще всего.
Изучив такие данные, ученые подсчитали среднее расстояние, на которое люди путешествовали. В "топе" стран с самым большим "радиусом вращения", как его определили исследователи, оказались самые дальние - Австралия и Новая Зеландия, остальные же пользователи Twitter ездиои не так далеко.
"Даже в эпоху глобализации и мнимого уменьшения влияния расстояний люди до сих пор перемещаются "локально", посещая соседние страны чаще, чем те, что расположены дальше", - указывают ученые.
Также они отметили, что пользователи Twitter более активны на выходных, а в другие страны отправляются в летние месяцы или в конце года - хотя результаты для каждого государства несколько отличались. К примеру, в арабских странах на решение выехать за рубеж влияют различные религиозные праздники.
Свои выводы ученые сравнили с данными туристической статистики, и выяснилось, что они довольно близки - ученые полагают, что доказали эффективность своего метода.