Фото: Reuters
Программа анализирует около сотни источников
Ученые разработали программу, которая на основе материалов СМИ сможет предупреждать о будущих вспышках эпидемии или насилия. Анализируя уже случившиеся события, система пытается обнаружить общие закономерности между ними и спрогнозировать, что произойдет в ближайшем будущем.
Прототип программы создали исследователь Эрик Хоровиц из Microsoft Research и Кира Радински, сотрудница Техниона (Израильского технологического института).
Как сообщил Хоровиц, их система создана на архиве газеты The New York Times за 22 года (с 1986 по 2007), а также ряде онлайн-источников, включая DBpedia, которая упорядочивает информацию из Википедии, WordNet, помогающей программе понять значение слов, и открытую базу знаний OpenCyc. Всего разработка использует более 90 источников, отмечает Technology Review.
Система была успешно протестирована на реальных событиях. В некоторых проверках точность предсказания составила от 70 до 90%. К примеру, исследуя новости о наводнении в Анголе в 2006 году, ПО верно предупредило о грядущей эпидемии холеры. Еще одно предупреждение о распространении болезни в Анголе последовало после анализа сообщений о крупном шторме в Африке в начале 2007 года.
Благодаря массе различных источников система обнаруживает контекст, недоступный при изучении одной лишь прессы. Например, она смогла выявить связь между событиями в Руандеи Анголе, зная, что оба государства находятся в Африке, имеют схожий ВВП, плотность заселения, долю земли, покрытую водой, была ли засуха в минувшем году и другие факторы.
Стоит отметить, что проект создается при поддержке Microsoft, однако компания пока не намерена делать из него коммерческий продукт. Чтобы система предсказывала тему завтрашних новостей еще точнее, Хоровиц и Радински намерены добавить в нее больше источников, включая архивы других газет и оцифрованную литературу.