Лента новостей — одна из главных «фишек» современных СМИ. Быстро рассказывать о главном чрезвычайно важно в XXI веке. Нет?
В прошлом году Томас Штайнер (Thomas Steiner) из гамбургского (Германия) офиса Google создал такой алгоритм, который способен помещать новость в поисковую выдачу, как только она появляется в любом СМИ. Сегодня он обновил его — добавил функцию определения изображений, чтобы текст было чем иллюстрировать.
Алгоритм прост до зубовного скрежета и вообще паразитирует на чужом поту. Он основан на идее о том, что если что-то важное прямо сейчас происходит в мире, то редакторы Википедии из разноязыких разделов в этот момент начнут обновлять страницы, посвящённые событию или как-то к нему относящиеся.
Википедия и её дочерний сайт Wikidata публикуют любые изменения с помощьюIRC-сервера Wikimedia. Сервер открыт всем ветрам, позволяя любому следить за тем, что происходит. Алгоритм г-на Штайнера просто контролирует этот канал и сверяет изменения в вики-статьях со свежими мирновостями.
Томас назвал его Wikipedia Live Monitor («Слежение за Википедией в прямо эфире»), запустил в работу в прошлом году, и ПО благополучно и быстро распознало много «горячих» новостей, таких как взрыв на Бостонском марафоне или пропажа малайзийского авиарейса MH370.
И вот теперь г-н Штайнер положил на свой торт визуальную вишенку. Для этого ему пришлось создать ещё одно приложение, которое сканирует социальные медиа в поисках изображений, связанных с конкретным поисковым запросом. Затем ПО извлекает любую визуальную информацию, удаляет дубликаты и кадрирует картинку так, чтобы они сочетались друг с другом в сетке выдачи. Это ПО автор назвал Social Media Illustrator («Социальный медиаиллюстратор»).
Результатом действий этих двух программ стал набор изображений, связанных с самыми последними новостями и организованных в сетку (см. скриншот). Идея г-на Штайнера в том, что эти образы так или иначе могут рассказать историю вне зависимости от текста. Результат работы ПО Томас публикует в Twitter по адресуhttps://twitter.com/mediagalleries.
Сегодня он представил результаты теста новой системы, проведённого во время Олимпиады в Сочи. Когда заканчивалось какое-либо соревнование, его победители почти моментально попадали в Википедию, причём сразу на нескольких языках. Это посылало сигнал алгоритму на поиск изображений атлетов в социальных сетях и создание сетки иллюстраций.
Результаты любопытны. Когда Томас Штайнер попросил нескольких людей определить релевантность выбранных алгоритмом фотографий, большинство отметило, что все изображения идеально соответствовали теме. А вот с изложением таким образом истории пока проблемы. По мнению опрошенных, эти изображения не рождают сюжета, не передают его.
Беглый просмотр результатов работы ПО в «Твиттер»-блоге разработчика убеждает в том, что многое пока не сделано. Вот одна из проблем: во многих случаях по сетке изображений, которые выдаёт алгоритм, не очень понятно, какую новость они иллюстрируют. Пока ПО не способно сразу генерировать ссылки на иллюстрациях, поэтому по ним нельзя кликнуть, чтобы понять, что же происходит. Более того, как уже сказано, фотографии «насильно» кадрируются, дабы сочетаться друг с другом в сетке, но это часто приводит к потере важной информации.
Это, конечно, не значит, что подход не имеет потенциала. Интерес к автоматизированному производству новостей растёт с каждым днём, а существующие алгоритмы всё ещё слишком наивны. Тем не менее нам кажется, что как минимум в ближайшую десятилетку журналистам-новостникам ничего не угрожает: эти ПО и алгоритмы самое большое станут помощником, но не заменят человека.
Подготовлено по материалам Technology Review. Алексей Халецкий
Алгоритм прост до зубовного скрежета и вообще паразитирует на чужом поту. Он основан на идее о том, что если что-то важное прямо сейчас происходит в мире, то редакторы Википедии из разноязыких разделов в этот момент начнут обновлять страницы, посвящённые событию или как-то к нему относящиеся.
Википедия и её дочерний сайт Wikidata публикуют любые изменения с помощьюIRC-сервера Wikimedia. Сервер открыт всем ветрам, позволяя любому следить за тем, что происходит. Алгоритм г-на Штайнера просто контролирует этот канал и сверяет изменения в вики-статьях со свежими мирновостями.
Томас назвал его Wikipedia Live Monitor («Слежение за Википедией в прямо эфире»), запустил в работу в прошлом году, и ПО благополучно и быстро распознало много «горячих» новостей, таких как взрыв на Бостонском марафоне или пропажа малайзийского авиарейса MH370.
Пример работы алгоритма на основе информации об исчезновении рейса MH370. (Изображение с «Твиттер»-аккаунта mediagalleries.)
И вот теперь г-н Штайнер положил на свой торт визуальную вишенку. Для этого ему пришлось создать ещё одно приложение, которое сканирует социальные медиа в поисках изображений, связанных с конкретным поисковым запросом. Затем ПО извлекает любую визуальную информацию, удаляет дубликаты и кадрирует картинку так, чтобы они сочетались друг с другом в сетке выдачи. Это ПО автор назвал Social Media Illustrator («Социальный медиаиллюстратор»).
Результатом действий этих двух программ стал набор изображений, связанных с самыми последними новостями и организованных в сетку (см. скриншот). Идея г-на Штайнера в том, что эти образы так или иначе могут рассказать историю вне зависимости от текста. Результат работы ПО Томас публикует в Twitter по адресуhttps://twitter.com/mediagalleries.
Сегодня он представил результаты теста новой системы, проведённого во время Олимпиады в Сочи. Когда заканчивалось какое-либо соревнование, его победители почти моментально попадали в Википедию, причём сразу на нескольких языках. Это посылало сигнал алгоритму на поиск изображений атлетов в социальных сетях и создание сетки иллюстраций.
Результаты любопытны. Когда Томас Штайнер попросил нескольких людей определить релевантность выбранных алгоритмом фотографий, большинство отметило, что все изображения идеально соответствовали теме. А вот с изложением таким образом истории пока проблемы. По мнению опрошенных, эти изображения не рождают сюжета, не передают его.
Беглый просмотр результатов работы ПО в «Твиттер»-блоге разработчика убеждает в том, что многое пока не сделано. Вот одна из проблем: во многих случаях по сетке изображений, которые выдаёт алгоритм, не очень понятно, какую новость они иллюстрируют. Пока ПО не способно сразу генерировать ссылки на иллюстрациях, поэтому по ним нельзя кликнуть, чтобы понять, что же происходит. Более того, как уже сказано, фотографии «насильно» кадрируются, дабы сочетаться друг с другом в сетке, но это часто приводит к потере важной информации.
Это, конечно, не значит, что подход не имеет потенциала. Интерес к автоматизированному производству новостей растёт с каждым днём, а существующие алгоритмы всё ещё слишком наивны. Тем не менее нам кажется, что как минимум в ближайшую десятилетку журналистам-новостникам ничего не угрожает: эти ПО и алгоритмы самое большое станут помощником, но не заменят человека.
Подготовлено по материалам Technology Review. Алексей Халецкий
Комментариев нет:
Отправить комментарий