
Исследователи AI VK выложили в открытый доступ массив данных из 40 млрд
обезличенных взаимодействий 10 млн пользователей с 20 млн коротких видео за
шесть месяцев, пишет
Forbes. Речь идет о датасете
VK-LSVD (Large Short-Video Dataset).
Благодаря публикации open-source-наборов разработчики могут совершенствовать
рекомендательные алгоритмы. Теперь исследователи могут получить информацию
о лайках, дизлайках, шерах, времени просмотра, контексте воспроизведения.
Длякаждого пользователя в массиве указаны социально-демографические
характеристики.
Подобные данные позволяют строить модели, ориентированные и на поведенческие
данные, и на контент. Каждый случай такой публикации — большое событие для
специалистов, отмечает издание.
Короткие видео не могут потребляться в фоновом режиме, в этом состоит их
уникальность, так как каждый клип получает ту или иную реакцию от
пользователя.
Свежие комментарии