Мы работаем над тем, чтобы наша NIGMA могла читать. Нет, конечно, делать это так, как мы, роботы пока не могут, но мы поставили перед собой цель сымитировать процесс беглого чтения с помощью алгоритма. Для чего? Для того, чтобы наш сервис смог подсказывать его пользователям, достаточно ли информативным будет текст для читающего его. Благодаря этому, все смогут улучшать публикуемый контент на основе анализа и рекомендаций от NIGM’ы и руководствуясь собственным опытом.
Для имитации процесса чтения NIGMA первым делом просматривает на сайтах из собственной базы тексты, имеющие положительные характеристики (люди их читают, обращают на них внимание, находят в них ответы по своим поисковым запросам и т. д.), а затем берет параметры такого контента за эталон. Далее при анализе конкретного материала NIGMA разбирает его на элементарные элементы (к примеру, сочетания слов, их количество, взаимосвязи между словами, расстояние между словами в тексте) и сравнивает их с эталонами по схожей тематике. По результатам алгоритм выдает набор рекомендуемых параметров, которые должен, по его мнению, содержать текстовый контент, привлекающий внимание пользователя.
Кроме этого, NIGMA сочетает результаты описанной выше итерации с анализом сайтов, обладающих хорошей видимостью по интересующим ключевым поисковым фразам. Таким образом, алгоритм сможет помочь подготовить интересный для пользователей контент так, чтобы он при этом нравился поисковым системам вносил свою лепту в обеспечение видимости сайтов в результатах их поиска.
Помимо этого, наша команда сейчас работает еще над одной интересной задачей. Мы хотим сделать так, чтобы NIGMA могла определять, насколько удачно сочетаются часто встречающиеся сегодня на сайтах пиктограммы с подписями к ним. Мы тестируем распознавание алгоритмом пиктограмм на сайтах, «чтение» сопровождающего текста и имитируем поведение пользователя, просматривающего этот элемент на сайте. Если NIGMA считает, что изображение не очень удачно сочетается с текстом, его поясняющим, она предлагает альтернативные картинки для замены текущей.