Собирал стат данные по твиттеру и столкнулся с тем, что ботов там уже больше чем не ботов. Как отличить бота от не бота в автоматическом режиме? Опишите, кто какие характерные признаки видел, отличать которые можно научить скрипт. Глубокий интеллектуальный анализ не подойдет, не справимся просто. Анализ сеть ботов на взаимный фолловинг тоже сложно определить
Пока нашел такие способы: 1) Имя 0, весь посты содержат ссылку 2) Ссылка +4 хэштега 3) 2-3 сообщения без ссылок (копирование чужих, левых сообщений), после чего дается ссылка на похудеть, либо на проверить зрение. Твиттер сам успешно борется с такими ботами, но если сканировать в реальном времени, то что-то обязательно выползет 4) Постинг одинаковых сообщений, но в каждом из них отмечен новый ник, для того, чтобы "жертва" обратила внимание.
Вариант, когда вся лента состоит только из ссылок, я исключил, так как в этом случае могут под фильтры попасть и "хорошие" боты, транслирующие материалы с сайта.