ИИ из Сибири отыщет в Сети завуалированную «запрещёнку»

ИИ из Сибири отыщет в Сети завуалированную «запрещёнку»

Ученые Института систем информатики (ИСИ) им. А. П. Ершова СО РАН научили искусственный интеллект находить запрещенные сайты, даже если те хорошо завуалированы. Программа способна отфильтровать данные и сделать по интернет-ресурсам собственные выводы, рассказали в научном центре. Ученые объединили нейронные сети с методами экспертов-лингвистов и специалистов по машинному обучению. Программа, которую разработали в институте, интегрирует нейросети с моделями, основанными на знаниях экспертов по искусственному интеллекту. В итоге инструмент проверяет информацию, находя нелегальный контент. Также интеллект объясняет, почему считает его таковым.

Старший научный сотрудник лаборатории искусственного интеллекта ИСИ Елена Сидорова отмечает:

«Идея проекта в том, что современные методы типа машинного обучения или нейронных сетей плохо справляются с поиском запрещенного контента. Злоумышленники могут использовать сленг при продаже наркотиков. Они называют их совершенно обычными словами, такими как «молоко» или «корова». Если блокировать эти слова, то будет заблокировано слишком много сайтов. Еще одна трудность — часто сообщения о продаже наркотиков размещаются на сайтах совершенно обычной тематики, например в комментариях к новостям».

Сначала программа анализирует структуру, затем с помощью словаря проводится лингвистический анализ содержания, и делается вывод, связан ли текст с темой наркотиков.

«Одно сообщение на веб-странице может содержать ссылку на другое, и эти цепочки помогают постоянно проверять подозрительную лексику и пополнять базу. Для обновления словаря названий наркотических средств также привлекались эксперты-наркологи, которые знают этот сленг», — уточняет Сидорова.

Отмечается, что методы машинного обучения определяют нелегальное содержание с точностью около 70%, комбинированный способ позволяет добиться точности выявления в 86% случаев. При этом почти 90% нейтральных сайтов метод не относит к нежелательным.

Источник

0

Автор публикации

не в сети 46 минут

Андрей Маргулис

576
С организацией DDoS атак завязал.
Выкладываю новости технологий и интересные статьи с темной стороны интернета.
32 года
День рождения: 14 Мая 1991
Комментарии: 551Публикации: 3128Регистрация: 12-12-2015
Понравилась статья? Поделиться с друзьями:
РЭНБИ - Europe
Авторизация
*
*
Регистрация
*
*
*
*
Ваш день рождения * :
Число, месяц и год:
Отображать дату:
Генерация пароля