Лица и голоса москвичей можно будет обрабатывать и передавать в обезличенном виде
Лента новостей
Персональные данные жителей столицы можно будет обрабатывать и передавать в обезличенном виде, причем без прямого согласия обладателя. Тем не менее за 30 дней до передачи собранных данных операторы будут обязаны уведомить об этом владельца данных
Фото лиц и записи голоса москвичей можно будет обрабатывать и передавать в обезличенном виде, причем без прямого согласия обладателя конкретного лица и голоса. Такие поправки подготовлены ко второму чтению законопроекта об обезличивании персональных данных. Их собираются внести в закон «О проведении в Москве эксперимента по установлению правового режима, связанного с внедрением технологий искусственного интеллекта», пишет ТАСС.
В тексте есть важная оговорка: за 30 дней до передачи собранных данных операторы будут обязаны уведомить об этом человека, с которого собирались изображения лица и записи голоса. Он сможет запретить использовать эти данные. Если запрета не будет, данные будут переданы дальше.
Куда именно — неизвестно. Предполагается, что данные москвичей используются для прокачки искусственного интеллекта, говорит гендиректор агентства разведывательных технологий «Р-Техно» Роман Ромачев:
Роман Ромачев генеральный директор агентства разведывательных технологий «Р-Техно» «Я так понял, что голосовые данные необходимы для обучения некоего искусственного интеллекта. Это системы, которые будут распознавать голос, распознавать то, что человек хочет от этой системы, то есть прямое обучение. Поскольку у людей разные голоса, разный тембр, дикция, поэтому ИИ необходимо обучить, и это очень длительный и дорогостоящий процесс. Для того чтобы уменьшить расходы на процессе обучения, очень часто многие разработчики, подчеркну многие, практически все используют добровольцев, то есть дают какую-то бесплатную возможность использовать ИИ, и в процессе взаимодействия человека с этим ИИ сам искусственный интеллект обучается. Я так полагаю, что желание передавать подобного рода голоса и есть не что иное, как попытка обучить ИИ каким-то действиям. Каким, нам не сообщают, не говорят. То есть, скорее всего, людей будут использовать втемную для того, чтобы обучить какую-то машинку для определенных действий. Я бы оградил многих желающих участвовать в этом эксперименте, потому что это на самом деле достаточно рискованно, поскольку, если вы не знаете, кому вы передаете свой голос, если эта организация не подконтрольна государственным структурам, это может быть какой-то подрядчик даже, то здесь с большей вероятностью будут утечки. Рано или поздно эти данные могут утечь в интернет, и тогда цифровой отпечаток вашего голоса может оказаться в руках у злоумышленника, и злоумышленники могут синтезировать ваш голос и работать с вашими близкими для того, чтобы их обманывать и совершать те самые телефонные мошенничества».
Каким именно образом операторы данных для ИИ получают данные москвичей, известно: это записи с камер наружного наблюдения, отпечатки пальцев при оплате покупок, отсканированные лица при проходе в метро. И, конечно, звонки, где абонента предупреждают, что разговор может быть записан, а записывается он всегда.
Как указано в поправках, пользоваться базой данных с собранной биометрией смогут госорганы Москвы, органы местного самоуправления, операторы обработки персональных данных, юридические лица. В доступе откажут иностранцам, лицам без гражданства, а также причастным к экстремистской деятельности или терроризму.
Конечно, от разнообразных утечек такие базы не будут застрахованы. Такие датасеты — лакомые кусочки для злоумышленников. Но все не так опасно, считает эксперт по информационной безопасности, гендиректор Phishman Алексей Горелкин:
Алексей Горелкин эксперт по информационной безопасности, гендиректор Phishman «Главное направление данного законодательства в том, чтобы появилась возможность нормально, легально обучать свои искусственные интеллекты, потому что там не искусственный интеллект, там, скорее всего, имитатор разумности. И вот главная проблема, которая сейчас складывается в большинстве IT-компаний — государственных ли, негосударственных ли, — с тем, где легально взять этот первичный датасет. И вот даже в среде тех, кто занимается разработкой в области AI, говорят, что отчитаются за каждый мегабайт информации, которую получили, кроме первичного датасета, потому что первичный датасет обычно получается всерую. И как раз чтобы этого избежать, появляется законопроект, который может предоставить обезличенные — это очень важно — данные для обучения нейронки. В данном проекте не будет такого, что ваши фотографии куда-то там раздаются, нет. Там будет такая история, что будут обезличенные данные предоставляться различным компаниям для их нейронок и обучения этих нейронок, при этом за 30 дней до того, как ваши данные могут быть, а могут не быть предоставлены для обучения нейронки, вас предупредят. Если вы против, вы можете эти данные отозвать. Да, эти данные могут быть лакомым куском для мошенников, хотя сейчас уже достаточное количество датасетов обезличенных, и с этим ничего не сделаешь. А вот как раз чтобы этого не было, в этом законопроекте предусматривается, что будет некая государственная система действовать, в которой и будут все эти данные храниться. Кому нужно будет получить какой-либо датасет, они будут обращаться и получать какие-то кусочки».
Планируется, что нормы по обезличиванию данных вступят в силу с 1 сентября следующего года. Ранее в беседе с РБК директор департамента цифрового развития и экономики данных Минэкономразвития Владимир Волошин отмечал, что «вопрос обезличивания персональных данных сейчас очень актуален, так как есть колоссальный запрос».
Данные, по словам Волошина, могут использоваться в кадровых и банковских системах, а также для обучения искусственного интеллекта на основе больших данных.