Публичные списки избирателей стали инструментом для деанонимизации граждан
Исследование показало, что даже ограниченные наборы данных о голосовании позволяют с высокой точностью идентифицировать личности. Злоумышленники и иностранные разведки могут использовать эту информацию для слежки за семьями военнослужащих, политической дискриминации при найме на работу или мошенничества с личными данными.
Содержание страницы
Механика деанонимизации через открытые данные
По словам Ноа М. Кенни, основателя консалтинговой компании Digital 520, открытые реестры избирателей в США легко сопоставляются с другими доступными базами данных. Это позволяет раскрывать личности людей, которые формально остаются анонимными. В обзоре отмечается, что еще 25 лет назад исследования Гарвардского университета доказали: 87% населения можно идентифицировать всего по трем параметрам — почтовому индексу, полу и дате рождения. Современные инструменты на базе искусственного интеллекта значительно упрощают и ускоряют этот процесс.
В исследовательском документе «Публичные записи о голосовании: документ или поверхность для атаки?» эксперт проанализировал данные из штатов Техас и Северная Каролина. Хотя в Техасе часть информации скрывают (например, точную дату рождения), исследование подтверждает, что это мало влияет на возможность повторной идентификации при использовании сторонних источников.
Практические эксперименты по поиску личностей
Используя скрипт на языке Python, исследователь сопоставил данные избирателей Техаса с базой индивидуальных пожертвований Федеральной избирательной комиссии. В ходе тестирования были проанализированы записи из одного района города Остин. Из 181 уникального донора удалось однозначно идентифицировать более 52% лиц, просто сопоставив их имена и почтовые индексы со списками избирателей. По мнению эксперта, коммерческие брокеры данных, обладающие более мощными инструментами, могут довести этот показатель до 90–95%.
В Северной Каролине ситуация осложняется тем, что в списках часто указываются номера телефонов. У 88,5% избирателей, предоставивших свой контактный номер, он является уникальным в пределах округа. Это делает телефонный номер идеальным ключом для мгновенного поиска человека в других базах данных.
Ключевые уязвимости в защите личной информации
- Сочетание имени и почтового индекса позволяет точно определить личность 95,8% избирателей в Техасе и 87,8% в Северной Каролине.
- История участия в выборах становится уникальным «цифровым отпечатком»: у 98,4% активных избирателей паттерн посещения участков за долгие годы не повторяется больше ни у кого другого.
- Публикация специальных кодов для пересылки воинской почты позволила вычислить 320 семей военнослужащих, находящихся в местах дислокации.
- Попытки Техаса скрыть точную дату рождения нивелируются публикацией даты регистрации избирателя, что в сочетании с полом и индексом позволяет вычислить 28% граждан.
Предлагаемые меры безопасности
В обзоре подчеркивается, что простое удаление части данных из списков не решает проблему. Эксперты считают более эффективным внедрение строгого контроля доступа. Рекомендуется установить лимиты на объем выгружаемых данных, ввести обязательную идентификацию запрашивающего, вести протоколы всех обращений и запретить коммерческую перепродажу этих записей.
На данный момент в США отсутствует всеобъемлющий федеральный закон о защите данных, а правила на уровне штатов и округов сильно различаются. В некоторых регионах получить полные базы данных можно бесплатно и анонимно из любой точки мира. По словам обозревателя, законодательные инициативы по ужесточению правил пока не находят достаточной поддержки в парламенте, а их текущие версии считаются слишком слабыми для реальной защиты приватности граждан.








Комментарии закрыты