«Бывших хакеров не бывает», — эту фразу доказал генетик Янив Эрлич сотрудник Уайтхедовского университета биомедицинских исследований и по совместительству бывший хакер. 18 января он опубликовал научную работу на тему: «Персональная идентификация геномов по косвенным фамильным данным».
В далеком прошлом Янив Эрлич был специалистом, который отвечал за защиту данных, помогал банкам и компаниям находить уязвимости в их сетях и базах данных. Вспомнив свое прошлое, Эрлич решил выяснить, можно ли, с помощью компьютера и открытых геномных баз данных, определить личности анонимных доноров этих баз.
Эрличу не пришлось взламывать базы данных, в которых хранится информация о людях. Все получилось довольно просто.
Статья, которая была опубликована в Science, содержит полную информацию о такой идентификации.
Процесс идентификации проходил в два этапа. На первом Эрлич смог собрать сведения по 32 геномам, взятые из международного научного проекта географическому картировании гаплотипов, при этом ему удалось сузить поиск до 10 000 жителей штата Юта.
Второй этап включал в себя использование другой базы данных, которая выложена в открытом доступе на одном из генеалогических сервисов, помогающих найти людям своих отдаленных родственников по линии отца по уникальному генетическому маркеру. В таких базах маркеры имеют привязку к фамилиям. База данных, которую использовал Эрлич, насчитывает больше 40 тысяч хромосом с привязкой к фамилии.
После того как удалось определить фамилию, и адрес жительства доноров, осталось узнать, кто из членов семьи предоставил свой геном в НарМар. Зная возраст, это было сделать не сложно – в результате это дало возможность определить анонимов, геномы которых были выложены в открытом доступе.
Конечно же, Эрлич не озвучил имена людей, но сам факт возможности идентификации по геному очень сильно настораживает. Это угроза личной безопасности человека.