Им нужно только ваше лицо.
Два исследователя из Гарварда опубликовали видеоматериалы, демонстрирующие довольно тревожный новый аппаратный инструмент, который они разработали — I-XRAY. Этот инструмент настолько опасен, что они не собираются делать его достоянием общественности.
Это устройство, используя очки RayBan от Meta, распознавание лиц и большие языковые модели (LLMs), может найти всю публичную информацию о вас в Интернете всего за несколько секунд и предоставить её пользователю очков.
Ваше имя, предыдущий опыт, домашний адрес, аккаунты в социальных сетях… всё. Как вы увидите, результаты довольно поразительные, и они поднимают важные вопросы о том, насколько просто для незнакомцев найти информацию о вас в наше время.
Сегодня вы узнаете о темной стороне систем искусственного интеллекта и о том, что они действительно способны сделать, а также о способах защитить себя от этих систем бесплатно.
Крутое и опасное могут идти рука об руку.
Итак, что такое I-XRAY?
I-XRAY – дешевый инструмент для доксинга.
Эта система использует умные очки Ray-Ban от Meta и доступный ИИ для «доксинга» людей в реальном времени, определяя их лица и извлекая конфиденциальную личную информацию, такую как имена, адреса, номера телефонов и даже информацию о родственниках.
Работает это следующим образом:
- Она использует возможность умных очков транслировать видео в Instagram в режиме реального времени. Компьютерная программа отслеживает этот видеопоток, а алгоритм ИИ, PimEyes, используется для идентификации лиц на кадрах.
- Как только система распознает лицо, она запрашивает публичные базы данных, чтобы извлечь личные данные.
- Также осуществляется поиск в Интернете для обнаружения статей или баз данных о регистрации избирателей для поиска дополнительной информации.
- Извлеченная информация затем возвращается пользователю через мобильное приложение, где большая языковая модель анализирует все источники информации, связывает факты и собирает профиль данного человека.
И что же может сделать этот продукт? Ну, удивительно незаконные вещи.
Доксинг как искусство.
В своей демонстрации Нгюен и Ардайфио использовали очки, чтобы идентифицировать одноклассников, раскрывая их адреса и имена родственников.
Они также подходили к незнакомцам в общественном транспорте и делали вид, что знают их, используя данные, которые они извлекли через систему.
Важно отметить, что такие технологии уже много лет доступны государственным учреждениям, поэтому, хотя данное оборудование делает эту технологию доступной для всех, она уже какое-то время была доступна «властям».
Важным аспектом является то, что этот инструмент показывает, что меры безопасности ИИ все еще имеют долгий путь.
Хотя у Meta есть политика конфиденциальности для этих очков, призывающая пользователей уважать частную жизнь других и ясно сигнализировать, когда идет запись, реальность такова, что эти политики больше касаются этикета, чем обязательных правил, и нет никаких гарантий, что пользователи будут им следовать.
На самом деле, когда The Verge, один из изданий, которому стали известны эти инструменты, спросил Meta, представитель компании сослался на условия обслуживания, не предоставив никаких указаний или решений для решения проблемы.
Но как этот инструмент работает «изнутри»?
Большие языковые модели и ResNets.
Успех этой системы основывается на трех технологиях.
Умные очки Ray-Ban от Meta.
Умные очки Ray-Ban от Meta – это сотрудничество между Meta и материнской компанией Ray-Ban, Luxottica, которые предлагают такие функции, как:
- Безрукое фото и видео: Встроенные камеры позволяют пользователям делать фотографии и записывать короткие видео (до 30 секунд) с помощью голосовых команд или физических кнопок.
- Звуковые функции: Очки включают открытые наушники и микрофоны, позволяя пользователям слушать музыку, принимать звонки и взаимодействовать с голосовым помощником Meta без использования наушников.
- Социальная интеграция: Контент, полученный с помощью очков, можно легко делиться на платформах, таких как Facebook и Instagram, через приложение Meta View.
Вкратце, очки предоставляют более удобный способ захватывать и делиться моментами, интегрируя в повседневные очки интеллектуальные функции.
PimEyes, технология распознавания лиц.
Еще одной важной частью головоломки является PimEyes. Эта технология распознавания лиц берет вашу фотографию и использует поиск изображений, чтобы найти «совпадения», другие изображения в открытой сети, которые, вероятно, являются вами.
Хотя PimEyes не предоставляет много информации о том, как она работает, у конкурента ClearviewAI есть такие данные, поэтому давайте воспользуемся ими как ссылкой.
Эта технология работает аналогично большинству современных поисковых систем: с использованием векторных вложений. Идея заключается в следующем:
Поскольку классические компьютеры могут обрабатывать только числа, нам нужно найти способ выразить эти изображения в числовом виде (в некотором смысле, они уже представлены численно, так как каждый пиксель уже имеет числовое представление). Однако мы добавляем небольшую изюминку; мы представляем эти изображения в закодированной форме: векторном вложении (эмбеддинге).

Как видно выше, для того чтобы сделать такую трансформацию, мы сначала предварительно обрабатываем оригинальное изображение, обрезая все части, кроме лица. Затем мы используем модели встраивания — нейронные сети, которые принимают изображение и выводят его векторное представление.
Это буквально тот же процесс, который многофункциональные модели, такие как модели GPT-4 от OpenAI, выполняют, получая изображение.
Затем мы преобразуем изображения в векторы. Но зачем? Кроме необходимости обрабатывать числа, векторы можно математически сравнивать друг с другом, используя методы, такие как косинусное сходство или евклидово расстояние.
Следовательно, мы можем преобразовать семантическое сходство между двумя изображениями (насколько схожи изображения) в математическое упражнение; чем ближе и похожи их векторные представления, тем более схожи и их исходные изображения.

Ты можешь рассматривать числа в этих векторах как атрибуты основного концепта. Таким образом, чем более схожи два вектора, тем более схожи и атрибуты обоих изображений.
Зная это, становится очевидным, как работает этот поиск; при появлении нового изображения система кодирует (преобразует) изображение в векторное представление, вставляет это представление в векторную базу данных и извлекает «k» наиболее похожих векторов, которые, если система достаточно детализирована, с большой вероятностью будут другими изображениями тебя в открытом интернете.
Конечно, это значит, что система не осуществляет запрос в интернете в реальном времени; она постоянно собирает изображения из интернета и хранит их на случай, если ты когда-либо захочешь выполнить извлечение.
Вкратце, такие системы, как ClearView AI и PimEyes, получают изображение и выдают список изображений того же человека, опубликованных в открытом интернете, одновременно собирая любую дополнительную метадату, которая была добавлена к изображению (например, источник, чтобы получить больше информации, которая также может присутствовать в этом источнике).
Естественно, в конце концов, у нас есть LLM, анализатор всех данных.
LLM — отличные анализаторы.
Как уже упоминалось, система использует извлеченные изображения как ссылки для доступа к другим данным (например, если система извлекает изображение из блога, она также получает текст в блоге).
Таким образом, она собирает множество информации о человеке. Затем все эти данные отправляются LLM, который отвечает за создание профиля человека, анализируя и выводя всевозможную информацию о пользователе из этого структурированного набора данных, предоставленного PimEyes.
Наконец, эти данные отправляются в приложение, которое демонстрирует всю информацию пользователю.
И вот так, любой с доступом к этой простой системе может выйти на улицу и собрать всевозможные данные о людях, даже прибегая, как уже упоминалось, к реальным разговорам с людьми, притворяясь, что знают все о случайном незнакомце, которого они увидели впервые всего несколько секунд назад.
Жутко.
С великой силой приходит и великая ответственность.
Естественно, I-XRAY не будет выпущена. Важно, что ты можешь удалить свои данные из многих баз данных изображений, следуя шагам в этом кратком руководстве.
Тем не менее, это не остановит многих пессимистов в отношении ИИ от использования этих примеров, чтобы убедить мир, что ИИ опасен. Но помни, те же инструменты, которые помогают злонамеренным лицам, также имеют решающее значение для борьбы с этими конкретными группами.
Те самые ИИ, которые помогают агентствам идентифицировать нехороших актеров, занимающихся преступной деятельностью (PimEyes), или ИИ, которые используют миллионы людей по всему миру, чтобы повысить свою продуктивность (LLM), а также на первый взгляд безобидные очки, которые помогают людям сообщать о своей жизни миру (очками Ray-Ban от Meta), могут быть использованы в сочетании для создания случаев, находящихся на грани законности.
Вынуждают ли нас эти крайности полностью запретить технологию? Должны ли мы преследовать создателей PimEyes или LLM, если кто-то использует их решения для слежки за людьми? Конечно, нет!
Решение намного проще. Хотя мы, безусловно, должны установить более высокие стандарты для мощных компаний, таких как Meta, чтобы удостовериться, что они выпустят безопасные технологии, решение в конечном итоге заключается в запрете применения, а не технологии.
Обсуждение закрыто.