Диалог человека и робота
Диалог человека и робота
Дмитрий Литвинов Опубликована сегодня в 3:26

Граница между человеком и машиной исчезла: ИИ говорит с нами голосами самых близких людей

Голосовые клоны возвращают людям с утратой речи способность говорить — Надин Лаван

Голос, который ты слышишь, может больше не принадлежать человеку. Один и тот же тембр, интонация, эмоция — но за ними стоит не живой источник, а программа, обученная имитировать любую речь. Исследование, опубликованное в PLoS One, показало: большинство людей больше не способны отличить настоящие голоса от цифровых клонов. Это не эффект кино — это момент, когда доверие к звуку рушится.

Уверенность, которая исчезла вместе с голосом

Команда Надин Лаван из Университета королевы Марии в Лондоне провела опыт, который лишил иллюзий даже скептиков. Восемьдесят записей — сорок человеческих, сорок созданных искусственным интеллектом. Задача добровольцев: определить, где человек, а где программа. Наивное ожидание — что слух отличит живое дыхание от цифрового шума — рухнуло.

По данным исследования, "чистые" синтетические голоса, не основанные на человеческих образцах, участники различали в 59% случаев. Но вокальные клоны, созданные на основе реальных людей, обманули 58% слушателей. Даже настоящие голоса распознавались правильно лишь в 62% случаев — статистически ничтожное преимущество.

Почему мы ошибаемся? Наш мозг полагается на микродетали тембра, дыхания и пауз. Алгоритмы уже умеют их копировать. Что это значит для коммуникации? Человеческое ухо перестаёт быть гарантом подлинности речи. Мы теряем сенсорный критерий доверия — тот самый, что веками считался неоспоримым.

Простая технология, которая разрушает барьеры

Самое тревожное в открытии — его бытовая доступность. Исследователи использовали не лабораторные инструменты, а открытые сервисы, доступные каждому пользователю сети. Четыре минуты записи речи — и система создаёт клон, способный повторить любую фразу с естественной эмоциональностью.

Сегодня можно клонировать голос из фрагмента интервью, сторис или голосового сообщения. Ошибиться теперь может любой — и жертва, и система защиты. Процесс требует минимальной подготовки, не стоит почти ничего и не имеет ограничений по использованию.

"Нам не понадобилось ничего, кроме открытых коммерческих решений", — пояснила автор исследования Надин Лаван.

Какие шаги делает злоумышленник?

  1. Находит публичную запись жертвы длиной не менее четырёх минут.
  2. Загружает её в программу для синтеза речи.
  3. Получает клон, готовый к применению в звонках, видео или фишинговых схемах.

То, что когда-то было привилегией спецслужб, теперь инструмент доступный подростку. Барьер между экспертом и аферистом исчез.

Когда имитация становится преступлением

9 июля Шэрон Брайтвелл из США получила звонок: голос дочери, рыдания, просьба о 15 тысячах долларов "на залог после аварии". Всё звучало слишком реально. Женщина перевела деньги немедленно. Позже выяснилось — это был сгенерированный клон.

Для банка, использующего голосовую аутентификацию, подобный сценарий — катастрофа. Для семьи — личная трагедия. Программы, основанные на распознавании речи, теряют надёжность.

Такое мошенничество уже не единично. Полиция США и Европы регистрирует рост случаев, когда аудиодипфейки используются для вымогательства и шантажа. Ошибка жертвы очевидна: доверие к звуку оказалось слабым звеном.

Политические последствия и новая форма пропаганды

Голосовая подделка перестала быть личной угрозой — теперь она инструмент влияния. В Австралии премьер-министр Квинсленда Стивен Майлз стал мишенью мошенников, клонировавших его речь для фальшивой рекламы криптовалюты. Публика поверила — ведь голос звучал безупречно.

Представьте, что за день до выборов распространяется аудиозапись, где лидер партии произносит оскорбительные слова. Проверить подлинность — невозможно за часы. Репутация рушится быстрее, чем можно провести экспертизу. Может ли демократия выдержать эпоху аудиодипфейков? Сомнительно, если система верификации не изменится.

Распространение ложных голосов становится идеальным оружием дезинформации. Видео-подделки уже вызывают беспокойство, но аудио опаснее — оно легче, быстрее и дешевле в производстве. Порог доверия снижается не только у граждан, но и у институтов власти.

Между риском и пользой

Исследовательница Надин Лаван подчёркивает: технология не злонамеренна сама по себе. Её возможности в медицине и образовании значительны. Голосовые клоны помогают людям с утратой речи, создают персонализированные аудиокурсы, возвращают способность говорить.

Однако позитивные примеры не компенсируют угрозу безопасности. Что произойдёт, если детекторы дипфейков не догонят генераторы? Тогда любая аудиозапись станет недостоверной. Судебные доказательства, журналистские расследования, личные разговоры — всё потеряет юридическую силу.

Разработчики уже работают над алгоритмами для выявления синтетического звука. Но гонка с генераторами асимметрична: новые модели создают естественность быстрее, чем детекторы учатся её распознавать.

Проверка как новая форма доверия

В условиях, когда подделка стоит дешевле правды, единственная защита — личная проверка. Если вы получаете тревожный звонок, не доверяйте эмоции — перезвоните по известному номеру, задайте уточняющие вопросы, которые известны только реальному человеку.

Можно ли считать осторожность паранойей? Нет. Это новая грамотность, такая же, как цифровая подпись в документах. Ошибка верификации голоса уже приравнивается к потере пароля.

Мини-инструкция для защиты:

  • не принимайте решений после аудиозвонков без визуального подтверждения;
  • храните резервные способы связи с близкими;
  • избегайте публикации длинных голосовых записей в открытом доступе;
  • используйте двухфакторную аутентификацию, не основанную на голосе.

Эти шаги не дают абсолютной безопасности, но восстанавливают контроль над коммуникацией.

Искажение, которое мы сами создали

Смысл эксперимента Лаван не в разоблачении искусственного интеллекта, а в демонстрации хрупкости человеческого восприятия. Мы доверяли голосу, потому что считали его частью личности. Теперь это лишь набор параметров, который можно сымитировать.

Ошибка общества — в убеждении, что технологии служат только комфорту. Последствие — утрата критического слуха. Альтернатива — создание культуры проверки, где подлинность речи подтверждается так же строго, как цифровая подпись.

А что если в будущем мы вообще перестанем верить звуку? Тогда коммуникация станет визуальной и текстовой. Голос утратит статус доказательства и превратится в декорацию. Точка невозврата уже близка — и именно сейчас решается, кто сохранит способность различать правду в шуме.

Подписывайтесь на Moneytimes.Ru

Читайте также

В Якутии золотоносная река Алдан остаётся одним из ключевых источников добычи металла вчера в 20:05
Пошёл на рыбалку – вернулся с золотом: на каких российских реках золото находят прямо под ногами

В четырёх российских реках золото до сих пор находят буквально под ногами: от якутского Алдана до амурской Зеи, где металл выходит на поверхность.

Читать полностью »
Земля в бассейне Уиллкокс в Аризоне опускается на 15 см ежегодно — спутники вчера в 19:43
Спутники показали шокирующие данные: в этом месте Земля опускается, и это может стать катастрофой

Спутниковые данные показывают, что в некоторых районах Аризоны земля опускается на 6 дюймов (15 см) в год из-за истощения подземных вод.

Читать полностью »
У женщин с высоким потреблением ПГП чаще диагностировали аденомы — Jama Oncology вчера в 18:32
Зубчатые батончики, майонез и колбаски — и каждая порция приближает к страшному. Еда в супермаркете ведёт к раку

Женщины до 50 лет, часто употребляющие продукты глубокой переработки, имеют более высокий риск кишечных полипов — предвестников рака. Исследование NHS II объясняет, почему.

Читать полностью »
Разлом Тинтина угрожает миру началом сильного землетрясения — Университет Виктории вчера в 17:17
12 000 лет без движений — и теперь всё может рухнуть: где зарождается следующее великое землетрясение

Разлом Тинтина в Канаде молчит 12 000 лет — и именно это делает его опасным: накопленное напряжение может вылиться в землетрясение 7,5 балла.

Читать полностью »
В Китае обнаружили древний алкогольный обряд с ферментированными напитками из зерновых — Journal of Archaeological Science вчера в 15:25
Обряды с алкоголем: как археологи нашли ключ к пониманию погребальных традиций древнего Китая

Международная группа археологов сделала сенсационное открытие, раскрыв секрет древнего алкогольного обряда в Китае, где ферментированные напитки использовались в погребальных ритуалах более трех тысяч лет назад.

Читать полностью »
Выращивание осьминогов хотят запретить для сохранения дикой природы  — инициатива Keep Them Wild вчера в 14:58
Этика в ракушке: страдания осьминогов в промышленных масштабах — чего мы не хотим знать

Проект по созданию первой интенсивной фермы для коммерческого выращивания осьминогов вызвал глобальную тревогу с момента объявления в 2021 году испанской компанией Nueva Pescanova о планах открыть предприятие в Лас-Пальмасе на острове Гран-Канария, способное выращивать и перерабатывать около миллиона осьминогов в год.

Читать полностью »
Экспедиции 1991 и 2014 годов нашли золотые монеты с парохода SS Central America — археологи вчера в 14:34
Золото, которое не хочет быть найденным: невероятные трудности и загадки поисков затонувшего парохода

В 1988 году найдено сокровище - SS Central America. Пароход затонул в 1857 году с десятками тонн золота. Экспедиции извлекали золотые монеты и слитки с глубины 2200 метров, но споры о праве собственности продолжаются.

Читать полностью »
Падение уровня Турканы ускорило движение разломов — профессор Кристофер Шольц вчера в 13:31
Когда озеро исчезает — начинает дышать Земля: поверхность трескается быстрее, чем успевает остывать климат

Засуха в Восточной Африке ослабляет давление на земную кору, ускоряя движение разломов и пробуждая вулканы под дном рифтовых озёр.

Читать полностью »