Спецпредставитель президента США Дональда Трампа по вопросам искусственного интеллекта Дэвид Сакс обвинил китайский стартап в плагиате. Фото Reuters
Дискредитация – ожидаемый ответ на нежелательный успех конкурента. В США заявили о наличии «существенных доказательств» использования стартапом DeepSeek разработок OpenAI, о краже, признаки которой американские разработчики заметили несколько месяцев назад, но осознали только сейчас. Правда, одновременно с этим для американского общества так и остался без ответа вопрос о правомерности бесконтрольного использования теми же американскими разработчиками массивов информации в виде чужих произведений.
Американские разработчики и чиновники, ответственные за технологическое лидерство США, пошли по пути дискредитации маленького китайского стартапа, ставшего вдруг для них конкурентом национального масштаба.
Информационная атака идет по всем фронтам. Дэвид Сакс, которого Дональд Трамп представил ранее не иначе как «царь Белого дома США» по вопросам искусственного интеллекта (ИИ), объявил о наличии «существенных доказательств», что в основе успеха DeepSeek лежат данные и наработки компании OpenAI.
В свою очередь, представители OpenAI на страницах американской прессы описывают механизм так называемой дистилляции. Речь идет про обучение «молодой» нейросети на данных и на уже полученном методом проб и ошибок опыте, которыми обладают «старые» нейросети-первопроходцы. Это позволяет существенно ускорить, упростить и удешевить весь процесс дальнейшего обучения.
Западное агентство Bloomberg, ссылаясь на источники, сообщило, что еще осенью прошлого года служба безопасности Microsoft зафиксировала, как лица, предположительно связанные с DeepSeek, получили доступ к большому объему данных, используя открытый программный интерфейс OpenAI. Сторонние компании могут покупать доступ к этому интерфейсу, но в случае, о котором говорится сейчас, доступ был несанкционированный.
«Компания DeepSeek заявляет, что ей удалось создать чат-бот за гроши. Каким образом? За счет использования того, что они у нас взяли, украли и применили. Это возмутительно, и с этим нужно разобраться», – объявил также кандидат на пост министра торговли США Говард Латник. Стоит ли говорить, что во всех этих случаях заявления о наличии неких доказательств кражи – по крайней мере пока – остаются бездоказательными.
Итак, первое направление информационной атаки – очередные обвинения в адрес Китая в плагиате и краже технологий. Второе направление – кибербезопасность, которая применительно к китайской разработке ставится под сомнение. Причем происходит это после мощной кибератаки, произведенной на китайский стартап буквально несколько дней назад.
Компания из Нью-Йорка Wiz Research, специализирующаяся на кибербезопасности, заявила, что обнаружила утечку конфиденциальных сведений из DeepSeek. Отмечается, что утечка коснулась более миллиона строк данных, среди которых были цифровые программные ключи, истории запросов пользователей в ИИ-чатах. Специалисты Wiz уведомили об этом DeepSeek, и китайская компания менее чем через час удалила попавшие в открытый доступ данные. «Но их было так просто найти, что мы уверены: мы не единственные, кто их обнаружил», – сообщили в Wiz.
К этой теме подключились и европейские регулирующие органы. Они требуют объяснить, какие личные данные европейских пользователей собирает приложение DeepSeek, с какими целями это делает и где их хранит. Например, с таким требованием выступил итальянский регулятор, соответствующий запрос послала также Ирландская комиссия по защите данных.
«Коммунистическая партия Китая может использовать закон о национальной безопасности для получения доступа к этим данным (к персональным данным ирландцев, да и в целом европейцев. – «НГ»). Политика конфиденциальности DeepSeek оговаривает возможность хранения любой личной информации пользователей ее продукта на расположенных в Китае серверах», – отметил с опаской депутат от ирландской партии «Фианна фойл» Малкольм Бирн.
Впрочем, проблема кибербезопасности, сохранности персональной информации по умолчанию актуальна для любого массового цифрового сервиса, будь то китайский, американский, европейский или в том числе российский продукт. Тем более что ранее уже получали всеобщую огласку случаи утечки персональных данных в том числе от пользователей ChatGPT. Происходило это в результате сбоев, которые в отдельные периоды затрагивали США, Великобританию, Канаду, Израиль. В открытый доступ утекали имена и фамилии, контакты, платежные данные.
Да и в целом американские разработчики, которые пытаются поймать китайских конкурентов на краже, и сами до сих пор не дали своему обществу четкого ответа на вопрос о правомерности бесконтрольного использования ими огромных массивов информации в виде чужих произведений (текстов, изображений, аудио, видео) и иных уникальных индивидуальных сведений (голос, внешность). Причем все это использовалось явно с коммерческими целями, ведь речь идет о рынках, на которых циркулируют, судя по капитализации ключевых игроков, триллионы долларов.
Примеров обеспокоенности американского общества этими вопросами немало. Некоторые информационные поводы были очень яркими. Более года назад группа американских писателей, в том числе автор цикла романов «Песнь льда и пламени» Джордж Мартин, подала иск в отношении компании OpenAI, создавшей чат-бот ChatGPT.
Писатели обвиняли разработчиков в нарушении авторских прав. По их утверждению, компания внесла тексты их произведений в большую языковую модель, чтобы без их согласия обучить нейросеть, которая в будущем скорее всего начнет самостоятельно продуцировать потоки низкопробных текстов, вытесняя при этом книги, написанные людьми.
Из-за нарушения авторских прав около года назад подавала иск против Microsoft и OpenAI газета The New York Times. Как сообщалось в иске, который пересказывали в том числе российские СМИ, технологические компании безвозмездно и незаконно использовали миллионы статей этого издания для обучения своих языковых моделей, в том числе для ставшего мировым хитом чат-бота ChatGPT. И теперь, как опасаются журналисты, эти нейросети на основе полученных знаний станут способны генерировать контент, конкурирующий с материалами СМИ.
Еще свежо предание и о массовой забастовке Гильдии сценаристов США и членов профсоюза голливудских актеров. Одним из требований бастующих как раз стало требование ограничить использование в киноиндустрии искусственного интеллекта: технологии должны помогать, упрощать рутинные процессы, а не заменять полностью сценаристов и актеров, на результатах труда которых обучались ИИ-модели. Были и другие случаи, когда некоторые актеры выступали против создания цифровой копии их внешности или голоса.
Наконец, подавали на OpenAI в суд и за то, что компания, как утверждали истцы, тайно и неправомерно собирала и фактически присваивала себе личные данные пользователей соцсетей, а также созданный ими контент, нарушая установленные законодательством США правила.
Все это ни в коей мере не оправдывает кражи данных и ноу-хау компаниями из других стран, если, конечно, такая кража имела место быть. Но это наглядно иллюстрирует полную правовую и этическую неразбериху, которая сейчас царит на глобальном IT-рынке и с которой ключевые игроки западной IT-индустрии как будто пока не торопились разбираться. Теперь вся эта проблематика вновь становится остроактуальной.