Baidu блокирует Google и Bing от сбора контента из-за растущего спроса на данные для ИИ

· 1 минут чтения

article picture

Китайский интернет-гигант Baidu недавно предпринял шаги по ограничению доступа поисковых систем Google и Bing к своему сервису Baidu Baike, аналогу Википедии. Это решение отражает растущую тенденцию защиты данных в эпоху развития искусственного интеллекта (ИИ).

Изменения в политике доступа

8 августа Baidu обновил файл robots.txt на сайте Baidu Baike, полностью заблокировав возможность индексации контента сервиса поисковыми роботами Google и Bing. Ранее в тот же день доступ был частично открыт, что позволяет предположить, что решение было принято внезапно.

Причины блокировки

Этот шаг Baidu можно рассматривать как попытку защитить свои онлайн-активы в условиях растущего спроса на большие объемы данных для обучения и создания моделей ИИ. Baidu Baike содержит около 30 миллионов статей, что делает его ценным ресурсом для разработчиков ИИ.

Тенденция в индустрии

Baidu не единственная компания, предпринимающая такие меры. Недавно социальная платформа Reddit также ограничила доступ поисковых систем к своему контенту, за исключением Google, с которым у компании есть специальное соглашение. Microsoft в прошлом году также угрожала ограничить доступ к своим данным для конкурентов, использующих их для обучения чат-ботов.

Последствия для пользователей

Несмотря на обновление политики доступа, многие записи из Baidu Baike все еще доступны в результатах поиска Google и Bing, вероятно, из-за кэшированного контента. Однако в будущем это может измениться, что повлияет на доступность информации для пользователей за пределами Китая.

Будущее доступа к данным

По мере развития технологий генеративного ИИ, многие крупные разработчики заключают сделки с издателями контента для доступа к качественной информации. Например, OpenAI недавно получила доступ к архивам журнала Time за более чем 100 лет.

Решение Baidu подчеркивает растущую важность контроля над данными в эпоху ИИ и может стать предвестником дальнейших изменений в доступе к информации в глобальном масштабе.