https://3dnews.ru/1089828/openai-eshchyo-shest-let-budet-obuchat-ii-na-biblioteke-shutterstock
https://er10.kz/read/it-novosti/openai-kupila-dostup-k-kontentu-vedushhih-amerikanskih-smi/
Казалось бы, новости ни о чём. Обучали бы дальше на открытых источниках… Кажется что просто для удобства купили доступ.
Однако есть такой эффект, как деградация способностей нейросетей при обучении на данных сгенерированных другими нейросетями. Сейчас интернет наполняется сгенерированными изображениями и текстами. Использование открытых источников для обучения становится вредным. Поэтому OpenAI подсуетилась заранее купить доступ к банкам информации созданной наверняка людьми без генеративных инструментов. Входной порог для создания передового ИИ вырос. Теперь для качественных результатов надо покупать чистые созданные исключительно людьми данные, за очень много денег.
OpenAI не торопится лоббировать законы о обязательной маркировке сгенерированных нейросетями данных. Так же OpenAI не торопиться выпускать на рынок передовые модели для генерации видео. Но когда открытые данные будут перенасыщены не маркированными сгенерированным контентом, когда иного почти не будут публиковать. Тогда и пролоббируют законы о обязательной маркировке.
Насчёт видео. OpenAI не торопиться с выпуском на рынок своего инструмента не только потому что он сможет создавать фейки. А потому что не нашли ещё способ поставить себя выше конкурентов. Не нашли у кого купить «чистый банк данных». Во многом потому что в отношении видео, это ещё вопрос, что считать «чистым». Ведь практические эффекты и обычная ручная обработка в сочетании с «зелёным фоном» - тоже может быть «ядовитым» материалом для обучения нейросетей.
Ждите того, что OpenAI купит доступ к сырым съёмочным материалам крупных кинокомпаний или доступ к камерам наблюдений.