Потыкал DeepSeek, почитал что про него пишут. И кажись понял (догадался) что случилось.
Есть сервисы типа GPT-Tunnel. И суть, в том что они просто оптом закупают токены через компании прокладки и дают доступ в обход санкций.
Китайцы взяли исходную модель и дообучили ей несколько слоёв на чатах пользователей какого то из подобных сервисов. Тем самым они подогнали модель под манеру рассуждений ChatGPT. Из за чего в широком спектре простых и средних задач, она показала результаты сходные с ChatGPT.
После публикации модели, они опубликовали цену её обучения. И на бирже случилась тряска. Цена акций nVidia и многих других компаний упала. Но, по моему мнению, это тупая паника. По причинам:
- Деньги в развитие ИИ вливают государства. Их интересом является сохранение суверенитета. Паразитная ИИ им не нужна.
- OpenAI покупает качественные произведённые людьми данные оптом (тексты, фото, рисунки). А открытые источники после 2021 года, выбирает с большой тщательностью. При этом не спешит вводить обязательную маркировку генеративного контента, тем самым загрязняя открытые источники им. Что повышает порог вхождения.
- Модели обученные на генеративном контенте, заметно хуже.
Какой прогнозирую итог событий? Тряска уляжется, а кто то уже закупил акций. ChatPGT наверняка начнёт вносить артефакты в ответы на запросы через API.