LINUXTALKS.CO

GitHub ввёл в строй систему машинного обучения Copilot, генерирующую код

 

L


0

0

GitHub
объявил
о завершении тестирования интеллектуального помощника GitHub
Copilot
, способного генерировать типовые
конструкции при написании кода. Система разработана совместно с проектом
OpenAI и использует платформу машинного обучения OpenAI Codex,
натренированную на большом массиве исходных текстов, размещённых в
публичных репозиториях GitHub. Сервис бесплатен для сопровождающих
популярных открытых проектов и студентов. Для остальных категорий
пользователей доступ к GitHub Copilot платный ($10 в месяц или $100 в
год), но предоставляется бесплатный ознакомительный доступ к течение 60
дней.

Поддерживается генерация кода на языках программирования Python,
JavaScript, TypeScript, Ruby, Go, C# и C++ с использованием различных
фреймворков. Доступны модули для интеграции GitHub Copilot со средами
разработки Neovim, JetBrains IDEs, Visual Studio и Visual Studio
Code.Судя по собранной в процессе тестирования телеметрии сервис
позволяет генерировать код достаточно высокого качества - например, 26%
предложенных в GitHub Copilot рекомендаций были приняты разработчиками
как есть.

От традиционных систем автодополнения кода GitHub Copilot отличается
возможностью формирования достаточно сложных блоков кода, вплоть до
готовых функций, синтезированных c учётом текущего контекста. GitHub
Copilot адаптируется к манере написания кода разработчиком и учитывает
используемые в программе API и фреймворки. Например, при наличии в
комментарии примера структуры JSON при начале написания функции для
разбора этой структуры GitHub Copilot предложит уже готовый код, а при
написании рутинных перечислений повторяющихся описаний сформирует
оставшиеся позиции.

Способность GitHub Copilot генерировать готовые блоки кода привело к
спорам, связанным с потенциальным нарушением копилефт лицензий. При
формировании модели машинного обучения использованы реальные исходные
тексты из репозиториев открытых проектов, размещённые на GitHub. Многие
из этих проектов поставляются под копилефт лицензиями, такими как GPL,
требующими поставки под совместимой лицензией кода производных работ. В
случае вставки предложенного Copilot существующего кода разработчики
могут невольно нарушить лицензию на проект, из которого был заимствован
данный код.

Может ли считаться производной работа, сгенерированная системой
машинного обучения, пока не
ясно
.
Также возникают вопросы к тому является ли модель машинного обучения
объектом авторских прав и если да, то кому принадлежат эти права и как
они соотносятся с правами на код, на основе которого построена модель.

С одной стороны сгенерированные блоки могут повторять отрывки текста из
существующих проектов, но с другой стороны система воссоздаёт структуру
кода, а не копирует сам код. В соответствии с проведённым в GitHub
исследованием только в 1% случаев предлагаемая Copilot рекомендация
может включать отрывки кода существующих проектов, размером более 150
символов. В большинстве ситуаций повторы возникают когда Copilot не
может корректно определить контекст или предлагает типовые решения
проблемы.

Для предотвращения подстановки существующего кода в Copilot добавлен
специальный фильтр, не допускающий пересечения с существующими
проектами. При настройке разработчик может на своё усмотрение
активировать или отключить данный фильтр. Из других проблем отмечается
вероятность, что синтезированный код может повторить ошибки и
уязвимости, присутствующие в коде, использованном при обучении модели.

// cc-by opennet.ru
// converted with crypt’s opennet autoreposter

>>> Подробности

★★☆☆☆

Это прям какой-то кибер-столлман-панк. Особенно доставляет:

Способность GitHub Copilot генерировать готовые блоки кода привело к спорам, связанным с потенциальным нарушением копилефт лицензий. При формировании модели машинного обучения использованы реальные исходные тексты из репозиториев открытых проектов, размещённые на GitHub. Многие из этих проектов поставляются под копилефт лицензиями, такими как GPL, требующими поставки под совместимой лицензией кода производных работ.

Хотя по сути человеки точно так же обучаются на кусках кода, в т.ч. и открытых проектов, да ещё и копипастят нещадно.

cocucka    
★★★★★★★★★★
Linux / Firefox
Ответ на: комментарий от cocucka

меня больше зацепило это:

Из других проблем отмечается вероятность, что синтезированный код может повторить ошибки и уязвимости, присутствующие в коде, использованном при обучении модели.

)))

crypt    
★★☆☆☆
FreeBSD / Chrome
Ответ на: комментарий от cocucka

мой ауторепостер новостей вполне исправно работает, но приходится каждый раз заполнять поля на сайте вручную. я думаю, нельзя ли напрямую постить на сайт из скрипта. но останавливают капчи и там еще csrf какой-то.

crypt    
★★☆☆☆
FreeBSD / Chrome
Ответ на: комментарий от crypt

нельзя ли напрямую постить на сайт из скрипта. но останавливают капчи и там еще csrf какой-то.

Натрави на скрипт Copilot, может он напишет? :)

cocucka    
★★★★★★★★★★
Linux / Firefox

Ждём закрытия проекта через 1,5 года из за миллиарда судебных исков. И в целом признания общей бесполезности шарлатанного проекта.

Для предотвращения подстановки существующего кода в Copilot добавлен специальный фильтр, не допускающий пересечения с существующими проектами. При настройке разработчик может на своё усмотрение активировать или отключить данный фильтр.

Ясно понятно, тоесть это вообще не AI для кода, а просто копипастилка где в именах переменных $(VAR_NAME) как в шаблонизаторах HTMLя. AI же используется только для разбора человекатаекста что-бы понять какой готовый кусок ему сунуть и подставить в имена переменных/методов/ункций и прочих слова их человекатекста.

Если бы у них была нейросетка пишущая код никакое разделение на то откуда этот код было бы практически невозможным.

Игрушка, не более того.

LINUXTALKS-CO    
★★★
Последнее исправление: LINUXTALKS-CO (всего исправлений: 1)

Linux / Firefox
Ответ на: комментарий от Crocodoom

Скорее переходный период от второй к третьей. Срубят бабла на подписках, потом скажут ой обвинят разработчиков оригинальной идеи и под предлогом тем или иным свернут проект, но у них конечно же появилось уже право пилить аналог. Эту реализацию сейчас просто монетизируют перед тем как закопать, что-бы как минимум отбить бабки которые вложили в энтуазисатов сделавших генерилку, а когда закопают вместе с разработчиками анонсируют сооооверщенно никак не относящуюся к этой штуке свою штуку встроенную в облачную подписку для VsCode которую они как раз выпустят в течении года двух. Под это дело уже от греха подальше майкрософт буквально недавно закопала atom он как бы не нужен, но это уже мои тараканы.

Я конечно то ещё диванный аналитик, но тут всё читается. Пройдёт время, увидим, посмотрим. Хотя какая в целом разница, ни виндой ни вскодом дел не имеем. Но всё же майки гиганты косвенно их вертухаи касаются всех часто.

LINUXTALKS-CO    
★★★
Последнее исправление: LINUXTALKS-CO (всего исправлений: 1)

Linux / Firefox
Ограничение на отправку комментариев: только для зарегистрированных пользователей, score>=90