[Программирование, GitHub, Машинное обучение, IT-компании] Разработчики критикуют GitHub Copilot: ИИ генерирует цитаты из проектов с открытым исходным кодом и выдает ключи API
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
Разработчики жалуются, что нейросетевой помощник программиста Copilot от GitHub порой слишком увлекается и начинает вместо нескольких строк нужного кода генерировать десятки строк, включая прямые цитаты и комментарии из проектов с открытым исходным кодом. Фактически он занимается «отмыванием» GPL от кода, который теперь можно использовать, не подчиняясь первоначальной лицензии, так как новый код получается под лицензией Copyleft.
Пример многострочной, якобы, генерации кода, где ИИ использовал код функции быстрого вычисления обратного квадратного корня из Quake III Arena с копирайтом автора под GNU GPL 2.0 license.
Извините, данный ресурс не поддреживается. :(
Позиция GitHub по этому вопросу — модель машинного обучения Copilot создает производные работы из ранее полученнызх входных данных, что может считаться производным продуктом программного обеспечения фактически под лицензией Copyleft или AGPL. Также GitHub уточнил, что «Copilot обычно не воспроизводит точные фрагменты кода», но как часто ИИ делает обратное, компания не пояснила, хотя раскрыла, что таких случаев было мало — 0,1%.
Примечательно, что GitHub в своей документации упомянул, что во время внутреннего тестирования Copilot почти 300 сотрудников несколько месяцев использовали сервис в своей повседневной работе. Технически это означает, что в итоге ИИ «второго пилота» создал часть текущих сервисов и это может дать всем пользователям GitHub право на получение копии исходного кода GitHub в соответствии с условиями AGPL, так как фактически GitHub частично стал проектом с открытым исходным кодом. Конечно, Microsoft и GitHub на это не пойдут, но прецедент все же был создан.
Другая проблема, с которой столкнулись сторонние разработчики, участвующие сейчас в программе тестирования GitHub Copilot — пробелы в безопасности при работе алгоритма ИИ «второго пилота» — он раскрывает секреты, которые находит и знает. Сервис «второго пилота» передает и выдает валидные и рабочие ключи API (SendGrid API Keys) репозиториев с открытым исходным кодом. Единственный вариант для владельцев этих проектов — не коммитить ключи API внутри репозиториев. Причем генеральный директор GitHub Нат Фридман в курсе проблемы, но компания не останавливает закрытое тестирование сервиса.
Извините, данный ресурс не поддреживается. :(
29 июня 2021 года Microsoft и GitHub представили нейросетевого помощника программиста Copilot («второй пилот») на базе технологий компании Open AI, занимающейся исследованиями в области искусственного интеллекта. Система GitHub Copilot обучена работать с различными фреймворками и языками программирования. Текущая техническая предварительная версия сервиса больше всего заточена для работы с Python, JavaScript, TypeScript, Ruby и Go.
GitHub Copilot работает на базе OpenAI Codex, новой системе искусственного интеллекта, созданной OpenAI. Решение OpenAI Codex обладает обширными знаниями о том, как разработчики используют код, и значительно более эффективен, чем GPT-3, в генерации кода, отчасти потому, что он был обучен на наборе данных, хранящемся в общедоступных репозиториях, включая терабайты общедоступного кода.
Первоначально этот инструмент стал доступен в качестве плагина к редактору Microsoft Visual Studio Code, также можно будет использовать прямо в браузере через GitHub Codespaces после регистрации в программе тестирования техночесго превью сервиса.
===========
Источник:
habr.com
===========
Похожие новости:
- [Python, Машинное обучение, Искусственный интеллект, TensorFlow] Нейродайджест: главное из области машинного обучения за июнь 2021
- [Информационная безопасность, Криптография, IT-компании] Операторы криптовымогателя REvil потребовали $ 70 млн выкупа
- [Python, Программирование] Учимся читать код, изучая стандартную библиотеку Python (перевод)
- [Законодательство в IT, Финансы в IT, IT-компании] В России использование чужой карты будет квалифицироваться как уголовное преступление
- [Ненормальное программирование, Open source, Обработка изображений, Программирование микроконтроллеров] Benchmark OpenCV на STM32
- [Машинное обучение, Научно-популярное, Искусственный интеллект] Сговор и жульничество в академических кругах (перевод)
- [Процессоры, IT-компании] Intel и Apple планируют первыми выйти на рынок с 3-нм процессорами TSMC
- [Информационная безопасность, Реверс-инжиниринг, IT-компании] Вскрытие покажет: анализируем драйвер Windows x64, защищенный VMProtect
- [Python, Программирование, Машинное обучение] Нейросети в исследовании процессов
- [Разработка под iOS, Беспроводные технологии, Смартфоны, IT-компании] Исследователь нашёл ещё одно название сети Wi-Fi, которое отключает беспроводной модуль в iPhone
Теги для поиска: #_programmirovanie (Программирование), #_github, #_mashinnoe_obuchenie (Машинное обучение), #_itkompanii (IT-компании), #_microsoft, #_github, #_nejrosetevoj_pomoschnik (нейросетевой помощник), #_copilot, #_programmirovanie (
Программирование
), #_github, #_mashinnoe_obuchenie (
Машинное обучение
), #_itkompanii (
IT-компании
)
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 12:27
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
Разработчики жалуются, что нейросетевой помощник программиста Copilot от GitHub порой слишком увлекается и начинает вместо нескольких строк нужного кода генерировать десятки строк, включая прямые цитаты и комментарии из проектов с открытым исходным кодом. Фактически он занимается «отмыванием» GPL от кода, который теперь можно использовать, не подчиняясь первоначальной лицензии, так как новый код получается под лицензией Copyleft. Пример многострочной, якобы, генерации кода, где ИИ использовал код функции быстрого вычисления обратного квадратного корня из Quake III Arena с копирайтом автора под GNU GPL 2.0 license. Извините, данный ресурс не поддреживается. :( Позиция GitHub по этому вопросу — модель машинного обучения Copilot создает производные работы из ранее полученнызх входных данных, что может считаться производным продуктом программного обеспечения фактически под лицензией Copyleft или AGPL. Также GitHub уточнил, что «Copilot обычно не воспроизводит точные фрагменты кода», но как часто ИИ делает обратное, компания не пояснила, хотя раскрыла, что таких случаев было мало — 0,1%. Примечательно, что GitHub в своей документации упомянул, что во время внутреннего тестирования Copilot почти 300 сотрудников несколько месяцев использовали сервис в своей повседневной работе. Технически это означает, что в итоге ИИ «второго пилота» создал часть текущих сервисов и это может дать всем пользователям GitHub право на получение копии исходного кода GitHub в соответствии с условиями AGPL, так как фактически GitHub частично стал проектом с открытым исходным кодом. Конечно, Microsoft и GitHub на это не пойдут, но прецедент все же был создан. Другая проблема, с которой столкнулись сторонние разработчики, участвующие сейчас в программе тестирования GitHub Copilot — пробелы в безопасности при работе алгоритма ИИ «второго пилота» — он раскрывает секреты, которые находит и знает. Сервис «второго пилота» передает и выдает валидные и рабочие ключи API (SendGrid API Keys) репозиториев с открытым исходным кодом. Единственный вариант для владельцев этих проектов — не коммитить ключи API внутри репозиториев. Причем генеральный директор GitHub Нат Фридман в курсе проблемы, но компания не останавливает закрытое тестирование сервиса. Извините, данный ресурс не поддреживается. :( 29 июня 2021 года Microsoft и GitHub представили нейросетевого помощника программиста Copilot («второй пилот») на базе технологий компании Open AI, занимающейся исследованиями в области искусственного интеллекта. Система GitHub Copilot обучена работать с различными фреймворками и языками программирования. Текущая техническая предварительная версия сервиса больше всего заточена для работы с Python, JavaScript, TypeScript, Ruby и Go. GitHub Copilot работает на базе OpenAI Codex, новой системе искусственного интеллекта, созданной OpenAI. Решение OpenAI Codex обладает обширными знаниями о том, как разработчики используют код, и значительно более эффективен, чем GPT-3, в генерации кода, отчасти потому, что он был обучен на наборе данных, хранящемся в общедоступных репозиториях, включая терабайты общедоступного кода. Первоначально этот инструмент стал доступен в качестве плагина к редактору Microsoft Visual Studio Code, также можно будет использовать прямо в браузере через GitHub Codespaces после регистрации в программе тестирования техночесго превью сервиса. =========== Источник: habr.com =========== Похожие новости:
Программирование ), #_github, #_mashinnoe_obuchenie ( Машинное обучение ), #_itkompanii ( IT-компании ) |
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 12:27
Часовой пояс: UTC + 5