Опубликован OpenChatKit, инструментарий для создания чатботов
Автор
Сообщение
news_bot ®
Стаж: 6 лет 9 месяцев
Сообщений: 27286
Представлен открытый инструментарий OpenChatKit, нацеленный на упрощение создания чатботов для специализированного и общего применения. Система адаптирована для выполнения таких задач, как ответы на вопросы, ведение многоэтапных диалогов, обобщение, извлечение информации, классификация текста. Код написан на языке Python и распространяется под лицензией Apache 2.0. В состав проекта входит готовая модель, код для тренировки своей модели, утилиты для тестирования результатов работы модели, средства для дополнения модели контекстом из внешнего индекса и адаптации базовой модели к решению собственных задач.
В качестве основы бота предлагается базовая модель машинного обучения (GPT-NeoXT-Chat-Base-20B), построенная при помощи языковой модели, охватывающей около 20 миллиардов параметров и оптимизированная для разговорного общения.
Для обучения модели использованы данные, полученные из коллекций проектов LAION, Together и Ontocord.ai.
Для расширения имеющейся базы знаний предлагается система, способная извлекать дополнительную информацию из внешних репозиториев, API и других источников. Например, возможна актуализация информации с использованием данных из Wikipedia и новостных лент. Дополнительно доступна модель для модерирования, натренированная с использованием 6 миллиардов параметров, основанная на модели GPT-JT и предназначенная для фильтрации неприемлемых вопросов или ограничения дискуссий в рамках определённых тем.
Отдельно можно отметить проект ChatLLaMA, предлагающий библиотеку для создания интеллектуальных помощников, похожих на ChatGPT. Проект развивается с оглядкой на возможность выполнения на собственном оборудовании и создания персонализированных решений, рассчитанных на охват узких областей знаний (например, медицина, юриспруденция, игры, научные исследования и т.п.). Код ChatLLaMA поставляется под лицензией GPLv3.
Проект поддерживает использование моделей на базе архитектуры LLaMA (Large Language Model Meta AI), предложенной компанией Meta. Полная модель LLaMA охватывает 65 миллиардов параметров, но для
ChatLLaMA рекомендуется использовать варианты с 7 и 13 миллиардами параметров или модели GPTJ (6 млрд), GPTNeoX (1.3 млрд), 20BOPT (13 млрд), BLOOM (7.1 млрд) и Galactica (6.7 млдр). Изначально модели LLaMA поставляются только исследователям по специальному запросу, но так как для доставки данных использовались торренты, энтузиасты подготовили скрипт, позволяющий загрузить модель любому желающему.
===========
Источник:
OpenNet.RU
===========
Похожие новости
- Главная ссылка к новости (https://www.together.xyz/blog/...)
- OpenNews: FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, на системах с одним GPU
- OpenNews: Проект Open-Assistant развивает открытый AI-бот, похожий на ChatGPT
- OpenNews: Amazon опубликовал набор данных для понимания речи на 51 языке
- OpenNews: Facebook опубликовал модель для машинного перевода, поддерживающую 200 языков
- OpenNews: Открыт код системы распознавания и перевода речи Whisper
Похожие новости:
- Выпуск Bubblewrap 0.8, прослойки для создания изолированных окружений
- FlexGen - движок для запуска AI-ботов, похожих на ChatGPT, на системах с одним GPU
- Выпуск Tor Browser 12.0.3 и дистрибутива Tails 5.10
- В почтовом клиенте Thunderbird запланирована полная переработка интерфейса
- Проект Open-Assistant развивает открытый AI-бот, похожий на ChatGPT
- Выпуск дистрибутива Tails 5.9
- В Ruby on Rails устранена уязвимость, допускающая подстановку SQL-кода
- Выпуск системы изоляции приложений Firejail 0.9.72
- Google опубликовал библиотеку Magritte для скрытия лиц на видео и фотографиях
- В ядро Linux 6.2 войдут улучшения RAID5/6 в Btrfs
Теги для поиска: #_chat, #_bot, #_ai, #_chatgpt
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 06:45
Часовой пояс: UTC + 5
Автор | Сообщение |
---|---|
news_bot ®
Стаж: 6 лет 9 месяцев |
|
Представлен открытый инструментарий OpenChatKit, нацеленный на упрощение создания чатботов для специализированного и общего применения. Система адаптирована для выполнения таких задач, как ответы на вопросы, ведение многоэтапных диалогов, обобщение, извлечение информации, классификация текста. Код написан на языке Python и распространяется под лицензией Apache 2.0. В состав проекта входит готовая модель, код для тренировки своей модели, утилиты для тестирования результатов работы модели, средства для дополнения модели контекстом из внешнего индекса и адаптации базовой модели к решению собственных задач. В качестве основы бота предлагается базовая модель машинного обучения (GPT-NeoXT-Chat-Base-20B), построенная при помощи языковой модели, охватывающей около 20 миллиардов параметров и оптимизированная для разговорного общения. Для обучения модели использованы данные, полученные из коллекций проектов LAION, Together и Ontocord.ai. Для расширения имеющейся базы знаний предлагается система, способная извлекать дополнительную информацию из внешних репозиториев, API и других источников. Например, возможна актуализация информации с использованием данных из Wikipedia и новостных лент. Дополнительно доступна модель для модерирования, натренированная с использованием 6 миллиардов параметров, основанная на модели GPT-JT и предназначенная для фильтрации неприемлемых вопросов или ограничения дискуссий в рамках определённых тем. Отдельно можно отметить проект ChatLLaMA, предлагающий библиотеку для создания интеллектуальных помощников, похожих на ChatGPT. Проект развивается с оглядкой на возможность выполнения на собственном оборудовании и создания персонализированных решений, рассчитанных на охват узких областей знаний (например, медицина, юриспруденция, игры, научные исследования и т.п.). Код ChatLLaMA поставляется под лицензией GPLv3. Проект поддерживает использование моделей на базе архитектуры LLaMA (Large Language Model Meta AI), предложенной компанией Meta. Полная модель LLaMA охватывает 65 миллиардов параметров, но для ChatLLaMA рекомендуется использовать варианты с 7 и 13 миллиардами параметров или модели GPTJ (6 млрд), GPTNeoX (1.3 млрд), 20BOPT (13 млрд), BLOOM (7.1 млрд) и Galactica (6.7 млдр). Изначально модели LLaMA поставляются только исследователям по специальному запросу, но так как для доставки данных использовались торренты, энтузиасты подготовили скрипт, позволяющий загрузить модель любому желающему. =========== Источник: OpenNet.RU =========== Похожие новости
|
|
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы
Текущее время: 22-Ноя 06:45
Часовой пояс: UTC + 5