腾讯 Открытый исходный код混元-A13B模型

Jin10 данные 27 июня сообщают, что 27 июня Tencent выпустила и открыла исходный код модели混元-A13B. Как сообщается, это крупная модель на основе архитектуры смешанных экспертов (MoE) с общим количеством параметров 80 миллиардов и активными параметрами 13 миллиардов, которая значительно снижает задержку вывода и вычислительные расходы, при этом обеспечивая результаты на уровне ведущих открытых моделей; в экстремальных условиях достаточно одной низкобюджетной графической карты.

Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить