ByteDance disponibiliza código aberto do modelo multimodal 3B Lance treinado em 128 GPUs A100

De acordo com Beating, a pesquisa da ByteDance disponibilizou em código aberto o Lance, um modelo multimodal unificado com 3 bilhões de parâmetros treinado usando apenas 128 GPUs A100. O Lance oferece suporte para compreensão, geração e edição de imagens e vídeos em um único framework, demonstrando que capacidades multimodais avançadas podem ser alcançadas com recursos computacionais mínimos ao usar uma arquitetura de mistura de especialistas em dois fluxos e codificação de posição rotatória ciente do modal.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários