Meta Lança Llama 4: Modelo Multimodal com Janela de Contexto de 10 Milhões de Tokens
A Meta lançou o Llama 4, um modelo multimodal com janela de contexto de 10 milhões de tokens, mas seu desempenho real e métodos de benchmark estão sob crítica.
Meta Lança Llama 4: Modelo Multimodal com Janela de Contexto de 10 Milhões de Tokens
De acordo com o criador do conteúdo, a Meta lançou recentemente a família de modelos Llama 4, um conjunto de grandes modelos de linguagem (LLMs) multimodal e de código aberto, com uma janela de contexto impressionante de 10 milhões de tokens. O modelo, que atualmente lidera o ranking do LM Arena, supera todos os outros modelos proprietários, com exceção do Gemini 2.5 Pro. No entanto, há controvérsias em torno dessa conquista.
Controvérsia no LM Arena
O apresentador destaca que o modelo exibido no LM Arena não é a versão original do Llama 4, mas sim uma versão ajustada para preferências humanas, o que permitiu sua dominância no ranking. Essa estratégia foi criticada pela equipe do LM Arena, que afirmou que a interpretação da Meta sobre suas políticas não condizia com o esperado. "O Llama 4 parece incrível no papel, mas não está passando no teste de vibes", comentou o apresentador, citando a resposta oficial.
Desempenho e Limitações
Embora o Llama 4 tenha se destacado em benchmarks, o criador do conteúdo ressalta que, na prática, o modelo enfrenta desafios significativos. Por exemplo, sua capacidade de processar grandes bases de código é limitada, e os requisitos de memória para utilizar sua janela de contexto de 10 milhões de tokens são inacessíveis para a maioria dos usuários. Além disso, o modelo Behemoth ainda está em treinamento, enquanto o Maverick, de tamanho médio, possui uma janela de contexto de 1 milhão de tokens.
Críticas e Ceticismo
Apesar do sucesso em testes padronizados, muitos usuários expressaram decepção com o desempenho real do Llama 4. O apresentador também menciona acusações de que a Meta teria treinado o modelo com dados específicos para benchmarks, algo que a empresa negou veementemente. "Acredito mais em vibes do que em benchmarks", afirma o criador, destacando que o modelo, embora promissor, ainda não atende plenamente às expectativas.
Impacto no Mercado e Alternativas
O vídeo também aborda a estratégia de "AI-first" adotada por empresas como a Shopify, citando um memorando interno que enfatiza a necessidade de equipes justificarem a contratação de humanos em vez de utilizar IA. O apresentador comenta que essa mentalidade reflete uma tendência global, mas ressalta a importância de modelos abertos como o Llama 4, que, apesar de suas limitações, são acessíveis à comunidade.
Por fim, o criador do conteúdo recomenda o uso do Augment Code, um agente de IA para bases de código em larga escala, como alternativa prática para desenvolvedores que desejam integrar IA em seus fluxos de trabalho diários.