De olho no mercado de AI, AMD lança o modelo de linguagem AMD-135M, voltado para implantações empresariais (Foto: Divulgação/AMD)

Inteligência Artificial

AMD lança novo modelo de SLM para IA Generativa

Vladimir Vidal

Published

30/09/2024

A AMD continua expandindo sua presença no mercado de inteligência artificial (IA), lançando não apenas novos chips, mas também apostando em software para alcançar segmentos de mercado ainda não dominados pela Nvidia. A empresa está comprometida em capturar novas fatias do setor de IA, introduzindo tecnologias inovadoras e modelos ajustados às necessidades empresariais.

AMD-135M: O Primeiro Modelo de Linguagem da AMD

Entre as novidades da AMD está o lançamento do seu primeiro modelo de linguagem pequeno, o AMD-135M, pertencente à família Llama, que foi projetado para implantações privadas em negócios. Embora ainda não esteja claro se o novo modelo está diretamente relacionado à recente aquisição da Silo AI pela AMD (o que depende da aprovação regulatória), este movimento demonstra um claro foco da empresa em atender demandas específicas de clientes com um modelo pré-treinado e utilizando o próprio hardware da AMD para inferências.

Tecnologia de Decodificação Especulativa

Uma das razões pelas quais os modelos da AMD são rápidos está na utilização da chamada decodificação especulativa. Esse processo envolve um “modelo de rascunho” menor que gera vários tokens candidatos em uma única passagem, que em seguida são enviados para um modelo maior e mais preciso, o “modelo alvo”, que verifica ou corrige os tokens. Essa abordagem permite que múltiplos tokens sejam gerados simultaneamente, aumentando a eficiência. No entanto, essa técnica tem um custo em termos de consumo de energia, devido ao aumento nas transações de dados.

Duas Versões de Modelos: AMD-Llama-135M e AMD-Llama-135M-Code

A AMD lançou duas versões do seu modelo: AMD-Llama-135M e AMD-Llama-135M-code, cada uma otimizada para tarefas específicas. Ambas utilizam a tecnologia de decodificação especulativa para acelerar a performance de inferência, o que é uma escolha lógica para serviços baseados em modelos de linguagem pequena. Nos testes de desempenho realizados pela AMD, ambas as versões superaram expectativas.

Advertisement. Scroll to continue reading.

Treinamento e Dados: 670 Bilhões de Tokens

O modelo base, AMD-Llama-135M, foi treinado do zero com 670 bilhões de tokens de dados gerais, processo que levou seis dias para ser concluído. Esse treinamento utilizou quatro nós de processamento baseados em AMD Instinct MI250, o que demonstra a capacidade de hardware da AMD de suportar grandes volumes de dados em curtos períodos.

AMD-Llama-135M-Code: Foco em Codificação

Além do modelo geral, a AMD também apresentou o AMD-Llama-135M-code, que foi ajustado com 20 bilhões de tokens adicionais especificamente voltados para tarefas de codificação. Esse ajuste fino foi concluído em quatro dias, usando o mesmo hardware, e visa proporcionar resultados mais rápidos e precisos em tarefas relacionadas ao desenvolvimento de software e automação de código.

Potencial de Otimizações Futuras

A AMD acredita que ainda há espaço para otimizações no desempenho desses modelos. Embora a empresa tenha divulgado números de benchmarks com suas GPUs da geração anterior, os especialistas imaginam o que os chips da geração atual, como o MI300X, e os da próxima geração, como o MI325X, serão capazes de realizar em termos de aceleração de IA generativa.

Competição com a Nvidia e a Expansão de Mercado

O lançamento do AMD-135M e do AMD-135M-code mostra que a AMD está focada em capturar uma fatia do mercado de inteligência artificial que não é dominada pela Nvidia. Ao desenvolver tanto hardware quanto software otimizados, a AMD espera oferecer soluções competitivas para negócios que desejam adotar IA generativa e modelos de linguagem para diferentes finalidades, desde automação de processos até o desenvolvimento de código.

Advertisement. Scroll to continue reading.

O Impacto da Decodificação Especulativa no Desempenho

A utilização da decodificação especulativa é um diferencial importante para a AMD. Essa técnica permite que modelos de IA generativa processem múltiplas saídas de forma simultânea, acelerando significativamente o tempo de resposta em inferências. No entanto, como qualquer inovação, há um trade-off, especialmente em relação ao consumo de energia. Mesmo assim, os resultados mostram que a tecnologia traz um avanço importante para quem busca eficiência em seus projetos de IA.

As GPUs AMD: Um Pilar de Desempenho para IA Generativa

As GPUs da AMD, como as usadas nos modelos Instinct MI250 e MI300X, têm mostrado que a empresa está bem posicionada para competir com outras gigantes do setor de IA. À medida que a demanda por chips especializados para IA aumenta, a AMD está pronta para fornecer soluções robustas tanto para tarefas gerais quanto para nichos específicos, como o desenvolvimento de código.

A Aposta da AMD em IA Generativa

A aposta da AMD em IA generativa vai além dos modelos de linguagem. A empresa está desenvolvendo um ecossistema que une hardware e software, oferecendo uma plataforma completa para empresas que desejam explorar o potencial da IA. O lançamento do AMD-135M e do AMD-135M-code é apenas o começo de uma estratégia mais ampla da AMD para expandir sua presença no mercado de IA.

Resumo para quem está com pressa:

AMD lança o modelo de linguagem AMD-135M, voltado para implantações empresariais.
O modelo utiliza decodificação especulativa, acelerando a geração de tokens.
Foram lançadas duas versões: AMD-Llama-135M e AMD-Llama-135M-code, para otimizações específicas.
O modelo foi treinado com 670 bilhões de tokens, levando seis dias para ser concluído.
A versão AMD-Llama-135M-code foi ajustada com 20 bilhões de tokens voltados para codificação.
A AMD planeja otimizações futuras para seus chips MI300X e MI325X.

In this article:

Twitter teve que pagar indenização milionária a ex-funcionário após ações de Elon Musk ao assumir empresa

Mundo

SpaceX: Starship de Musk enfrenta nova falha em lançamento

Foguete Starship da SpaceX perde contato em teste e destroços iluminam o céu

Luis Gomes07/03/2025

Apple lançou o M4 Pro: Novo chip oficial da maçã para Mac mini e MacBook Pro

Tecnologia

Apple anuncia novo Mac Studio, mas estratégia de Chips levanta dúvidas

Novo lançamento da Apple custa mais de R$ 50 mil

João Souza06/03/2025

Pesquisa de brasileiros explica como sol pode afetar terremotos (Ilustração)

Curiosidades

Aquecimento global e Sol podem aumentar terremotos?

Pesquisa de brasileiros explica como sol pode afetar terremotos

Hugo Oliveira05/03/2025

Novos cálculos elevam chances de impacto de asteroide (Foto: NASA)

Mundo

Novos cálculos triplicam probabilidade de impacto de asteroide com a Terra

Cálculos elevam risco de impacto de 2,2 para 2,8%

João Souza20/02/2025

Presidente do Santos confirmou o interesse em Neymar

Esporte

Gramado natural do Maracanã causa lesão em Thiago Silva

Incoerência: Casa de Neymar tem gramado sintético igual ao que ele crítica nos estádios

Luis Gomes19/02/2025

The Guardian e OpenAI fecham parceria hostórica (Foto: GenAI Arte)

Inteligência Artificial

Guardian anuncia parceria estratégica com a OpenAI

Tecnologia da OpenAI será usada pelo Guardian Media Group através de contrato inédito

João Souza18/02/2025

DeepSeek e Baidu obrigam OpenAI a aumentar força na batalha das IAs (Foto: OpenAI/Divulgação)

Inteligência Artificial

Baidu e OpenAI liberam chatbots grátis para frear DeepSeek

DeepSeek e Baidu obrigam OpenAI a aumentar força na batalha das IAs

Luis Gomes12/02/2025

Donald Trump declarou que a DeepSeek é um "chamado de alerta" para empresas americanas

Inteligência Artificial

Donald Trump fala pela primeira vez sobre o DeepSeek

Donald Trump, presidente dos Estados Unidos, declarou na segunda-feira (27/1) que o lançamento de um chatbot pela empresa chinesa DeepSeek é um “chamado de...

Bruno Silva28/01/2025

DeepSeek, laboratório chinês, revelou a receita técnica de seu modelo R1, desafiando gigantes da IA

Inteligência Artificial

Como a pequena startup DeepSeek abalou as estruturas do Vale do Silício

O jornal Financial Times (FT) analisou como o laboratório de inteligência artificial DeepSeek, com sede na China, surpreendeu o mundo ao revelar toda a...

Vladimir Vidal27/01/2025

DeepSeek ultrapassou o ChatGPT e se tornou o aplicativo mais baixado na App Store

Inteligência Artificial

Guerra tecnológica: A IA chinesa que ultrapassou o ChatGPT em downloads

A empresa chinesa DeepSeek tem se tornado um dos nomes mais comentados no mercado de inteligência artificial (IA) global. Recentemente, seu aplicativo ultrapassou concorrentes...

Bruno Silva27/01/2025

Drift

Inteligência Artificial

AMD lança novo modelo de SLM para IA Generativa

AMD-135M: O Primeiro Modelo de Linguagem da AMD

Tecnologia de Decodificação Especulativa

Duas Versões de Modelos: AMD-Llama-135M e AMD-Llama-135M-Code

Treinamento e Dados: 670 Bilhões de Tokens

AMD-Llama-135M-Code: Foco em Codificação

Potencial de Otimizações Futuras

Competição com a Nvidia e a Expansão de Mercado

O Impacto da Decodificação Especulativa no Desempenho

As GPUs AMD: Um Pilar de Desempenho para IA Generativa

A Aposta da AMD em IA Generativa

Resumo para quem está com pressa:

Últimas

Mundo

SpaceX: Starship de Musk enfrenta nova falha em lançamento

Tecnologia

Apple anuncia novo Mac Studio, mas estratégia de Chips levanta dúvidas

Curiosidades

Aquecimento global e Sol podem aumentar terremotos?

Mundo

Novos cálculos triplicam probabilidade de impacto de asteroide com a Terra

Esporte

Gramado natural do Maracanã causa lesão em Thiago Silva

Inteligência Artificial

Inteligência Artificial

Guardian anuncia parceria estratégica com a OpenAI

Inteligência Artificial

Baidu e OpenAI liberam chatbots grátis para frear DeepSeek

Inteligência Artificial

Donald Trump fala pela primeira vez sobre o DeepSeek

Inteligência Artificial

Como a pequena startup DeepSeek abalou as estruturas do Vale do Silício

Inteligência Artificial

Guerra tecnológica: A IA chinesa que ultrapassou o ChatGPT em downloads

Mais notícias para você