Como a pequena startup DeepSeek abalou as estruturas do Vale do Silício

DeepSeek, laboratório chinês, revelou a receita técnica de seu modelo R1, desafiando gigantes da IA

DeepSeek, laboratório chinês, revelou a receita técnica de seu modelo R1, desafiando gigantes da IA (Divulgação)

O jornal Financial Times (FT) analisou como o laboratório de inteligência artificial DeepSeek, com sede na China, surpreendeu o mundo ao revelar toda a “receita” técnica de seu modelo avançado. Este movimento transformou seu recluso fundador, Liang Wenfeng, em um herói nacional, desafiando diretamente as tentativas dos Estados Unidos de conter as ambições tecnológicas chinesas. A iniciativa coloca o país em destaque no competitivo cenário da inteligência artificial, especialmente em relação ao Vale do Silício.

O Modelo R1 e Seu Impacto Global

Na segunda-feira, 20 de janeiro, a DeepSeek lançou o modelo R1, explicando em um estudo detalhado como construir um modelo de linguagem de grande escala (LLM) com um orçamento reduzido. Segundo o FT, Este modelo é capaz de aprender automaticamente e se aprimorar sem supervisão humana. Enquanto empresas como OpenAI, criadora do ChatGPT, e Google DeepMind dominavam o campo, o R1 provocou debates acalorados sobre a capacidade de gigantes como Meta e Anthropic de manter sua vantagem técnica.

Liang Wenfeng: Símbolo de Orgulho Nacional

Liang Wenfeng, fundador da DeepSeek e gestor do fundo de hedge High-Flyer, tornou-se uma figura de destaque na China. Recentemente, ele participou de uma reunião com Li Qiang, a segunda maior autoridade do país, reforçando a importância de romper barreiras tecnológicas. Este reconhecimento demonstra o impacto de sua visão na promoção da independência tecnológica chinesa.

Uma Jornada Inusitada no Mundo da IA

Inicialmente considerado excêntrico por investir em milhares de GPUs Nvidia, Liang usou sua experiência no mercado financeiro para desenvolver modelos de IA eficientes. Sua equipe se especializou em extrair o máximo de potencial dos chips Nvidia, mesmo após as restrições impostas pelos Estados Unidos sobre exportações para a China.

Superando Limitações Tecnológicas

Com a proibição de exportação dos chips mais potentes, a equipe da DeepSeek inovou ao maximizar a eficiência de GPUs menos avançadas. Este foco singular em pesquisa e compartilhamento de descobertas torna a DeepSeek uma concorrente perigosa. A empresa ainda não levantou capital externo, mantendo-se fiel à sua missão de pesquisa.

A Estrutura da DeepSeek e Seu Impacto Local

Liang formou uma equipe exclusivamente chinesa, composta por doutores das principais universidades do país, como Peking e Tsinghua. Ele acredita que a DeepSeek deve desenvolver seus próprios talentos para competir globalmente, uma abordagem que rendeu elogios e reforçou sua identidade como pioneira local no campo da IA.

Eficiência Financeira Impressionante

Com apenas 2.048 chips H800 da Nvidia e um investimento de US$ 5,6 milhões, a DeepSeek treinou um modelo com 671 bilhões de parâmetros. Comparado aos custos astronômicos de empresas como OpenAI e Google, esse feito destaca a eficiência da DeepSeek em lidar com recursos limitados.

Desafios e Futuro da DeepSeek

Ainda segundo analista do FT, embora tenha conquistado resultados impressionantes, a DeepSeek enfrenta desafios para se manter competitiva. O financiamento pelo High-Flyer, seu principal patrocinador, mostrou-se instável em 2024, o que pode comprometer sua expansão futura. Além disso, empresas americanas estão ampliando rapidamente suas capacidades computacionais.

Concorrência no Vale do Silício

Nos Estados Unidos, empresas como OpenAI e xAI estão construindo megaclusters com tecnologias de ponta. Projetos como o Stargate, em parceria com o SoftBank, e o supercomputador Colossus, de Elon Musk, representam investimentos massivos que visam manter a liderança no setor de IA.

DeepSeek: Um Modelo de Pesquisa e Inovação

Apesar das dificuldades, a DeepSeek continua comprometida com sua visão de transformar o campo da IA. Sua abordagem baseada em pesquisa e inovação contrasta com o modelo comercial das gigantes americanas, posicionando-a como uma referência na China.

O Papel da China no Cenário Global de IA

A China, com seu vasto conjunto de talentos em engenharia, está se tornando um protagonista importante no cenário da IA. A DeepSeek exemplifica como o país pode superar limitações e competir globalmente, desafiando a supremacia tecnológica do Vale do Silício.

Conclusão: Lições da DeepSeek

A DeepSeek mostrou que é possível alcançar grandes avanços na IA com recursos limitados e foco em pesquisa. Sua trajetória é um lembrete do potencial de inovação em ambientes desafiadores, um feito que não deve ser subestimado.

*Com informações do Financial Times

Resumo para quem está com pressa

Sair da versão mobile