DeepSeek faz Silicon Valley falar

DeepSeek-Silicon-Valley

Pontos principais:

  • A DeepSeek lançou uma versão aberta de seu modelo de raciocínio R1, impressionando a indústria de tecnologia.
  • O modelo R1 da DeepSeek parece corresponder ou superar o modelo o1 da OpenAI em certos benchmarks de IA.
  • A DeepSeek afirma que treinou um de seus modelos por apenas US$ 5,6 milhões, em comparação com os custos de treinamento das principais empresas americanas.
  • A empresa conseguiu isso apesar das sanções dos EUA que proíbem a venda de chips avançados para empresas chinesas.
  • O sucesso da DeepSeek levantou preocupações sobre a competitividade da IA nos EUA e o impacto nos mercados de ações.

Desde que a empresa chinesa de IA DeepSeek lançou uma versão aberta de seu modelo de raciocínio R1 no início desta semana, muitos na indústria de tecnologia têm feito grandes pronunciamentos sobre o que a empresa conquistou e o que isso significa para o estado da IA.

Por exemplo, o capitalista de risco Marc Andreessen postou que a DeepSeek é “uma das conquistas mais impressionantes e impressionantes que já vi”.

O modelo R1 da DeepSeek parece corresponder ou superar o modelo o1 da OpenAI em certos benchmarks de IA. E a empresa afirma que um de seus modelos custou apenas US$ 5,6 milhões para treinar, em comparação com as centenas de milhões de dólares que as principais empresas americanas pagam para treinar os seus.

A empresa também parece ter conseguido isso apesar das sanções dos EUA que proíbem a venda de chips avançados para empresas chinesas. A MIT Technology Review escreve que o sucesso da empresa ilustra como as sanções estão “impulsionando startups como a DeepSeek a inovar de maneiras que priorizam eficiência, compartilhamento de recursos e colaboração”. (Por outro lado, o The Wall Street Journal relata que o CEO da DeepSeek, Liang Wenfeng, recentemente disse ao premier chinês que as restrições de exportação dos EUA ainda representam um obstáculo.)

O CEO da Curai, Neal Khosla, ofereceu uma explicação mais simples, afirmando que a empresa é um “estado psicopata” que está “fingindo que o custo é baixo para justificar a definição de preço baixo e esperando que todos mudem para ele [para] danificar a competitividade da IA nos EUA”. (Uma Nota da Comunidade foi anexada ao seu post apontando que Khosla não oferece evidências para isso e que seu pai, Vinod, é um investidor da OpenAI.)

Enquanto isso, o jornalista Holger Zschaepitz sugeriu que a DeepSeek “poderia representar a maior ameaça aos mercados de ações dos EUA” – se uma empresa chinesa puder construir um modelo de ponta a baixo custo, sem acesso a chips avançados, isso questionaria “a utilidade dos centenas de bilhões de dólares em capital sendo despejados nessa indústria”.

Em resposta, o CEO da Y Combinator, Garry Tan, argumentou que o sucesso da DeepSeek seria na verdade bom para seus concorrentes americanos. “Se os modelos de treinamento ficarem mais baratos, mais rápidos e mais fáceis”, escreveu ele no X, “a demanda por inferência (uso real do mundo da IA) crescerá e acelerará ainda mais, o que garante que o fornecimento de computação será usado.”

E o Cientista Chefe de IA do Meta, Yann LeCun, argumentou contra a visão da análise da DeepSeek através da lente China versus Estados Unidos. Em vez disso, ele sugeriu que a verdadeira lição é que “modelos de código aberto estão superando os proprietários”.

“A DeepSeek se beneficiou da pesquisa aberta e do código aberto (por exemplo, PyTorch e Llama do Meta)”, escreveu LeCun no LinkedIn esta semana. “Eles tiveram novas ideias e as construíram em cima do trabalho de outras pessoas. Como seu trabalho é publicado e de código aberto, todos podem se beneficiar dele.”

Todo o debate parece estar impulsionando os consumidores a experimentar o produto. Até a tarde de domingo, o assistente de IA da DeepSeek era o aplicativo gratuito mais popular na Apple App Store, logo à frente do ChatGPT.

Fonte: TechCrunch

Image Credits: Just_Super / Getty Images

Publicar comentário