DeepSeek faz Silicon Valley falar
Pontos principais:
- A DeepSeek lançou uma versão aberta de seu modelo de raciocínio R1, impressionando a indústria de tecnologia.
- O modelo R1 da DeepSeek parece corresponder ou superar o modelo o1 da OpenAI em certos benchmarks de IA.
- A DeepSeek afirma que treinou um de seus modelos por apenas US$ 5,6 milhões, em comparação com os custos de treinamento das principais empresas americanas.
- A empresa conseguiu isso apesar das sanções dos EUA que proíbem a venda de chips avançados para empresas chinesas.
- O sucesso da DeepSeek levantou preocupações sobre a competitividade da IA nos EUA e o impacto nos mercados de ações.
Desde que a empresa chinesa de IA DeepSeek lançou uma versão aberta de seu modelo de raciocínio R1 no início desta semana, muitos na indústria de tecnologia têm feito grandes pronunciamentos sobre o que a empresa conquistou e o que isso significa para o estado da IA.
Por exemplo, o capitalista de risco Marc Andreessen postou que a DeepSeek é “uma das conquistas mais impressionantes e impressionantes que já vi”.
O modelo R1 da DeepSeek parece corresponder ou superar o modelo o1 da OpenAI em certos benchmarks de IA. E a empresa afirma que um de seus modelos custou apenas US$ 5,6 milhões para treinar, em comparação com as centenas de milhões de dólares que as principais empresas americanas pagam para treinar os seus.
A empresa também parece ter conseguido isso apesar das sanções dos EUA que proíbem a venda de chips avançados para empresas chinesas. A MIT Technology Review escreve que o sucesso da empresa ilustra como as sanções estão “impulsionando startups como a DeepSeek a inovar de maneiras que priorizam eficiência, compartilhamento de recursos e colaboração”. (Por outro lado, o The Wall Street Journal relata que o CEO da DeepSeek, Liang Wenfeng, recentemente disse ao premier chinês que as restrições de exportação dos EUA ainda representam um obstáculo.)
O CEO da Curai, Neal Khosla, ofereceu uma explicação mais simples, afirmando que a empresa é um “estado psicopata” que está “fingindo que o custo é baixo para justificar a definição de preço baixo e esperando que todos mudem para ele [para] danificar a competitividade da IA nos EUA”. (Uma Nota da Comunidade foi anexada ao seu post apontando que Khosla não oferece evidências para isso e que seu pai, Vinod, é um investidor da OpenAI.)
Enquanto isso, o jornalista Holger Zschaepitz sugeriu que a DeepSeek “poderia representar a maior ameaça aos mercados de ações dos EUA” – se uma empresa chinesa puder construir um modelo de ponta a baixo custo, sem acesso a chips avançados, isso questionaria “a utilidade dos centenas de bilhões de dólares em capital sendo despejados nessa indústria”.
Em resposta, o CEO da Y Combinator, Garry Tan, argumentou que o sucesso da DeepSeek seria na verdade bom para seus concorrentes americanos. “Se os modelos de treinamento ficarem mais baratos, mais rápidos e mais fáceis”, escreveu ele no X, “a demanda por inferência (uso real do mundo da IA) crescerá e acelerará ainda mais, o que garante que o fornecimento de computação será usado.”
E o Cientista Chefe de IA do Meta, Yann LeCun, argumentou contra a visão da análise da DeepSeek através da lente China versus Estados Unidos. Em vez disso, ele sugeriu que a verdadeira lição é que “modelos de código aberto estão superando os proprietários”.
“A DeepSeek se beneficiou da pesquisa aberta e do código aberto (por exemplo, PyTorch e Llama do Meta)”, escreveu LeCun no LinkedIn esta semana. “Eles tiveram novas ideias e as construíram em cima do trabalho de outras pessoas. Como seu trabalho é publicado e de código aberto, todos podem se beneficiar dele.”
Todo o debate parece estar impulsionando os consumidores a experimentar o produto. Até a tarde de domingo, o assistente de IA da DeepSeek era o aplicativo gratuito mais popular na Apple App Store, logo à frente do ChatGPT.
Fonte: TechCrunch
Image Credits: Just_Super / Getty Images
Publicar comentário