Anúncio

Cuiaba - MT / 30 de janeiro de 2025 - 23:22

OpenAI diz ter evidências de que teve modelos copiados pela DeepSeek

A OpenAI diz ter encontrado evidências de que a startup chinesa de inteligência artificial DeepSeek usou os modelos de propriedade da empresa dos EUA para treinar seu próprio concorrente de código aberto.

A declaração foi dada à medida em que crescem as preocupações sobre uma potencial violação de propriedade intelectual.

O anúncio do avanço de uma forma mais barata de um modelo de IA feito pela chinesa provocou uma queda em série das ações de empresas de tecnologia nos EUA e na Europa.

Cálculos feitos pelo jornal Financial Times e pela agência de notícias Bloomberg apontam que a perda superou US$ 1 trilhão (R$ 5,9 trilhões) em valor de mercado apenas nesta segunda-feira (27).

O fabricante do ChatGPT, sediado em São Francisco, disse ao Financial Times que viu algumas evidências de destilação, uma técnica usada por desenvolvedores para obter melhor desempenho em modelos menores usando saídas de modelos maiores e mais capazes.

Isso permite que eles alcancem resultados semelhantes em tarefas específicas a um custo muito menor.

A OpenAI se recusou a dar mais detalhes de suas supostas evidências. Seus termos de serviço afirmam que os usuários não podem copiar nenhum de seus serviços ou usar a saída para desenvolver modelos que competem com a OpenAI.

O lançamento do modelo de raciocínio R1 da DeepSeek surpreendeu os mercados, bem como investidores e empresas de tecnologia no Vale do Silício, devido ao seu desempenho impressionante em tarefas cognitivas. Seus modelos alcançaram altas classificações e resultados comparáveis aos principais modelos dos EUA.

Uma fonte próxima à OpenAI disse que a destilação era uma prática comum na indústria e destacou que a empresa oferece aos desenvolvedores uma maneira de fazer isso usando sua própria plataforma, e destacou: “O problema é quando você está fazendo isso para criar seu próprio modelo para seus próprios propósitos”.

Procurada, a DeepSeek não atendeu ao Financial Times.

Anteriormente, o chefe da IA e criptografia do presidente Donald Trump, David Sacks, havia dito que é possível que o roubo de IP tenha ocorrido.

“Há uma técnica na IA chamada destilação, quando um modelo aprende com outro modelo [e] meio que suga o conhecimento do modelo pai”, disse Sacks à Fox News nesta terça (28).

“E há evidências substanciais de que o que a DeepSeek fez aqui foi destilar o conhecimento dos modelos OpenAI, e não acho que a OpenAI esteja muito feliz com isso”, acrescentou Sacks, sem fornecer evidências.

A DeepSeek disse que usou apenas 2.048 placas de vídeo Nvidia H800 e US$ 5,6 milhões para treinar seu modelo V3 com 671 bilhões de parâmetros, uma fração do que a OpenAI e o Google gastaram para treinar modelos de tamanho comparável.

Alguns especialistas apontaram que o modelo gerou respostas que indicavam que ele havia sido treinado em saídas do GPT –4 delas da OpenAI, o que violaria seus termos de serviço.

Informantes do setor dizem que, na realidade, é prática comum para laboratórios de IA, tanto na China quanto nos EUA, usar saídas de empresas líderes como a OpenAI.

Líderes do setor como a OpenAI investiram na contratação de pessoas para ensinar seus modelos a produzir respostas que soem mais humanas. Isso é caro e exige muito trabalho, e informantes do setor dizem que é comum que players menores aproveitem seu trabalho.

“É uma prática muito comum para startups e acadêmicos usar saídas de LLMs comerciais alinhados a humanos, como ChatGPT, para treinar outro modelo”, disse Ritwik Gupta, postulante a PhD em IA na Universidade da Califórnia.

“Isso significa que você obtém essa etapa de feedback humano de graça. Não é surpreendente para mim que a DeepSeek supostamente estaria fazendo o mesmo. Se estivessem, interromper essa prática precisamente pode ser difícil”, ele acrescentou.

A prática também aponta para um enigma financeiro emergente para empresas de fronteira que estão fazendo pesquisas de ponta em IA sobre como elas defendem sua vantagem técnica quando outros grupos podem pegar carona em seus modelos.

As empresas chinesas absorveram rapidamente as lições de suas contrapartes americanas ao mesmo tempo em que inovaram abordagens para maximizar seu número limitado de chips, tornando mais barato treinar e executar os modelos.

“Sabemos que as empresas sediadas na[China — e outras — estão constantemente tentando destilar os modelos das principais empresas de IA dos EUA”, acrescentou a OpenAI em uma declaração.

“Nós nos envolvemos em contramedidas para proteger nossa PI, incluindo um processo cuidadoso para quais capacidades de fronteira incluir em modelos lançados, e acreditamos que, à medida que avançamos, é extremamente importante que trabalhemos em estreita colaboração com o governo dos EUA para proteger melhor os modelos mais capazes dos esforços de adversários e concorrentes para tomar a tecnologia dos EUA.”

A OpenAI está atualmente lutando contra alegações de violação de direitos autorais, publicadas por jornais e criadores de conteúdo, incluindo ações judiciais do The New York Times e autores proeminentes, que acusam a empresa de treinar seus modelos em seus artigos e livros sem permissão.

noticia por : UOL

Facebook
Twitter
WhatsApp
Telegram
Anúncio

Cuiaba - MT / 30 de janeiro de 2025 - 23:22

LEIA MAIS

Anúncio