.
O mais novo modelo de IA da Anthropic, Claude 3,7 sonetos, custou “algumas dezenas de milhões de dólares” para treinar usando menos de 10^26 falhas de poder de computação.
Isso é de acordo com o professor Wharton, Ethan Mollick, que em um post X na segunda -feira transmitiu um esclarecimento que recebeu do PR do Anthrópico. “Fui contactado pela Anthrópica, que me disse que o Sonnet 3.7 não seria considerado um modelo de 10^26 e custaria algumas dezenas de milhões de dólares”. ele escreveu“Embora os modelos futuros sejam muito maiores”.
O Strong The One alcançou o Antrópico para confirmação, mas não recebeu uma resposta até o tempo de publicação.
Supondo que Claude 3,7 soneto realmente custe apenas “algumas dezenas de milhões de dólares” para treinar, não considerando as despesas relacionadas, é um sinal de quão relativamente barato está se tornando lançar modelos de ponta. O antecessor de Claude 3,5 Sonnet, lançado no outono de 2024, também custou algumas dezenas de milhões de dólares para treinarCEO antrópico Dario Amodei revelou em um ensaio recente.
Esses totais se comparam bastante favoravelmente aos preços de treinamento dos principais modelos da 2023. Para desenvolver seu modelo GPT-4, o OpenAI gastou mais de US $ 100 milhões, de acordo com ao CEO da Openai, Sam Altman. Enquanto isso, o Google gastou cerca de US $ 200 milhões para treinar seu Modelo Gemini Ultra, um estudo de Stanford estimado.
Dito isto, Amodei espera modelos futuros de IA para custou bilhões de dólares. Certamente, os custos de treinamento não capturam trabalhos como testes de segurança e pesquisa fundamental. Além disso, à medida que a indústria de IA adota modelos de “raciocínio” que funcionam em problemas por longos períodos de tempo, os custos de computação dos modelos em execução provavelmente continuarão a aumentar.
.








