Não tenho certeza do que significa "como esperado" - em termos de perda de pré-treinamento, provavelmente - mas a expectativa deve ser que fenômenos emergentes que você não pode prever com antecedência surjam com uma escala sem precedentes. Isso foi muito verdadeiro para modelos do tamanho do GPT-4 em comparação com modelos do tamanho do GPT-3.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
11 gostos
Recompensa
11
9
Republicar
Partilhar
Comentar
0/400
DataChief
· 09-07 05:17
Escala é poder
Ver originalResponder0
MEVVictimAlliance
· 09-07 04:27
O fenômeno do cisne negro é irreversível
Ver originalResponder0
OnchainGossiper
· 09-04 09:20
A inovação muitas vezes é difícil de prever
Ver originalResponder0
gaslight_gasfeez
· 09-04 07:49
Romper as fronteiras do conhecimento
Ver originalResponder0
ImpermanentSage
· 09-04 07:45
Quanto maior o modelo, mais confuso fica.
Ver originalResponder0
OldLeekMaster
· 09-04 07:42
É assustador como os modelos estão trapaceando.
Ver originalResponder0
StealthMoon
· 09-04 07:42
A transformação em larga escala é muito importante
Não tenho certeza do que significa "como esperado" - em termos de perda de pré-treinamento, provavelmente - mas a expectativa deve ser que fenômenos emergentes que você não pode prever com antecedência surjam com uma escala sem precedentes. Isso foi muito verdadeiro para modelos do tamanho do GPT-4 em comparação com modelos do tamanho do GPT-3.