Muitas pessoas, ao enfrentarem um desempenho insatisfatório de modelos de IA, a primeira reação é criticar o algoritmo em si. Mas, pensando bem, o modelo na verdade está apenas executando fielmente as "instruções" dos dados — o que ele aprendeu, é o que irá gerar de saída.
Se o resultado final parecer muito absurdo? Então é preciso voltar atrás. Comece verificando a origem dos dados. O problema está na qualidade do conjunto de treinamento ou os próprios recursos de entrada já possuem viés? Essa mudança de hábito de pensamento vai impactar diretamente na forma como você constrói todo o sistema. Em vez de ajustar parâmetros continuamente, é melhor concentrar mais energia na limpeza e preparação dos dados. Pequenas mudanças, grande diferença.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
20 gostos
Recompensa
20
7
Republicar
Partilhar
Comentar
0/400
BoredRiceBall
· 14h atrás
Dados de má qualidade resultam em resultados ruins, só quem já foi enganado é que entende.
Anos de culpar o algoritmo, já chega de injustiça.
Se o conjunto de treinamento é ruim, mesmo o melhor modelo é inútil, agora entendi.
Em vez de ajustar os parâmetros, é melhor limpar os dados primeiro, para evitar desperdício de tempo.
Já devia ter alguém que explicasse isso claramente, o modelo é como um espelho.
Ver originalResponder0
TokenUnlocker
· 01-15 00:02
No fundo, ainda é preciso gerir bem os seus próprios dados, o modelo é apenas um bode expiatório
Dados de má qualidade produzem resultados de má qualidade, realmente é um pouco injusto culpar o algoritmo
Este princípio é o mesmo no mundo das criptomoedas, se a entrada estiver errada, a saída certamente será absurda
Em vez de culpar a cadeia ou os contratos todos os dias, é melhor primeiro verificar quais são os seus dados de operação na cadeia
Concordo, ajustar os parâmetros é realmente uma solução paliativa, não resolve a raiz do problema, dá trabalho e não é apreciado
A qualidade dos dados é a produtividade, essa frase não tem erro
Gastar tempo limpando os dados na fase inicial, para depois gastar menos horas extras corrigindo bugs na fase final, entende?
O modelo é como um espelho, reflete o que você lhe dá, não culpe o espelho por ser feio
Muita gente simplesmente não quer admitir que o problema está na sua entrada, chega de conversa
Quem entende essa lógica provavelmente vai sofrer muito menos prejuízos
Ver originalResponder0
ForkYouPayMe
· 01-14 01:57
Dados lixo entram, modelo lixo sai, é assim mesmo, muitas pessoas ainda culpando o algoritmo
Algoritmos sendo culpados há anos, no fundo, é preciso atacar a origem do problema
Essa é a lição do Web3, garbage in, garbage out, sem limpeza de dados tudo é em vão
Você tem razão, em vez de brincar com parâmetros, é melhor focar na qualidade dos dados, eficiência máxima, meu amigo
Em vez de culpar o modelo, culpe seu conjunto de dados, nem todo mundo consegue chegar aqui
Concordo plenamente, muitos projetos fracassam por causa da qualidade dos dados
Essa é a verdadeira direção, 80% dos problemas estão na etapa de pré-processamento
Ver originalResponder0
TokenCreatorOP
· 01-14 01:55
Dados lixo entram, modelo lixo sai, não é senso comum, haha
---
Mais uma vez, um monte de gente jogando a culpa no algoritmo, estou realmente pasmo, nem sequer olham para os dados que estão alimentando
---
Gostei, finalmente alguém disse isso, os entusiastas de ajuste de parâmetros realmente deveriam refletir
---
É por isso que eu digo que engenheiros de dados são mais valiosos que engenheiros de algoritmos, ninguém quer ouvir
---
Limpar os dados realmente pode resolver oitenta por cento dos problemas, mas ninguém quer fazer esse tipo de trabalho "chato"
---
Rir até morrer, um monte de gente copia e cola conjuntos de dados e começa a culpar o modelo, merecido
---
Portanto, o segredo é encontrar uma fonte de dados limpa, o resto é ilusão
---
Exatamente, lixo entra, lixo sai, sempre foi a verdade
Ver originalResponder0
SchrödingersNode
· 01-14 01:50
Dados jogados no lixo, o modelo vira um monstro, isso não é senso comum, haha
De fato, é preciso verificar a origem, os mestres em ajuste de parâmetros precisam acordar
Concordo plenamente, muitas pessoas adoram culpar o algoritmo, na verdade o que alimentaram já está podre há muito tempo
Vocês já encontraram aquele tipo de treinamento com um conjunto de dados uma bagunça e ainda assim culpar o modelo?
A maioria das pessoas não percebe o quão importante é a qualidade dos dados
Concordo, ao invés de ajustar os parâmetros loucamente, é melhor primeiro organizar bem os dados
É por isso que bons engenheiros sempre se dedicam a aprimorar a qualidade dos dados
Ver originalResponder0
GamefiGreenie
· 01-14 01:50
Dizendo a verdade, lixo de dados entra, lixo de dados sai, ninguém consegue salvar
garbage in garbage out, é tão simples assim
Há dois dias, o nosso projeto foi exatamente assim, sempre culpando o modelo, depois descobrimos que o problema era o próprio conjunto de dados que estava enviesado
A limpeza de dados é a parte mais importante, mas infelizmente muitas pessoas não querem investir tempo nisso
Isso é como a interação na cadeia, se você inserir o endereço errado, mesmo o contrato mais poderoso será inútil
Ver originalResponder0
SchrodingersFOMO
· 01-14 01:48
Concordo totalmente, já caí nessa armadilha antes, ajustando hiperparâmetros até ao limite, só depois percebi que era um problema de dados.
A frase "lixo entra, lixo sai" é realmente uma lição de sangue e lágrimas, é preciso refletir bem.
O modelo é como um espelho, se refletir feio é porque a fonte já está suja, não adianta consertar o espelho.
É por isso que os cientistas de dados são mais valiosos do que os engenheiros de ajuste de hiperparâmetros, o fundamental é consolidar bem a base.
Meu Deus, se tivesse visto este artigo mais cedo, não teria desperdiçado tanto poder de processamento, dói na carteira.
Muitas pessoas, ao enfrentarem um desempenho insatisfatório de modelos de IA, a primeira reação é criticar o algoritmo em si. Mas, pensando bem, o modelo na verdade está apenas executando fielmente as "instruções" dos dados — o que ele aprendeu, é o que irá gerar de saída.
Se o resultado final parecer muito absurdo? Então é preciso voltar atrás. Comece verificando a origem dos dados. O problema está na qualidade do conjunto de treinamento ou os próprios recursos de entrada já possuem viés? Essa mudança de hábito de pensamento vai impactar diretamente na forma como você constrói todo o sistema. Em vez de ajustar parâmetros continuamente, é melhor concentrar mais energia na limpeza e preparação dos dados. Pequenas mudanças, grande diferença.