SQL-STDEVP ou STDEV e como usá-lo?
tenho uma tabela:
LocationId OriginalValue Mean
1 0.45 3.99
2 0.33 3.99
3 16.74 3.99
4 3.31 3.99
E assim por diante...
Como é que eu resolveria o Standard Deviation
Usando esta tabela e também o que é que recomendarias - STDEVP
ou STDEV
?
3 answers
Para o usar, basta:
SELECT STDEVP(OriginalValue)
FROM yourTable
De baixo, provavelmente queres STDEVP
.
O STDEV é utilizado quando o grupo de números a avaliar é apenas uma amostragem parcial de toda a população. O denominador para a divisão da soma dos desvios ao quadrado é N-1, em que N é o número de observações ( um número de itens no conjunto de dados ). Tecnicamente, subtrair o 1 é referido como "não tendencioso"."
O STDEVP é utilizado quando o grupo de números a ser avaliado está completo-é a população inteira de valores. Neste caso, o 1 não é subtraído e o denominador para dividir a soma dos desvios ao quadrado é simplesmente N em si, o número de observações ( uma contagem de itens no conjunto de dados ). Tecnicamente, isso é referido como "tendencioso"."Lembrando que o P em STDEVP significa "população" pode ser útil. Uma vez que o conjunto de dados não é uma mera amostra, mas constituída de todos os valores reais, esta função de desvio padrão pode retornar um resultado mais preciso.
Geralmente, deve utilizar {[[0]} quando tiver de estimar o desvio-padrão com base numa amostra. Mas se você tiver dados inteiros de coluna apresentados como argumentos, então use STDEVP
.
Em geral, se os seus dados representarem toda a população, utilize
STDEVP
; caso contrário, utilizeSTDEV
.
Note que para amostras grandes, as funções retornam quase o mesmo valor, então melhor usar STDEV
Neste caso.
Nas estatísticas existem dois tipos de desvios-padrão: um para uma amostra e outro para uma população. O desvio-padrão da amostra, geralmente anotado pela letra s, é utilizado como uma estimativa do desvio-padrão da população. O desvio padrão da população, geralmente anotado pela letra grega minúscula sigma, é usado quando os dados constituem a população completa. É difícil responder sua pergunta diretamente -- amostra ou população -- porque é difícil dizer o que você está trabalhando com: uma amostra ou uma população. Muitas vezes depende do contexto. Considere o seguinte exemplo. Se eu quiser saber o desvio padrão da idade dos estudantes em minha classe, então eu u=usaria STDEVP porque a classe é minha população. Mas se eu quero usar a minha classe como uma amostra da população de todos os alunos na escola, isto é, o que é conhecido como uma amostra de conveniência, e provavelmente seria tendencioso, mas eu discordo), então gostaria de usar DESVPAD porque a minha classe é um exemplo. O o valor resultante seria a minha melhor estimativa de STDEVP. Como mencionado acima (1) Para grandes tamanhos de amostra (digamos, mais de trinta), a diferença entre os dois torna-se trivial, e (2) geralmente você deve usar STDEV, não STDEVP, porque na prática geralmente não temos acesso à população. Na verdade, pode-se argumentar que se sempre tivéssemos acesso às populações, então não precisaríamos de estatísticas. Todo o ponto das estatísticas inferenciais é ser capaz de fazer inferências sobre uma população baseada em exemplo.