O desvio padrão caracteriza. Como encontrar o desvio padrão. Indicadores médios da série dinâmica

Os principais critérios para a diversidade de uma característica em uma população estatística são: limite, amplitude, desvio padrão, coeficiente de oscilação e coeficiente de variação. Na lição anterior, foi discutido que os valores médios fornecem apenas uma característica generalizada da característica que está sendo estudada no agregado e não levam em consideração os valores de suas variantes individuais: valores mínimo e máximo, acima da média, abaixo média, etc

Exemplo. Valores médios de duas sequências numéricas diferentes: -100; -20; 100; 20 e 0,1; -0,2; 0,1 são absolutamente idênticos e iguaisSOBRE.No entanto, os intervalos de dispersão destes dados de sequência média relativa são muito diferentes.

A determinação dos critérios elencados para a diversidade de uma característica é realizada principalmente tendo em conta o seu valor em elementos individuais da população estatística.

Indicadores para medir a variação de uma característica são absoluto E relativo. Os indicadores absolutos de variação incluem: faixa de variação, limite, desvio padrão, dispersão. O coeficiente de variação e o coeficiente de oscilação referem-se a medidas relativas de variação.

Limite (lim)– Este é um critério determinado pelos valores extremos de uma variante em uma série de variação. Ou seja, este critério é limitado pelos valores mínimo e máximo do atributo:

Amplitude (Am) ou faixa de variação - Esta é a diferença entre as opções extremas. O cálculo deste critério é realizado subtraindo o seu valor mínimo do valor máximo do atributo, o que nos permite estimar o grau de dispersão da opção:

A desvantagem do limite e da amplitude como critérios de variabilidade é que eles dependem completamente dos valores extremos da característica na série de variação. Nesse caso, as flutuações nos valores dos atributos dentro de uma série não são levadas em consideração.

A descrição mais completa da diversidade de uma característica numa população estatística é fornecida por desvio padrão(sigma), que é uma medida geral do desvio de uma opção em relação ao seu valor médio. O desvio padrão é frequentemente chamado desvio padrão.

O desvio padrão é baseado na comparação de cada opção com a média aritmética de uma determinada população. Como no agregado sempre haverá opções menores e maiores que isso, então a soma dos desvios com o sinal "" será anulada pela soma dos desvios com o sinal "", ou seja, a soma de todos os desvios é zero. Para evitar a influência dos sinais das diferenças, são tomados os desvios da média aritmética quadrada, ou seja, . A soma dos desvios quadrados não é igual a zero. Para obter um coeficiente capaz de medir a variabilidade, faça a média da soma dos quadrados - esse valor é chamado variações:

Em essência, a dispersão é o quadrado médio dos desvios dos valores individuais de uma característica em relação ao seu valor médio. Dispersão quadrado do desvio padrão.

A variância é uma quantidade dimensional (nomeada). Portanto, se as variantes de uma série numérica são expressas em metros, então a variância dá metros quadrados; se as opções forem expressas em quilogramas, então a variância dá o quadrado desta medida (kg 2), etc.

Desvio padrão– raiz quadrada da variância:

Caso o número de elementos da população, então ao calcular a dispersão e o desvio padrão no denominador da fração, em vez dedeve ser colocado.

O cálculo do desvio padrão pode ser dividido em seis etapas, que devem ser realizadas em uma determinada sequência:

Aplicação do desvio padrão:

a) para julgamento da variabilidade de séries de variação e avaliação comparativa da tipicidade (representatividade) das médias aritméticas. Isto é necessário no diagnóstico diferencial ao determinar a estabilidade dos sintomas.

b) reconstruir a série de variação, ou seja, restauração de sua resposta de frequência com base em três regras sigma. No intervalo (М±3σ) 99,7% de todas as variantes da série estão localizadas no intervalo (М±2σ) - 95,5% e na faixa (М±1σ) - opção de linha de 68,3%(Fig. 1).

c) identificar opções “pop-up”

d) determinar os parâmetros de norma e patologia usando estimativas sigma

e) calcular o coeficiente de variação

f) calcular o erro médio da média aritmética.

Para caracterizar qualquer população que tenhatipo de distribuição normal , basta conhecer dois parâmetros: a média aritmética e o desvio padrão.

Figura 1. Regra Três Sigma

Exemplo.

Na pediatria, o desvio padrão é usado para avaliar o desenvolvimento físico das crianças, comparando os dados de uma determinada criança com os indicadores padrão correspondentes. A média aritmética do desenvolvimento físico de crianças saudáveis ​​​​é tomada como padrão. A comparação dos indicadores com os padrões é realizada por meio de tabelas especiais nas quais os padrões são apresentados juntamente com as escalas sigma correspondentes. Acredita-se que se o indicador de desenvolvimento físico da criança estiver dentro do padrão (média aritmética) ±σ, então desenvolvimento físico a criança (de acordo com este indicador) corresponde à norma. Se o indicador estiver dentro do padrão ±2σ, então há um ligeiro desvio da norma. Se o indicador ultrapassar esses limites, o desenvolvimento físico da criança difere acentuadamente da norma (a patologia é possível).

Além dos indicadores de variação expressos em valores absolutos, a pesquisa estatística utiliza indicadores de variação expressos em valores relativos. Coeficiente de oscilação - esta é a razão entre a faixa de variação e o valor médio da característica. Coeficiente de variação - Esta é a razão entre o desvio padrão e o valor médio da característica. Normalmente, esses valores são expressos em porcentagens.

Fórmulas para cálculo de indicadores de variação relativa:

Pelas fórmulas acima fica claro que quanto maior o coeficiente V estiver mais próximo de zero, menor será a variação nos valores da característica. Quanto mais V, mais variável será o sinal.

Na prática estatística, o coeficiente de variação é o mais utilizado. É utilizado não apenas para avaliação comparativa da variação, mas também para caracterizar a homogeneidade da população. A população é considerada homogênea se o coeficiente de variação não ultrapassar 33% (para distribuições próximas do normal). Aritmeticamente, a razão entre σ e a média aritmética neutraliza a influência do valor absoluto dessas características, e a razão percentual torna o coeficiente de variação um valor adimensional (sem nome).

O valor resultante do coeficiente de variação é estimado de acordo com as gradações aproximadas do grau de diversidade da característica:

Fraco - até 10%

Média - 10 - 20%

Forte - mais de 20%

A utilização do coeficiente de variação é aconselhável nos casos em que seja necessário comparar características diferentes em tamanho e dimensão.

A diferença entre o coeficiente de variação e outros critérios de dispersão é claramente demonstrada exemplo.

Tabela 1

Composição dos trabalhadores das empresas industriais

Com base nas características estatísticas apresentadas no exemplo, podemos concluir sobre a relativa homogeneidade da composição etária e do nível de escolaridade dos colaboradores da empresa, dada a baixa estabilidade profissional do contingente inquirido. É fácil perceber que uma tentativa de julgar essas tendências sociais pelo desvio padrão levaria a uma conclusão errônea, e uma tentativa de comparar as características contábeis “experiência profissional” e “idade” com o indicador contábil “educação” seria geralmente incorreto devido à heterogeneidade dessas características.

Além da expectativa matemática de uma variável aleatória que. determina a posição do centro da distribuição de probabilidade. Uma característica quantitativa da distribuição de uma variável aleatória é a dispersão da variável aleatória;

Denotaremos dispersão por D [x] ou.

A palavra dispersão significa dispersão. A dispersão é uma característica numérica da dispersão, a dispersão dos valores de uma variável aleatória em relação à sua expectativa matemática.

Definição 1. A variância de uma variável aleatória é a expectativa matemática do quadrado da diferença entre uma variável aleatória e sua expectativa matemática (ou seja, a expectativa matemática do quadrado da variável aleatória centrada correspondente):

A variância tem a dimensão do quadrado da variável aleatória. Às vezes, para caracterizar a dispersão, é mais conveniente utilizar uma quantidade cuja dimensão coincide com a dimensão de uma variável aleatória. Este valor é o desvio padrão.

Definição 2. A raiz do desvio quadrático médio de uma variável aleatória é a raiz quadrada de sua variância:

ou em formato expandido

O desvio padrão também é denotado

Observação 1. Ao calcular a variância, a fórmula (1) pode ser convenientemente transformada da seguinte forma:

ou seja, a variância é igual à diferença entre a expectativa matemática do quadrado da variável aleatória e o quadrado da expectativa matemática da variável aleatória.

Exemplo 1. Um tiro é disparado contra um objeto. Probabilidade de acerto. Determine a expectativa matemática, dispersão e desvio padrão.

Solução. Construindo uma tabela de valores de números de ocorrências

Por isso,

Para apresentar o significado do conceito de dispersão e desvio padrão como características da dispersão de uma variável aleatória, consideremos exemplos.

Exemplo 2. Uma variável aleatória é dada pela seguinte lei de distribuição (ver tabela e Fig. 413):

Exemplo 3. Uma variável aleatória é dada pela seguinte lei de distribuição (ver tabela e Fig. 414):

Determine: 1) expectativa matemática, 2) dispersão, 3) desvio padrão.

A dispersão, a dispersão da variável aleatória no primeiro exemplo é menor que a dispersão da variável aleatória no segundo exemplo (ver Fig. 414 e 415). As variâncias desses valores são 0,6 e 2,4, respectivamente.

Exemplo 4; A variável aleatória é dada pela seguinte lei de distribuição (ver tabela e Fig. 415):

Determine: 1) expectativa matemática, 2) dispersão, 3) desvio padrão.

Definição

Desvio padrão ( Inglês Desvio Padrão, SD) é um indicador usado na teoria das probabilidades e na estatística matemática para avaliar o grau de dispersão de uma variável aleatória em relação à sua expectativa matemática. No investimento, o desvio padrão do retorno de um título ou carteira é usado para avaliar uma medida de risco. Quanto maior o grau de dispersão dos retornos títulos em relação ao retorno esperado (expectativa matemática de retorno), maior será o risco do investimento e vice-versa.

O desvio padrão é geralmente denotado pela letra grega σ (sigma), e o desvio padrão pela letra latina S ou como Std(X), onde X é uma variável aleatória.

Fórmula

Desvio padrão verdadeiro

Se a distribuição exata de uma variável aleatória discreta for conhecida, ou seja, seu valor for conhecido para cada resultado e a probabilidade de cada resultado puder ser estimada, então a fórmula para calcular o desvio padrão será semelhante a esta.

Onde X i é o valor da variável aleatória X para o i-ésimo resultado; M(X) expectativa matemática da variável aleatória X; pi – probabilidade do i-ésimo resultado; N – número de resultados possíveis.

Neste caso, a expectativa matemática de uma variável aleatória é calculada pela fórmula:

Desvio padrão populacional

Na prática, em vez da distribuição exata de uma variável aleatória, normalmente apenas uma amostra de dados está disponível. Neste caso, é calculado um valor estimado do desvio padrão, que neste caso é denominado desvio padrão (S). Se a estimativa for baseada em toda a população de dados, a fórmula a seguir deverá ser usada.

Onde X i é o i-ésimo valor da variável aleatória X; X – média aritmética da população geral; N é o volume da população geral.

Desvio padrão da amostra

Se não for usada toda a população de dados, mas uma amostra dela, a fórmula para calcular o desvio padrão será baseada em uma estimativa imparcial da variância.

Onde X i é o i-ésimo valor da variável aleatória X; X – média aritmética da amostra; N – tamanho da amostra.

Exemplos de cálculo

Exemplo 1

Um gestor de carteira deve avaliar os riscos de investir em ações de duas empresas A e B. Ao mesmo tempo, considera 5 cenários para o desenvolvimento de eventos, cujas informações são apresentadas na tabela.

Como conhecemos a distribuição exata dos retornos de cada ação, podemos calcular o verdadeiro desvio padrão dos retornos de cada ação.

Etapa 1. Vamos calcular a expectativa matemática de rentabilidade de cada ação.

M(A) = -5%×0,02+6%×0,25+15%×0,40+24%×0,30+34%×0,03 = 15,62%

M(B) = -18%×0,02+2%×0,25+16%×0,40+27%×0,30+36%×0,03 = 22,14%

Etapa 2. Vamos substituir os dados obtidos na primeira fórmula.

Como podemos perceber, as ações da Empresa A caracterizam-se por um menor nível de risco, pois apresentam menor desvio padrão de retornos. De referir ainda que o seu retorno esperado é inferior ao das ações da Empresa B.

Exemplo 2

O analista possui dados sobre a rentabilidade de dois títulos nos últimos 5 anos, que são apresentados na tabela.

Como a distribuição exata dos retornos é desconhecida e o analista possui apenas uma amostra da população de dados, podemos calcular o desvio padrão da amostra com base na variância imparcial.

Etapa 1. Vamos calcular o retorno esperado de cada título como a média aritmética da amostra.

XA = (7 + 15 + 2 – 5 + 6) ÷ 5 = 5%

X B = (3 – 2 + 12 + 4 +8) ÷ 5 = 5%

Etapa 2. Vamos calcular o desvio padrão do retorno de cada um dos títulos usando a fórmula de uma amostra da população geral de dados.

Ressalta-se que ambos os títulos apresentam rentabilidade esperada igual de 5%. Ao mesmo tempo, o desvio padrão do retorno do título B é menor, o que, em igualdade de circunstâncias, o torna um objeto de investimento mais atraente devido a um melhor perfil de risco-retorno.

Desvio Padrão no Excel

O Excel fornece duas funções para calcular o desvio padrão de uma amostra e de uma população.

Para amostragem, use a função “STDEV.V”:

  1. Em um intervalo de células B1:F1
  2. Selecione a célula de saída B2.
  3. efeitos , na janela pop-up " Inserindo uma função» selecione Categoria « Lista alfabética completa" e selecione a função " DESV.V».
  4. No campo " Número1» selecionar um intervalo de células B1:F1, campo " Número2OK».

Para a população em geral, utiliza-se a função “STDEV.G”:

  1. Em um intervalo de células B1:F1 os valores da variável aleatória X são inseridos.
  2. Selecione a célula de saída B2.
  3. Na linha de comando, clique em efeitos , na janela pop-up " Inserindo uma função» selecione Categoria « Lista alfabética completa" e selecione a função " DESV.G».
  4. No campo " Número1» selecionar um intervalo de células B1:F1, campo " Número2"deixe em branco e clique no botão" OK».

Interpretação

Ao investir, o desvio padrão dos retornos é usado como medida de volatilidade. Quanto maior o seu valor, maior o risco associado ao investimento neste ativo e vice-versa. Ceteris paribus, deve ser dada preferência ao ativo para o qual este indicador seja mínimo.

A raiz quadrada da variância é chamada de desvio padrão da média, que é calculado da seguinte forma:

Uma transformação algébrica elementar da fórmula do desvio padrão leva-a à seguinte forma:

Esta fórmula muitas vezes acaba sendo mais conveniente na prática de cálculo.

O desvio padrão, assim como o desvio linear médio, mostra o quanto, em média, os valores específicos de uma característica se desviam de seu valor médio. O desvio padrão é sempre maior que o desvio linear médio. Existe a seguinte relação entre eles:

Conhecendo essa relação, você pode usar os indicadores conhecidos para determinar o desconhecido, por exemplo, mas (EU calcule a e vice-versa. O desvio padrão mede o tamanho absoluto da variabilidade de uma característica e é expresso nas mesmas unidades de medida que os valores da característica (rublos, toneladas, anos, etc.). É uma medida absoluta de variação.

Para sinais alternativos, por exemplo presença ou ausência ensino superior, as fórmulas de seguro, dispersão e desvio padrão são as seguintes:

Mostremos o cálculo do desvio padrão de acordo com os dados de uma série discreta que caracteriza a distribuição dos alunos de uma das faculdades da universidade por idade (Tabela 6.2).

Tabela 6.2.

Os resultados dos cálculos auxiliares são apresentados nas colunas 2 a 5 da tabela. 6.2.

A idade média de um aluno, anos, é determinada pela fórmula da média aritmética ponderada (coluna 2):

Os desvios quadrados da idade individual do aluno em relação à média estão contidos nas colunas 3-4, e os produtos dos desvios quadrados e as frequências correspondentes estão contidos na coluna 5.

Encontramos a variância da idade dos alunos, anos, usando a fórmula (6.2):

Então o = l/3,43 1,85 *oda, ou seja, Cada valor específico da idade de um aluno se desvia da média em 1,85 anos.

Coeficiente de variação

Do meu jeito valor absoluto o desvio padrão depende não apenas do grau de variação da característica, mas também dos níveis absolutos das variantes e da média. Portanto, é impossível comparar diretamente os desvios-padrão das séries de variação com diferentes níveis médios. Para poder fazer tal comparação, é necessário encontrar a participação do desvio médio (linear ou quadrático) na média aritmética, expressa em porcentagem, ou seja, calcular medidas relativas de variação.

Coeficiente de variação linear calculado pela fórmula

Coeficiente de variação determinado pela seguinte fórmula:

Nos coeficientes de variação, elimina-se não só a incomparabilidade associada às diferentes unidades de medida da característica em estudo, mas também a incomparabilidade que surge devido às diferenças no valor das médias aritméticas. Além disso, os indicadores de variação caracterizam a homogeneidade da população. A população é considerada homogênea se o coeficiente de variação não ultrapassar 33%.

De acordo com a tabela. 6.2 e os resultados dos cálculos obtidos acima, determinamos o coeficiente de variação, %, conforme fórmula (6.3):

Se o coeficiente de variação ultrapassar 33%, isso indica a heterogeneidade da população estudada. O valor obtido no nosso caso indica que a população de alunos por idade é homogênea em composição. Assim, uma função importante da generalização dos indicadores de variação é avaliar a confiabilidade das médias. Quanto menos c1, a2 e V, quanto mais homogêneo for o conjunto de fenômenos resultante e mais confiável for a média resultante. De acordo com a “regra dos três sigma” considerada pela estatística matemática, em séries normalmente distribuídas ou próximas a elas, desvios da média aritmética não superiores a ±3 ocorrem em 997 casos em 1000. Assim, sabendo X e a, você pode ter uma ideia inicial geral da série de variações. Se, por exemplo, a média remunerações funcionário da empresa era de 25.000 rublos e a é igual a 100 rublos, então com uma probabilidade próxima da certeza, pode-se argumentar que os salários dos funcionários da empresa flutuam dentro da faixa (25.000 ± ± 3 x 100), ou seja, de 24.700 a 25.300 rublos.

O objetivo deste artigo é mostrar, como fórmulas matemáticas que você pode encontrar em livros e artigos, decompõe-se em funções elementares no Excel.

Neste artigo iremos analisar as fórmulas desvio padrão e variância e calculá-los no Excel.

Antes de prosseguir com o cálculo do desvio padrão e a análise da fórmula, é aconselhável compreender os indicadores estatísticos básicos e a notação.

Considerando as fórmulas dos modelos de previsão, encontraremos os seguintes indicadores:


Por exemplo, temos uma série temporal - vendas por semana em unidades.

Semana

Envio, peças

Para esta série temporal i=1, n=10, ,

Considere a fórmula do valor médio:

Semana

Envio, peças

Para nossa série temporal, determinamos o valor médio

Além disso, para identificar tendências, além do valor médio, também é interessante ver o quão dispersas estão as observações em relação à média. O desvio padrão mostra até que ponto as observações se desviam da média.

A fórmula para calcular o desvio padrão de uma amostra é a seguinte:

Vamos dividir a fórmula em suas partes componentes e calcular o desvio padrão no Excel usando nossa série temporal como exemplo.

1. Calcule o valor médio para isso usando a fórmula do Excel = AVERAGE(B11:K11)


2. Determine o desvio de cada valor da série em relação à média


para a primeira semana = 6-10=-4

para a segunda semana = 10-10=0

para terços = 7-1=-3, etc.

3. Para cada valor da série, determinamos a diferença quadrada do desvio dos valores da série em relação à média

para a primeira semana = (-4)^2=16

para a segunda semana = 0 ^ 2 = 0

para terços = (-3)^2=9, etc.

4. Calcule a soma dos desvios quadrados dos valores em relação à média usando a fórmula =SOMA(referência de intervalo (referência de intervalo com)