$average
[1] 66.04
$median
[1] 67.22
$mode
[1] 68.1 68.1
$average
[1] 65.86
$median
[1] 67.5
$mode
[1] 67 70
Após tabularmos os dados ou apresentarmos graficamente, percebemos que ainda assim a quantidade de informações pode ser muito grande para descrevê-los. Desse modo, surgem algumas medidas que podem resumir tudo isso, de modo a preservar as principais características contidas nessas observações, são as denominadas medidas de posição ou tendência central, e as medidas de dispersão ou de variabilidade, que tem a propriedade de localizar a distribuição dos dados e também caracterizar sua variabilidade, respectivamente. Nesse capítulo trataremos das medidas de posição, e no Capítulo 4, as medidas de dispersão.
As medidas de posição representam o ponto central da massa de dados, de modo que o seu valor indica que as observações estão em torno dele, mas que não necessariamente, o valor dessa medida central exista no conjunto de dados. A escolha das medidas de posição apresentadas, dependerá da natureza das variáveis, bem como algumas peculiaridades existentes nos dados, como por exemplo, a existência de dados discrepantes. Vamos apresentar na sequência, a primeira medida de tendência central e a mais conhecida e utilizada na estatística, a média aritmética.
Quando iniciamos uma conversa e percebemos que alguém está no meio termo em um determinado posicionamento, dizemos que a pessoa está fazendo “média”, vulgarmente, dizemos que está em cima do muro. Nesse mesmo raciocínio, é a média aritmética, uma medida em que o seu valor representa o valor central das observações. Podemos comparar a média como um ponto de equilíbrio em um sistema de pesos, do qual se cada observação pode ser representada com uma certa massa no ponto no eixo X de um plano cartesiano, então o ponto que representa a média equilibrará esse sistema de pesos. Definimos,
Em notação, dizemos que \(\mu\) é uma característica amostral, isto é, representa a média populacional e chamamos de parâmetro. Na prática, essa informação é desconhecida e a representamos por uma medida amostral, que chamamos de estimador, uma função que depende apenas dos dados amostrais. Um estimador para \(\mu\) representa a média aritmética \(\bar{X}\). O valor observado de \(\bar{X}\) pode ser representado por \(\bar{x}\), em termos de notação. Vejamos um exemplo a seguir.
\[\begin{align*} \bar{X} = \frac{3 + 1 + \ldots + 1}{20}=\frac{34}{20}= 1,7~\textrm{erros}. \end{align*}\]
Portanto, o número de erros encontrados em um conjunto de caracteres, podem ser representados por uma única medida, que é a média amostral. A interpretação é que, em média, ocorreram \(1,7\) erros nos caracteres monitorados em um meio de comunicação, e significa, que os 20 conjuntos de caracteres apresentam um número de erros em torno desse valor.
A Definição 3.1 é utilizada para dados sem agrupamento, isto é, dados brutos ou dados elaborados. Para o caso de dados agrupados em distribuição de frequência, definimos,
Podemos representar a Definição 3.2 em termos populacionais, substituindo o tamanho \(n\) por \(N\), como também representar a expressão em termos de valor observado. Porém, para simplificarmos a notação, preferimos usar dessa forma. Vejamos mais um exemplo a seguir.
Porém, para o caso da variáveis quantitativas contínuas isso não ocorre, porque usamos o ponto médio para representar as observações de cada classe. Vejamos o próximo exemplo, a seguir.
Se calculássemos a média sem agrupamento, o valor seria \(\bar{X} = 65,86\)ºF. Observamos uma perda de precisão com os dados quando agrupados com intervalo de classe. Mas isso pode ser justificado por exemplo, se nesse experimento a diferença em \(0,18\)ºF não altera os resultados da pesquisa, e assim, podemos apresentar os dados de forma mais organizada.
Nos exemplos anteriores, observamos que a média leva em consideração a todas as observações, em seu cálculo. Apesar dessa ideia ser interessante, uma vez que conseguimos captar as informações de cada elemento da amostra ou população, qualquer alteração que houver em alguma observação, pode alterar completamente o resultado da média aritmética. É caso dos dados discrepantes, isto é, observações muito distante da grande parte dos dados. Isso pode ocorrer por diversas situações, como erro humano, ao digitar errado em uma planilha, elementos mal amostrados, de modo que, determinado elemento selecionado para a amostra não pertencia a população de interesse, ou até mesmo, uma condição atípica na realização da coleta dos dados. Vejamos mais algumas características da média aritmética:
Uma saída para contornar o problema dos dados discrepantes, pode ser abordado no exemplo a seguir.
Para representar esse conjunto de dados, usamos a média aritmética para representá-los:
\[\begin{align*} \bar{X} & = \frac{1 + 5 + \ldots + 40}{17} = 9,67~und. \end{align*}\]
Observamos que as observações \(x_1 = 1~unid.\) e \(x_{17} = 40~und.\) podem ter influenciado o resultado, e como suspeitamos desses valores, vamos usar uma medida mais robusta a essa violação, isto é, que não será influenciado por esses valores. Chamamos de média aparada, denotada por \(\bar{X}_{ap}\), que para uma amostra de tamanho \(n\), temos: \[ \begin{align} \bar{X}_{ap} & = \displaystyle\frac{\sum_{i = 2}^{n - 1}X_{(i)}}{n - 2}, \end{align} \tag{3.5}\] em que \(X_{(i)}\) é a \((i)\)-ésima variável em ordem crescente de magnitude, tal que \(X_{(1)} = \min\limits_{i}X_i\) e \(X_{(n)} = \max\limits_{i}X_i\).
Usando a expressão (3.5), apresentamos a média aparada: \[ \bar{X}_{ap}=\frac{5 + 5 + \ldots + 10}{15} = 7,65~unid. \]
Observamos pelo resultado, que os valores extremos acabam não influenciando no resultado da média aparada, e portanto, pode ser uma alternativa de medida de posição, para representar o conjunto de dados.
Complementando as características da média, apresentamos algumas propriedades pelo Teorema 3.1 a seguir, do qual iremos usar a Definição 3.1 como base, e as demais seguem de forma similar.
Baseado na Definição 3.1, e considerando \(c\) uma constante, então:
Considerando uma amostra \(X_1\), \(X_2\), , \(X_n\), e \(c\) uma constante, e que \(Y_i = X_i \pm c\), para \(i\) \(=\) \(1\), \(2\), \(\ldots\), \(n\), então a média aritmética de \(Y_i\) é dado por: \[\begin{align*} \bar{Y} & = \frac{\sum_{i=1}^{n}Y_i}{n}\\ & = \frac{\sum_{i=1}^{n}X_i \pm c}{n}\\ & = \frac{\sum_{i=1}^{n}X_i}{n} \pm \frac{\sum_{i=1}^{n} c}{n}\\ & = \frac{\sum_{i=1}^{n}X_i}{n} \pm \frac{n \times c}{n}\\ & = \bar{X} \pm c. \quad \textrm{c.q.d.} \end{align*}\]
Considerando uma amostra \(X_1\), \(X_2\), , \(X_n\), e \(c\) uma constante, e que \(Y_i = X_i \times c\), para \(i\) \(=\) \(1\), \(2\), \(\ldots\), \(n\), então a amplitude de \(Y_i\) é dado por: \[\begin{align*} \bar{Y} & = \frac{\sum_{i=1}^{n}Y_i}{n}\\ & = \frac{\sum_{i=1}^{n}X_i \times c}{n}\\ & = \frac{X_1 \times c + X_2 \times c + \ldots + X_n \times c}{n} \\ & = c \times \frac{X_1 + X_2 + \ldots + X_n }{n} \\ & = c \times \bar{X}. \quad \textrm{c.q.d.} \end{align*}\]
Fazendo:
\[ D=\sum\limits_{i=1}^{n}(X_i-c)^2. \] Expandindo o somatório e derivando \(D\) em relação a “c”, temos que
\[\begin{align*} D & =\sum\limits_{i=1}^{n}(X_i-c)^2=\sum\limits_{i=1}^{n}(X_i^2-2cX_i+c^2)\\ & =\sum\limits_{i=1}^{n}X_i^2-\sum\limits_{i=1}^{n}2cX_i+\sum\limits_{i=1}^{n}c^2, \end{align*}\] e que \[ \frac{dD}{dc}=-2\sum\limits_{i=1}^{n}X_i+2nc. \]
Igualando a derivada a zero, e resolvendo em \(A\), temos: \[ \frac{dD}{dc}=-2\sum\limits_{i=1}^{n}X_i+2nc=0, \] \[ 2nc=2\sum\limits_{i=1}^{n}X_i, \] \[ c=\frac{\sum\limits_{i=1}^{n}X_i}{n} = \bar{X}. \] Certificando se o ponto é de máximo ou de mínimo, \[ \frac{d^2D}{d^2c}=2n>0. \] Como a segunda derivada é maior que zero, fica provado que o ponto é de mínimo.
Uma outra alternativa para contornarmos os problemas de dados discrepantes encontrados na média aritmética, pode ser apresentada por meio da medida de posição chamada de mediana, do qual leva em consideração a posição ordenada dos dados ao invés de usar or próprios valores observados. Mas especificamente, o valor da mediana é o ponto central dos dados, em que abaixo desse valor, representa as 50% menores observação, ao passo que, os valores acima da mediana representam as 50% maiores observações. De outro modo, dizemos que a mediana representa um ponto central no conjunto de dados em que a quantidade de elementos abaixo ou acima desse valor, não supera 50%. Essa última definição representa melhor o que significa a mediana, pois podemos ter valores centrais repetidos, e dessa forma isso ocorrendo, a primeira afirmação não será válida para a definição da mediana. Formalmente, definimos,
A mediana amostral é o melhor estimador para a mediana populacional, e pode ser considerado também como um estimador para a média populacional (\(\mu\)). Detalhes sobre a escolha de um melhor estimador para um determinado parâmetro, será estudado no Capítulo 9. Como a mediana leva em consideração a posição das observações, a condição do tamanho amostral ou populacional acaba sendo importante para essa medida, de modo que, se o tamanho for um número par ou ímpar, teremos condições diferentes para o cálculo. Uma outra informação importante para o cálculo da mediana, é que será necessário ordenar as observações de modo crescente. Em notação para o caso de uma amostra de tamanho \(n\), dizemos que \(X_{(1)}\), \(X_{(2)}\), \(\ldots\), \(X_{(n)}\) representa uma amostra em ordem crescente de magnitude, isto é, \(X_{(1)} = \min_{i}X_i\) e \(X_{(n)} = \max_{i}X_i\), e precisaremos desse ordenamento para obter o valor da mediana, baseados na expressões da Definição 3.3. Se utilizarmos o Exemplo 3.4, perceberemos que não é necessário eliminar as observações extremas em ordem de magnitude, como foi realizado com a média aparada. Isso demonstra que a mediana é uma outra alternativa de medida robusta para a escolha de uma medida de posição de modo a representar um conjunto de dados. Vejamos o exemplo a seguir.
Para o caso de variáveis quantitativas contínuas sem agrupamento, o procedimento é o mesmo realizado no Exemplo 3.4. Para os dados da Tabela 2.3, isto é, dados agrupados sem intervalo de classe (variáveis quantitativas discretas), podemos calcular a mediana usando a Definição 3.3. Precisaremos apenas complementar as informações com o acréscimo da frequência acumulada abaixo de (\(f_{ac\downarrow_i}\)), que foi apresentada na Tabela 2.6. Vejamos o próximo exemplo.
Número de erros \(\mathbf{(X_i)}\) | \(\mathbf{F_i}\) | Frequência acumulada (\(\mathbf{F_{ac\downarrow_i}}\)) |
---|---|---|
\(0\) | \(3\) | \(3\) |
\(1\) | \(7\) | \(10\) |
\(2\) | \(4\) | \(14\) |
\(3\) | \(5\) | \(19\) |
\(4\) | \(1\) | \(20\) |
Total | \(20\) | - |
O valor da mediana será dado da seguinte forma: \[\begin{align*} Md(X) & = \frac{X_{(\frac{20}{2})} + X_{\left( \frac{20}{2} + 1 \right)}}{2}\\ & = \frac{X_{(10)} + X_{(11)}}{2}. \end{align*}\] Para sabermos qual o valor observado para a variável \(X_{(10)}\) e \(X_{(11)}\), marcamos os grupos 2 (linhas 2 de vermelho) e 3 (linha 3 de amarelo). No grupo 2, temos sete elementos que correspondem as variáveis \(X_{(4)}\), \(X_{(5)}\), \(\ldots\), \(X_{(10)}\), uma vez que os três menores valores estão no grupo 1. Assim o \(X_{(10)} = 1\) erros. No grupo 3, nós temos quatro elementos que correspondem as variáveis \(X_{(11)}\), \(X_{(12)}\), \(\ldots\), \(X_{(14)}\), uma vez que abaixo desse grupo nós temos as dez primeiras observações. Assim, o \(X_{(11)} = 2\) erros. Usamos as frequências simples (\(F_i\)) e acumulada \(F_{ac\downarrow_i}\), para obter essas informações. Retornando ao cálculo da mediana, temos: \[\begin{align*} Md(X) & = \frac{X_{(10)} + X_{(11)}}{2}\\ & = \frac{1 + 2}{2} = 1,5~\textrm{erros}. \end{align*}\] Caso os dados estivessem em rol, o resultado seria o mesmo.
No caso de dados agrupados com intervalo de classe (variáveis quantitativas contínuas), vamos definir um estimador para a mediana populacional, usando uma dedução geométrica por meio do histograma de frequências e as ogivas. Para isso, vamos usar os dados do Exemplo 2.1 para facilitar a explicação, em que apresentamos na Figura 3.1 o histograma e as ogivas desses dados agrupados.
Para estimar a mediana a partir dos dados arranjados em uma tabela de distribuição de frequência com intervalo de classe, é necessário definir a classe mediana e em seguida encontrar a mediana interpolando os resultados. A posição da mediana é obtida acumulando-se frequências das classes 1, 2, etc., até se encontrar o valor que seja igual ou imediatamente superior a \(n/2\). Apresentamos algumas notações importantes para o entendimento da dedução do estimador de \(\mu_d(X)\), que segue:
Com essa notação apresentamos a Figura 3.2 para facilitar a compreensão da dedução. Iremos apresentar dois métodos, o primeiro baseado no limite inferior da classe da mediana, e o segundo baseado no limite superior da classe da mediana. Nesse tipo de natureza de dados, desprezaremos se o número de elementos é par ou ímpar. Entenderemos que a classe da mediana é aquela que contempla o valor observado para a variável \(X_{(n / 2)}\). Para isso, podemos observar esse valor na coluna da frequência acumulada (abaixo de), \(f_{ac\downarrow_i}\). Nos dados do Exemplo 2.1, a classe da mediana é \(57,5\) \(|\)— \(68,1\) porque \(f_{ac\downarrow_4} = 19\), isto é, abaixo de \(68,1~\textrm{ºF}\) temos as primeiras \(19\) observações, e nessa classe contemplamos as observações ordenadas \(x_{(8)}\), \(x_{(9)}\), \(\ldots\), \(x_{(19)}\), que contém \(x_{(n / 2)} = x_{(36 / 2)} = x_{(19)}\). Temos essas observações na classe 4 (classe da mediana), porque a frequência acumulada (abaixo de) anterior a classe da mediana, \(f_{ac\downarrow_3} = 7\). Isso significa que a partir do oitavo elemento ordenado até o décimo nono temos elementos pertencentes a classe da mediana.
Feito essas considerações, apresentamos o primeiro método de dedução da expressão da mediana, a seguir.
1° Método
Uma vez que sabemos a classe da mediana, pela Figura 3.3 podemos determinar o valor da mediana por:
\[ \begin{align} Md(X) & = LI_{Md}+x, \end{align} \tag{3.8}\]
sendo necessário encontrar o valor \(x\). Assim, faremos uma regra de três simples pela semelhança de triângulos (triângulo verde e vermelho) que pode ser observado pela Figura 3.4.
Assim, temos
Variação | Frequência | |
---|---|---|
\(c\) | \(\rightarrow\) | \(f_{Md}\) |
\(x\) | \(\rightarrow\) | \(n/2-f_{ant}\). |
Determinando \(x\), \[ x=\left\lbrace \frac{\frac{n}{2}-f_{ant}}{f_{Md}}\right\rbrace c. \]
Como \(Md(X) = LI_{Md} + x\), então \[ \begin{equation} Md(X) = LI_{Md} + \left\lbrace \frac{\frac{n}{2}-f_{ant}}{f_{Md}}\right\rbrace \times c. \end{equation} \tag{3.9}\]
2° Método
Uma vez que sabemos a classe da mediana, pela Figura 3.3 podemos determinar o valor da mediana pelo segundo método, sendo necessário encontrar o valor \(y\) na seguinte expressão (3.10). \[ \begin{align} Md(X) & = LS_{Md} - y. \end{align} \tag{3.10}\]
Assim, faremos uma regra de três simples usando a semelhança de triângulos (triângulo verde e amarelo). Assim,
Variação | Frequência | |
---|---|---|
\(c\) | \(\rightarrow\) | \(f_{Md}\) |
\(y\) | \(\rightarrow\) | \(n/2-f_{post}\) |
Determinando \(y\), \[ y=\left\lbrace \frac{\frac{n}{2}-f_{post}}{f_{Md}}\right\rbrace c. \] a mediana amostral pode ser expressa como
\[\begin{equation} Md(X) = LS_{Md} - \left\lbrace \frac{\frac{n}{2}-f_{post}}{f_{Md}} \right\rbrace \times c. \end{equation}\]
Formalizando essas ideias, definimos um estimador da mediana amostral para dados agrupados com intervalo de classe da seguinte forma,
Vamos apresentar o resultado da mediana para os dados do Exemplo 2.1 a seguir.
Vejamos algumas características sobre a mediana, que seguem:
Para complementarmos essas características, vamos apresentar algumas propriedades da mediana no Teorema 3.2. Iremos a Definição 3.3, bem como a expressão (3.7) para \(n\) ímpar. Para os demais casos, os resultados são similares.
Baseado na Definição 3.3, e considerando \(c\) uma constante, então:
As medidas de posição até agora apresentadas não foram aplicadas para as variáveis qualitativas de um modo geral, apenas a mediana para o caso de variável quantitativa ordinal. Contudo, podemos apresentar um medida mais simples, que seja possível ser aplicada para todas as naturezas de variáveis apresentadas, definida a seguir.
Dessa forma, podemos perceber que um conjunto de dados poderá ter mais de uma moda, isto é, se observarmos dois valores mais frequentes e iguais, teremos uma distribuição bimodal, três valores mais frequentes iguais, teremos uma distribuição trimodal, mais de três, uma distribuição multimodal, ou até mesmo uma distribuição amodal, quando todos os valores se repetem apenas uma vez.
Para o caso das variáveis quantitativas contínuas, essa definição não se aplica, porque dificilmente dois valores serão iguais para esse tipo de variável. O que faz pensar que dois valores sejam iguais em uma variável quantitativa contínua é a limitação do instrumento de medida. Basta perceber que dois valores possivelmente iguais, se mensurados por outros instrumentos de medidas mais precisos, os valores serão diferentes à medida que o número de dígitos nas casas decimais aumentam. Assim, faz-se necessário pensarmos em uma definição para a moda como sendo o valor com alta densidade de observações em sua proximidade. Uma forma de determinarmos um estimador para \(\mu_o\) em variáveis contínuas é por meio do histograma de frequências. Inicialmente, determinamos a classe de maior frequência para os dados agrupados com intervalo de classe, para determinarmos a moda. Se todas as classes apresentarem mesma frequência, não haverá moda. A classificação quanto a distribuição segue a mesma mencionada anteriormente, isto é, amodal, unimodal, bimodal, trimodal ou multimodal. A moda baseada no histograma de frequência é também chamada de moda de Czuber.
A moda de Czuber pode ser facilmente obtida pela semelhança de triângulos ABC e DCE no esquema seguinte. A moda, se refere ao valor da abscissa correspondente ao vértice C comum aos dois triângulos. É fácil perceber que os segmentos de retas AB e DE correspondem aos valores \(\Delta_1\) e \(\Delta_2\).
Observamos pela Figura 3.5, que o valor da moda é \(Mo=LI_{Mo}+x\), bastando determinar o valor \(x\) pela semelhança de triângulos, isto é, \[ \frac{x}{c-x}=\frac{\Delta_1}{\Delta_2}\Rightarrow x=\left\lbrace \frac{\Delta_1}{\Delta_1+\Delta_2}\right\rbrace \times c. \] Assim, a moda é determinada por: \[\begin{equation*} Mo(X)=LI_{Mo}+\left\lbrace \frac{\Delta_1}{\Delta_1+\Delta_2}\right\rbrace \times c, \end{equation*}\] sendo \(LI_{Mo}\) o limite inferior da classe da moda, \(\Delta_1 = f_{Mo} - f_{i_{ant}}\), \(\Delta_2 = f_{Mo} - f_{i_{post}}\), \(f_{Mo}\) é a frequência absoluta da classe da moda, \(f_{i_{ant}}\) frequência absoluta anterior à classe da moda, \(f_{i_{post}}\) frequência posterior à classe da moda, e \(c\) a amplitude da classe.
Karl Pearson, observou a existência de uma relação empírica que permite calcular a moda quando são conhecidas a média (\(\overline{X}\)) e a mediana (\(Md\)) de uma distribuição assimétrica. Essas condições satisfazem a relação empírica, \[ \begin{equation} Mo(X)=3Md(X)-2\overline{X}. \end{equation} \tag{3.13}\] Formalmente, definimos
Vejamos algumas características sobre a moda, que seguem:
Para complementarmos essas características, vamos apresentar algumas propriedades da moda no Teorema 3.2. Iremos usar a Definição 3.7 como referência, porém, para os demais casos, os resultados são similares.
Baseado na Definição 3.7, e considerando \(c\) uma constante, então:
Seja \[ Y_i=X_i\pm c, \] então \[ Mo(Y)=Mo(X) \pm c. \]
Sejam \[ Y_i=cX_i, \] então \[ Mo(Y)=cMo(X). \]
Por fim, apresentamos o Exemplo 2.1 de Magalhães e Lima (2015), para termos uma noção sobre essas três medidas de posição, a seguir.
Companhia | A | B |
---|---|---|
Média | 2,5 | 2,0 |
Mediana | 1,7 | 1,9 |
Moda | 1,5 | 1,9 |
Qual a companhia mais adequada? Inicialmente vamos discutir as informações fornecidas supondo que o estudante terá seu salário “escolhido” de acordo com uma política salarial cuja tabela acima é um resumo. A companhia \(A\) tem 50% dos seus estagiários recebendo até 1,7 salários mínimos e o valor com mais chance de ocorrência é 1,5. Como a média é 2,5 devem haver alguns poucos estagiários com salário bem mais alto. A companhia B tem as três medidas bem próximas indicando uma razoável simetria entre salários altos e baixos. A opção do estudante dependerá de sua qualificação. Se ele for bem qualificado, deve preferir a companhia A pois terá maior chance de obter um dos altos salários. se tiver qualificação próxima ou abaixo dos outros estudantes, deve preferir B que parece ter uma política mais homogênea de salários.
Com o pacote leem podemos utilizar todas os cálculos para as medidas de posição, tanto para dados agrupados quanto para dados não agrupados, sendo variável qualitativa ou quantitativa, e ainda inseri-los nos gráficos apresentados na Seção 2.3 do Capítulo 2. As funções para computar as medidas média, mediana e moda são: mean()
, median()
e mfreq()
, respectivamente.
Por questão didática, usaremos apenas os dados apresentados do Exemplo 2.1 a título de ilustração, no Código R 3.3, para computarmos as três medidas de posição abordadas neste capítulo.
$average
[1] 66.04
$median
[1] 67.22
$mode
[1] 68.1 68.1
$average
[1] 65.86
$median
[1] 67.5
$mode
[1] 67 70
Notas | \(F_i\) |
---|---|
0 \(|\)— 2 | 4 |
2 \(|\)— 4 | 12 |
4 \(|\)— 6 | 15 |
6 \(|\)— 8 | 13 |
8 \(|\)— 10 | 6 |
Apresente o cálculo para todas as medidas de posição estudadas e as interprete.
Vamos inicialmente inserir na tabela de notas, a coluna dos pontos médios das classes, e a frequência acumulada abaixo de (\(f_{ac\downarrow_i}\)), do qual segue:
Notas | \(F_i\) | \(\tilde{X}_i\) | \(F_{ac\downarrow_i}\) |
---|---|---|---|
0 \(|\)— 2 | 4 | 1 | 4 |
2 \(|\)— 4 | 12 | 3 | 16 |
4 \(|\)— 6 | 15 | 5 | 31 |
6 \(|\)— 8 | 13 | 7 | 44 |
8 \(|\)— 10 | 6 | 9 | 50 |
Para as duas transformações \(X\) e \(Y\), dada uma amostra fixada, as medidas \(\bar{X}\) e \(S\) podem ser consideradas como uma constante, pois elas não se alteram. Então, usando a propriedade (II) para os Teoremas 3.1, 3.2 e 3.3, temos que respectivamente, a média, a mediana e a moda de \(Y\), são iguais a 0. Usando esses mesmos teoremas para o cálculo da média, mediana e moda de \(Z\), precisamos redefinir essa variável como \(Z_i = X_i/S + \bar{X}/S\). Assim, para \(X_i/S\) basta considerarmos que \(X_i\) está multiplicado por uma constante \(k_1 = 1/ S\) e daí usamos a propriedade (I) dos teoremas citados, acrescido de outra constante \(k_2 = \bar{X}/S\), do qual usamos a propriedade (II) desses mesmos teoremas, logo, a média, média e moda serão também iguais a 0. Para que haja um entendimento mais claro, faremos a prova apenas para a média nas duas transformações, e para as demais medidas, deixaremos como exercício para os leitores.
Entendemos que uma variável tem natureza discretizada quando seus potenciais valores assumem em um conjunto enumerável ou categorizado, isto é, variável quantitativa discreta e variáveis qualitativas.↩︎