Diferença entre covariância e correlação
Covariância e Correlação são dois termos que são exatamente opostos um ao outro, ambos são usados em estatísticas e análises de regressão, a covariância nos mostra como as duas variáveis variam entre si, enquanto a correlação nos mostra a relação entre as duas variáveis e como elas estão relacionadas .
Correlação e covariância são dois conceitos estatísticos usados para determinar a relação entre duas variáveis aleatórias. A correlação define como uma mudança em uma variável afetará a outra, enquanto a covariância define como dois itens variam juntos. Está confuso? Vamos mergulhar mais fundo para entender a diferença entre esses termos intimamente relacionados.
O que é covariância?
A covariância mede como as duas variáveis se movem em relação uma à outra e é uma extensão do conceito de variância (que diz como uma única variável varia). Pode assumir qualquer valor de -∞ a + ∞.
- Quanto mais alto esse valor, mais dependente é o relacionamento. Um número positivo significa covariância positiva e denota que existe uma relação direta. Efetivamente, isso significa que um aumento em uma variável também levaria a um aumento correspondente na outra variável, desde que as outras condições permaneçam constantes.
- Por outro lado, um número negativo significa covariância negativa, o que denota uma relação inversa entre as duas variáveis. Embora a covariância seja perfeita para definir o tipo de relacionamento, é ruim para interpretar sua magnitude.

Qual é a correlação?
A correlação está um passo à frente da covariância, pois quantifica a relação entre duas variáveis aleatórias. Em termos simples, é uma medida unitária de como essas variáveis mudam entre si (valor de covariância normalizado).
- Ao contrário da covariância, a correlação tem um limite superior e inferior em um intervalo. Só pode assumir valores entre +1 e -1. Uma correlação de +1 indica que as variáveis aleatórias têm uma relação direta e forte.
- Por outro lado, a correlação de -1 indica que existe uma forte relação inversa, e um aumento em uma variável levará a uma diminuição igual e oposta na outra variável. 0 significa que os dois números são independentes.
Fórmula para covariância e correlação
Vamos expressar esses dois conceitos, matematicamente. Para duas variáveis aleatórias A e B com valores médios como Ua e Ub e desvio padrão como Sa e Sb respectivamente:
Efetivamente, a relação entre os dois pode ser definida como:

Ambas as correlações e covariâncias encontram aplicação nos campos da análise estatística e financeira. Visto que a correlação padroniza o relacionamento, é útil na comparação de quaisquer duas variáveis. Isso ajuda o analista a desenvolver estratégias como pair trade e hedging, não apenas para retornos eficientes da carteira, mas também para salvaguardar esses retornos em termos de movimentos adversos no mercado de ações.
Infográficos de correlação vs covariância
Vamos ver a principal diferença entre correlação vs covariância.

Principais diferenças
- A covariância é um indicador do grau em que duas variáveis aleatórias mudam uma em relação à outra. A correlação, por outro lado, mede a força dessa relação. O valor da correlação é limitado na parte superior por +1 e na parte inferior por -1. Portanto, é um intervalo definido. No entanto, a faixa de covariância é indefinida. Pode assumir qualquer valor positivo ou negativo (teoricamente, o intervalo é de -∞ a + ∞). Você pode ter certeza de que uma correlação de .5 é maior que .3, e o primeiro conjunto de números (com correlação de .5) são mais dependentes um do outro do que o segundo conjunto (com correlação de .3). Interpretar tal resultado seria difícil para cálculos de covariância.
- A mudança de escala afeta a covariância. Por exemplo, se o valor de duas variáveis é multiplicado por constantes semelhantes ou diferentes, isso afeta a covariância calculada desses dois números. No entanto, aplicando o mesmo mecanismo de correlação, a multiplicação por constantes não altera o resultado anterior. Isso ocorre porque uma mudança de escala não afeta a correlação.
- Ao contrário da covariância, a correlação é uma medida livre de unidades da interdependência de duas variáveis. Isso torna mais fácil para os valores de correlação calculados serem comparados entre quaisquer duas variáveis, independentemente de suas unidades e dimensões.
- A covariância pode ser calculada para apenas duas variáveis. A correlação, por outro lado, pode ser calculada para vários conjuntos de números. Outro fator que torna a correlação desejável para analistas em comparação com a covariância.
Covariância vs Tabela Comparativa de Correlação
Base | Covariância | Correlação | ||
Significado | A covariância é um indicador da extensão em que 2 variáveis aleatórias são dependentes uma da outra. Um número mais alto denota dependência mais alta. | A correlação é um indicador de quão fortemente essas 2 variáveis estão relacionadas, desde que outras condições sejam constantes. O valor máximo é +1, denotando um relacionamento de dependência perfeito. | ||
Relação | A correlação pode ser deduzida de uma covariância. | A correlação fornece uma medida de covariância em uma escala padrão. É deduzido dividindo a covariância calculada com o desvio padrão. | ||
Valores | O valor da covariância está na faixa de -∞ e + ∞. | A correlação é limitada a valores entre -1 e +1. | ||
Escalabilidade | Afeta a covariância | A correlação não é afetada por uma mudança nas escalas ou multiplicação por uma constante. | ||
Unidades | A covariância tem uma unidade definida, pois é deduzida pela multiplicação de dois números e suas unidades. | A correlação é um número absoluto sem unidade entre -1 e +1, incluindo valores decimais. |
Conclusão
A correlação e a covariância estão intimamente relacionadas entre si e, no entanto, diferem muito. A covariância define o tipo de interação, mas a correlação define não apenas o tipo, mas também a força dessa relação. Devido a esse motivo, a correlação é freqüentemente denominada como o caso especial de covariância. No entanto, se for necessário escolher entre os dois, a maioria dos analistas prefere a correlação, pois ela não é afetada pelas mudanças nas dimensões, locais e escala. Além disso, uma vez que é limitado a um intervalo de -1 a +1, é útil fazer comparações entre variáveis entre domínios. No entanto, uma limitação importante é que ambos os conceitos medem a única relação linear.