Exemplo: Variável de uma amostra estatística de um conjunto de tamanho 50 (N).
A construção de um histograma envolve as seguintes etapas:
Organizar os dados em ordem crescente.
Definir os intervalos e o número de classes.
Construir o gráfico.
Como definir o intervalo e o número de classes para um dado conjunto de dados? Não há fórmula matemática exata, mas uma sistemática consiste em determinar:
κ = número de classes
Δi = intervalo
Vmax = valor máximo
Vmín = valor mínimo
n = número de dados
Dentro dessa sistemática, é essencial que κ . Δi ≥ Vmax - Vmin, de modo que todos os dados do intervalo sejam abrangidos. Um Δi muito pequeno pode incluir variações muito pequenas de valores ou ruído e um Δi muito grande pode eliminar variações importantes dos dados.
Para n < 200, pode-se aplicar com segurança a fórmula proposta por Sturges:[4]
κ é o menor inteiro tal que κ > 1 + 3,32 * log(n)
Neste exemplo:
n = 18 e κ = 6 é uma boa escolha.
Δi ≥ (Vmax-Vmin)/κ. Como Δi ≥ (67-44)/6 , Δi = 5 é uma boa escolha.
Alguns aplicativos computacionais, como por exemplo o Origin, definem automaticamente o número de classes e de intervalos. Porém, é necessário que o usuário verifique se a solução proposta pelo aplicativo atende à necessidade de o histograma ser suficiente e adequadamente elucidativo, ou seja, se atenderá à proposta inicial.
A etimologia da palavra histograma é incerta. Suspeita-se que essa palavra derive dos termos gregos histos ("não erguido", como os mastros do navio ou as barras verticais do histograma) e gramma ("desenhar", "escrever", "gravar"), mas outra corrente defende que o termo deriva do inglês historical diagram ("diagrama histórico"), introduzido por Karl Pearson em 1895.
Tipos gráficos de um histograma:
Frequência absoluta.
Frequência relativa.
O gráfico de frequência absoluta é o histograma usual, onde no eixo dos y, ordenadas, estão a frequência (absoluta ou relativa) com que uma classe aparece no conjunto de medidas, tal como representado na Figura acima.
Para a construção da frequência relativa e acumulativa, precisamos fazer uma tabela associando a cada classe o número percentual em que ela aparece no conjunto de dados:
Por exemplo, na classe entre 45 e 50 mg/dL obteve-se quatro amostras dentre as 18 submetidas à análise. Logo a frequência relativa é.
Frequência relativa = (4/18) * 100% = 22,22%
Um histograma pode ser construído, considerando "dado" como qualquer medida ou resultado experimental, para responder às seguintes questões:
Que tipo de distribuição os dados estão sugerindo?
Como os dados estão localizados?
Os dados são simétricos?
Existem dados que devem ser desconsiderados por estarem distante dos demais dentro do conjunto?
Como os dados estão dispersos?
Um histograma, também conhecido como distribuição de frequências ou diagrama das frequências, é a representação gráfica, em colunas (retângulos), de um conjunto de dados previamente tabulado e dividido em classes uniformes. A base de cada retângulo representa uma classe e a altura de cada retângulo representa a quantidade ou frequência com que o valor dessa classe ocorreu no conjunto de dados.
Além de ser uma importante ferramenta da estatística, o histograma também é uma das sete ferramentas da qualidade.
Quando o volume de dados aumenta indefinidamente dentro do conjunto e o intervalo de classes tende a zero (o que torna os retângulos cada vez mais "finos" e "altos"), a distribuição de frequência passa para uma distribuição de densidade de probabilidades.
A construção de histogramas tem caráter preliminar em qualquer estudo e é um importante indicador da distribuição de dados. Eles podem indicar se uma distribuição se aproxima de uma função normal, assim como também pode indicar a mistura de populações, quando se apresentam bimodais.
Histograma de um grupo de 18 pacientes. Coleta de HDL com 6 classes definidas e intervalos de 5 mg/dL.



