Per comprimere un testo (il discorso è in generale estendibile ad una sequenza di byte quindi pensabili come caratteri) è necessario in generale averne un modello indicante le distribuzioni di probabilità.
Fondamentalmente gli approcci per ottenere un modello sono di due tipi: contestuale (si basa sulla conoscenza del contesto) e basato su un dizionario che tiene memoria di un certo numero di sotto-stringhe e al loro ripetersi inserisce soltanto un richiamo all'occorrenza precedente.
Un modellizzatore che si basa sull'uso di un dizionario è ad esempio usato nell'algoritmo LZ77.
Nessun commento:
Posta un commento