Joint Photographic Experts Group

Joint Photographic Experts Group Joint Photographic Experts Group, er navnet på et ekspertudvalg, der skabte en standard for komprimering og koder filer og stillbilleder. Dette udvalg blev komponeret fra starten ved en fusion af flere grupperinger i et forsøg på at dele og udvikle deres ekspertise i digital billedbehandling. ISO, tre år før, havde startet sine undersøgelser i området.

Udover at være en komprimeringsmetode er ofte betragtes som et filformat. JPEG / Exif er det mest almindelige billedformat bruges af digitale kameraer og andre image capture udstyr, sammen med JPG / JFIF, som også er et andet format til lagring og transmission af fotografiske billeder på World Wide Web . Disse format variationer er ofte ikke skelnes, og kaldes "JPEG". Filer af denne type er normalt navngivet med forlængelsen.

JPEG-komprimering

JPEG-format anvender normalt en lossy komprimering for at reducere størrelsen af ​​billedfiler, betyder det, at skærmen eller dekomprimere billedet ikke kan få præcis det samme billede, der er startet før komprimering. Der er også tre varianter af standard JPEG komprimerede billede uden at miste data: JPEG2000, JPEG-LS Lossless JPEG.

JPEG-komprimering algoritme er baseret på to visuelle fænomener af det menneskelige øje: Den ene er det faktum, der er meget mere følsom over for ændringer i luminans end i krominans; dvs. fanger tydeligere skifter farve lysstyrke. Den anden er, at notatet nemmere små ændringer i lysstyrken i homogene zoner i områder, hvor variation er stor; for eksempel ved kanterne af ligene af objekter.

En funktion af JPEG er fleksibilitet til at justere graden af ​​komprimering. En meget høj grad af kompression generere en lille filstørrelse, på bekostning af et betydeligt tab af kvalitet. Med en lav komprimeringsgraden billedkvaliteten meget lig den originale du opnås, men med en større filstørrelse.

Tabet af kvalitet, når successive kompressioner udføres, er kumulative. Det betyder, at hvis et billede er komprimeret og dekomprimeret, vil billedkvaliteten blive tabt, men hvis det bliver at komprimere et allerede komprimeret billede endnu større tab vil medføre. Hver efterfølgende komprimering vil medføre yderligere tab af kvalitet. Kvalitetsforringende komprimering er ikke egnet i billeder eller grafik, der har tekst, linjer eller skarpt definerede kanter, men for filer, der indeholder store områder med solide farver.

Kodning

Mange af de funktioner JPEG standard er lidt brugt. Dette er en kort beskrivelse af en af ​​mange metoder, der almindeligvis anvendes til at komprimere billeder, når det påføres et indgangsbillede med 24 bits per pixel. Denne særlige mulighed er en lossy komprimering metode.

Farverum transformation

Det begynder at konvertere billedet fra RGB-farver til en anden kaldte YUV eller YCbCr. Dette farverum er svarende til den anvendt farvesystemer PAL og NTSC fjernsyn, men er meget tættere på MAC-tv-system.

Dette farverum består af tre dele:

  • Komponenten Y eller luminans; dvs. gråtonebilledet.
  • U eller v eller CB og Cr komponenter henholdsvis modsætning det blå og røde forskel; begge signaler benævnes krominans.

Ligningerne, der udfører denne base ændring fra RGB til YUV er:

Ligningerne for den omvendte ændring kan opnås clearing af ovenstående og følgende opnås:

Hvis den første trio af ligninger diskuterede vi se, at de tre komponenter tages som den mindste værdi af luminans kanalen 16. Den maksimale værdi er 235, mens krominans kanalerne 240. Alle disse værdier vil passe ind i en byte ved afrunding nærmeste heltal. I denne fase er der ingen signifikant tab af information, selv om afrunding indsætter en lille margin umærkelig for det menneskelige øje fejl.

Undersampling

En mulighed, der kan anvendes til at gemme billedet er at reducere farven oplysninger om lysstyrke. Der er flere metoder: Hvis dette trin ikke gælder, billedet er stadig i YUV farverum, så billedet ikke lider tab. Det kan halveres farveinformation, 4: 2: 2, som har halvdelen farveopløsningen og lysstyrke forbliver intakt. En anden metode udbredte er at reducere farven til den fjerde, 4: 2: 0, hvor farven er reduceret med en faktor 2 i både vandret og lodret. Hvis billedet var begyndt gråtoner, kan du være helt elimineret farve oplysninger, opholder sig som 4: 0: 0.

Nogle programmer tillader gemme billeder i JPEG refererer til disse metoder med 1 × 1,1 × 1,1 × 1 til YUV 4: 4: 4, 2 × 1,1 × 2,1 × 1 til YUV 4: 2: 2 og 2 × 2,1 × 1,1 × 1 for den sidstnævnte metode, YUV 4: 2: 0.

Algoritmiske teknikker, der anvendes til dette trin er normalt bilineær interpolation, nærmeste nabo, kubisk foldning, Bezier, B-spline og Catmun-Roll.rh

Diskret cosinus transformation

Hver komponent af billedet er opdelt i små blokke af 8 × 8 pixels, som forarbejdes næsten uafhængigt, hvilket reducerer beregningstiden. Det følger den typiske gitter dannelse, som bliver synlige i billeder gemt med høj kompression. Hvis billedet lidt en subsampling af farven, vil farverne i det endelige billede være i blokke af 8 × 16 og 16 × 16 pixels, som var 4: 2: 2 eller 4: 2: 0.

Så hver lille blok omdannes til frekvensdomænet ved diskrete cosinus transformation, forkortet DCT opkald.

Et eksempel på en af ​​de små blokke af 8 × 8 er begyndt dette:

Den næste proces er restarles 128 til indstilling af de resterende numre 0, mellem -128 og 127.

Vi går videre til DCT transformationsmatrix, og hvert element afrunding til nærmeste heltal.

Bemærk, at den største element i hele systemet vises i øverste venstre hjørne; dette er DC koefficient.

Digital kvantificering

Det menneskelige øje er meget god til at detektere små ændringer i lysstyrken i relativt store områder, men ikke når lysstyrken skifter hurtigt i små områder. På grund af denne tilstand, kan man fjerne de høje frekvenser, uden stort tab af visuel kvalitet. Dette gøres ved at dividere hver komponent i frekvensdomænet med en konstant for denne komponent, og afrunding til nærmeste heltal. Dette er den proces, hvor de fleste af oplysningerne går tabt, når et billede bearbejdes af denne algoritme. Resultatet af dette er, at høje frekvenskomponenter, tendens til at være lig med nul, mens mange andre bliver små positive og negative tal.

En typisk matrix kvantisering matrix er Losheller, der eventuelt anvendes i JPEG standard:

Opdeling hver koefficient af de transformerede billedes matrix mellem hver koefficient i kvantiseringsmatrix, opnås denne matrix, og kvantificeres:

For eksempel kvantificering det første element, DC koefficient, ville være:

Entropi kodning

Entropi kodning er en speciel form for tabsfri komprimering. Til dette, er matrixelementerne taget langs en zig-zag, at sammensætte grupper med lignende frekvenser, og indsætte nuller kodning, og ved hjælp Huffman kodning for resten. Du kan også bruge aritmetiske kodning, overlegen i forhold til Huffman, men sjældent brugt, da den er dækket af patenter, denne komprimering producerer filer 5% lavere, men på bekostning af længere kodning og afkodning, dette lille gevinst, kan også anvendes til at påføre en mindre grad af billedkomprimering og mere kvalitet til en lignende størrelse.

I ovenstående matrix, zig-zag-sekvens er følgende:
-26, -3, 0, -3, -2, -6, 2, -4, 1 -4, 1, 1, 5, 1, 2, -1, 1, -1, 2, 0, 0, 0, 0, 0, -1, -1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0

JPEG har en Huffman-kode for at skære snoren over det punkt, hvor de andre koefficienter nul, og dermed spare plads:
-26, -3, 0, -3, -2, -6, 2, -4, 1 -4, 1, 1, 5, 1, 2, -1, 1, -1, 2, 0, 0, 0, 0, 0, -1, -1, EOB

Støj ved kompression

Resultatet efter kompression kan variere, afhængigt af aggressiviteten af ​​skillevægge kvantiseringsmatrix, jo højere værdien af ​​disse delere, de fleste koefficienter bliver nul, og billedet er komprimeret. Men højere kompressioner producere mere støj i billedet, forværring af deres kvalitet. Et billede med en høj kompression kan have en meget mindre filstørrelse, men mange ufuldkommenheder vil ikke være interessant, en meget lav komprimering vil producere en høj billedkvalitet, men vil have en stor størrelse kan du ønsker mere formateret uden tab som PNG.

De fleste mennesker, der surfer på internettet er bekendt med disse skønhedsfejl, der resulterer i god kompression. For at undgå dem, vil du nødt til at reducere niveauet af kompression eller anvende tabsfri komprimering, der producerer større filer senere.

Dekodning

Dekodningsprocessen ligner den ene fulgt hidtil, kun i bakgear. I dette tilfælde, at information går tabt, vil de endelige værdier ikke matcher originalen.

Oplysningerne matrix fanges, dekodes, og sætte hver værdi på dens tilsvarende boks. Derefter multipliceres hver af disse værdier ved den tilsvarende værdi af kvantiseringsmatrix anvendes, da mange værdier er nuller, er det kun værdierne for det øverste venstre hjørne komme sig.

Efter DCT transformation er ugjort:

Og endelig tilføjer 128 til hver post:

At sammenligne forskellene mellem den oprindelige og den komprimerede blok, forskellen mellem de to matricer, gennemsnittet af deres absolutte værdier er, giver en idé om det tab af kvalitet:

Det kan ses, at de største forskelle ligger tæt på stedet, og i bunden, mellem venstre og center, bemærke mere det sidste, som du kan få øje på, der var klar før mod hjørnet. Gennemsnittet af de absolutte værdier af subtraktion er 4,8125, men i nogle områder er højere.

Forrige artikel Jephtha
Næste artikel Jim McDaniels