Computer Info - jaargang 3, nummer 1, 1995
Grafische bestanden (2)
Zoals iedere tekstverwerker een eigen manier heeft om documenten op te slaan, zo bestaan er voor digitale beelden diverse bestandsformaten. Soms zijn die gerelateerd aan het programma waarmee ze zijn bewerkt, soms aan het systeem waarmee ze zijn vastgelegd. Vanzelfsprekend doet iedere fabrikant zijn best zijn eigen bedenksel tot standaard te verheffen. De gebruiker is echter het meest gebaat met een formaat dat alle kleuren en details van een foto weet vast te leggen, en dat door ieder willekeurig softwarepakket wordt ondersteund.Desktop Publishing is een term die sinds 1985 vaak valt in de grafische wereld. Aanvankelijk gebeurde dat met een bijklank van spot en hoon, maar allengs met ontzag en op den duur met bezorgdheid. Achteraf is gebleken dat rond die tijd niet minder dan een revolutie heeft plaats gevonden, waarvan de gevolgen in de vorm van bedrijfssluitingen en verschuivingen in de markt nu pas goed merkbaar zijn.
DTP zou nooit van de grond hebben kunnen komen als er geen methode was gevonden om behalve tekst ook beelden digitaal te verwerken. De eerste personal computers en laserprinters hadden het er moeilijk mee. Het toepassen van kleur was nog volkomen science fiction, maar zelfs op een klein zwart-wit fotootje stond de gemiddelde processor een kwartier of wat te kauwen en de resultaten waren erbarmelijk.
PCX
Behalve bestandsgrootten wordt de belangrijkste drempel voor `desktop imaging' gevormd door de onmogelijkheid van apparatuur om grijswaarden weer te geven. Zoals bekend bestaan er voor een computer slechts enen en nullen; met betrekking tot beeldinformatie komt dat neer op een verzameling witte of zwarte eenheden. Middentonen tussen licht en donker kunnen op papier slechts worden gesuggereerd door de verstrooiing van inktpuntjes, een methode die bekend staat als `dithering' (kreupel vertaald: pointillering). Iedere punt of `dot' zowel zwart als wit is in dat geval 1 `bit' en het bestand waarin een beeld met die elementen beschreven wordt heet een `bitmap'.Het meest gangbare bestandsformaat voor dergelijke bitmaps of `lijntekeningen' was aanvankelijk PCX, zoals gespecificeerd door ZSoft. ZSoft Paintbrush is lange tijd het voornaamste programma geweest waarmee op een PC foto's konden worden gescand en bewerkt. De belangrijkste concurrentie kwam van een programma dat Dr. Halo (CUT) heette en de tegenhanger op Apple-systemen heette MacPaint (PICT). De bestanden die die applicaties genereren worden gekenmerkt door de grofheid van het raster. De punten van zo'n raster zijn gevormd door de samenklontering van dots en wekken pas een indruk van grijs als ze van grote afstand worden beschouwd.
8-bits
Een `grayscale' onderscheidt zich van een lijntekening doordat het suggereren van grijswaarden niet overgelaten wordt aan de printerdots, maar aan de wijze waarop de bits worden gegroepeerd. Hier heeft een binair getal niet langer betrekking op het wit of zwart zijn van een punt, maar op de waarde die een component aanneemt. De laagste waarde van een 8-bits component is 0 (hexadecimaal 00), de hoogste 255 (hexadecimaal FF). Zo'n component of `sample' geldt als het kleinste element van een digitale voorstelling en wordt veelal aangeduid met de term `pixel' (picture element). Voor het pixelmatig vastleggen van beelden is een rijk bestandsformaat nodig.Teneinde tot een standaard voor digitaal gerasterde beelden te komen werden eind 1986 door Aldus Corporation de specificaties voor een dergelijk rijk bestand opgesteld, het `tagged information file format', kortweg TIFF.
Kenmerken
De voordelen van TIFF boven zoiets als PCX als drager van beelddata springen niet in het oog zolang het om lijntekeningen gaat, maar worden evident naar mate er hogere eisen aan de capaciteit worden gesteld. De karakteristieken van TIFF als standaard zijn:
- Zwart-wit beelden kunnen worden beschreven als lijntekening (1-bits) of grayscale (8-bits). Voor het weergeven van beelden in kleur is minimaal een 8-bits eenheid nodig. In dat geval spreekt men van `high color' of paletkleur, omdat de waarde van een component geldt als index van een soort staalkaart met 256 tinten. Volmaakte `true color'-beelden vereisen 3 of 4 samples per pixel. Dat laatste hangt samen met het gebezigde kleurmodel (RGB, CMYK of XYZ).
- Om omvangrijke grafische bestanden te kunnen samenpersen zijn verschillende compressiealgoritmen ontwikkeld. Deze worden allen, (RLE, PackBits, LZW, JPEG) onderkend.
- Onafhankelijkheid ten opzichte van de karakteristieken van scanners, printers of monitoren. De standaard voorzag allereerst in de behoeften van scannerfabrikanten; de uitvoer naar beeldschermen of afdrukeenheden staat los van enige manier waarop een beeld is vastgelegd.
- Overdraagbaarheid voor alle besturingssystemen. Het maakt niet uit of het toegepast wordt op een DOS/Windows-, Apple- of UNIX-systeem.
- Uitbreidbaar met nieuwe labels naar gelang er nieuwe eisen aan digitale beelden worden gesteld. Het formaat wordt dan ook voortdurend opgewaardeerd. De basisversie 4.0 is geldig sinds 1987 en werd in 1988 opgewaardeerd tot 5.0. In 1992 werden de specificaties uitgebreid met versie 6.0
- Mogelijkheid om beeldonspecifieke informatie op te slaan. Dit kan betrekking hebben op de bestandsnaam maar ook op een beschrijving van het onderwerp of de rechten die eventueel aan gebruik van het beeld verbonden zijn.
Baseline
De regels waaraan een TIFF moet voldoen zijn vastgelegd in twee delen, te weten de `Baseline' en de `Extensions'. De Baseline, het hart van het formaat, voorziet in eerste instantie in de structurering van het bestand. Een soort inhoudsopgave in het begin, bijvoorbeeld, verwijst naar de lokatie van diverse soorten gegevens. De gegevens liggen opgeslagen in `directories' (hoewel een TIFF meerdere varianten van een beeld kan bevatten gaat een Baseline niet verder dan één).De eigenlijke labels of `tags' hebben betrekking op de manier waarop de data door een applicatie moeten worden geïnterpreteerd. Zo hebben de parameters voor een 1-, 8- en 24-bits scans betrekking op de fotometrische interpretatie (is de hoogste waarde van een beeldeenheid wit of, omgekeerd, zwart?), de toegepaste compressiemethode (CCITT, LZW of JPEG ), en de afmetingen (breedte en hoogte).
Aanvullende informatie die niet door alle toepassingsprogramma's hoeven te worden geïnterpreteerd is te vinden in de velden, zoals daar zijn `Artist' (de maker van het beeld), `HostComputer' (het systeem vanwaar het afkomstig is), `Make' (de scanner), `ColorMap' (de beschrijving van een 8-bits kleurenpalet) of `ExtraSamples' (bijvoorbeeld de componenten van een alfakanaal).
Extensions
Omdat TIFF een uitbreidbaar bestandsformaat is, krijgt iedere gebruiker van grafische software vroeg of laat te maken met foutmeldingen la `error parsing the file'. Het zijn de specificaties voor bepaalde `extensions' die enerzijds maken dat een verouderd programma op een bepaald moment een beeld niet meer kan laden en anderzijds de toepassingsmogelijkheden van de beschrijvingswijze vergroten.De meest waarschijnlijke oorzaak van foutmeldingen is de gebruikte compressiemethode. Dit immers is een techniek die voortdurend verder ontwikkeld wordt en waarvoor telkens nieuwe standaards worden opgesteld. Ook de manier waarop een scan wordt opgebouwd is onderwerp van een extensie. In normale gevallen bestaat een TIFF uit regels pixels, oftewel `strips', maar voor hoge-resolutie-bestanden is het met betrekking tot de kwaliteit van de compressie beter hem op te bouwen met blokken (`tiles').
Digitale beelden kunnen op een monitor uitsluitend weergegeven worden met behulp van de primaire kleuren rood, groen en blauw. Dit wordt het additieve model genoemd. Voor reproduktie op papier gelden echter de wetten van het subtractieve model (CMYK). Er bestaan geen TIFF-extensies die voorzien in algoritmen voor de adequate vertaling van RGB (24-bits) naar CMYK (32-bits); dat komt voor de verantwoording van de kleurscheidingsroutine van het toepassingsprogramma. Wel kan de mogelijkheid gegevens over kleurreproducerende apparatuur in velden onder te brengen worden benut door `color management systems' (CMS). De beschrijving van kleuren hoeft overigens niet beperkt te blijven tot 3 of 4 componenten. Een `high fidelity'-bestand, bijvoorbeeld, heeft 7 kanalen (rood, groen, blauw, cyaan, magenta, geel en zwart), zodat er geen tinten buiten het bereik van enig systeem hoeven te vallen
CIE
Behalve volgens de gangbare RGB- en CMYK-modellen kan een tint in TIFF 6.0 tevens in de kleurruimten YCC (als Photo-CD) of CIE (XYZ of Lab) worden beschreven. Kenmerkend voor deze ruimten is het onderscheid van één kanaal voor helderheid en twee voor chrominantie. De laatste is een apparaatonafhankelijke, door een internationale commissie opgestelde standaard die volledig gebaseerd is op het perceptievermogen van het menselijk oog en wordt door een CMS als basis gebruikt voor conversie. Gezien de betrouwbaarheid zal CIE-Lab meer en meer de standaard worden voor de beschrijving van kleuren in een TIFF.robert kooijman