Pragt.info
Partner site van: www.heinpragt.com
(c) Hein Pragt
logo pragt.info
Zoeken op deze site!
 
 

Bestandsformaten
© 2010 Hein Pragt

bestandsformaten Sinds het begin van de computers zijn er verschillende soorten van opslag van gegevens ontstaan. In eerste instantie ontstonden er zelfs verschillende wijze van opslaan van tekens zoals ascii, ebcdic en tegenwoordig unicode. Maar ook werden er veel binaire bestandsformaten ontwikkeld, niet zelden om het bestand onleesbaar te maken en ook om een bestand type aan een specifieke applicatie te koppelen. Ook zijn er bijvoorbeeld verschillende formaten voor grafische bestanden zoals gif, jpeg, png en tiff. Ondanks dat sommige fabrikanten de indeling van hun bestandsformaat niet wilden prijsgeven om concurrentie buiten de deur te houden, werden deze formaten snel door slimme gebruikers gedecodeerd en beschreven. Tegenwoordig kunnen de meeste programma's elkaars bestandsformaten lezen naar hun eigen formaat omzetten. Het bestandsformaat wordt vaak aangegeven door middel van een zogenaamde extensie aan het einde van de bestandsnaam.

Er zijn in de praktijk twee soorten bestandsformaten, tekstbestanden en binaire bestanden. Bij tekstformaat is de informatie ook leesbaar door de mens als kan de inhoud wel een onbegrijpelijke structuur hebben. Een binair bestand is een opeenvolging van binaire tekens die alleen door een computerprogramma's geïnterpreteerd kan worden. Tegenwoordig zijn veel bestandsformaten gebaseerd op XML wat een tekst formaat is. Veel binaire bestandsformaten hebben een vaste layout aan het begin van het bestand waar informatie over het bestand staat, de zogenaamde header of meerdere headers. Hierin staan bij bijvoorbeeld grafische bestanden de afmetingen van het beeld, het kleurformaat maar ook gegevens van de bron of het bewerkingsprogramma.

Open standaarden

Een open standaard is een norm (of standaard) die publiek beschikbaar is. Deze norm bestaat dan uit specificaties van een bestandsformaat die door meerdere partijen kan worden gebruikt. Doordat iedereen een open standaard kan gebruiken, neemt de uitwisselbaarheid tussen de verschillende soorten hardware en software systemen toe. Hierdoor kan ook een grotere diversiteit aan aanbieders ontstaan en is men minder afhankelijk van een bepaalde leveranciers. In de ICT zijn veel standaarden echter gesloten en moet men een licentie kopen bij de organisatie die in bezit is van de rechten. Dat een standaard open is hoeft niet te betekenen dat er geen licentie hoeft te worden aangevraagd, soms is er toch sprake van een octrooi of patent, dit kan ook op een klein onderdeel van de open standaard betrekking hebben. Zo was er jarenlang een licentie op de compressie binnen het grafische gif formaat, waardoor het effectief dus geen licentievrij formaat was maar wel open standaard.

Op deze pagina staat informatie in de vorm van bestanden over of verwijzingen naar de specificaties van de layout van diverse bestandsformaten.
Vriendelijke groet, Hein Pragt


Office bestandsformaten

RTF (Rich Text Format) is een bestandsformaat ontwikkeld door Microsoft in 1987 waarmee tekstverwerkingsbestanden uitgewisseld kunnen worden tussen verschillende programma's. De meeste tekstverwerkingsprogramma's kunnen tegenwoordig bestanden in het RTF formaat lezen en schrijven. Het ontwikkelteam bij Microsoft baseerde de opmaaktaal van RTF op TeX, een opmaaktaal voor teksten en formules geschreven door Donald Knuth. Rich Text Format is eigendom van Microsoft maar de specificatie wordt gratis vrijgegeven. (Document: rtf.rtf)

Excel (Microsoft Office Excel) is in zijn huidige vorm beschikbaar voor Microsoft Windows en voor Apple Mac OS X. Op beide platformen is het de dominante marktleider bij de rekenbladsoftware. Microsoft Excel gebruikt tot 2007 een eigen binaire bestandsformaat genaamd Binaire Interchange File Format (Biff). Hierna maakte het gebruik van Office Open XML, een op XML gebaseerd formaat. (Document: excelfileformat.pdf)

Grafische bestandsformaten

TIFF(Tagged Image File Format) is een flexibele bestandsindeling voor opslag van beelden. Het werd ontwikkeld door Aldus Corporation om beelden op te slaan van scanners en fotobewerkingsprogramma’s, maar de extensie is momenteel onder de controle van Adobe. Het formaat is flexibel en kan beelden met allerlei eigenschappen opslaan. (Document: TIFF6.pdf)

JPEG (Joint Photographic Experts Group)is een bestandsindeling voor het opslaan van afbeeldingen. De JPEG bestandsindeling kent diverse compressiemogelijkheden, hoe hoger de compressie des te kleiner het bestand maar ook hoe geringer de beeldkwaliteit. JPEG wordt veel gebruikt voor foto’s, bijvoorbeeld in digitale camera’s. Een grote tekortkoming van het JPEG formaat is dat er slechts 8-bit per kleur mogelijk zijn. (Document: jfif3.pdf)

BMP (Bitmap) is een bestandsindeling voor afbeeldingen, dat veel gebruikt wordt door het Microsoft Windows grafische subsysteem (GDI). BMP bestanden zijn meestal niet gecomprimeerd, zodat ze vaak erg groot zijn in vergelijking tot andere grafische bestandsformaten. De datacompressie kan RLE zijn (Run-length eenwording is het vervangen van herhalende patronen door het aantal herhalingen plus wat herhaald moest worden), echter 24 bits dure koor BMP bestanden zijn nooit gecomprimeerd. (link: wiki/BMP_file_format) (Document: Bmp.txt)

GIF (Graficus Ondergangen Format ) is een bestandsindeling voor het opslaan van afbeeldingen. GIF ondersteunt een variabel aantal kleuren, verschillende resoluties, animatie en een transparante achtergrond. Het maximale aantal kleuren in een GIF bestand is beperkt tot maximaal 256 die door een mapping tabel wel uit 262.144 verschillende kleuren gekozen kunnen worden. Voor de compressie wordt gebruikt gemaakt van LZW (Lepel Sief Welga gebruikt een z.g. woordenboek om het bestand te comprimeren) wat lange tijd door Unisys gepatenteerd was. Dit patent is echter overal momenteel verlopen. (link: wiki/Graphics_Interchange_Format) (Document: Gifstd.txt)

PCX (Personal Computer eXchange) is een bestand formaat voor grafische bestanden, dat ontwikkeld is door de firma ZSoft Corporation. Het was het standaard formaat van het Paintbrush programma wen werd daardoor een breed geaccepteerd format. Het is echter door de tijd ingehaald door andere formaten zoals gif, jpeg en png. De PCX indeling wordt nog veel gebruikt op Windows systemen. PCX ondersteunt de kleurmodi RGB, geïndexeerde kleuren, grijswaarden en bitmaps en de compressiemethode RLE (Run lengt eenwording is het vervangen van herhalende patronen door het aantal herhalingen plus wat herhaald moest worden) zonder gegevensverlies en afbeeldingen kunnen een bitdiepte van 1, 4, 8 of 24 bits hebben. (Link: wiki/PCX) (Document: Pcx.txt)


OpenDocument

Het OpenDocument formaat (ODF) ook wel het OASIS Open Document Format for Office Applications genoemd, is een open standaard voor het opslaan en uitwisselen van office bestanden zoals tekstbestanden, rekenbladen, grafieken en presentaties. De OpenDocument standaard werd ontwikkeld door het OASIS consortium, vanuit de XML-gebaseerde bestandsindeling van OpenOffice.org. Het is sinds november 2006 een officieel door de ISO gepubliceerde standaard. De OpenDocument standaard kan geïmplementeerd worden zonder enige beperking.

De belangrijkste bestandsextensies voor documenten zijn:

  • .odb voor databank bestanden;
  • .odc voor grafiek, .otc voor grafieksjabloon bestanden;
  • .odf voor formule en wiskundige vergelijking, .otf voor formulesjabloon bestanden;
  • .odg voor (vector)tekening, .otg voor tekeningsjabloon bestanden;
  • .oth voor webpaginasjabloon bestanden;
  • .odi voor afbeelding, .oti voor afbeeldingssjabloon bestanden;
  • .odm voor hoofddocument bestanden;
  • .odp voor presentatie, .otp voor presentatiesjabloon bestanden;
  • .ods voor rekenblad, .ots voor rekenbladsjabloon bestanden;
  • .odt voor tekst, .ott voor tekstsjabloon bestanden.

De inhoud van een OpenDocument document kan bestaan uit een enkel XML bestand, maar zal meestal bestaan uit meerdere bestanden bestaan die gecomprimeerd zijn en als één bestand worden gebundeld met behulp van ZIP compressie. De belangrijkste voordelen op een rij zijn, het is een ISO standaard, het is vrij uitwisselbaar en vrij implementeerbaar, volledig gratis en er zijn geen licentie- of patentverplichtingen of beperkingen.

Lees hier meer: www.oasis-open.org

Lees hier: ODF op de overheidsagenda

Lees hier: Open Document Format versus OpenXML



Ascii / ebcdic / Unicode

De meest gebruikte computer standaard is ASCII, the American Standard Code for Information Interchange. In de begintijd van computers ontstond ook de noodzaak op om bepaalde vormen van informatie in een digitaal formaat op te slaan. De standaard ASCII-tabel bestaat uit twee delen, de 95 zichtbare tekens (hoofd- en kleine letters, cijfers, leestekens, de spatie en enkele andere symbolen) en stuurcodes.

IBM kwam in de zestiger jaren van de vorige eeuw met haar eigen oplossing EBCDIC, Extended Binary Coded Decimal Interchange Code voor toepassing op haar mainframes en de AS/400 systemen. Het systeem was gebaseerd op het oude ponskaart principe en had een aantal problemen, de letters van het alfabet waren geplaatst in blokken, wat niet erg handig is voor sorteren.

Tegenwoordig is unicode de internationale standaard voor de identificatie van grafische tekens en symbolen, vergelijkbaar met de ASCII-standaard, maar uitgebreider. De standaard voorziet in alle tekens en symbolen van alle geschreven talen. De standaard wordt onderhouden door het Unicode Consortium en in tegenstelling tot ASCII heeft Unicode als doel alle gebruikte schriften te ondersteunen. De standaard bevat momenteel ruim 100.000 gestandaardiseerde tekens en ongeveer 900.000 voor toekomstig gebruik gereserveerde codes.

Links:
Wikipedia Ascii
Wikipedia ebcdic
Wikipedia unicode





Last update: 17-07-2010
 

Disclaimer.

Hoewel de heer Hein Pragt de informatie beschikbaar op deze pagina met grote zorg samenstelt, sluit de heer Pragt alle aansprakelijkheid uit met betrekking tot de informatie die, in welke vorm dan ook, via deze site wordt aangeboden. Het opnemen van een afbeelding of verwijzing is uitsluitend bedoeld als een mogelijke bron van informatie voor de bezoeker en mag op generlei wijze als instemming, goedkeuring of afkeuring worden uitgelegd, noch kunnen daaraan rechten worden ontleend.
Op de artikelen van de heer Pragt op deze Internet Site rust auteursrecht. Overname van informatie (tekst en afbeeldingen) is uitsluitend toegestaan na voorafgaande schriftelijke toestemming van de rechthebbende. Voor vragen over copyright en het gebruik van de informatie op deze site kunt u contact opnemen met: (email: copyright@heinpragt.com)

Webdedesign: © Hein Pragt
Fotografie: © Hein Pragt
Auteur: © Hein Pragt

Privacy beleid
Wij maken gebruik van externe advertentiebedrijven om advertenties weer te geven wanneer u onze website bezoekt. Deze bedrijven gebruiken mogelijk informatie (niet uw naam, adres, e-mailadres of telefoonnummer) over uw bezoek aan deze of aan andere websites om advertenties weer te geven over goederen en services waarin u wellicht geïnteresseerd bent. Als u hierover meer informatie wenst of als u wilt voorkomen dat deze bedrijven deze informatie gebruiken, klikt u op deze link.