Een bestand is een verzameling van gegevens die een eenheid vormen en geschikt zijn voor computerverwerking. Informatie binnen een bestand is ten allen tijden binair, oftewel opgemaakt uit een combinatie van nullen en enen.
Bestanden kunnen op de harde schijf van een computer worden opgeslagen als bestandsnaam.extensie. Het gedeelte na de laatste punt (.) in de bestandsnaam staat voor de extensie; een manier waarop herkend kan worden welk type programma moet worden gebruikt om het bestand te openen. Dit wil overigens niet zeggen dat door het wijzigen van de extensie ook automatisch het type van het bestand wijzigt.
De maximaal toegestane lengte van de bestands- en extensienaam hangt af van het gebruikte besturingssysteem:
In DOS en Windows 3.1 mocht een bestandsnaam slechts uit acht karakters bestaan en de extensie uit drie karakters. Vanaf Windows 95 en in alle recentere versies van het besturingssysteem van Microsoft, mogen bestanden inclusief de extensie uit maximaal 260 karakters bestaan. Met de Anniversary Update van Windows 10 is het met behulp van een slim trucje zelfs mogelijk om nóg langere bestandsnamen op te slaan.
Om bovenstaande reden krijgen bestandsnamen in DOS of Windows 3.1, die oorspronkelijk in nieuwere versies van Windows zijn opgeslagen, een ingekorte bestandsnaam. Deze naam bestaat uit de eerste zes karakters van de oorspronkelijk opgegeven naam, gevolgd door een '~'-teken en de letter 'x'. De letter x wijzigt automatisch in een cijfer dat aangeeft hoe vaak het bestand met dezelfde naam opgeslagen is. Dit wil zeggen dat, in het geval een bestand met de naam 'bestand~1' reeds bestaat, een volgend identiek bestand de naam 'bestand~2' toegewezen krijgt.
Een bestand bevat bovendien een bronbestand dat additionele informatie bevat, zoals het bestandstype en diens grootte. Het einde van de inhoud van elke bestand wordt afgesloten met een karakter. Deze geeft aan dat eventuele informatie die na dit karakter zou volgen niet tot hetzelfde bestand behoort.
Wellicht vraag je jezelf af wat nu het nut is van het opslaan van informatie over de grootte van een bestand in het bronbestand, terwijl de grootte van het bestand allang bekend is.
De volgende voorbeelden geven aan waarom dit wel degelijk belangrijk is.
Ongetwijfeld heb je weleens een bestand gedownload via internet, waarop vervolgens je browser vastliep of server van de host de verbinding verbrak. Als het een tekstbestand betreft, mis je hierdoor wellicht een gedeelte van je tekst. Maar als het om een binair bestand gaat (bijvoorbeeld een .exe-bestand), kan het gevaarlijk zijn om het bestand uit te voeren, gezien door het afbreken van de download, informatie ontbreekt.
Het besturingssysteem vergelijkt daarom de grootte van het bestand met de in het bronbestand aangegeven informatie om de validiteit te controleren. Dit proces wordt over het algemeen foutdetectie genoemd. In werkelijkheid gaat het om een ietwat ingewikkelder algoritme dat bekend staat als CRC (Cyclic Redundancy Check).
Wanneer een bestand besmet is met een virus, voegt het virus informatie aan het bestand toe. Hierdoor is de in het bronbestand opgeslagen informatie over de grootte van het bestand niet meer juist en kan het virus worden geïdentificeerd. In het geval het virus ook geprogrammeerd is om informatie in het bronbestand aan te passen, is deze helaas lastiger te ontdekken.
Afbeelding: © Studio DI - Shutterstock.com