Semantisk uppmärkning - att tagga dokument med betydelse

För god tillgänglighet i en digital bok krävs att innehållet struktureras tydligt och att bokens olika beståndsdelar noggrant märks upp med sina respektive betydelser. Här förklarar vi begreppet semantisk uppmärkning och varför det är en viktig komponent i tillgänglig e-boksproduktion.

En tryckt bok, som vi på MTM kallar för svartskrift, är främst avsedd att läsas av seende. Svartskriften kan använda olika grafiska inslag för att synliggöra bokens beståndsdelar och deras relation till varandra, till exempel indrag för nytt stycke, olika typsnitt och storlekar för rubriker och brödtext, eller att ett nytt kapitel alltid börjar lite längre ner på en högersida (som kallas för recto). Typografiska konventioner som dessa fungerar för en seende läsare av en bok som stöd för att känna igen sig och hitta i bokens struktur.

Visuella ledtrådar inte tillräckligt

För digitala böcker som ska vara tillgängliga kan man inte förlita sig på bokinnehållets utseende och layout för att hjälpa läsaren att förstå strukturen – det är ju inte alls säkert att läsaren läser boken med ögonen på en skärm. Kanske navigerar hen i boken med en skärmläsare, som presenterar innehållet med hjälp av talsyntes eller på en digital punktskriftsskärm.

Tillgängliga e-böcker kan inte, i likhet med tillgängliga webbplatser, vila på visuella ledtrådar för att göra tydligt vad som är vad i boken. De måste ha ett annat sätt att beskriva strukturen. Här får man ta hjälp av så kallad semantisk uppmärkning. Semantisk uppmärkning innebär att man märker upp varje informationsbit med en standardiserad etikett som beskriver bitens innehåll.

Låt oss titta på ett exempel:

<p>Måndag morgon</p>
<p>Det var en vanlig måndag …</p>

Här har vi hamnat bakom kulisserna på en e-bok som använder HTML för att tagga innehållet. HTML står för HyperText Markup Language. Språket används för att strukturera innehåll på webben, men det är även en viktig byggsten i e-boksformatet Epub, som är en utbredd branschstandard. HTML innehåller en uppsättning av taggar för att beskriva innehållet. I exemplet ovan ser vi hur de två textbitarna är uppmärkta med taggen ”p”, som står för ”paragraph”. Informationen som förmedlas är att det finns två stycken, ett med texten ”Måndag morgon” och sedan ett med texten ”Det var en vanlig måndag …”.

Standardiserade etiketter ger flexibel funktionalitet

Uppmärkningen med HTML-taggar är ett standardiserat sätt att benämna och sortera e-boksinnehållet. Det gör att informationen blir läsbar för maskiner och möjlig att tolka för ett hjälpmedel som skärmläsare. Skärmläsaren i sin tur kan presentera innehållet på det sätt som användaren föredrar, den kan till exempel läsa upp innehållet, tala om vilken typ av innehåll som är i fokus, eller hjälpa till med navigation, till exempel hoppa till nästa stycke.

Det finns dock lite förbättringspotential i exemplet. ”Måndag morgon” råkar nämligen vara en rubrik. Att använda p-taggen för en rubrik är nämligen inte så exakt, ett stycke och en rubrik är ju två olika saker. Vid semantisk uppmärkning strävar man efter semantisk precision. Uppsättningen av taggar i HTML har reserverade namn för rubriker på olika nivåer. Genom att byta ut taggen ”p” mot ”h1” – som står för ”heading 1” – för vår rubrik kan vi göra vårt exempel mer semantiskt precist:

<h1>Måndag morgon</h1>
<p>Det var en vanlig måndag …</p>

Så, nu är det mer rätt, ändringen i uppmärkningen av innehållet fångar nu skillnaden i betydelse mellan rubriken och stycket genom att använda taggar som motsvarar innehållet bättre.

Faktiska konsekvenser för läsaren

Men semantisk uppmärkning av e-böcker är inte främst en teoretisk övning. Hur pass väl uppmärkt en e-bok är har stor betydelse för graden av tillgänglighet, på samma sätt som när man bygger webbplatser. Det korrigerade exemplet gör till exempel att en läsare med synnedsättning kan använda sin skärmläsare för att stega mellan rubriker, eller för att få en signal som talar om att ”Måndag morgon” är just en rubrik, på högsta nivån. Dessa exempel hade inte varit möjliga utan korrigeringen till en bättre semantisk uppmärkning. Om informationen om vad som är vad i boken finns där kan hjälpmedel som skärmläsare, talsynteser och punktskriftsskärmar jobba ostört. Om bokens utformning har bristande struktur och semantik i boken blockerar det i stället hjälpmedlens möjligheter att jobba och läsaren blir lidande, hen tappar kontext, navigationsmöjligheter, etcetera. Kanske ger hen upp och lägger ifrån sig e-boken. Därför är korrekt semantisk uppmärkning så viktigt.

Utesluter inte arbete med grafisk presentation

Att arbeta med noggrann semantisk uppmärkning utesluter inte arbete med grafisk formgivning av bokens innehåll. En välutvecklad stilmall (CSS, Cascading Style Sheets) i en Epub-bok som bestämmer marginaler, typsnitt, med mera, behöver inte störa tillgängligheten för personer som använder skärmläsare. (Det är däremot viktigt att tänka på att det även finns grafiska tillgänglighetsaspekter, till exempel för liten text, svårlästa typsnitt, och så vidare.) En väl utförd stilmall behöver inte stå inte i vägen för den som använder skärmläsare, så länge den läggs ovanpå en väl utförd semantisk uppmärkning.

Vi återgår till vårt exempel. Följande justering av det första exemplet skulle fungera fint för en stilmall som formger rubriken för visuell presentation på skärm:

<p class="rubrik">Måndag morgon</p>
<p>Det var en vanlig måndag …</p>

I stilmallen kan man enkelt hänvisa till p-taggar som har klass-namnet ”rubrik”, och på så vis styra deras utseende i e-boken så att de presenteras i fetstil och lite större än brödtexten.

Observera att namnet ”rubrik” inte är en standardiserad etikett, den hittade vi på. Även om sättet kan användas för att styra visuell presentation finns det ingen möjlighet för hjälpmedel eller läsprogram att veta att innehållet ska tolkas på något särskilt sätt. Läsare som navigerar och orienterar sig med hjälpmedel får svårare att läsa boken. Därför är den standardiserade etiketten ”h1”, som används i det andra exemplet, bättre.

Universell utformning ökar läsbarheten för alla

När utformningen av e-boken tar hänsyn till alla möjliga sätt att läsa den på kallar vi det universell utformning. Universell utformning som designprincip är en viktig grund för det europeiska tillgänglighetsdirektivet, med målet att kommersiella produkter och tjänster ska utformas på ett sätt så att fler kan ta del av dem.

Semantisk uppmärkning – en noggrann taggning av innehållets betydelse – är en viktig del av universell utformning av e-böcker. Inte bara hjälpmedel som skärmläsare utan även funktionalitet som byggs in i läsprogram och appar drar nytta av en noggrant uppmärkt e-bok. Genom att jacka i de standarder som används av hjälpmedel och programvara vidgar du läsbarheten av ditt e-boksinnehåll för alla. Resultatet är e-böcker vars berättelser kan navigeras på flera sätt. En sådan e-bok förutsätter inte läsning med ögonen, men stödjer det, jämsides med exempelvis taktil läsning eller läsning med öronen – eller kombinationer av dessa.

Fördjupning

I den här introduktionen beskrev vi semantisk uppmärkning med hjälp av några väldigt basala märkord från HTML, ”p” för stycken och ”h1” för rubriker på högsta nivån. Vill du fördjupa dig i tillgänglighet och semantisk uppmärkning för e-böcker mer i detalj rekommenderar vi Daisy-konsortiets kunskapsbank ”Accessible Publishing Knowledge Base”. Där kan du läsa mer om uppmärkning och tillgänglighet för olika typer av innehåll och konstruktioner som förekommer i e-böcker.

Fördjupa dig på Daisy-konsortiets Accessible Publishing Knowledge Base (länk öppnas i nytt fönster)

I tillgänglighetsdirektivet beskrivs vikten av semantisk uppmärkning för tillgänglighet i e-böcker på följande sätt:

Kodningens precisionsgrad bestämmer e-bokfilernas tillgänglighet, i synnerhet när det gäller klassificeringen av olika grundläggande beståndsdelar i verket och den standardiserade beskrivningen av dess struktur. Interoperabilitet i fråga om tillgänglighet bör maximera dessa filers kompatibilitet med olika användarprogram och med befintliga och framtida tekniska hjälpmedel. (direktivets inledande skäl, 41).

Läs hela texten i det europeiska tillgänglighetsdirektivet (2019/882) på EU:s webbplats EUR-Lex

Tipsa en vän om denna sida via epost.
(Obligatoriskt fält)
(Obligatoriskt fält)
(Obligatoriskt fält)
(Obligatoriskt fält)