Vinnare av Tidskriftspriset: Årets rörligt 2024!
Lite för häftigt?När filmupplevelsen blir superrealistisk, rent av interaktiv, utmanas vår förmåga att hantera intensiva intryck. Hur känner man sig efter två timmars biljakt, i verkligheten alltså?
Bild: Lindsten & Nilsson

Framtidens tv kan bli obehagligt verklig

Hur verklighetstrogen filmupplevelse vill du ha? Storskalig 3D hemma i vardagsrummet kan bli nästa stora grej, men kontrast och färgintensitet är viktigare för tittarna och där finns det mycket kvar att hämta. 

Publicerad

Jag står med fötterna tätt ihop på en mycket liten vagn byggd av några plankor och fyra järnvägshjul. Långsamt och med ett klonk för varje skarv makar vagnen sig uppför en brant stigning längs ett smalt spår, som ringlar mellan befästningstornen i en medeltida bergsby. Snart lämnar spåret banvallen och fortsätter uppåt, fritt hängande i luften. Jag tittar ner mellan skenorna och genast slår svindeln till. Det är säkert mer än hundra meter ner till marken och det finns inget att hålla sig i.

Uppe på krönet tittar jag åt höger och hinner ta in en magnifik utsikt över havet, innan spåret dyker rakt ner mot marken. Vagnen accelererar och jag böjer instinktivt på benen för att kunna hålla mig kvar. Det suger i magen, och nu ser jag att rälsen planar ut i en skarp vänstersväng längre fram. Precis före svängen kryper jag ihop ännu mer och lutar mig allt vad jag kan in i kurvan för att inte slungas ut i sjön. Det går bra. Sedan gör rälsen en kort snabb stigning – och tar slut. Vagnen och jag flyger fram genom luften, högre och högre, rakt mot en enorm stenmur.

Nu vrålar jag rakt ut ur djupet av min skräckslagna reptilhjärna, trots att jag egentligen vet att det är en workshop, och att andra deltagare har i uppgift att fånga mig om jag skulle falla. Men de tättslutande hörlurarna och videoglasögonen skärmar bort omgivningen totalt och suger in mig nästan fullkomligt i en annan verklighet. Videoglasögonen har inbyggda rörelsesensorer, så att omgivningen följer med när jag vrider huvudet. De är framtagna för att ge dataspel och 3D-simulatorer en mer verklighetstrogen och intensiv upplevelse. Imponerad, darrig i benen och med en önskan att verka visionär, slänger jag ur mig att vi i framtiden troligen kommer att kunna sitta hemma i soffan och se på tv med den här tekniken. Men Haibo Li, professor i medieteknik vid Kungliga tekniska högskolan i Stockholm, ber mig att tänka ett varv till:

– Föreställ dig att du skulle se en hel actionfilm på det här sättet. Hur länge skulle du egentligen orka med ett sådant överflöd av intryck? Jag skulle tro att de flesta skulle krokna efter fem minuter.

Haibo Li kom till Sverige 1990, blev docent i bildkodning 1997 och professor i signalbehandling 1999. Han har sin grund inom matematiken, men har under åren breddat sin forskning till att innefatta människan och hennes relation till teknik.

– Det har alltid funnits en ängslig föreställning om att mer av allt är bättre. Men försök att minnas den mest medryckande upplevelse du har haft när du har ägnat dig åt ett medium. Förmodligen är det inte när du såg en 3D-film eller spelade ett avancerat dataspel, utan kanske snarare när du läste en riktigt bra bok, säger Haibo Li.

I en tid då kommunikation genom rörlig bild växer explosionsartat vill han nyansera och problematisera vårt invanda förhållningssätt till informationsförmedling. En bild anses säga mer än tusen ord, och video förmedlar mer information än stillbild. En vanlig uppfattning är även att 3D ger en intensivare upplevelse än 2D, att en större skärm är bättre än en mindre – och att upplevelsen förstärks av interaktivitet.

– Men det finns varken forskning eller empiri som stöder uppfattningen att more is better och att deltagande alltid ger en djupare upplevelse än passivt intagande. Så ur ett akademiskt perspektiv kan man faktiskt betrakta de här idéerna som rena myter, menar Haibo Li.

Content is king (ungefär ”det är innehållet som räknas”) lyder ett talesätt inom mediebranschen. Haibo Li håller med. Enligt honom är det först och främst innehållets förmåga att slå an känslor hos mottagaren som påverkar upplevelsens intensitet. Mottagaren måste också få måla upp en egen bild av den värld som mediet beskriver. En realistisk bild- och ljudåtergivning kan ge en extra skjuts och göra det lättare för tittaren att ryckas med, men utan ett engagerande innehåll som personen kan relatera till är tekniken värdelös. De flesta människor har nog någon gång suttit av en biofilm som trots toppkvalitet när det gäller ljud och bild varit bedövande tråkig.

Trycksvärta på vitt papper kan alltså konkurrera med en berg-och-dal-banefärd i 3D när det gäller upplevelsens intensitet. Ändå har vi sedan televisionens födelse ständigt utvecklat tekniken. Den svartvita bilden har bytts till färg, skärmarna har blivit större och ljudet har fått fler kanaler för surround-effekt. Vi jagar den ultimata kicken hemma i fredagsmyset. I den andra änden sitter producenter, regissörer och filmfotografer, som vill att deras berättelse ska omfamna tittaren på alla tänkbara sätt.

De senaste åren har det skett en hisnande utveckling av skärmar och tv-mottagare för hemmabruk. Men deras potential är i dagsläget outnyttjad, i väntan på att distributörerna av tv- och film-on-demandtjänster tar fram en ny standard för sina sändningar. När detta väl händer, kommer bilden vi tar emot i vardagsrummet att bli betydligt mer verklighetstrogen och verka mer hänförande än tidigare – under förutsättning att innehållet känns angeläget, om vi ska tro Haibo Li.

Mellan televisionens etablering i USA i slutet av 1940-talet och övergången till digital-tv i början av 2000-talet skedde egentligen bara en enda riktigt omvälvande teknikförbättring. Det handlar förstås om övergången till färg-tv, som fick fäste i USA i mitten av 1960-talet och slog igenom i Europa några år senare. I övrigt kunde vi som tv-tittare inte göra särskilt mycket för att förstärka upplevelsen av lördagens cowboyfilm, hur mycket vi än var beredda att betala för en lyxigare tv-apparat.

Trots andra tekniska framsteg som månlandningar, miniräknare, digitalklockor och bärbara datorer, måste vi ännu i slutet av 1990-talet hålla till godo med i princip samma bildupplösning som på 1950-talet.

– Proppen lossnade i och med övergången till digital-tv. Med digital teknik kan teknikskiftena komma tätare, berättar Per Björkman, som är distributionschef på SVT.

Den första generationens digital-tv, som började lanseras 1999, hade ungefär samma upplösning som det gamla analoga formatet: 720 bildpunkter på bredden. Några år senare, 2005, kom high definition (HD) med 1 280 bildpunkter. Därefter kom så kallad full HD, med 1 920 pixlar på bredden, som vi fortfarande lever med.

I Sverige gnälldes det en del över att det analoga tv-nätet släcktes ner, vilket gjorde att folk fick byta ut sin tv eller skaffa en digitalbox. Men tack vare övergången till digital-tv kunde det tilldelade frekvensområdet för marksänd tv nu rymma långt fler kanaler, dessutom med högre upplösning.

Bättre upplösning och mer färg
Med högre upplösning, mustigare färger och större skillnad mellan ljust och mörkt ska nästa generations HDtv ta tittarupplevelsen till en ny nivå. Kraven på placering och storlek av dessa ultrahögupplösta bildskärmar kan dock bli knepiga att uppfylla, på grund av begränsningar i vår egen synskärpa.


Bild: Johan Jarnestad

Nästa steg efter full HD kallas 4K och har nästan 4000 bildpunkter på bredden. Sådana tv-skärmar finns redan ute i handeln och i ett och annat vardagsrum. Nyligen släpptes dessutom de första 8K-skärmarna.

– Vi är just klara med jättearbetet att ställa om från produktion och utsändning i den gamla standardupplösningen till första generationens HD-tv, och redan nu undrar tittarna när vi börjar sända i 4K, berättar Per Björkman. Men jag säger stopp, vänta lite! Antalet pixlar är inte avgörande längre. Däremot kommer vi att få in andra häftiga egenskaper i framtidens tv, bara branschen kommer överens om en standard.

Haibo Li är inne på samma spår. Han menar att bildpunktskriget snart är över, precis som när hetsen kring digitalkamerornas pixeltäthet till slut lade sig för några år sedan. Orsaken, menar han, är att vi faktiskt inte kan se någon skillnad.

– Hur placerar vi våra tv-apparater? Nästan alltid på väggen mitt emot soffan. I de flesta vardagsrum blir därför avståndet mellan tittare och tv-skärm minst tre meter. Den som byter upp sig från full HD till 4K fyrdubblar antalet bildpunkter på sin skärm. Men tittaren kommer inte att se någon skillnad, för våra ögon är inte så högupplösta på det avståndet, säger Haibo Li.

ör att få bäst valuta för en bildskärm ska tittaren sitta just på det avstånd där ögat inte längre kan urskilja de enskilda bildpunkterna. Om avståndet ökas flyter pixlarna ihop allt mer, och den höga upplösningen går till spillo. En 4K-tv på 46 tum ska betraktas från ungefär 80 centimeter. Den som ändå envisas med att vilja sitta på tre meters avstånd och dessutom skaffar en 8K-tv måste ha en skärm som mäter åtminstone sju gånger fyra meter för att kunna dra nytta av den höga upplösningen.

Men det finns mycket mer att hämta i nästa generations tv-format än bara högre upplösning. Senast 2017 ska representanter för tv-bolag, filmbranscherna och elektronikproducenterna ha enats kring det övriga innehållet i den nya standarden ultra high definition, UHD.

Vilket blir då nästa viktiga steg för att förstärka tittarens bildupplevelse? Många skulle nog gissa på 3D. Men enligt Haibo Li kommer djupseende ganska långt ner på listan över egenskaper som ger tittaren en stark känsla av närvaro:

– Studier visar att kontrast hamnar på första plats. Därefter färgintensitet, sedan upplösning och först efter det kommer djupseende.

Först kontrast alltså. Det mänskliga ögat kan, tack vare sin förmåga att ständigt ändra storleken på pupillen, hantera mycket stora skillnader i ljusintensitet. Till exempel kan vi urskilja en svart kajak i en motljusgata på ett glittrande vatten. Men vid en mycket hastig förändring av ljusintensiteten, eller om vi rör oss mellan extrema skillnader, känner vi oss bländade. Till exempel när någons klocka skickar en solkatt i våra ögon, eller när vi kommer från en mörk källare ut i starkt solsken. Att bli bländad är en del av vår verklighet. Men fundera på hur reflektionen till exempel från en bildörr i starkt solljus ser ut på en tv. Eller om du någonsin har blivit bländad av solen eller ett blixtnedslag i en filmscen.

– Den maximala ljusintensitet som ryms i dagens tv- och videostandard härstammar från vad de gamla tjock-tv-apparaterna klarade av, och är något vi har fått dras med, berättar Per Björkman.

Bilden i en gammaldags skärm med katodstrålerör bildas av elektronstrålar som sveper över små punkter av fosfor, som då avger ljus. Hundra procent vitt på en sådan skärm avger omkring 80 cd/m2 (candela per kvadratmeter). De skärmar som säljs i dag klarar av ungefär 500 cd/m2, och nästa generation klarar ännu mer.

– Innan vi börjar bygga om här på SVT för att sända program i 4K vill vi att UHD-standarden ska ge oss möjlighet att utnyttja den fantastiska vitnivån i moderna platt-skärmar. Då har vi en chans att komma i närheten av den kontrast vi upplever i verkligheten, säger Per Björkman.

Men det finns ännu mer att hämta. Den standard som definierar färgomfånget, alltså hur intensiva färger videosignalen får innehålla, är visserligen inte lika gammal som standarden för ljusintensitet. Den togs fram i början av 1990-talet för första generationens HD-tv-format och gav lite bättre tryck i färgerna än analog-tv. Men prestandan hos dagens LCD, LED- och plasmaskärmar har gjort även denna standard föråldrad. Moderna tv-apparater kan visa betydligt djupare och mustigare färger än vad som ryms i nuvarande tv- och filmsignal . Den nya UHD-standarden kommer att ge ett mycket större färgomfång, så att bilden blir mer verklighetstrogen.

Pixeltillväxt En 8K-signal har 80 gånger fler bildpunkter än den standardupplösning (SD) som många tv-program fortfarande sänds i.

Rörlig bild består av stillbilder som spelas upp tätt efter varandra. I Europa levererar den standardupplösta tv-signalen 25 bildrutor varje sekund – en kompromiss mellan den bandbredd man fann rimlig för analog tv, nätspänningens svängning på 50 hertz samt biofilmens 24 bilder per sekund. Biofilmens hastighet standardiserades redan för snart hundra år sedan, i mitten av 1920-talet. Film var dyrt och producenterna ville att kamerorna skulle gå så långsamt som möjligt. Just 24 bilder per sekund ansågs – i kombination med en mekanism som släcker varje bildruta ett kort ögonblick så att den projiceras två gånger – vara den lägsta uppdateringsfrekvens som kunde tillåtas, utan att betraktaren skulle uppfatta de enskilda stillbilderna. Men med så låg hastighet på filmen uppstår en del förvrängningar. Objekt som rör sig snabbt framför kameran, liksom snabba panoreringar, ger ett intryck av rörelseoskärpa när filmen spelas upp. Dessutom uppstår ett knappt förnimbart blinkande när varje bild släcks och sedan visas igen. Efter snart hundra år med långfilm presenterad på detta sätt, har dessa förvrängningar blivit något som vi förknippar med ett filmiskt utseende. En vanlig tv-kamera, som alltså inte registrerar ljuset på emulsionsfilm, utan på en elektronisk bildsensor, ger mjukare övergång mellan varje bildruta och kräver därför inget blinkande med svartrutor. Häri ligger den subjektiva skillnaden mellan film och video. Filmens rörelseoskärpa och ryckiga hopp mellan bildrutorna förknippar vi med en påhittad berättelse som utspelar sig långt bort från vardag och verklighet. Videons mjuka, jämna flyt känns å sin sida mer som det våra ögon ser i det vanliga livet. Video förknippas dessutom rent innehållsmässigt mer med vardagen – nyhetsinslag, barnprogram och dokumentärer filmas sedan slutet av 1970-talet huvudsakligen med videokameror.

När den nya UHD-standarden nu tas fram finns det inget skäl att begränsa sig till en kompromiss från början av förra seklet. Formatet kommer att kunna klara upp till 120 bilder per sekund, vilket bejublas av bland annat sportfantaster, som längtar efter en så realistisk reproducering som möjligt av snabba rörelser, utan rörelseoskärpa.

Men frågan är hur publiken kommer att reagera. Filmen Hobbit: En oväntad resa, som hade premiär 2013, visades på bio med måttliga 48 rutor per sekund. Det gav upphov till många negativa kommentarer. Kritikerna ansåg att de mjuka rörelserna och den skarpa bilden fick filmen att kännas alldeles för – just det – verklighetstrogen. Det utseende som vi normalt förknippar med en filmsaga saknades, vilket bröt magin. Med andra ord finns redan möjligheten att göra mer verklighetstrogna filmer, både på bio och på våra tv-skärmar i hemmet. Men det kanske inte är vad vi behöver för att ryckas med.

År 2011 började BBC testsända i 3D för en referensgrupp med en och en halv miljon tittare. Två år senare lades projektet ner på obestämd tid eftersom intresset var minimalt. Tittarna tyckte bland annat att det var för bökigt att hantera de speciella glas-ögonen. Dagens 3D-videoteknik ger dessutom sämre kontrast och ett mindre färgomfång – egenskaper som enligt studier spelar större roll för upplevelsen än tredimensionellt djup.

– Jag dömer inte ut 3D-tv. Tids nog kommer det att slå igenom, säger Haibo Li. Men det finns många problem kvar att lösa för att det ska fungera. Först och främst måste glasögonen bort, krånglet med dem skapar en barriär mellan tittaren och upplevelsen.

Studier och referensgrupper i all ära, men i slutänden är det ofta först när ny teknik når den breda publiken som det går att avgöra om den blir en succé eller parentes i teknikhistorien. 1970-talets fyrkanaliga hifi-anläggningar, som skulle ge musikupplevelser i vardagsrummet med både djup och bredd. floppade innan årtiondet var till ända. Likaså betraktar SVT i dag sin egen satsning på tv-ljud i fem surround-kanaler från mitten av 00-talet som dödfödd. Luktbio, smell-o-vision, hamnade i skamvrån efter en enda film (Scent of Mystery, 1960). Och vilket är egentligen det mest bestående minnet från SVT:s trevande försök med 3D-inslag i Söndagsöppet i början av 1990-talet? Troligen de festliga glasögonen av papp. Den här typen av tillbakablickar ger ett hum om hur många teknikfloppar det går på en succé, vilket gör det lätt att bli skeptisk till de nymodigheter vi ser i dagens kristallkula. Men den ständige tvivlaren bör samtidigt beakta ett citat från den rörliga bildens barndom. Det fälldes 1928 av Joseph Schenck, filmproducent i Hollywood och sedermera medgrundare av 20th Century Fox: ”Ljudfilm är en fluga som kommer att hålla i fyra, max fem månader.” Han fick för övrigt medhåll av självaste Charlie Chaplin.

Smartare packning ger fler pixlar

Digital video består av digitala stillbilder i följd. Bildsensorn i en professionell HD-videokamera registrerar 25 bilder varje sekund, som var och en tar upp ungefär 6 MB datautrymme okomprimerat. En sekund video från en sådan kamera tar således upp 150 MB, och en minut kräver 9 GB. Ett minneskort till en konsumentvideokamera rymmer omkring 64 GB och skulle alltså bara kunna härbärgera ynka sju minuter okomprimerad video.

Datamängden i digital video behöver därför packas, komprimeras, för att bli hanterbar, oavsett om det gäller att få plats på kamerans minneskort, på redigeringsdatorns hårddisk eller för att rymmas i den uppkoppling eller tv-signal som strömmar videon till tittaren. På ena sidan, exempelvis i kameran, finns ett program som sållar bort och packar ihop data enligt en viss kod. På andra sidan, i datorn, i smart-telefonen eller digital-tv-mottagaren, finns ett program som avkodar och packar upp datamängden enligt samma kod. Ordet kodek är en sammanskrivning av koder-dekoder.

En kodek använder flera olika tekniker för att minska bildinformationen utan att den subjektiva bildkvaliteten försämras. Den mest grundläggande är samma som vid komprimering av stillbilder, som i det välkända formatet JPEG. I stället för att ange färgen för varje enskild bildpunkt delas bilden upp i ett lapptäcke av mindre rutor. Kodeken kastar bort datamängden för varje enskild pixel, och sparar i stället ner ett avrundat medelvärde för hela rutan. Större rutor ger effektivare komprimering, men orsakar också lättare synliga artefakter. Tydligast syns det på gradvisa färgövertoningar som till exempel en blå himmel. Mindre rutor ger mindre synbar påverkan, men blir inte lika effektiv.

För att framtidens högupplösta 4K- och 8K-video inte ska proppa igen de internetuppkopplingar och sändarmaster som tar bilden hem till tittaren behövs en mer effektiv packning än tidigare. Den kodek som ska möjliggöra UHD-tv har fått namnet H.265, att jämföra med den vanliga HD-signalens H.264. H.265 är mer intelligent och flexibel i sin uppdelning av bilden i rutor än sin föregångare. Den strävar hela tiden efter att runda av i större och färre rutor, men har fortfarande möjligheten att skapa ett finmaskigt rutnät där innehållet är komplext och brokigt. H.265 är nästan dubbelt så effektiv som H.264 och kan minska datamängdens storlek till en tusendel utan förvrängning som kan upptäckas av den genomsnittlige tittaren.

Underskattat genombrott i Linköping

År 1981 utvecklade den svenske forskaren Robert Forchheimer ett nytt, okonventionellt sätt att komprimera video på, kallat hybridkodning. Han skickade in en artikel om idén till en av de största internationella facktidningarna, men blev refuserad. Metoden ansågs orealistisk eftersom den krävde alldeles för stor beräkningskraft för att fungera i realtid. Men efter bara några år hade mikroprocessorerna kommit ikapp, och med draghjälp från Televerket antogs kodeken som en internationell standard med namn H.261. Alla efterföljande versioner, fram till dagens H.265, grundas på denne Linköpingsteknologs innovation.

Vårt eget filmande kräver nya algoritmer

Professor Haibo Li driver för närvarande ett projekt på KTH för att ta fram nya video-algoritmer som är bättre anpassade till smarttelefoner och surfplattor. De flesta videokodekar är konstruerade så att det går åt stor datorkraft för att packa ihop videon, men mindre för att packa upp den. Packningen görs oftast i kraftfulla redigeringsdatorer eller i konverterare i tv-husens apparatrum.

– Inom ett år är varje ägare till en ny smarttelefon också distributör av video i 4K, vilket gör att vi måste tänka om helt och hållet, säger Haibo Li.

Om telefonen använder någon av de kodekar som finns i dag för att spela in, redigera och skicka i väg högupplöst video, så blir det inte mycket batteritid kvar för samtal och surf, eftersom hög belastning på telefonens processor drar mycket ström. Utmaningen för forskarteamet är därför dels att ta fram smartare packningsmetoder som belastar processorerna mindre, dels att åstadkomma en jämnare fördelning av beräkningskraften mellan avsändare och mottagare. 

Upptäck F&F:s arkiv!

Se alla utgåvor