Detektor Security Academy är ett utbildningskoncept i vilket Detektor tillsammans med noggrant utvalda tekniskt ledande säkerhetsföretag, samarbetar för att producera, distribuera och marknadsföra väsentlig information om de möjligheter som dagens säkerhetsteknologi kan erbjuda.
I denna andra artikel är det intelligent video som utgör fokus. Kompetenspartner i sammanhanget är OPAX och SAAB som inom ramen för Detektor Security Academy ger en uppdaterad inblick i ämnet videoanalys och kameraövervakning.

Intelligent videoanalys

Om man ska välja ett ämne där själva utmaningen är att höja medvetenheten och kunskapsnivån i säkerhetsbranschen, då ligger intelligent video bra till. Det finns många frågetecken att räta ut när det gäller denna relativt nya och potentiellt kraftfulla teknologi. Vad kan förväntas av intelligent video? Hur fungerar det? Vilken ’Return on Investment’ (ROI) kan användarna hoppas på? Dessa och en mängd andra frågor får sina svar i denna artikel.


Av Matts Lilja, Frode Berg Olsen (OPAX) och Leif Haglund, Amritpal Singh (Saab).


Det finns flera alternativa rubriceringar till ”Intelligent video”. Redan här röjs det faktum att vi talar om något relativt nytt. De alternativa termer som används mest är intelligent videoanalys (IVA) och videoinnehållsanalys (VCA=Video Content Analysis). Därutöver finns en mängd olika variationer på ovanstående uttryck, men VCA är den bästa termen för att beskriva vad det egentligen handlar om. Att benämna ett teknologiskt system som intelligent, i ordets sanna betydelse, är inte korrekt. Gemensamt för alla olika termer som beskriver VCA är att de har att göra med den teknologi som används för att analysera video genom specifik data, beteende, objekt och attityd.

Skapa nytta genom förenkling

Stora mängder videodata återfinns idag i konsument- och företagsapplikationer, men interaktion med denna lagrade video kräver bättre verktyg för att beskriva, organisera och sköta videodata. På grund av detta behov har företag tillsammans med forskningsinstitut samarbetat i syfte att utforska möjligheterna i att automatisera beskrivning och kategorisering av multimedia i allmänhet, och video i synnerhet. Arbetet med att manuellt beskriva videodata är naturligtvis mycket tidskrävande, därför behövs automatiserade metoder. Målet är att automatiskt skapa videosammanfattningar eftersom strukturerad media är mer lämplig att söka efter.

Säkerhetsvideo

Stora mängder video kan också hittas i säkerhetsanläggningar med kameraövervakning. Intresset för VCA har ökat under senare år, och är denna artikels fokus. Inom säkerhet används VCA främst för analys av realtidsvideo, men kan med fördel också användas för att söka på inspelat material genom att sätta vissa parametrar för mjukvaran att söka efter. Detta är en funktionalitet som sparar väldigt mycket tid och på så sätt ytterligare bidrar med nytta i en VCA-installation.

”Ointelligent” videoövervakning

För att exemplifiera vad som utgör ett typiskt videoövervakningssystem och varför detta varken kan klassas som intelligent eller analytiskt, utgår vi ifrån en stormarknad. Ett antal kameror är mer eller mindre direkt kopplade till ett antal monitorer, som i vissa fall är övervakade av operatörer och i vissa fall också spelas in. Den videoförädling som på sin höjd sker är av bildförbättrande art. All analys och förståelse för vad som pågår i det övervakade området är upp till operatörerna. Lyckligtvis händer det oftast ingenting speciellt eller hotfullt, det är tur. Studier visar nämligen på att operatörerna förlorar upp till 90 procent av sin uppmärksamhet efter bara 22 minuter av manuell videoövervakning. Om det då sker en händelse som behöver åtgärdas ger videoövervakningssystemet inget annat stöd än att det går att titta på förloppet i efterhand, om det har spelats in. Om man beaktar tidigare nämnda siffror för en operatörs uppmärksamhet så är det inte svårt att inse att risken är överhängande att en incident, eller annan viktig händelse, går obemärkt förbi även då videoövervakning är installerad. Undersökandet av vad som pågått innan, under och efter en incident måste göras genom att manuellt gå igenom inspelad video. Eftersom ingen riktig support erbjuds av system online eller offline, så kan inte ett sådant system klassas som analytiskt eller intelligent.

Skillnaden mellan en traditionell kameraövervakning och en anläggning VCA är att man i det senare fallet får  automatiserade funktioner som förenklar och till viss del överkommer problemen med operatörer, såväl offline som online.

Rörelsedetektion

Innan vi går in djupare på hur teknologin bakom VCA fungerar så tar vi upp en enklare typ av videoanalys som har funnits i mer än 20 år, nämligen rörelsedetektion (motion detection). Rörelsedetektion är idag en integrerad del av många digitala övervakningskameror och övervakningsmjukvaror. Rörelsedetektion tittar på förändringar i pixelvärden (rörelse) i en videoström och triggas igång av en händelse om rörelsen ligger över en viss nivå. I mer avancerade anläggningar kan systemet kräva att rörelsen ska ske inom ett visst bestämt område i bilden, eller om objektet är av en viss storlek, för att larm/inspelning ska triggas igång.

Eftersom rörelsedetektion är relativt osofistikerad är dess användning begränsad, inte minst på grund av den mängd falsklarm som den skapar. Med falsklarm menar vi händelser som triggar igång larmet/inspelningen trots det att inget riktigt objekt rört sig i bilden. Den viktigaste fördelen med rörelsedetektion är att den ofta används för att kontrollera när video spelas in och inte, eftersom en statisk bild sällan är av intresse. På detta sätt sparas en hel del lagringsutrymme.

Vad är intelligent?

Så rörelsedetektion är alltså inte speciellt intelligent. Vad är det då som gör att VCA betraktas som intelligent? Är det överhuvudtaget rimligt att kalla ett VCA-system för intelligent?
Om vi återvänder till stormarknaden igen och nu förser systemet med VCA så kan vi se ett antal förbättringar.

• Eftersom att stormarknaden består av ett antal affärer, entrér/utgångar, öppna ytor osv är det en utmaning för ett konventionellt system att hålla reda på hela gallerian.
I ett VCA-system vet systemet relationen mellan kamerorna i nätverket och dess positionering i förhållande till vissa platser i gallerian. Dessutom kan VCA-system följa människor och objekt genom nätverket på ett konsekvent sätt. På detta sätt så kan operatörerna få en klart förbättrad överblick av gallerian. Det blir t ex möjligt att fråga VCA-systemet vart en förövare kommit ifrån och – kanske ännu viktigare – vart han kan ta vägen och vart man kan stoppa honom?

• Titt som tätt kan det uppkomma behov av att specialbevaka ett visst område i gallerian. I ett konventionellt system betyder det att en operatör måste vara extra uppmärksam på ett visst område. Detta kräver att han minskar sin uppmärksamhet på övriga områden eller att ytterligare en operatör tillsätts. I ett VCA-system kan operatören själv definiera ett virtuellt säkerhetsområde med tillhörande regler för att trigga ett alarm. Han kan alltså fortsätta att utföra sina normala plikter medan VCA-systemet ser till att ha särskild koll på ett speciellt område.

• Om en incident uppstår som leder till att ett larm går av via VCA-systemet kommer inte bara operatörerna att meddelas, utan även en PTZ-kapabel HDTV kamera kan automatiskt zooma in på händelsen som utlöst larmet och skapa högkvalitetsbilder på objektet.

• Ett VCA-system kan också integreras med biometrisk identifikation. Det innebär att operatörerna själva måste identifiera sig innan de går in i ett känsligt område.

Så fungerar VCA



Innan någon analys kan ske måste meta-data tas från videoströmmen. Meta-datan
innehåller information om t ex objektets hastighet, storlek och position.
VCA är möjligt tack vare skapandet och analyserandet av meta-data. Typiska exempel av meta-data är:

• Objektets storlek och position i bilden.
• Objektets hastighet.
• Nummerplåtar.

Enkelt uttryckt är meta-data en term för data om data, eller data som beskriver innehållet av vad kameran ser. Eftersom denna aktuella data sedan förs vidare till analys så är kvaliteten och precisionen i skapandet av meta-data är av yttersta vikt.

Först och främst är det viktigt att bara riktiga objekt beskrivs, så att inte vegetation som rör sig på grund av vind och liknande betraktas som objekt. Vidare är det viktigt att se till att skuggor inte heller tas upp av systemet som objekt.

Meta-datans betydelse Betydelsen av att meta-datan har hög precision kan belysas om man utgår från en applikation som t ex  automatisk nummerplåtsigenkänning (ANPR). Om precisionen är låg i ett ANPR-system och tillförlitligheten i identifieringen av ID är undermålig kommer ANPR-systemet att vara värdelöst. Det kan också leda till problem om ett objekts storlek felbedöms så att t ex en person kan äntra ett förbjudet område utan att larmet triggas igång. Ju högre säkerhet som krävs av VCA-systemet, ju högre krav måste man följaktligen ställa på skapandet av korrekt meta-data. Själva datan i bilden är naturligtvis också viktig att ta i beaktande. Är det tillräckligt att veta ett objekts position i bilden för att kunna implementera en steril zon eller ett ’trip wire’ alarm? Tänk vilka möjligheter som skulle finnas om olika objekts position kunde plottas på en karta via koordinater och vidare om man kunde klassificera dem som människor, bilar, djur etc.

När det gäller värdet för slutanvändaren är meta-data analysen av naturligtvis av yttersta intresse. Det är ju resultatet av den som presenteras som händelser för användaren.

Analysen av en människas position över tid kan resultera i områdesöverträdelse, beroende på personens rörelser och typen av analys som används. Om meta-data innehåller information om objektets geografiska position kan meta-datan avgöra om det rör sig om en för snabbt körandes bil eller en människa som springer. Informationen om varje bils hastighet kan sedan användas för att beräkna medelhastigheten på ett vägavsnitt eller för att detektera och larma när det börjar bildas köer.

I en högsäkerhetsanläggning kan ett organiserat inbrott detekteras tidigare om t ex systemet är programmerat att larma i händelse av att ett visst antal personer samtidigt rör sig mot ett visst område från olika håll. Om meta-data insamlingen är precis och robust kan en person, teoretiskt sett, följas mellan kamerorna i en stad eller byggnad.

  Sida 1 (4) Next Page
© 2009 AR Media International AB