Større datainnsikt med maskinlæring

Kjetil Åmdal og Harald S. Bø i Capgemini forteller om fordelene ved maskinlæring.

Større datainnsikt med maskinlæring

Av: Mailen Sorknes | Publisert: 20. Jan 2016 | Kategori: Leveranse

Nesten alt vi gjør på internett analyseres av algoritmer som forsøker å forutsi vår neste handling basert på tidligere nettatferd. Capgemini bruker samme metode for å finne årsaker og sammenhenger som kundene deres kan dra nytte av.

Store brukerbaserte web-tjenester som Amazon og Netflix vet veldig godt hva du har lyst til å se eller kjøpe med en gang du besøker nettsiden deres. De vet også hvordan de skal få deg til å følge deres forslag og klarer dermed å tvinne deg rundt lillefingeren uten at du selv er klar over det. Men ikke alle vet hvorfor det kan virke som om de nesten kjenner deg bedre enn du kjenner deg selv.

Det er her maskinlæring kommer inn – spesielle modeller bestående av algoritmer som lærer av dataene og forsøker å forstå sammenhenger i både store og små datamengder.

– Vi bruker slike modeller og algoritmer sammen med andre metoder og teknikker for å predikere utfall eller analysere årsaker til en gitt problemstilling for en virksomhet

– Vi bruker slike modeller og algoritmer sammen med andre metoder og teknikker for å predikere utfall eller analysere årsaker til en gitt problemstilling for en virksomhet, forklarer Kjetil Åmdal, business analyst i IT Advisory-avdelingen til Capgemini.

Les også: Maskinlæring og data science – for både store og små.

Gjør informasjon mer tilgjengelig

Leveranse - Kjetil og Harald har blant annet vært med på å levere Capgeminis første rene maskinlæringsprosjekt med Microsoft-teknologi.

Kjetil og Harald har blant annet vært med på å levere Capgeminis første rene maskinlæringsprosjekt med Microsoft-teknologi.

Sammen med kollega Harald Svandal Bø, konsulent i avdelingen Information Management, har Kjetil jobbet med å implementere maskinlæring i prosjekter de leverer til kunder. Metoden er særlig nyttig for å analysere store mengder data med komplekse sammenhenger, ustrukturerte data eller data som kommer inn med høy hastighet – ofte kalt Big Data.

– Med maskinlæring bruker vi datamengdene til å trekke nyttige konklusjoner fra problemstillingene vi analyserer. På den måten tilgjengeliggjøres informasjonen som ligger i datagrunnlaget til kunden, sier Harald.

Denne metoden gir bedrifter innsikt i kunder og prosesser som det ellers kan være vanskelig å få tak i.

– En av styrkene til maskinlæring er at algoritmene håndterer store datamengder på en mer strukturert måte enn oss mennesker, og ser sammenhenger vi ikke kan se med det blotte øyet.

Hva som utgjør de beste maskinlæringsmodellene vet du gjerne ikke før du har sett de forskjellige resultatene. Derfor er det viktig med kontinuerlig vurdering, prøving og feiling.

Arbeidsgruppen for slike prosjekter består ofte av en domeneekspert, en dataekspert og en data scientist. Disse blir alle en del av en syklus med mål om å finne og analysere data, implementere dette i modellen og oppdage mønstre som kan brukes til å forandre virksomheten.

Ikke like utbredt i Norge

Selv om maskinlæring er et veldig aktuelt tema i IT-verdenen, er det langt fra nytt.

– Mye av teknologien som brukes er flere tiår gammel, og later til å være i mer utstrakt bruk i andre land som for eksempel USA. Ettersom dette er en viktig del av å gjøre data om til innsikt og handling, blir det også stadig mer aktuelt her i Norge, sier Kjetil.

Vi blir utsatt for algoritmer daglig når vi surfer på nettet, og det er derfor Amazon kan komme med forslag til nye bøker du bare må ha.

Konsulenten spekulerer i om noe av grunnen til at vi her til lands ikke har kommet så langt med det ennå, er at vi har et ganske sterkt forhold til personvernet. Mye av informasjonen blir brukt for å kartlegge atferden vår og forutsi handlinger, men Kjetil synes ikke dette er problematisk.

– Hvis tjenestetilbydere kan bruke enkel informasjon om meg for å gi meg en bedre brukeropplevelse, mer relevant innhold og mer treffende tilbud, gir jeg den gladelig fra meg

– Hvis tjenestetilbydere kan bruke enkel informasjon om meg for å gi meg en bedre brukeropplevelse, mer relevant innhold og mer treffende tilbud, gir jeg den gladelig fra meg. Hvis de skulle ende opp med å misbruke infoen, er det all grunn til å tro at de kommer til å stå overfor mye større problemer enn jeg gjør.

Han synes det er synd at mange har så sterke motforestillinger mot slik informasjonsdeling, ikke minst fordi bedre forståelse for menneskelig atferd også er et samfunnsmessig gode.

– I hvert fall innenfor helse tror jeg vi kunne gjort fremskritt med en praksis og kultur som tar utgangspunkt i å dele informasjon for å bidra til forskning og bedre helsetjenester. I stedet får jeg inntrykket av at det er mer prisverdig å trykke denne informasjonen så tett til brystet som mulig, sier han.

Utviklet stort helseprosjekt

Det siste året har de to konsulentene vært med på å levere Capgeminis første rene maskinlæringsprosjekt med Microsoft-teknologi, Prediktiv analyse i Helse Sør-Øst. Det regionale helseforetaket ønsket å se nærmere på eventuelle sammenhenger mellom klimavariabler og akuttinnleggelser, og potensielt bruke kunnskapen til en bedre kortsiktig planlegging av ressursbruk på sykehusene.

Basert på store mengder innsamlet data om værforhold, luftkvalitet og innleggelser, eksperimenterte Capgemini med ulike maskinlæringsalgoritmer for å utforske dataene og lage prediksjonsmodeller. Datasettene ble behandlet og preparert i SQL Server og i Microsofts skytjeneste Azure.

– Vi ønsket å se om disse metodene kunne finne åpenbare sammenhenger, som at antall benbrudd øker når det er underkjølt regn, og mindre åpenbare sammenhenger mellom ulike værtyper og antall innleggelser. Maskinlæring gjør at vi kan forstå hva som ligger bak ulike resultater og hvilke drivere som kan påvirke de ulike utfallene, sier Harald.

Capgeminis løsning indikerte at det er betydelige sammenhenger mellom værfenomen og antall innleggelser på sykehusene innenfor visse diagnose- og aldersgrupper.

– Men det er viktig å tenke på at tolkninger av resultatene kan være flere. Vi kan ikke påstå noe helt konkret, men får trukket frem nyttige resultater som vi drøfter sammen med eksperter på området.

Les også: Å arbeide med maskinlæring.

Økt etterspørsel

Det er en økende etterspørsel etter arbeidsmetoden og verktøyene som kan samle og analysere store mengder data.

– Vi opplever en økt interesse og det virker som om mange har fått øynene opp for prediktiv analyse og maskinlæring. Det er veldig spennende, sier Kjetil.

Maskinlæring i skyen gjør at man i dag kan laste opp egne data på nett og sette opp analyser og modeller på kort tid. Før var det mye mer tungvint.

– Terskelen nå er utrolig lav, det handler bare om å utnytte verktøyene man har tilgjengelig, sier Harald.

Har du også lyst til å finne korrelasjoner mellom ulike årsaker til problemstillinger, kan maskinlæring være et av fagfeltene for deg. Søk jobb i Capgemini og ta del i fremtidens utvikling.