Magma topp logo Til forsiden Econa

Fra kundedata til forretningsverdi

figur-authorfigur-author

Sammendrag

Artikkelen belyser hvordan selskaper kan kapitalisere på sine kundedata gjennom avanserte kundeanalyser. Først definerer vi hva som menes med avanserte kundeanalyser, deretter trekker vi frem to konkrete eksempler der det ene omhandler prediksjon av prissensitivitet og det andre datadrevet kundesegmentering. Gjennom disse to eksemplene gir vi også en introduksjon til de to sentrale metodene innen kundeanalyser, kjent som prediksjons- og segmenteringsmodeller, og deler andre mulige praktiske anvendelser av disse modellene. Begge eksemplene er hentet fra forbrukermarkedet, men metodene som beskrives, er like relevante for bedriftsmarkedet.

Innledning

Det moderne forbrukermarkedet er i rask endring, og vi har sett at konsumentene i stor grad har endret kjøpsvaner og kjøpsadferd de siste ti årene. Dagens kunder har stadig høyere forventninger til produkter, leveringstider, pris og kvalitet enn tidligere, og mye kan forklares ved den enorme økningen i tilgjengelig informasjon. Kundene er mer informert enn noen gang, søker stadig etter andres bekreftelse og ser på tidligere kunders erfaringer før et eventuelt kjøp. Det at kundene alltid har med seg internett i lommen, muliggjør kontinuerlig tilstedeværelse i markedet og har gjort det digitale aspektet uunnværlig i de fleste kundereiser i dag.

Disse endringene i markedet skaper store ringvirkninger hos bedriftene. Mange er nødt til å revurdere sine eksisterende forretningsmodeller, og særlig ser vi at markedsavdelingene til bedriftene må gjennom store endringsprosesser for å tilpasse seg den nye virkeligheten. Dette er en reell utfordring som kan virke svært krevende, og det stiller store krav til ressursbruk og endringsvilje. Heldigvis ser vi at deler av løsningene på de mange nye utfordringene bedriftene møter kan finnes i dataene som kundene skaper når de interagerer med bedriftenes digitale tjenester. Som et resultat er det for bedrifter i forbrukermarkedet et stort potensial for å kapitalisere på avanserte kundeanalyser. Vår erfaring er at dette kan være et svært verdifullt bruksområde for stordata og avansert analyse.

Vi vil i denne artikkelen gå nærmere inn på hva avanserte kundeanalyser er, vise hva det kan brukes til gjennom to reelle caser, og reflektere rundt hvor vi ser den videre utviklingen innenfor dette fagområdet. I hovedsak tar vi utgangspunkt i forbrukermarkedet, men mange av metodene er like anvendelige i bedriftsmarkedet.

Avanserte kundeanalyser: hva og hvorfor?

Kundeanalyser handler om å skape forretningsverdi og forbedre kundegrensesnittet gjennom å jobbe datadrevet, der man samler og analyserer data om kunders adferd for å skape kundeinnsikt som muliggjør mer effektive beslutninger og prosesser. De to sentrale analysemetodene innen avanserte kundeanalyser er datadrevne segmenteringsmodeller og prediksjonsmodeller.

I likhet med mange av de moderne paraplydefinisjonene på ny teknologi og metoder er det utfordrende å finne en klar definisjon på hva avanserte kundeanalyser faktisk er. Vi definerer avanserte kundeanalyser som all analyse hvor majoriteten av dataene er skapt eller hentet fra kundene. Videre har vi erfart at avanserte kundeanalyser i seg selv har begrenset verdi, da verdien ikke skapes av analysene. Verdien kommer først når de ulike forretningsområdene tar i bruk innsikten fra analysene. Således kan man se på avanserte kundeanalyser slik man ser på bruken av strategikonsulenter: Verdien er ikke sluttpresentasjonen i PowerPoint, det er implementeringen av innsikten fra sluttrapporten som skaper resultatene og verdien. Vår erfaring er at avanserte kundeanalyser gir verdi på de aller fleste forretningsområdene, fra markedsavdelingen til salgsorganisasjonen, produktutviklerne, kundeservice og ikke minst økonomifunksjonen.

Det å analysere kundedata er i utgangspunktet ikke noe nytt. Lenge har vi brukt ulike former for datainnsamling gjennom spørreundersøkelser, observasjoner og intervjuer for å forstå hvordan vi best kan tilpasse oss kundenes behov og skape mest mulig verdi. Det som har endret seg, er i stor grad vår evne til å opparbeide oss et bedre bilde av hvordan kundene faktisk agerer, og vi kan nå i større grad supplere kundenes faktiske adferd med hva de selv sier. Takket være den teknologiske utviklingen som har gitt oss en kraftig økning i maskinvare og tilgjengelige data, og stadig ny forskning innen statistikk og maskinlæring, kan vi nå med stadig større treffsikkerhet beskrive og predikere hvordan kundene oppfører seg.

Det klassiske eksemplet på tidlig bruk av avanserte kundeanalyser kommer fra Target i USA. Gjennom å analysere kundenes transaksjonsdata ble de oppmerksomme på mønstre og kjøpsadferd som kunne relateres til ulike faser av en persons liv. Denne innsikten ble så brukt til å tilpasse utsendelser av markedsmateriell og kuponger slik at de ble mer relevante for kundene. Hovedpoenget med strategien var å ligge et steg foran konkurrentene, slik at man kunne forutse hvilke behov kundene hadde før de selv ble klar over behovet. Kroneksempelet fra Target er da de sendte ut kuponger for produkter gravide ofte kjøper, til en elev på videregående skole i USA. Faren ble oppgitt over at Target utsatte datteren hans for markedsføring av / oppmuntring til graviditet, men så viste det seg at datteren faktisk var gravid, og at Target hadde utviklet en statistisk analyse som satte en graviditetsscore på kundene og kunne predikere når de hadde termin, innenfor et relativt lite tidsvindu (Forbes, 2012).

I de senere årene har det vært en eksplosjon i anvendelsen og videreutviklingen av avanserte analysemetoder, og ingenting tyder på at utviklingen stopper. Vi blir stadig mer sofistikerte i både innsamling av data og algoritmeutvikling, noe som muliggjør enda mer treffsikre og verdiskapende analyseformer, eksempelvis fullautomatisert og personalisert prising, og markedsføring basert på modellering av kjøpssannsynlighet.

Så hvor står vi egentlig nå? Hvilke muligheter har vi for å skape bedre kundeforståelse, og hvordan skal vi best dra nytte av dette i dag? For å vise noen av mulighetene skal vi kort gjennomgå to prosjekter vi har gjennomført på dette fagområdet, innenfor prediksjonsmodeller og segmenteringsmodeller.

Prediksjonsmodeller

Prediksjonsmodellering handler om å prøve å forutsi hva som kommer til skje, gjennom analyse. I motsetning til deskriptiv analyse, som handler om å beskrive hva som skjer, tar prediksjonsmodellene stilling til hva vi tror fremtidige utfall av en gitt problemstilling kommer til å være. De kan være svært verdifulle hvis de har en høy treffsikkerhet, men det er en avansert analyseform som stiller store krav til datamengde, datakvalitet og analysekapabiliteter. Har man utviklet en særdeles god prediksjonsmodell, er veien ofte kort til å videreutvikle denne til å bli en preskriptiv modell. Preskriptiv modellering innebærer at vi lar modellen selv ta stilling til hva vi bør gjøre, og det anses ofte som den mest avanserte og krevende formen for analyse.

Typiske anvendelser av prediksjonsmodeller innen avanserte kundeanalyser kan være prediksjon av kundefrafall, en kunde eller kundegruppes valg av produkt, kjøpskanal eller kjøp av kombinasjoner av produkter, produktanbefalinger, oppsalg og mersalg («andre kunder som så på dette, så også på ….» eller «… kjøpte også …»), for å nevne noen. Her vil vi fokusere på en mulig anvendelse av prediksjonsmodeller som omhandler prediksjon av kunders prissensitivitet.

Prediksjon av prissensitivitet

Det er en kunst å sette riktig pris på et produkt eller en tjeneste. Det finnes store mengder litteratur og teorier som omhandler prisingsområdet, og det er flere veier til Rom. Ofte er man nødt til å kombinere ulike former for innsikt og strategier for å klare å jobbe smart og effektivt med prising.

Generelt sett er pris er en av de parameterne som har aller mest å si for bunnlinjeresultatet for en bedrift, noe McKinsey ga eksempler på i sin artikkel «The Power of Pricing». De fant at for et gjennomsnittlig S&P1500-selskap vil én prosent økning i pris gi åtte prosent økning i driftsresultat, gitt at salgsvolumet holder seg konstant (McKinsey, 2003). Til tross for dette opplever vi ikke at enhver bedrift oppjusterer prisen med én prosent med jevne mellomrom. Årsaken til dette er at pris og volum «dessverre» går hånd i hånd. En økning i pris vil med stor sannsynlighet føre til nedgang i salgsvolum.

Heldigvis finnes det metoder vi kan bruke til å utforske sammenhengen mellom pris og volum, og som gjør at vi kan bli enda flinkere til å sette prisen på våre produkter. I dette eksemplet skal vi ta for oss en mulig tilnærming til smartere prising som faller inn under det vi definerer som avanserte kundeanalyser. Den tar utgangspunkt i en bedrift som allerede hadde en fungerende prisstrategi, men som ønsket mer innsikt i hvordan man kunne bli enda bedre til å prise varene sine. I hovedsak søkte vi innsikt i kundenes prissensitivitet, altså hvor mye salgsvolumet for et gitt produkt endrer seg gitt en prisendring, og å identifisere mulige produkter hvor det var et potensial for å øke prisene.

Den klassiske metoden for å skaffe seg innsikt i forholdet mellom pris og volum er gjennom etterspørselskurver der man estimerer hvor mye av et visst produkt kundene er villige til å kjøpe til en gitt pris. Har man så en etterspørselskurve, kan man lett regne seg frem til ulike salgsvolum og konsumentenes priselastisitet eller prissensitivitet. Utfordringen med dette er at det er en teoretisk fremgangsmåte som dessverre kommer til kort i den virkelige verden. Resultatet ved bruk av denne enkle formen for analyse blir ikke som forventet grunnet markedenes kompleksitet og uforutsigbarhet. Tankegangen og den bakenforliggende forståelsen av markedet er god, men overførbarheten til virkelige markeder er utfordrende og lite belyst i grunnlitteraturen innen mikroøkonomi. Det hele står egentlig og faller på den flyktige etterspørselskurven. Ikke bare er den tilnærmet umulig å estimere godt, den har også en iboende forenkling som distanserer den fra virkeligheten – nemlig forenklingen om at pris er den eneste parameteren som påvirker etterspørsel.

Det vi ser, er at det er et bredt spekter av parametere som påvirker hvor mye som selges av et produkt: Har produktet vært sterkt markedsført, har det vært en plutselig økning i produktets popularitet i markedet, har konkurrentene våre priset sitt produkt lavere, har et nyere og bedre produkt blitt lansert? Disse og andre faktorer påvirker hvor mye av et produkt eller en tjeneste vi selger.

Så når den klassiske etterspørselskurven kommer til kort, hvordan skal vi da skaffe oss relevant innsikt i våre kunders prissensitivitet? Svaret ligger i bruken av data og avansert analyse.

figur

Figur 1 Oversikt over de ulike angrepsmetodene for estimering av priselastisitet.

Figur 1 eksemplifiserer hva som ofte skjer hvis vi prøver å anvende etterspørselsteori i praksis. Hvis vi eksempelvis plotter ut faktisk ukentlig salg av et produkt mot produktets pris den uken, ser vi ofte at det er utfordrende å gjøre en treffende regresjon, og vi ender med en etterspørselskurve som er dårlig tilpasset datapunktene. Med en slik suboptimal etterspørselskurve blir det svært vanskelig å hente ut noen verdifull beslutningsstøtte.

Avanserte kundeanalyser åpner for muligheten til å forstå komplekse sammenhenger uten å gjøre store forenklinger. Figuren lengst til høyre forsøker å vise hvordan vi har valgt å angripe problemet. Ved å inkludere flere dimensjoner som samlet prøver å fange de mest relevante faktorene rundt en prisendring, og så plotte historiske prisendringer mot disse, sitter vi igjen med et flerdimensjonalt rom som tillater en mye mer avansert form for analyse (som dessverre er utfordrende å illustrere på en god måte).

For å benytte seg av vår tilnærming for estimering av prissensitivitet er man avhengig av å ha god tilgang på data av god kvalitet. I prosjektet vi presenterer her, endte vi med et datasett bestående av rundt 100 000 historiske prisendringer, som hver var tilknyttet 60 parametere som i størst mulig grad forsøkte å beskrive markedssituasjonen rundt prisendringene. Tabellen under viser et sammendrag av de ulike parameterne:

Tabell 1 Gruppering av parametere brukt i prissensitivitetsanalysen.
SalgsparametereProduktparametereKonkurrentparametereTidsparametere
PrisendringerProdukthierarkiKonkurrentpriserDag
SalgsendringerProdukttypePrisrangeringerUke
KampanjerProduktets popularitetKonkurrentklassifiseringerMåned
Fordeling netthandel vs. fysisk handelDager siden produktet ble lansertÅr
LagernivåerHelligdager
Butikktype

Dette er på ingen måte en uttømmende liste, og det er flere andre faktorer man optimalt sett kunne inkludert i analysen. Eksempelvis ble vi nødt til å se bort fra substitutteffekter grunnet kompleksitet og manglende data. Det er også verdt å nevne at vi tar utgangspunkt i at produktene anses som homogene i konkurransebildet, altså at et gitt produkt anses å være det samme på tvers av konkurrentene, selv om det finnes naturlige forskjeller som omhandler tilgjengelighet, leveringstider, frakt, service og lojalitet.

Avhengig av hvilke data man har og mengden av disse, velger man så en algoritme som er godt tilpasset til å lære sammenhengen mellom input-dataene (de 60 markedsparameterne) og output-dataene (estimert volumendring kommende tidsperiode mot foregående tidsperiode), gitt en foreslått prisendring. I dette tilfellet endte vi med en maskinlærings­algoritme som benytter seg av en metodikk kalt gradient boosting.

En av de store fordelene med gradient boosting og andre tremodeller er at de er mer gjennomsiktige enn for eksempel nevrale nettverk. Dette innebærer at vi ikke bare får en ren prediksjonsmodell ut av analysearbeidet, vi får også noe innsikt i hvordan algoritmen forstår sammenhengene i dataene. Det følger altså med en deskriptiv del ved disse analyseformene. Denne innsikten kan være svært verdifull input til ulike beslutninger som omhandler prising og kundeinnsikt, og gir oss muligheten til å selv få innsikt i de komplekse, underliggende sammenhengene.

Et eksempel på en slik type innsikt ser vi av figur 2. Figuren viser det som kalles et tredimensjonalt partial dependence-plott. Dette plottet viser hvordan algoritmen har analysert påvirkningen to av input-parameterne har på utfallsvariabelen. I dette eksempelet ser vi på hvordan antallet sidevisninger et produkt har på bedriftens nettside, og en prosentmessig prisendring en gitt periode, påvirker modellens oppfatning av hvorvidt salgsvolum kommer til å få en positiv eller negativ påvirkning i kommende periode. Det fargede området viser den marginale påvirkningen på utfallsvariabelen, der et positivt tall indikerer en økning i salgsvolum, og et negativt tall indikerer en nedgang. Den røde linjen i figuren viser skillet mellom prisreduksjoner (venstre side av linjen) og prisøkninger (høyre side av linjen). Det interessante med denne figuren er at det lar oss bekrefte en velkjent hypotese om at kundene er mindre prissensitive ved populære produkter. Har vi for eksempel et produkt som har 1 400 sidevisninger, og vi setter opp prisen med 20 prosent, ser vi at den marginale påvirkningen på salgsvolum er svakt positiv. Det betyr at hvis vi setter opp prisen på et populært produkt, vil vi forvente at salgsvolumet holder seg stabilt, gitt at alle andre parametere holdes konstante. Det er verdt å merke seg at dette ikke nødvendigvis gjelder alle produktene i porteføljen, men for enkelte småvarer som ble solgt til et lavt pengebeløp, var dette tilfellet. Denne formen for innsikt er svært relevant for økonomifunksjonen.

Modellen vi utviklet for denne kunden, ble laget for å fungere som beslutningsstøtte for prisingsarbeidet. Den muliggjør mer kvalifisert gjetning rundt hva man kan forvente av salgsvolum ved ønskede prisendringer, og gir rom for å utforske konsekvensene av ulike priser gitt de eksisterende markedsforholdene. Treffsikkerheten på modellen er absolutt akseptabel til sitt bruk, men den var ikke god nok til at det var hensiktsmessig å la algoritmen selv ta beslutninger for hva prisen på produktene burde være. I tillegg kommer hensynet til produktlønnsomhet og videre kategorilønnsomhet. Dette vil i tillegg kreve kostnadsdata, noe som vil gjøre prosessen ytterligere utfordrende.

Det vi ser, er at jo tidligere man får et bevisst forhold til sine data og mulighetene man har for å samle inn stadig mer data, jo bedre blir modellenes treffsikkerhet, og man kan etter hvert begynne å bevege seg inn mot preskriptive algoritmer som automatisk og kontinuerlig vil kunne sette tilnærmet optimale priser.

figur

Figur 2 Eksempel på tredimensjonalt partial dependence-plott.

Datadrevne segmenteringsmodeller

Segmentering er en velkjent komponent som stammer fra markedsføringsområdet, og som går ut på å dele et marked i flere delmarkeder basert på felles­trekk mellom individene i markedet. Selv mener vi at man kan utvide segmenteringsbegrepet til å omhandle mer enn bare markeder, altså all relevant oppdeling av en større «masse» til flere mindre grupper som har samme fellestrekk. Selv om segmentering er en velkjent og mye brukt metodikk, er det etter vår erfaring få bedrifter som har benyttet den nye teknologien og de store datamengdene vi har i dag, til å jobbe mer metodisk med segmenteringsmodeller. Det vi ser, er at det ligger et stort potensial i å benytte datadrevne segmenteringsmodeller innenfor mange ulike områder.

Her vil vi fokusere på kundesegmentering som et verktøy til å videreutvikle markedsføring og produktstrategi, men den samme metodikken kan brukes til segmentering av for eksempel butikker, produkter og ansatte.

Kundesegmentering

Hovedpoenget bak kundesegmentering er å opparbeide seg et bedre bilde av nyansene i markedet, slik at man kan tilpasse markedsføring og produktene til de ulike identifiserte gruppene. Ser man på et marked som en helhet, vil man fort kunne slite med å være relevant, ettersom man da gjør for store generaliseringer og benytter seg av populasjonens totale gjennomsnitt innenfor ulike dimensjoner. Ettersom en populasjon består av unike individer, kan man da fort ende med å ikke være tilpasset noen dersom man tar utgangspunkt i at alle individene oppfører seg som gjennomsnittet, noe de sjeldent gjør.

Det finnes i hovedsak fire hoveddimensjoner innenfor kundesegmentering som belyser hvilke kriterier vi legger til grunn i segmenteringsmodellen. Disse er geografiske kriterier, demografiske kriterier, psykografiske kriterier og adferdsbaserte kriterier. Vår oppfatning er at det i de fleste markeder er de adferdsbaserte segmenteringsmodellene som gir mest verdi og innsikt. Årsaken til dette er at det i utgangspunktet er irrelevant om kunden er ung eller gammel, bor i by eller bygd, eller er mann eller kvinne: Det som betyr noe, er hvordan kunden agerer, og hvilken kjøpsadferd vedkommende viser.

Eksempelvis vil man ved demografisk kundesegmentering kunne få et resultat som viser at menn over 60 år bosatt i byer foretrekker å handle varene sine i butikk, de gjør mange små kjøp, og de foretrekker å få markedsmateriell fysisk i postkassen. Utfordringen med dette er at det antagelig også finnes personer i dette segmentet som har en helt motsatt adferd, men siden vi her har brukt demografiske parametere som segmenteringskriterier for å si noe om adferd, gjør vi en generalisering på feil grunnlag. Det er derfor i de fleste anvendelser mer relevant å se på personens faktiske adferd.

Utfordringen med adferdsbaserte segmenteringsmodeller er at de er mer krevende å gjennomføre. Geografiske og demografiske parametere er ofte lettere tilgjengelig og mer håndgripelige i et datasett. Adferdsbaserte parametere kan være mer utfordrende å konstruere og oversette til et datapunkt. Det å skulle si noe om en persons lojalitet eller holdning til en bedrift er vanskeligere enn å si noe om hvor i landet personen bor. Fordelen er at når man først har investert i utformingen av gode adferdsbaserte parametere, sitter man igjen med et mye bedre beslutningsgrunnlag, og potensialet for at innsikten fører til verdiskaping, øker.

Har man så utarbeidet gode adferdsbaserte segmenteringsparametere og samlet inn dataene, blir neste fase å ta stilling til hvordan man skal identifisere kundesegmentene i datasettet. Her skiller vi mellom det vi kaller hypotesedrevet og datadrevet segmentering. Den hypotesedrevne metoden innebærer at man setter opp en hypotese på hvor skillet mellom segmentene ligger. Dette er etter vår oppfatning en mye brukt, men ofte lite verdifull metodikk. Utfordringene med denne metoden er at den innfører kunstige skiller i dataene som ikke nødvendigvis reflekterer de faktiske forskjellene blant kundene.

Figur 3 eksemplifiserer denne utfordringen forenklet til en todimensjonal segmenteringsmodell. La oss si at vi her forsøker å segmentere kunder basert på andel produkter kjøpt på salg og andel produkter kjøpt på nett. Ved en hypotesedrevet modell vil man fort kunne ende med å legge inn et kunstig skille i datapunktene slik vi ser på venstre side. Det som visuelt sett ser ut som et segment eller klynge, blir delt i to, og vi ender med å sette et skille mellom kunder som i utgangpunktet har relativt lik adferd. Det er opplagt å se at dette skillet er kunstig når vi kun ser på to dimensjoner, og at man her enkelt kan se at vi har én klynge av kunder. Det er ikke like opplagt å identifisere feilsatte hypoteser når vi øker antallet segmenteringsparametere/dimensjoner.

Datadrevne segmenteringsmodeller søker etter å finne de naturlig opptredende klyngene i dataene. Ved hjelp av algoritmer kan vi da beregne likheten mellom datapunktene og slik identifisere de punktene som ligner hverandre i et ubegrenset antall dimensjoner.

figur

Figur 3 Illustrasjon av forskjellene mellom hypotesedrevet og datadrevet segmentering.

Selv om analyseformen tillater et ubegrenset antall parametere, er det ofte hensiktsmessig å holde dette antallet relativt lavt, da man med flere parametere ofte kan få for komplekse segmenter. Med et økende antall parametere kommer gjerne et økende antall segmenter med veldig store variasjoner i størrelse. I mange tilfeller vil det derfor være et poeng å holde mengden segmenter og parametere på et nøkternt nivå, da det forretningsmessig gir mer mening og er enklere å forholde seg til.

Datadrevne segmenteringsmodeller har et stort potensial, men skal man virkelig hente ut verdi av analyseformen, må man ha et bevisst forhold til hva man ønsker å bruke segmenteringsmodellen til. Selv den mest avanserte segmenteringsmodell kan være verdiløs dersom innsikten den frembringer, ikke hjelper oss med å besvare de forretningsmessige utfordringene vi ønsker å løse. Formålet med segmenteringsmodellen må derfor være nøye gjennomtenkt, ettersom det vil påvirke mange av beslutningene man tar underveis i segmenteringsprosessen.

Nylig gjorde vi et prosjekt for en kunde som ønsket å tilpasse kundereisene sine til ulike kundegrupper. Ved å ta utgangspunkt i de foregående to års transaksjonsdata generert av nærmere en million kunder, satte vi opp en datadrevet segmenteringsmodell som tok utgangspunkt i åtte adferdsbaserte parametere. Disse åtte parameterne ble definert basert på en forventet påvirkning på hvordan kundene ønsket å handle av bedriften. Eksempelvis er det naturlig å forvente at andelen produkter kjøpt i forskjellige varekategorier, antall kjøp og størrelse på kjøp og andel produkter kjøpt på salg gir oss indikasjoner på hva slags type kunde en person er. Hadde derimot formålet med segmenteringsmodellen vært å differensiere markedsføringsstrategien, ville det vært mer naturlig å ta inn parametere som for eksempel antall klikk på nyhetsbrev og et mål på kundelojalitet.

Når man jobber med datadrevne segmenteringsprosjekter, er det ikke selve modellen som er det utfordrende å implementere. Utfordringen ligger i det å finne de riktige dataene og parameterne som gir en innsikt man kan agere på. Det er også slik at man kan få store utslag i segmentene ved kun å fjerne eller legge til en parameter. Hvis vi for eksempel hadde redusert antallet parametere fra åtte til syv ved å fjerne parameteren som måler andel produkter kjøpt på salg fra eksempelet over, ville vi fått fire veldig annerledes segmenter enn de fem vi fant når vi tok med alle parameterne. Det er vanskelig å si hva som er det riktige antallet segmenter og parametere i denne typen prosjekter, og det blir en kontinuerlig vurdering underveis i prosjektet om man har kommet frem til et stabilt og innsiktsfullt resultat.

Tilsvarende kan mulig feiltolkning av kausalitet være en utfordring med datadrevne metoder. Man kan fort se seg blind på sammenhenger som tilsynelatende finnes i modellen, men som i realiteten er spuriøse – der en bakenforliggende variabel påvirker flere parametere i samme retning. Det er derfor viktig å tilnærme seg denne typen problemstillinger med et metodeverk som også bidrar til å avdekke denne typen kausalitet.

Oppsummering

Vi har ovenfor gitt en overordnet innsikt i to ulike anvendelsesområder for avanserte kundeanalyser, men det finnes et hav av andre områder hvor de samme metodikkene kan gi stor forretningsverdi. Noen eksempler på andre prosjekter vi har gjennomført, er problemstillinger knyttet til å avdekke kredittrisiko, øke treffsikkerheten innen likviditetsprognoser, risikoprisingsanalyse, avdekke sannsynligheten for kundefrafall og forbedre programmer innen antihvitvasking. Andre områder er å drive trafikk til både digitale og fysiske salgskanaler, og videre kjøpsadferd, og dette er bare noen få eksempler. Vår erfaring er at organisasjoner i dag, både private og offentlige, på langt nær utnytter de mulighetene som finnes innen avanserte kundeanalyser.

Hva så med fremtiden? Ser vi fremover, finnes det både gode og dårlige nyheter for bedrifter som ønsker å kapitalisere på sine kundedata. Med innføring av GDPR kreves det i større grad aksept fra kundene for å lagre og utnytte deres data analytisk. Bruk av kundedata bør skape merverdi for kunden, ikke bare for bedriften. Eksempelvis vil all verdi som skapes av en prisdiskriminerende algoritme, tilfalle bedriften, og dette budskapet alene vil neppe bidra til aksept fra kundene. Dermed blir det å sette sammen et verdiforslag rundt aksept som gagner både bedriften og kundene, en problemstilling mange vil måtte overkomme for å akselerere bruken av avanserte kundeanalyser.

Vi ser at de som ikke posisjonerer seg tidlig og arbeider systematisk med avanserte kundeanalyser, har utfordringer med å ta igjen forspranget til konkurrentene, og dette forspranget vil ofte bare øke. Det blir derfor viktigere enn noen gang både å sikre seg tilgang til gode kundedata og å bruke disse på en god måte. De som lykkes, skaper varige konkurransefortrinn som reflekteres i forretningsverdien.

Begreper

  • Tremodeller: Samlebetegnelse på maskinlæringsalgoritmer som benytter seg av beslutningstrær.
  • Avansert analyse: Samlebetegnelse på analyseformer som tar i bruk avanserte statistiske modeller og maskinlæring for å finne mønstre i data.
  • Gradient boosting: Maskinlæringsteknikk som sammenstiller flere tremodeller til én stor modell.
  • Nevrale nettverk: Maskinlæringsalgoritmer som sterkt forenklet etterligner det biologiske nervevevet i hjernen.
  • Psykografiske kriterier: Segmenteringskriterier som baserer seg på ulike psykologiske egenskaper, verdier, holdninger og interesser.
  • Klusteringalgoritme: Maskinlæringsalgoritme som finner klustre (tette samlinger) av datapunkter i et flerdimensjonalt rom.
  • Holl, K. (2012). How Target Figured Out A Teen Girl Was Pregnant Before Her Father Did. Hentet 1. juli 2018 fra: https://www.forbes.com/sites/kashmirhill/2012/02/16/how-target-figured-out-a-teen-girl-was-pregnant-before-her-father-did/#5cf9b27d6668
  • Marn, M.V. Roegner, E.V., & Zawada, C.C. (2003). The power of pricing. Hentet 1. juli 2018 fra https://www.mckinsey.com/business-functions/marketing-and-sales/our-insights/the-power-of-pricing

© Econas Informasjonsservice AS, Rosenkrantz' gate 22 Postboks 1869 Vika N-0124 OSLO
E-post: post@econa.no.  Telefon: 22 82 80 00.  Org. nr 937 747 187. ISSN 1500-0788.

RSS