Ostrukturerat innehåll:en outnyttjad bränslekälla för AI och maskininlärning

Av Alex Welsh , Vice President, Analytics Practice, Ephesoft

Skulle du välja vart du skulle åka på semester om du bara hade tillgång till 10 till 20 procent av recensionerna och informationen på en resewebbplats? Om du gör det kommer du förmodligen att få en oförglömlig resa, men av skäl som du kanske inte gillar. Ändå fattar statliga organisationer och företag – från tillverkning till försäkringsbolag och hälsovård till banker – beslut i samma linje. Och det har de gjort i flera år. De tittar på den enkla information de kan få från strukturerad data samtidigt som de ignorerar deras ostrukturerade data, som Deloitte tror kan stå för 80 till 90 procent av innehållet som genereras globalt, vilket gör ostrukturerad data till en enorm källa till outnyttjat värde.

Lyckligtvis gör framsteg inom AI (artificiell intelligens) och maskininlärning det nu möjligt och överkomligt att sålla igenom och finna mening i enorma mängder ostrukturerad data som erhållits från video- och ljudfiler, e-post, loggar, inlägg på sociala medier och till och med aviseringar från Internet of Things (IoT)-enheter. All denna data kan ge enorma fördelar, till exempel när den används för att automatisera uppgifter som är manuellt intensiva och ofta mycket repetitiva. En uppgift är till exempel att se upp för röda flaggor:specifika kriterier eller beteenden som kan indikera att något är fel och korrigerande åtgärder måste vidtas snabbt. Låt oss titta på några fall från olika branscher.

Vad sägs om en försäkringsskada som på ytan verkar bra, men förtjänar att utredas, eller en arbetssökande som kanske döljer information? Vad sägs om en leverans av lättfördärvliga läkemedel som kanske inte har varit kylda under en del av sin resa, eller ett kontrakt som kan bryta mot ett lands lagar eller bryter mot ett befintligt avtal med ett annat företag? Det viktiga är att en röd flagga indikerar problem som, om de lämnas okontrollerade, kan orsaka stor skada.

Artificiell intelligens är enormt datahungrig

Hur möjliggör AI och maskininlärning mer effektiv dataanalys? Genom att mata den med data. Genom att ge en maskininlärningsmodell exempel på bra och dåliga transaktioner lär den sig att skilja mellan de två typerna. Och ju mer data som maskininlärningsmodellen bearbetar, desto mer förstärker den dessa lärdomar, vilket ökar noggrannheten.

Så även om AI och maskininlärning gör stora framsteg, måste företag och andra organisationer komma ikapp. Tänk på det så här:data är som bränsle. Vi behöver det för att driva vårt tänkande för att fatta kloka beslut. Men vi har utarbetat alla enkla saker, den strukturerade data som kommer i snygga och snygga paket. Men det är här bränsleanalogin går sönder:även om ytterligare en liter gas låter oss köra ytterligare 20 till 30 mil, ju mer data vi lägger in gör det möjligt för oss att fatta betydligt bättre och mer exakta beslut – inte bara ytterligare 20 till 30 -udda miles värda—och för att göra dem ännu snabbare.

Ändå har en enorm del av vår data, vår ostrukturerade data, förblivit outnyttjad så länge eftersom den hade varit för dyr och för svår att komma åt och bearbeta. Och även om det inte längre är fallet när ny teknik för att samla in och analysera ostrukturerad data blir tillgänglig, har många människor i företag och andra organisationer förbisett dessa framsteg.

Var de smarta pengarna finns

International Data Corporation (IDC) förutspår att år 2020 kommer organisationer som analyserar både strukturerad och ostrukturerad data – det vill säga all relevant data – och levererar användbar information att uppnå ytterligare 430 miljarder dollar i produktivitetsvinster jämfört med sina konkurrenter som inte utför sådan dataanalys. Och företag som förstår detta väntar inte till 2020. En chef på ett multinationellt försäkringsbolag baserat i Tyskland hänvisar till ostrukturerad data som sin största risk. De förstår siffrorna och arbetar för att se till att de inte överraskas av att skriva försäkringar som utsätter dem för skulder som de kunde ha undvikit.

Den kombinerade kraften av big data, AI och maskininlärning kan göra det lättare att bearbeta information relaterad till ännu mer komplexa utmaningar. Till exempel kan banker och andra organisationer mer exakt och snabbare upptäcka bedrägerier, skatteflykt, penningtvätt och andra system genom att utvinna vad som tidigare varit obearbetad, ostrukturerad data. Detta gör det möjligt för dem att fånga upp och stänga av fall av bedrägeri och missbruk, samt undvika de många falska positiva resultat som kan uppstå när de bara förlitar sig på strukturerad data. Handelsfinansieringsavtal, inklusive kontrakt och flera datakällor, mellan länder eller företag kan också genomsökas för att avgöra om bedrägeri eller orättvisor förekommer, oavsett om de är avsiktliga eller inte.

Dessutom kan AI och maskininlärning hjälpa banker och andra typer av företag att bättre identifiera och verifiera identiteten på sina kunder genom automatiserade Know Your Customer-procedurer (KYC). Sådana förfaranden kan hjälpa till att förhindra att de används, medvetet eller oavsiktligt, för penningtvättsaktiviteter samt hjälpa till att förhindra att mutor och andra former av korruption inträffar. KYC-procedurer kan också göra det möjligt för företag att bättre förstå sina kunders finansiella affärer och behov, samt hjälpa dem att hantera risker på ett mer försiktigt sätt. Andra fördelar inkluderar att snabba upp tiden till intäkter när man tar in nya kunder, vilket gör KYC inte till ytterligare en kostnad utan istället en vinstkälla.

AI och maskininlärning kan öka din konkurrenskraft

Med alla fördelar som uppnås genom AI och maskininlärning – och de framsteg inom teknik som används för att bearbeta strukturerad och ostrukturerad data – är det dags för fler företag och organisationer att dra nytta av den största informationskällan som finns tillgänglig:sin egen ostrukturerade data.

Om författaren

Alex Welsh leder Ephesofts globala Analytics Practice. Han är en erfaren försäljningsdirektör, projektledare och entreprenör med en passion för att lösa kunders uppdragskritiska problem med innovativa kostnadseffektiva tekniska lösningar.