Vad är djupinlärning?

Djupt lärande, en avancerad teknik för artificiell intelligens, har blivit allt populärare de senaste åren, tack vare riklig data och ökad datorkraft. Det är den huvudsakliga tekniken bakom många av de applikationer vi använder varje dag, inklusive språköversättning online och automatiserad ansiktsmärkning i sociala medier.

Denna teknik har också visat sig vara användbar inom sjukvården: Tidigare i år använde datavetare vid Massachusetts Institute of Technology (MIT) djupinlärning för att skapa ett nytt datorprogram för att upptäcka bröstcancer.

Klassiska modeller hade krävt ingenjörer att manuellt definiera regler och logik för att upptäcka cancer, men för denna nya modell gav forskarna en djupinlärningsalgoritm 90 000 mammografisökningar med full upplösning från 60 000 patienter och lät den hitta de vanliga mönstren mellan skanningar av patienter som slutade med bröstcancer och de som inte gjorde det. Det kan förutsäga bröstcancer upp till fem år i förväg, en avsevärd förbättring jämfört med tidigare riskprognosmodeller.

Vad är maskininlärning exakt?

Deep learning är en delmängd av maskininlärning, en gren av artificiell intelligens som konfigurerar datorer för att utföra uppgifter genom erfarenhet. I motsats till klassiska, regelbaserade AI-system utvecklar maskininlärningsalgoritmer sitt beteende genom att bearbeta kommenterade exempel, en process som kallas “utbildning”.

För att till exempel skapa ett program för upptäckt av bedrägerier tränar du en maskininlärningsalgoritm med en lista över banktransaktioner och deras eventuella resultat (legitimt eller bedrägligt). Maskininlärningsmodellen undersöker exemplen och utvecklar en statistisk representation av gemensamma egenskaper mellan legitima och bedrägliga transaktioner. Efter det, när du förser algoritmen med data för en ny banktransaktion, klassificerar den det som legitimt eller bedrägligt baserat på de mönster som det har hämtat från träningsexemplen.

Ju mer kvalitetsdata du ger desto mer exakt blir en maskininlärningsalgoritm när du utför sina uppgifter.

Maskininlärning är särskilt användbart för att lösa problem där reglerna inte är väl definierade och inte kan kodas i olika kommandon. Olika typer av algoritmer utmärker sig vid olika uppgifter.

Deep Learning och Neural Networks

Medan klassiska maskininlärningsalgoritmer löste många problem som regelbaserade program kämpade med, är de dåliga i att hantera mjuk data som bilder, video, ljudfiler och ostrukturerad text.

Till exempel att skapa en modell för förutsägelse av bröstcancer med klassiska maskininlärningsmetoder skulle kräva insatser från dussintals domenexperter, datorprogrammerare och matematiker, enligt AI-forskare och dataforskare Jeremy Howard. Forskarna måste göra mycket funktionsteknik, en svår process som programmerar datorn för att hitta kända mönster i röntgen- och MR-skanningar. Därefter använder ingenjörerna maskininlärning utöver de extraherade funktionerna. Att skapa en sådan AI-modell tar år.

Deep-learning algoritmer löser samma problem med djupa neurala nätverk, en typ av programvaruarkitektur inspirerad av den mänskliga hjärnan (även om neurala nätverk skiljer sig från biologiska neuroner). Neurala nätverk är lager på lager av variabler som anpassar sig till egenskaperna hos den data de tränas på och blir kapabla att utföra uppgifter som att klassificera bilder och konvertera tal till text.

artificiellt neurala nätverk - Wikipedia

Neurala nätverk är särskilt bra på att självständigt hitta vanliga mönster i ostrukturerad data. När du till exempel tränar ett djupt neuralt nätverk på bilder av olika objekt, hittar det sätt att extrahera funktioner från dessa bilder. Varje lager i det neurala nätverket upptäcker specifika funktioner som kanter, hörn, ansikten, ögonbollar etc.

neurala nätverkslager - arxiv.org

Genom att använda neurala nätverk undanröjer djupinlärningsalgoritmer behovet av funktionsteknik. När det gäller MIT: s modell för bröstcancerförutsägelse, tack vare djupinlärning, krävde projektet mycket mindre ansträngning från datavetare och domenexperter, och det tog mindre tid att utvecklas. Modellen kunde också hitta funktioner och mönster i mammogramsökningar som mänskliga analytiker missade.

Neurala nätverk har funnits sedan 1950-talet (åtminstone konceptuellt). Men fram till nyligen avvisade AI-samhället dem till stor del eftersom de krävde stora mängder data och datorkraft. Under de senaste åren har tillgängligheten och prisvärdheten för lagring, data och datorresurser drivit neurala nätverk i spetsen för AI-innovation.

Vad används Deep Learning för?

Det finns flera domäner där djupinlärning hjälper datorer att ta itu med tidigare olösliga problem.

Datorsyn: Datorsyn är vetenskapen om att använda programvara för att förstå innehållet i bilder och video. Detta är ett av de områden där djupinlärning har gjort stora framsteg. Bortsett från bröstcancer, kan djupinlärande bildbehandlingsalgoritmer upptäcka andra typer av cancer och hjälpa till att diagnostisera andra sjukdomar.

Men djupt lärande är också inblandat i många av de applikationer du använder varje dag. Apples Face ID använder deep learning, liksom Google Photos använder deep learning för olika funktioner som att söka efter objekt och scener samt korrigera bilder. Facebook använder djupinlärning för att automatiskt märka personer i de foton du laddar upp.

Djupinlärning hjälper också sociala medieföretag att automatiskt identifiera och blockera tvivelaktigt innehåll, såsom våld och nakenhet. Och slutligen spelar djupinlärning en mycket viktig roll för att göra det möjligt för självkörande bilar att förstå sin omgivning.

Röst- och taligenkänning: När du ger ett kommando till din Amazon Echo-smarthögtalare eller din Google Assistant konverterar djupinlärningsalgoritmer din röst till textkommandon. Flera onlineapplikationer använder djupinlärning för att transkribera ljud- och videofiler. Google släppte nyligen en Gboard-taltranskriptionsapp i realtid på enheten som använder djupinlärning för att skriva medan du pratar.

Naturlig språkbehandling (NLP) och generation (NLG): Naturlig språkbehandling, vetenskapen om att extrahera innebörden av ostrukturerad text, har varit en historisk smärtpunkt för klassisk programvara. Det är praktiskt taget omöjligt att definiera alla olika nyanser och dolda betydelser av skriftspråk med datorregler. Men neurala nätverk utbildade på stora textkoder kan exakt utföra många NLP-uppgifter.

Googles översättningstjänst såg en plötslig ökning av prestanda när företaget bytte till djupinlärning. Smarta högtalare använder djupt lärande NLP för att förstå de olika nyanserna i kommandon, till exempel de olika sätten du kan be om väder eller vägbeskrivning.

Djupinlärning är också mycket effektivt för att skapa meningsfull text, även kallad generering av naturligt språk. Gmails smarta svar och Smart Compose använder djupinlärning för att ta fram relevanta svar på dina e-postmeddelanden och förslag för att slutföra dina meningar. En textgenereringsmodell som utvecklats av OpenAI tidigare i år skapade långa utdrag av sammanhängande text.

Gränserna för djupt lärande

Trots alla dess fördelar har djupt lärande också vissa brister.

Databeroende: Generellt kräver djupinlärningsalgoritmer stora mängder träningsdata för att kunna utföra sina uppgifter korrekt. Tyvärr finns det inte tillräckligt med kvalitetsutbildningsdata för många problem för att skapa modeller för djupinlärning.

Förklarbarhet: Neurala nätverk utvecklar sitt beteende på extremt komplicerade sätt – även deras skapare kämpar för att förstå sina handlingar. Brist på tolkning gör det extremt svårt att felsöka fel och fixa misstag i deep-learning algoritmer.

Algoritmisk bias: Djupinlärningsalgoritmer är lika bra som de data de tränas på. Problemet är att träningsdata ofta innehåller dolda eller uppenbara fördomar, och algoritmerna ärver dessa förspänningar. Till exempel kommer en algoritm för ansiktsigenkänning som tränas mestadels på bilder av vita människor att prestera mindre exakt på icke-vita människor.

Brist på generalisering: Deep-learning algoritmer är bra på att utföra fokuserade uppgifter men dåliga på att generalisera sin kunskap. Till skillnad från människor kommer en djupinlärningsmodell som är utbildad att spela StarCraft inte att kunna spela ett liknande spel: säg WarCraft. Dessutom är djupinlärning dålig för att hantera data som avviker från dess träningsexempel, även känd som “edge cases”. Detta kan bli farligt i situationer som självkörande bilar, där misstag kan få dödliga konsekvenser.

Framtiden för djupt lärande

Tidigare i år tilldelades pionjärerna för djupinlärning Turing Award, datavetenskapens motsvarighet till Nobelpriset. Men arbetet med djupinlärning och neurala nätverk är långt ifrån över. Olika ansträngningar pågår för att förbättra djupinlärning.

Några intressanta arbeten inkluderar djupinlärningsmodeller som kan förklaras eller är öppna för tolkning, neurala nätverk som kan utveckla sitt beteende med mindre träningsdata och avancerade AI-modeller, djupinlärningsalgoritmer som kan utföra sina uppgifter utan att förlita sig på en stor molndatorresurs.

Och även om djupt lärande för närvarande är den mest avancerade tekniken för artificiell intelligens, är det inte AI-branschens slutdestination. Utvecklingen av djupt lärande och neurala nätverk kan ge oss helt nya arkitekturer.

Relaterade Artiklar

Back to top button