15 interessante idéer til maskinlæringsprojekter for begyndere [2021]

author
25 minutes, 13 seconds Read

Indholdsfortegnelse

Ideer til maskinlæringsprojekter

Da kunstig intelligens (AI) fortsætter med at udvikle sig hurtigt i 2021, bliver det stadig vigtigere for alle aktører inden for dette område at beherske maskinlæring (ML). Det skyldes, at både AI og ML supplerer hinanden. Så hvis du er nybegynder, er det bedste, du kan gøre, at arbejde på nogle Machine Learning-projekter.

Vi, her hos upGrad, tror på en praktisk tilgang, da teoretisk viden alene ikke vil være til hjælp i et arbejdsmiljø i realtid. I denne artikel vil vi udforske nogle interessante Machine Learning-projekter, som begyndere kan arbejde på for at sætte deres Machine Learning-viden på prøve. I denne artikel finder du 15 top ideer til maskinlæringsprojekter for begyndere, så de kan få praktisk erfaring.

Men lad os først tage fat på det mere relevante spørgsmål, der må lure i dit sind: hvorfor bygge maskinlæringsprojekter?

Når det kommer til karrierer inden for softwareudvikling, er det et must for håbefulde udviklere at arbejde på deres egne projekter. Udvikling af virkelige projekter er den bedste måde at skærpe dine færdigheder på og materialisere din teoretiske viden til praktisk erfaring. Jo mere du eksperimenterer med forskellige Machine Learning-projekter, jo mere viden får du.

Mens lærebøger og studiematerialer vil give dig al den viden, du har brug for at vide om Machine Learning, kan du aldrig rigtig mestre ML, medmindre du investerer din tid i virkelige praktiske eksperimenter – projekter om Machine Learning. Når du begynder at arbejde med ideer til maskinlæringsprojekter, vil du ikke kun kunne teste dine styrker og svagheder, men du vil også få en eksponering, som kan være uhyre nyttig for at sætte skub i din karriere. I denne vejledning finder du 15 interessante ideer til maskinlæringsprojekter for begyndere, så du kan få praktisk erfaring med maskinlæring.

Så her er nogle få maskinlæringsprojekter, som begyndere kan arbejde med:

Her er nogle fede maskinlæringsprojektideer for begyndere

Se vores video om maskinlæringsprojektideer og emner…

Denne liste over maskinlæringsprojektideer for studerende er velegnet til begyndere, og dem, der lige er begyndt med maskinlæring eller datalogi generelt. Disse ideer til maskinlæringsprojekter vil sætte dig i gang med alle de praktiske ting, du har brug for for at få succes i din karriere som maskinlæringsfagperson. Omdrejningspunktet for disse maskinlæringsprojekter er maskinlæringsalgoritmer for begyndere, dvs. algoritmer, der ikke kræver, at du har en dyb forståelse af maskinlæring, og som derfor er perfekte for studerende og begyndere.

Herudover, hvis du leder efter projektidéer om maskinlæring til sidste år, bør denne liste få dig i gang. Så lad os uden videre springe direkte ind i nogle Machine Learning projektidéer, der vil styrke din base og give dig mulighed for at klatre op ad stigen.

Stock Prices Predictor

En af de bedste ideer til at begynde at eksperimentere du hands-on Machine Learning projekter for studerende er at arbejde på Stock Prices Predictor. Erhvervsorganisationer og virksomheder er i dag på udkig efter software, der kan overvåge og analysere virksomhedens præstationer og forudsige fremtidige priser på forskellige aktier. Og med så mange tilgængelige data om aktiemarkedet er det et arnested af muligheder for dataloger med hang til finans.

Hvor du går i gang, skal du dog have en god portion viden inden for følgende områder:

  • Prediktiv analyse: Udnyttelse af forskellige AI-teknikker til forskellige dataprocesser som f.eks. datamining, dataudforskning osv. for at “forudsige” adfærden for mulige resultater.
  • Regressionsanalyse: Regressionsanalyse er en form for forudsigelsesteknik, der er baseret på samspillet mellem en afhængig (mål) og en eller flere uafhængige variabler (forudsigere).
  • Handlingsanalyse: I denne metode analyseres alle de handlinger, der udføres af de to ovennævnte teknikker, hvorefter resultatet føres ind i maskinlæringshukommelsen.
  • Statistisk modellering: Det indebærer opbygning af en matematisk beskrivelse af en proces i den virkelige verden og udarbejdelse af de eventuelle usikkerheder i denne proces.

Hvad er maskinlæring, og hvorfor det er vigtigt

SportsPredictor

I Michael Lewis’ Moneyball forvandlede Oakland Athletics-holdet baseballens ansigt ved at indarbejde analytisk spillerscoutingteknik i deres gameplan. Og ligesom dem kan du også revolutionere sporten i den virkelige verden! Dette er et fremragende maskinlæringsprojekt for begyndere.

Da der ikke er mangel på data i sportsverdenen, kan du udnytte disse data til at opbygge sjove og kreative maskinlæringsprojekter, f.eks. ved at bruge college sportsstatistik til at forudsige, hvilken spiller der ville få den bedste karriere i hvilke sportsgrene (talent scouting). Du kan også vælge at forbedre holdledelsen ved at analysere styrker og svagheder hos spillerne på et hold og klassificere dem i overensstemmelse hermed.

Med den mængde af sportsstatistik og data, der er til rådighed, er dette en fremragende arena til at skærpe dine færdigheder inden for dataudforskning og visualisering. For alle med flair for Python vil Scikit-Learn være det ideelle valg, da det indeholder en række nyttige værktøjer til regressionsanalyse, klassifikationer, dataindsamling og så videre. At nævne maskinlæringsprojekter for det sidste år kan hjælpe dit CV med at se meget mere interessant ud end andre.

6 Times Artificial Intelligence Startled The World

Develop A Sentiment Analyzer

Dette er en af de interessante ideer til maskinlæringsprojekter. Selv om de fleste af os bruger sociale medieplatforme til at formidle vores personlige følelser og meninger, så verden kan se dem, ligger en af de største udfordringer i at forstå “følelserne” bag de sociale medieindlæg.

Og dette er den perfekte idé til dit næste maskinlæringsprojekt!

Sociale medier blomstrer med tonsvis af brugergenereret indhold. Ved at skabe et ML-system, der kan analysere stemningen bag tekster eller et indlæg, ville det blive så meget lettere for organisationer at forstå forbrugeradfærd. Dette ville til gengæld give dem mulighed for at forbedre deres kundeservice og dermed give mulighed for optimal forbrugertilfredshed.

Du kan prøve at udvinde data fra Twitter eller Reddit for at komme i gang med dit projekt med sentimentanalyserende maskinlæring. Dette kan være et af de sjældne tilfælde af deep learning-projekter, som også kan hjælpe dig på andre områder.

Forbedre sundhedsvæsenet

AI- og ML-applikationer er allerede begyndt at trænge ind i sundhedsindustrien og er også hurtigt ved at ændre det globale sundhedsvæsens ansigt. Wearables til sundhedsvæsenet, fjernovervågning, telemedicin, robotkirurgi osv. er alle mulige på grund af maskinlæringsalgoritmer drevet af AI. De hjælper ikke kun HCP’er (Health Care Providers) med at levere hurtige og bedre sundhedstjenester, men reducerer også lægernes afhængighed og arbejdsbyrde i betydeligt omfang.

Så hvorfor ikke bruge dine færdigheder til at udvikle et imponerende maskinlæringsprojekt baseret på sundhedsvæsenet? At håndtere et projekt med Machine Learning-algoritmer for begyndere kan være nyttigt for at opbygge din karriere med en god start.

Sundhedsplejeindustrien har enorme mængder af data til deres rådighed. Ved at udnytte disse data kan du skabe:

  • Diagnostiske plejesystemer, der automatisk kan scanne billeder, røntgenbilleder osv. og give en præcis diagnose af mulige sygdomme.
  • Præventive plejeapplikationer, der kan forudsige mulighederne for epidemier som f.eks. influenza, malaria osv, både på nationalt og lokalt niveau.

Disse 6 maskinlæringsteknikker forbedrer sundhedsvæsenet

Forbered ML-algoritmer – fra bunden!

Dette er en af de fremragende idéer til maskinlæringsprojekter for begyndere. At skrive ML-algoritmer fra bunden vil give to fordele:

  • Enten er det at skrive ML-algoritmer den bedste måde at forstå det praktiske i deres mekanik.
  • To, du vil lære, hvordan du omdanner matematiske instruktioner til funktionel kode. Denne færdighed vil være nyttig i din fremtidige karriere inden for maskinlæring.

Du kan begynde med at vælge en algoritme, der er ligetil og ikke for kompleks. Bag udarbejdelsen af hver algoritme – selv de enkleste – ligger der flere nøje beregnede beslutninger. Når du har opnået et vist niveau af beherskelse af opbygningen af enkle ML-algoritmer, kan du forsøge at justere og udvide deres funktionalitet. Du kan f.eks. tage en vanilla logistisk regressionsalgoritme og tilføje reguleringsparametre til den for at omdanne den til en lasso/ridge-regressionsalgoritme. At nævne maskinlæringsprojekter kan hjælpe dit CV med at se meget mere interessant ud end andre.

Udvikle et neuralt netværk, der kan læse håndskrift

En af de bedste ideer til at begynde at eksperimentere du hands-on Java-projekter for studerende er at arbejde på neurale netværk. Dyb læring og neurale netværk er de to aktuelle buzzwords inden for AI. De har givet os teknologiske vidundere som førerløse biler, billedgenkendelse og så videre.
Så nu er det tid til at udforske arenaen for neurale netværk. Begynd dit projekt med neurale netværk til maskinindlæring med MNIST Handwritten Digit Classification Challenge. Den har en meget brugervenlig grænseflade, der er ideel for begyndere.

Maskinlæringsingeniører: Myter vs. realiteter

Movie Ticket Pricing System

Med udvidelsen af OTT-platforme som Netflix, Amazon Prime, foretrækker folk at se indhold som efter deres bekvemmelighed. Faktorer som prisfastsættelse, indholdskvalitet & markedsføring har haft indflydelse på disse platformes succes.

Oprisen for at lave en film i fuld længde er steget eksponentielt i den seneste tid. Kun 10 % af de film, der bliver lavet, giver overskud. Den hårde konkurrence fra tv- & OTT-platforme sammen med de høje billetpriser har gjort det endnu sværere for film at tjene penge. Den stigende pris på biografbilletten (sammen med prisen på popcorn) efterlader biografsalen tom.

Et avanceret billetprissystem kan helt sikkert hjælpe filmproducenterne og seerne. Billetprisen kan være højere i takt med den stigende efterspørgsel efter billetter og omvendt. Jo tidligere seeren bestiller billetten, jo lavere er prisen for en film med stor efterspørgsel. Systemet bør intelligent beregne prisfastsættelsen afhængigt af seernes interesse, sociale signaler og udbuds-efterspørgselsfaktorer.

Iris Flowers Classification ML Project

En af de bedste ideer til at begynde at eksperimentere med praktiske maskinlæringsprojekter for studerende er at arbejde med Iris Flowers Classification ML Project. Irisblomster-datasættet er et af de bedste datasæt til klassifikationsopgaver. Da irisblomster er af forskellige arter, kan de adskilles på grundlag af længden af bægerblade og kronblade. Dette ML-projekt har til formål at klassificere blomsterne blandt de tre arter – Virginica, Setosa eller Versicolor.

Dette særlige ML-projekt kaldes normalt for “Hello World” inden for maskinlæring. Datasættet med irisblomster indeholder numeriske attributter, og det er perfekt for begyndere til at lære om superviserede ML-algoritmer, primært hvordan man indlæser og håndterer data. Da der er tale om et lille datasæt, kan det også nemt passe i hukommelsen uden at kræve særlige transformationer eller skaleringsmuligheder. Og dette er den perfekte idé til dit næste maskinlæringsprojekt!

Du kan downloade iris-datasættet her.

BigMart Sales Prediction ML Project

Dette er en fremragende ML-projektidé for begyndere. Dette ML-projekt er bedst til at lære, hvordan uovervågede ML-algoritmer fungerer. BigMart-salgsdatasættet består af salgsdata fra præcis 2013 for 1559 produkter på tværs af ti forretninger i forskellige byer.

Sigtet her er at bruge BigMart-salgsdatasættet til at udvikle en regressionsmodel, der kan forudsige salget af hvert af de 1559 produkter i det kommende år i de ti forskellige BigMart-forretninger. BigMart-salgsdatasættet indeholder specifikke attributter for hvert produkt og hver forretning og hjælper derved med at forstå de egenskaber ved de forskellige produkter og forretninger, der påvirker det samlede salg af BigMart som brand.

Anbefalingsmotorer med MovieLens-datasæt

Anbefalingsmotorer er blevet enormt populære på online shopping- og streamingwebsteder. For eksempel har online-indholdsstreamingplatforme som Netflix og Hulu anbefalingsmotorer til at tilpasse deres indhold i henhold til individuelle kundepræferencer og browsinghistorik. Ved at skræddersy indholdet til at imødekomme forskellige kunders behov og præferencer har disse websteder været i stand til at øge efterspørgslen efter deres streamingtjenester.

Som nybegynder kan du forsøge dig med at opbygge et anbefalingssystem ved hjælp af et af de mest populære datasæt, der er tilgængelige på nettet – MovieLens-datasættet. Dette datasæt indeholder over “25 millioner vurderinger og en million tag-applikationer anvendt på 62.000 film af 162.000 brugere”. Du kan begynde dette projekt ved at opbygge en world-cloud-visualisering af filmtitler for at lave en filmanbefalingsmotor til MovieLens.

Du kan tjekke MovieLens-datasættet her.

Predicting Wine Quality using Wine Quality Dataset

Det er et veletableret faktum, at alder gør vin bedre – jo ældre vinen er, jo bedre smager den. Alder er dog ikke det eneste, der bestemmer en vins smag. Talrige faktorer er afgørende for vinens kvalitetscertificering, herunder fysiokemiske test såsom alkoholmængde, fast syreindhold, flygtig syre, densitet og pH-niveau, for blot at nævne nogle få.

I dette ML-projekt skal du udvikle en ML-model, der kan undersøge en vins kemiske egenskaber for at forudsige dens kvalitet. Det datasæt for vinkvalitet, som du skal bruge til dette projekt, består af ca. 4898 observationer, herunder 11 uafhængige variabler og en afhængig variabel. At nævne maskinlæringsprojekter for det sidste år kan hjælpe dit CV med at se meget mere interessant ud end andre.

MNIST Handwritten Digit Classification

Dette er et af de interessante maskinlæringsprojekter. Deep Learning og neurale netværk har fundet anvendelsesmuligheder i mange virkelige applikationer som billedgenkendelse, automatisk tekstgenerering, førerløse biler og meget mere. Men før du kaster dig ud i disse komplekse områder af Deep Learning, bør du begynde med et simpelt datasæt som MNIST-datasættet. Så hvorfor ikke bruge dine færdigheder til at udvikle et imponerende maskinlæringsprojekt baseret på MNIST?

MNIST-klassifikationsprojektet er designet til at træne maskiner til at genkende håndskrevne tal. Da begyndere normalt finder det udfordrende at arbejde med billeddata frem for flade relationelle data, er MNIST-datasættet bedst for begyndere. I dette projekt vil du bruge MNIST-datasættene til at træne din ML-model ved hjælp af Convolutional Neural Networks (CNN’er). Selv om MNIST-datasættet kan passe problemfrit i din pc-hukommelse (det er meget lille), er opgaven med håndskrevet talgenkendelse ret udfordrende.

Du kan få adgang til MNIST-datasættet her.

Human Activity Recognition using Smartphone Dataset

Dette er en af de trendende projektidéer inden for maskinlæring. Smartphone-datasættet omfatter fitnessaktivitetsoptegnelser og oplysninger om 30 personer. Disse data blev opfanget via en smartphone udstyret med inertialsensorer.

Dette ML-projekt har til formål at opbygge en klassifikationsmodel, der kan identificere menneskelige fitnessaktiviteter med en høj grad af nøjagtighed. Ved at arbejde med dette ML-projekt lærer du det grundlæggende i klassifikation og også, hvordan man løser problemer med flere klassifikationer.

14. Objektdetektion med dyb læring

Dette er et af de interessante maskinlæringsprojekter, der skal oprettes. Når det drejer sig om billedklassificering, bør Deep Neural Networks (DNN’er) være dit første valg. Mens DNN’er allerede anvendes i mange reelle billedklassificeringsapplikationer, har dette ML-projekt til formål at skrue det op i en højere enhed.

I dette ML-projekt vil du løse problemet med objektdetektion ved at udnytte DNN’er. Du skal udvikle en model, der både kan klassificere objekter og også nøjagtigt lokalisere objekter af forskellige klasser. Her vil du behandle opgaven med objektdetektion som et regressionsproblem i forhold til objektgrænsemasker. Desuden skal du definere en multiskala-inferensprocedure, der kan generere objektdetektioner med høj opløsning og med minimale omkostninger.

Fake News Detection

Dette er en af de fremragende ideer til maskinlæringsprojekter for begyndere, især hvordan falske nyheder spreder sig som en steppebrand nu. Falske nyheder har en evne til at sprede sig som en løbeild. Og med de sociale medier, der dominerer vores liv lige nu, er det blevet mere kritisk end nogensinde før at skelne falske nyheder fra virkelige nyhedsbegivenheder. Det er her, at maskinlæring kan hjælpe. Facebook bruger allerede AI til at filtrere falske og spammede historier fra brugernes feeds.

Dette ML-projekt har til formål at udnytte NLP-teknikker (Natural Language Processing) til at opdage falske nyheder og misvisende historier, der stammer fra ikke-reputable kilder. Du kan også bruge den klassiske tekstklassifikationsmetode til at designe en model, der kan skelne mellem ægte og falske nyheder. I sidstnævnte metode kan du indsamle datasæt for både ægte og falske nyheder og oprette en ML-model ved hjælp af Naive Bayes-klassifikatoren for at klassificere en nyhed som bedragerisk eller ægte på baggrund af de ord og sætninger, der anvendes i den.

Enron e-mailprojekt

Enron e-mail datasættet indeholder næsten 500k e-mails fra over 150 brugere. Det er et ekstremt værdifuldt datasæt til naturlig sprogbehandling. Dette projekt omfatter opbygning af en ML-model, der anvender k-means-grupperingsalgoritmen til at opdage svigagtige handlinger. Modellen vil opdele observationerne i “k” antal klynger i henhold til lignende mønstre i datasættet.

Parkinson-projektet

Parkinson-datasættet omfatter 195 biomedicinske optegnelser om personer med 23 forskellige karakteristika. Ideen bag dette projekt er at designe en ML-model, der kan skelne mellem raske personer og personer, der lider af Parkinsons sygdom. Modellen anvender XGboost-algoritmen (extreme gradient boosting) baseret på beslutningstræer til at foretage adskillelsen.

Flickr 30K-projektet

Datasættet Flickr 30K består af mere end 30 000 billeder, der hver især har en unik billedtekst. Du skal bruge dette datasæt til at opbygge en billedtekstgenerator. Ideen er at opbygge en CNN-model, der effektivt kan analysere og udtrække funktioner fra et billede og skabe en passende billedtekst, der beskriver billedet på engelsk.

Mall customers project

Som navnet antyder, omfatter mall customers-datasættet registreringer af personer, der har besøgt et indkøbscenter, f.eks. køn, alder, kunde-ID, årsindkomst, forbrugsscore osv. Du skal opbygge en model, der vil bruge disse data til at segmentere kunderne i forskellige grupper baseret på deres adfærdsmønstre. En sådan kundesegmentering er en meget nyttig markedsføringstaktik, som bruges af brands og marketingfolk til at øge salg og omsætning og samtidig øge kundetilfredsheden.

Kinetics-projekt

I dette projekt skal du bruge et omfattende datasæt, der omfatter tre separate datasæt – Kinetics 400, Kinetics 600 og Kinetics 700 – som indeholder URL-links til over 6,5 millioner videoer af høj kvalitet. Dit mål er at skabe en model, der kan registrere og identificere et menneskes handlinger ved at studere en række forskellige observationer.

Anbefalingssystemprojekt

Dette er en rig samling af datasæt, der indeholder en bred vifte af datasæt, der er indsamlet fra populære websteder som Goodreads boganmeldelser, Amazon-produktanmeldelser, sociale medier osv. Dit mål er at opbygge en anbefalingsmotor (som dem, der anvendes af Amazon og Netflix), der kan generere personlige anbefalinger af produkter, film, musik osv. baseret på kundens præferencer, behov og onlineadfærd.

Bostons boligprojekt

Bostons boligdatasæt består af detaljer om forskellige huse i Boston baseret på faktorer som skatteprocent, kriminalitetsrate, antal værelser i et hus osv. Det er et fremragende datasæt til forudsigelse af priserne på forskellige huse i Boston. I dette projekt skal du opbygge en model, der kan forudsige prisen på et nyt hus ved hjælp af lineær regression. Lineær regression er bedst egnet til dette projekt, da den anvendes, når dataene har en lineær sammenhæng mellem input- og outputværdierne, og når input er ukendt.

Cityscapes-projektet

Dette open source-datasæt indeholder annotationer på pixelniveau af høj kvalitet af videosekvenser indsamlet fra gader i 50 forskellige byer. Det er uhyre nyttigt til semantisk analyse. Du kan bruge dette datasæt til at træne dybe neurale net til at analysere og forstå det urbane bybillede. Projektet omfatter design af en model, der kan udføre billedsegmentering og identificere forskellige objekter (biler, busser, lastbiler, træer, veje, mennesker osv.) fra en videosekvens fra en gade.

YouTube 8M-projektet

Youtube 8M er et enormt datasæt, der har 6,1 millioner YouTube-video-ID’er, 350.000 timers video, 2,6 milliarder lyd/visuelle funktioner, 3862 klasser og i gennemsnit 3 etiketter for hver video. Det anvendes i vid udstrækning til videoklassificeringsprojekter. I dette projekt skal du opbygge et videoklassifikationssystem, der præcist kan beskrive en video. Det skal tage hensyn til en række forskellige input og klassificere videoerne i forskellige kategorier.

Urban sound 8K

Datasættet urban sound 8K anvendes til lydklassificering. Det omfatter en forskelligartet samling af 8732 bylyde, der tilhører forskellige klasser som f.eks. sirener, gademusik, hundelyd, fuglekvidren, fuglekvidren, folk der taler osv. Du skal designe en lydklassifikationsmodel, der automatisk kan registrere, hvilken bylyd der spilles i

IMDB-Wiki-projektet

Dette mærkede datasæt er sandsynligvis en af de mest omfattende samlinger af ansigtsbilleder, der er indsamlet fra hele IMDB og Wikipedia. Den indeholder over 5 millioner ansigtsbilleder, der er mærket med alder og køn. med mærket køn og alder. Du skal skabe en model, der kan registrere ansigter og forudsige deres alder og køn med nøjagtighed. Du kan lave forskellige alderssegmenter/intervaller som f.eks. 0-10, 10-20, 30-40 osv.

Librispeech-projektet

Librispeech-datasættet er en massiv samling af engelske taler, der stammer fra LibriVox-projektet. Den indeholder engelsksprogede taler med forskellige accenter, der strækker sig over mere end 1000 timer, og den er det perfekte værktøj til talegenkendelse. Fokus i dette projekt er at skabe en model, der automatisk kan oversætte lyd til tekst. Du skal opbygge et talegenkendelsessystem, der kan registrere engelsk tale og oversætte den til tekstformat.

German traffic sign recognition benchmark (GTSRB) project

Dette datasæt indeholder mere end 50 000 billeder af trafikskilte, der er segmenteret i 43 klasser og indeholder oplysninger om den afgrænsende boks for hvert trafikskilt. Det er ideelt til klassificering i flere klasser, hvilket er præcis, hvad du vil fokusere på her. Du skal opbygge en model ved hjælp af en deep learning-ramme, der kan genkende skiltes afgrænsende boks og klassificere trafikskilte. Projektet kan være yderst nyttigt for autonome køretøjer, da det registrerer skilte og hjælper chauffører med at træffe de nødvendige foranstaltninger.

29. Sammenfatning af tekst til sportskampsvideoer

Dette projekt er præcis, som det lyder – at opnå et præcist og kortfattet resumé af en sportsvideo. Det er et nyttigt værktøj for sportswebsteder, der informerer læserne om kampens højdepunkter. Da neurale netværk er bedst til tekstresuméer, skal du opbygge denne model ved hjælp af dybe læringsnetværk såsom 3D-CNNs, RNNs og LSTMs. Du vil først fragmentere en sportsvideo i flere sektioner ved hjælp af de relevante ML-algoritmer og derefter bruge en kombination af SVM(Support vector machines), neurale netværk og k-means-algoritmen.

30. Generator til opsummering af forretningsmøder

Summarisering indebærer, at man kort og koncist uddrager de mest meningsfulde og værdifulde stykker information fra samtaler, lyd/videofiler osv. Det sker generelt ved at feature fange de statistiske, sproglige og følelsesmæssige træk med dialogstrukturen i den pågældende samtale. I dette projekt skal du bruge dybe indlærings- og naturlige sprogbehandlingsteknikker til at skabe præcise resuméer af forretningsmøder, samtidig med at konteksten i hele samtalen opretholdes.

31. Sentimentanalyse for depression

Depression er et stort sundhedsproblem globalt set. Hvert år begår millioner af mennesker selvmord på grund af depression og dårlig mental sundhed. Normalt er stigmatisering af mentale sundhedsproblemer og forsinket behandling de to hovedårsager til dette. I dette projekt vil du udnytte de data, der er indsamlet fra forskellige sociale medieplatforme, og analysere sproglige markører i indlæg på sociale medier for at forstå personers mentale sundhed. Ideen er at skabe en deep learning-model, der kan give værdifuld og præcis indsigt i en persons mentale sundhed langt tidligere end konventionelle metoder.

32. Løser af håndskrevne ligninger

Håndskrevne matematiske udtryksgenkendelser er et afgørende forskningsområde inden for computer vision-forskningen. Du vil opbygge en model og træne den til at løse håndskrevne matematiske ligninger ved hjælp af konvolutionelle neurale netværk. Modellen vil også gøre brug af billedbehandlingsteknikker. Dette projekt omfatter træning af modellen med de rigtige data, så den bliver dygtig til at læse håndskrevne cifre, symboler osv. for at levere korrekte resultater for matematiske ligninger af forskellig kompleksitet.

33. Ansigtsgenkendelse til at registrere humør og anbefale sange

Det er en kendt kendsgerning, at folk lytter til musik baseret på deres aktuelle humør og følelser. Så hvorfor ikke skabe et program, der kan registrere en persons humør ud fra hans eller hendes ansigtsudtryk og anbefale sange i overensstemmelse hermed? Til dette formål skal du bruge computer vision-elementer og -teknikker. Målet er at skabe en model, der effektivt kan udnytte computer vision til at hjælpe computere med at opnå en forståelse på højt niveau af billeder og videoer.

34. Musikgenerator

En musikkomposition er intet andet end en melodisk kombination af forskellige frekvensniveauer. I dette projekt skal du designe en automatisk musikgenerator, der kan komponere korte musikstykker med minimal menneskelig indgriben. Du vil bruge deep learning-algoritmer og LTSM-netværk til at opbygge denne musikgenerator.

35. Sygdomsforudsigelsessystem

Dette ML-projekt er designet til at forudsige sygdomme. Du vil oprette denne model ved hjælp af R og R Studio og Breast Cancer Wisconsin (Diagnostic) Dataset. Dette datasæt omfatter to prædiktorklasser – godartet og ondartet brystmasse. Det er vigtigt at have et grundlæggende kendskab til tilfældige skove og XGBoost for at kunne arbejde med dette projekt.

36. At finde en beboelig exoplanet

I det seneste årti er det lykkedes os at identificere mange transiterende og exoplaneter. Da den manuelle fortolkning af potentielle exoplaneter er temmelig udfordrende og tidskrævende (for ikke at glemme, at den også er udsat for menneskelige fejl), er det bedst at bruge dybdeindlæring til at identificere exoplaneter. Dette projekt har til formål at finde ud af, om der findes beboelige exoplaneter omkring os ved hjælp af CNN’er og støjende tidsseriedata. Denne metode kan identificere beboelige exoplaneter med større præcision end den mindste kvadraters metode.

37. Regenerering af billeder til gamle & beskadigede filmruller

Genoprettelse af gamle eller beskadigede filmruller er en udfordrende opgave. Det er næsten altid umuligt at genskabe gamle billeder til deres oprindelige tilstand. Dyb indlæring kan dog løse dette problem. Du vil opbygge en deep learning-model, der kan identificere defekter i et billede (skrammer, huller, folder, affarvning osv.) og bruge Inpainting-algoritmer til at gendanne det. Du kan endda farvelægge gamle B&W-billeder.

Real-world industriprojekter

Magenta

Dette forskningsprojekt fokuserer på at udforske anvendelserne af maskinlæring i skabelsesprocessen af kunst og musik. Du vil udvikle unikke forstærkende lærings- og dybe læringsalgoritmer, der kan generere billeder, sange, musik og meget mere. Det er det perfekte projekt for kreative hjerner, der brænder for kunst og musik.

BluEx

BluEx er blandt de førende logistikvirksomheder i Indien, som har udviklet en stor fanbase takket være deres rettidige og effektive leverancer. Men som det gælder for alle logistikudbydere, står BluEx over for en særlig udfordring, der koster både tid og penge – dets chauffører benytter ikke ofte de optimale leveringsveje, hvilket medfører forsinkelser og højere brændstofomkostninger. Du vil oprette en ML-model ved hjælp af forstærkende læring, der kan finde den mest effektive vej for et bestemt leveringssted. Dette kan spare op til 15 % af brændstofomkostningerne for BluEx.

Motion Studios

Motion Studios kan prale af at være Europas største radioproduktionshus med en omsætning på over en milliard dollars. Lige siden medievirksomheden lancerede deres realityshow RJ Star, har de fået en fænomenal respons og er blevet oversvømmet med stemmeklip. Da der er tale om et realityshow, er der et begrænset tidsvindue for udvælgelse af kandidater. Du skal opbygge en model, der kan skelne mellem mandlige og kvindelige stemmer og klassificere stemmeklip for at lette en hurtigere filtrering. Dette vil bidrage til en hurtigere udvælgelse og lette opgaven for showets ledere.

LithionPower

Lithionpower bygger batterier til elektriske køretøjer. Normalt lejer bilisterne virksomhedens batterier for en dag og erstatter dem med et opladet batteri. Batteriets levetid afhænger af faktorer som kørt distance/dag, overskridelse af hastighedsgrænser osv. LithionPower anvender en variabel prismodel baseret på chaufførens kørselshistorik. Målet med dette projekt er at opbygge en klyngemodel, der grupperer chaufførerne efter deres kørselshistorik og giver chaufførerne incitamenter på grundlag af disse klynger. Dette vil øge overskuddet med 15-20 %, men det vil også betyde, at chauffører med en dårlig kørehistorik skal betale mere.

Konklusion

Her er en omfattende liste over idéer til maskinlæringsprojekter. Maskinlæring er stadig på et tidligt stadie i hele verden. Der er mange projekter, der skal gennemføres, og der er meget, der skal forbedres. Med kloge hoveder og skarpe ideer bliver systemer med støtte til erhvervslivet bedre, hurtigere og mere rentable. Hvis du ønsker at udmærke dig inden for maskinlæring, skal du samle praktisk erfaring med sådanne maskinlæringsprojekter.

Kun ved at arbejde med ML-værktøjer og ML-algoritmer kan du forstå, hvordan ML-infrastrukturer fungerer i virkeligheden. Gå nu i gang og afprøv al den viden, du har indsamlet gennem vores guide til ideer til maskinlæringsprojekter, for at bygge dine helt egne maskinlæringsprojekter!

Hvor let er det at gennemføre disse projekter?

Disse projekter er meget grundlæggende, og en person med et godt kendskab til maskinlæring kan nemt vælge og afslutte et af disse projekter.

Kan jeg udføre disse projekter på ML Internship?

Ja, som nævnt er disse projektideer grundlæggende for studerende eller begyndere. Der er en stor mulighed for, at du kommer til at arbejde på nogen af disse projektidéer i løbet af din praktik.

Hvorfor skal vi bygge maskinlæringsprojekter?

Når det kommer til karrierer inden for softwareudvikling, er det et must for håbefulde udviklere at arbejde på deres egne projekter. Udvikling af virkelige projekter er den bedste måde at skærpe dine færdigheder på og materialisere din teoretiske viden til praktisk erfaring.

Led den AI-drevne teknologiske revolution

PG Diploma in Machine Learning and Artificial Intelligence

Læs mere

Similar Posts

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.