Tabelă de materii
- Idei de proiecte de învățare automată
- Iată câteva idei interesante de proiecte de învățare a mașinilor pentru începători
- Stock Prices Predictor
- SportsPredictor
- Develop A Sentiment Analyzer
- Îmbunătățiți asistența medicală
- Pregătiți algoritmi ML – de la zero!
- Dezvoltați o rețea neuronală care poate citi scrisul de mână
- Movie Ticket Pricing System
- Iris Flowers Classification ML Project
- BigMart Sales Prediction ML Project
- Motoare de recomandare cu setul de date MovieLens
- Predicting Wine Quality using Wine Quality Dataset
- MNIST Handwritten Digit Classification
- Human Activity Recognition using Smartphone Dataset
- 14. Detectarea obiectelor cu Deep Learning
- Detecția știrilor false
- Enrol Email Project
- Proiect Parkinson
- Proiect Flickr 30K
- Mall customers project
- Proiect Kinetics
- Proiect de sistem de recomandări
- Proiectul privind locuințele din Boston
- Proiectul Cityscapes
- Proiectul YouTube 8M
- Urban sound 8K
- Proiect IMDB-Wiki
- Proiect Librispeech
- Proiectul GTSRB (German traffic sign recognition benchmark)
- Proiecte industriale din lumea reală
- Magenta
- BluEx
- Motion Studios
- LithionPower
- Concluzie
- Cât de ușor este să implementați aceste proiecte?
- Pot face aceste proiecte în cadrul unui stagiu de ML?
- De ce trebuie să construim proiecte de învățare automată?
- Conduceți revoluția tehnologică condusă de AI
Idei de proiecte de învățare automată
În timp ce Inteligența Artificială (AI) continuă să progreseze rapid în 2021, obținerea stăpânirii învățării automate (ML) devine din ce în ce mai importantă pentru toți jucătorii din acest domeniu. Acest lucru se datorează faptului că atât AI, cât și ML se completează reciproc. Deci, dacă sunteți un începător, cel mai bun lucru pe care îl puteți face este să lucrați la unele proiecte de Machine Learning.
Noi, aici, la upGrad, credem într-o abordare practică, deoarece cunoștințele teoretice singure nu vor fi de ajutor într-un mediu de lucru în timp real. În acest articol, vom explora câteva proiecte interesante de Machine Learning la care începătorii pot lucra pentru a-și pune la încercare cunoștințele de Machine Learning. În acest articol, veți găsi 15 idei de proiecte de învățare automată de top pentru începători pentru a obține experiență practică.
Dar mai întâi, să abordăm întrebarea mai pertinentă care trebuie să se ascundă în mintea dvs.: de ce să construiți proiecte de învățare automată?
Când vine vorba de cariere în dezvoltarea de software, este o necesitate pentru dezvoltatorii aspiranți să lucreze la propriile proiecte. Dezvoltarea de proiecte din lumea reală este cel mai bun mod de a vă perfecționa abilitățile și de a materializa cunoștințele teoretice în experiență practică. Cu cât experimentați mai mult cu diferite proiecte de Machine Learning, cu atât mai multe cunoștințe dobândiți.
În timp ce manualele și materialele de studiu vă vor oferi toate cunoștințele de care aveți nevoie pentru a ști despre Machine Learning, nu veți putea niciodată să stăpâniți cu adevărat ML dacă nu vă investiți timpul în experimente practice din viața reală – proiecte de Machine Learning. Pe măsură ce începeți să lucrați la idei de proiecte de învățare automată, nu numai că veți putea să vă testați punctele forte și punctele slabe, dar veți obține, de asemenea, o expunere care poate fi extrem de utilă pentru a vă impulsiona cariera. În acest tutorial, veți găsi 15 idei interesante de proiecte de învățare a mașinilor pentru începători, pentru a obține experiență practică pe învățarea mașinilor.
Iată câteva proiecte de învățare a mașinilor la care începătorii pot lucra:
Iată câteva idei interesante de proiecte de învățare a mașinilor pentru începători
Veziți videoclipul nostru despre idei și subiecte de proiecte de învățare a mașinilor…
Această listă de idei de proiecte de învățare a mașinilor pentru studenți este potrivită pentru începători și pentru cei care abia încep să se ocupe de învățarea mașinilor sau de știința datelor în general. Aceste idei de proiecte de învățare automată vă vor pune în mișcare cu toate aspectele practice de care aveți nevoie pentru a reuși în cariera dvs. ca profesionist în domeniul învățării automate. Punctul focal al acestor proiecte de învățare a mașinilor sunt algoritmii de învățare a mașinilor pentru începători, adică algoritmi care nu necesită o înțelegere profundă a învățării mașinilor și, prin urmare, sunt perfecți pentru studenți și începători.
În continuare, dacă sunteți în căutarea unor idei de proiecte de învățare a mașinilor pentru ultimul an, această listă ar trebui să vă pună pe picioare. Așadar, fără alte formalități, să trecem direct la câteva idei de proiecte de Machine Learning care vă vor consolida baza și vă vor permite să urcați pe scara ierarhică.
Stock Prices Predictor
Una dintre cele mai bune idei pentru a începe să vă experimentați proiecte practice de Machine Learning pentru studenți este să lucrați la Stock Prices Predictor. Organizațiile de afaceri și companiile de astăzi sunt în căutarea unui software care să monitorizeze și să analizeze performanța companiei și să prezică prețurile viitoare ale diferitelor acțiuni. Și cu atât de multe date disponibile pe piața bursieră, aceasta este un focar de oportunități pentru cercetătorii de date cu înclinație pentru finanțe.
Cu toate acestea, înainte de a porni la drum, trebuie să aveți o bună parte de cunoștințe în următoarele domenii:
- Analiza predictivă: Folosirea diverselor tehnici de inteligență artificială pentru diferite procese de date, cum ar fi extragerea datelor, explorarea datelor etc., pentru a „prezice” comportamentul unor rezultate posibile.
- Analiza de regresie: Analiza regresivă este un tip de tehnică predictivă bazată pe interacțiunea dintre o variabilă dependentă (țintă) și o variabilă/ variabile independente (predictor).
- Analiza acțiunii: În această metodă, toate acțiunile efectuate prin cele două tehnici menționate mai sus sunt analizate, după care rezultatul este introdus în memoria de învățare automată.
- Modelare statistică: Aceasta implică construirea unei descrieri matematice a unui proces din lumea reală și elaborarea incertitudinilor, dacă există, în cadrul acelui proces.
Ce este învățarea automată și de ce este importantă
SportsPredictor
În cartea Moneyball a lui Michael Lewis, echipa Oakland Athletics a transformat fața baseball-ului prin încorporarea tehnicii analitice de cercetare a jucătorilor în planul lor de joc. Și, la fel ca ei, și tu poți revoluționa sportul în lumea reală! Acesta este un excelent proiect de învățare automată pentru începători.
Din moment ce nu există o lipsă de date în lumea sportului, puteți utiliza aceste date pentru a construi proiecte de învățare automată amuzante și creative, cum ar fi utilizarea statisticilor din sporturile universitare pentru a prezice ce jucător ar avea cea mai bună carieră în anumite sporturi (depistarea talentelor). Ați putea opta, de asemenea, pentru îmbunătățirea managementului echipei prin analiza punctelor forte și a punctelor slabe ale jucătorilor dintr-o echipă și clasificarea lor în consecință.
Cu cantitatea de statistici și date sportive disponibile, aceasta este o arenă excelentă pentru a vă perfecționa abilitățile de explorare și vizualizare a datelor. Pentru oricine are un fler în Python, Scikit-Learn va fi alegerea ideală, deoarece include o serie de instrumente utile pentru analiza de regresie, clasificări, ingestia de date și așa mai departe. Menționarea proiectelor de Machine Learning pentru ultimul an poate ajuta CV-ul dvs. să arate mult mai interesant decât altele.
6 Times Artificial Intelligence Startled The World
Develop A Sentiment Analyzer
Aceasta este una dintre ideile interesante de proiecte de învățare a mașinilor. Deși majoritatea dintre noi folosim platformele de social media pentru a ne transmite sentimentele și opiniile personale pentru ca lumea să le vadă, una dintre cele mai mari provocări constă în înțelegerea „sentimentelor” din spatele postărilor din social media.
Și aceasta este ideea perfectă pentru următorul tău proiect de învățare automată!
Mediile sociale sunt înfloritoare cu tone de conținut generat de utilizatori. Prin crearea unui sistem ML care ar putea analiza sentimentul din spatele textelor, sau a unei postări, ar deveni mult mai ușor pentru organizații să înțeleagă comportamentul consumatorilor. Acest lucru, la rândul său, le-ar permite să își îmbunătățească serviciile pentru clienți, oferind astfel posibilitatea unei satisfacții optime a consumatorilor.
Puteți încerca să extrageți datele de pe Twitter sau Reddit pentru a începe proiectul dvs. de învățare automată de analiză a sentimentului. Acesta ar putea fi unul dintre acele cazuri rare de proiecte de învățare profundă care vă pot ajuta și în alte aspecte.
Îmbunătățiți asistența medicală
Aplicațiile AI și ML au început deja să pătrundă în industria medicală și, de asemenea, transformă rapid fața asistenței medicale globale. Articolele purtabile pentru sănătate, monitorizarea la distanță, telemedicina, chirurgia robotică etc., toate acestea sunt posibile datorită algoritmilor de învățare automată alimentați de IA. Aceștia nu numai că îi ajută pe HCP (Health Care Providers) să ofere servicii de sănătate rapide și mai bune, dar reduc, de asemenea, dependența și volumul de muncă al medicilor într-o măsură semnificativă.
Atunci, de ce să nu vă folosiți abilitățile pentru a dezvolta un proiect impresionant de învățare automată bazat pe asistența medicală? Să vă ocupați de un proiect cu algoritmi de Machine Learning pentru începători poate fi de ajutor pentru a vă construi cariera cu un start bun.
Industria medicală are la dispoziție cantități enorme de date. Prin valorificarea acestor date, puteți crea:
- Sisteme de îngrijire de diagnosticare care pot scana automat imagini, radiografii etc. și pot oferi un diagnostic precis al posibilelor boli.
- Aplicații de îngrijire preventivă care pot prezice posibilități de epidemii cum ar fi gripa, malaria, etc., atât la nivel național, cât și la nivel comunitar.
Aceste 6 tehnici de învățare automată îmbunătățesc asistența medicală
Pregătiți algoritmi ML – de la zero!
Aceasta este una dintre ideile excelente de proiecte de învățare automată pentru începători. Scrierea algoritmilor ML de la zero va oferi două beneficii:
- Unul, scrierea algoritmilor ML este cel mai bun mod de a înțelege detaliile esențiale ale mecanicii lor.
- Două, veți învăța cum să transformați instrucțiunile matematice în cod funcțional. Această abilitate vă va fi utilă în viitoarea dvs. carieră în Machine Learning.
Puteți începe prin a alege un algoritm care este simplu și nu prea complex. În spatele realizării fiecărui algoritm – chiar și a celor mai simpli – se află mai multe decizii atent calculate. Odată ce ați atins un anumit nivel de măiestrie în construirea unor algoritmi ML simpli, încercați să le modificați și să le extindeți funcționalitatea. De exemplu, ați putea lua un algoritm de regresie logistică de tip vanilie și să-i adăugați parametri de regularizare pentru a-l transforma într-un algoritm de regresie lasso/ridge. Menționarea proiectelor de învățare a mașinilor poate ajuta CV-ul dvs. să pară mult mai interesant decât altele.
Dezvoltați o rețea neuronală care poate citi scrisul de mână
Una dintre cele mai bune idei pentru a începe să vă experimentați proiecte Java practice pentru studenți este lucrul la rețeaua neuronală. Învățarea profundă și rețelele neuronale sunt cele două cuvinte la modă care se întâmplă în AI. Acestea ne-au oferit minuni tehnologice, cum ar fi mașinile fără șofer, recunoașterea imaginilor și așa mai departe.
Deci, acum este momentul să explorați arena rețelelor neuronale. Începeți proiectul dvs. de învățare automată prin rețele neuronale cu MNIST Handwritten Digit Classification Challenge. Acesta are o interfață foarte ușor de utilizat, ideală pentru începători.
Inginerii de învățare automată: Myths vs. Realities
Movie Ticket Pricing System
Cu expansiunea platformelor OTT, cum ar fi Netflix, Amazon Prime, oamenii preferă să vizioneze conținut în funcție de confortul lor. Factori precum stabilirea prețurilor, calitatea conținutului & Marketingul au influențat succesul acestor platforme.
Costul de realizare a unui film de lung metraj a crescut exponențial în ultimul timp. Doar 10% din filmele care sunt realizate aduc profit. Concurența acerbă din partea televiziunii & Platformele OTT, împreună cu costul ridicat al biletelor, a făcut ca filmele să facă bani și mai greu. Costul în creștere al biletului de teatru (împreună cu costul floricelelor de porumb) lasă sala de cinema goală.
Un sistem avansat de stabilire a prețului biletelor poate ajuta cu siguranță producătorii de filme și spectatorii. Prețul biletului poate fi mai mare odată cu creșterea cererii de bilete și viceversa. Cu cât spectatorul își rezervă biletul mai devreme, cu atât costul este mai mic, pentru un film cu cerere mare. Sistemul ar trebui să calculeze în mod inteligent prețul în funcție de interesul spectatorilor, de semnalele sociale și de factorii de cerere și ofertă.
Iris Flowers Classification ML Project
Una dintre cele mai bune idei pentru a începe să experimentați proiecte practice de învățare automată pentru studenți este să lucrați la proiectul de clasificare ML Iris Flowers. Setul de date Iris flowers este unul dintre cele mai bune seturi de date pentru sarcinile de clasificare. Deoarece florile de iris sunt de specii variate, acestea pot fi distinse pe baza lungimii sepalelor și petalelor. Acest proiect ML își propune să clasifice florile între cele trei specii – Virginica, Setosa sau Versicolor.
Acest proiect ML special este denumit de obicei „Hello World” al învățării automate. Setul de date privind florile de iris conține atribute numerice și este perfect pentru ca începătorii să învețe despre algoritmii ML supravegheați, în principal cum să încarce și să manipuleze datele. De asemenea, având în vedere că este un set de date mic, acesta poate încăpea cu ușurință în memorie fără a necesita transformări speciale sau capacități de scalare. Și aceasta este ideea perfectă pentru următorul dvs. proiect de învățare automată!
Puteți descărca setul de date iris aici.
BigMart Sales Prediction ML Project
Aceasta este o idee excelentă de proiect ML pentru începători. Acest proiect ML este cel mai bun pentru a învăța cum funcționează algoritmii ML nesupravegheați. Setul de date privind vânzările BigMart cuprinde exact datele de vânzări din 2013 pentru 1559 de produse din zece puncte de vânzare din diferite orașe.
Obiectivul aici este de a utiliza setul de date de vânzări BigMart pentru a dezvolta un model de regresie care poate prezice vânzarea fiecăruia dintre cele 1559 de produse în anul următor în cele zece puncte de vânzare BigMart diferite. Setul de date privind vânzările BigMart conține atribute specifice pentru fiecare produs și punct de vânzare, ajutându-vă astfel să înțelegeți proprietățile diferitelor produse și magazine care influențează vânzările globale ale BigMart ca marcă.
Motoare de recomandare cu setul de date MovieLens
Motoarele de recomandare au devenit extrem de populare în site-urile de cumpărături online și de streaming. De exemplu, platformele de streaming de conținut online precum Netflix și Hulu au motoare de recomandare pentru a-și personaliza conținutul în funcție de preferințele individuale ale clienților și de istoricul de navigare. Prin adaptarea conținutului pentru a satisface nevoile și preferințele de vizionare ale diferiților clienți, aceste site-uri au reușit să stimuleze cererea pentru serviciile lor de streaming.
Ca începător, puteți încerca să construiți un sistem de recomandări folosind unul dintre cele mai populare seturi de date disponibile pe web – setul de date MovieLens. Acest set de date include peste „25 de milioane de evaluări și un milion de aplicații de etichete aplicate la 62.000 de filme de către 162.000 de utilizatori”. Puteți începe acest proiect prin construirea unei vizualizări world-cloud a titlurilor de filme pentru a realiza un motor de recomandare a filmelor pentru MovieLens.
Puteți verifica setul de date MovieLens aici.
Predicting Wine Quality using Wine Quality Dataset
Este un fapt bine stabilit că vârsta face ca vinul să fie mai bun – cu cât este mai vechi vinul, cu atât va avea un gust mai bun. Cu toate acestea, vârsta nu este singurul lucru care determină gustul unui vin. Numeroși factori determină certificarea calității vinului, inclusiv teste fizico-chimice, cum ar fi cantitatea de alcool, aciditatea fixă, aciditatea volatilă, densitatea și nivelul pH-ului, pentru a numi doar câteva.
În acest proiect ML, trebuie să dezvoltați un model ML care poate explora proprietățile chimice ale unui vin pentru a prezice calitatea acestuia. Setul de date privind calitatea vinului pe care îl veți utiliza pentru acest proiect constă în aproximativ 4898 de observații, incluzând 11 variabile independente și o variabilă dependentă. Menționarea proiectelor de învățare automată pentru ultimul an poate ajuta CV-ul dvs. să pară mult mai interesant decât altele.
MNIST Handwritten Digit Classification
Acesta este unul dintre proiectele interesante de învățare automată. Învățarea profundă și rețelele neuronale au găsit cazuri de utilizare în multe aplicații din lumea reală, cum ar fi recunoașterea imaginilor, generarea automată de text, mașinile fără șofer și multe altele. Cu toate acestea, înainte de a pătrunde în aceste domenii complexe ale Deep Learning, ar trebui să începeți cu un set de date simplu, cum ar fi setul de date MNIST. Deci, de ce să nu vă folosiți abilitățile pentru a dezvolta un proiect impresionant de învățare automată bazat pe MNIST?
Proiectul de clasificare a cifrelor MNIST este conceput pentru a antrena mașinile să recunoască cifrele scrise de mână. Având în vedere că, de obicei, pentru începători este o provocare să lucreze cu date de imagine peste date relaționale plate, setul de date MNIST este cel mai bun pentru începători. În acest proiect, veți utiliza seturile de date MNIST pentru a vă antrena modelul ML folosind rețele neuronale convoluționale (CNN). Deși setul de date MNIST poate încăpea fără probleme în memoria PC-ului dvs. (este foarte mic), sarcina de recunoaștere a cifrelor scrise de mână este destul de dificilă.
Puteți accesa setul de date MNIST aici.
Human Activity Recognition using Smartphone Dataset
Aceasta este una dintre ideile de proiect de învățare automată în trending. Setul de date pentru smartphone-uri include înregistrarea activității de fitness și informații despre 30 de persoane. Aceste date au fost capturate cu ajutorul unui smartphone echipat cu senzori inerțiali.
Acest proiect ML urmărește să construiască un model de clasificare care poate identifica activitățile de fitness uman cu un grad ridicat de precizie. Lucrând la acest proiect ML, veți învăța elementele de bază ale clasificării și, de asemenea, cum să rezolvați probleme de multiclasificare.
14. Detectarea obiectelor cu Deep Learning
Acesta este unul dintre proiectele de învățare automată interesante de creat. Când vine vorba de clasificarea imaginilor, rețelele neuronale profunde (Deep Neural Networks – DNN) ar trebui să fie alegerea ta de bază. În timp ce DNN-urile sunt deja utilizate în multe aplicații de clasificare a imaginilor din lumea reală, acest proiect ML are ca scop să le ridice la un nivel superior.
În acest proiect ML, veți rezolva problema detectării obiectelor prin utilizarea DNN-urilor. Va trebui să dezvoltați un model care poate atât să clasifice obiecte, cât și să localizeze cu acuratețe obiecte din clase diferite. Aici, veți trata sarcina de detectare a obiectelor ca pe o problemă de regresie la măștile de delimitare a obiectelor. De asemenea, veți defini o procedură de inferență pe mai multe scări care poate genera detecții de obiecte de înaltă rezoluție la un cost minim.
Detecția știrilor false
Aceasta este una dintre ideile excelente de proiecte de învățare automată pentru începători, mai ales cum știrile false se răspândesc ca un foc de paie acum. Știrile false au darul de a se răspândi ca un foc de paie. Și, având în vedere că social media ne domină viețile în acest moment, a devenit mai critic ca niciodată să distingem știrile false de evenimentele reale. Aici ne poate ajuta învățarea automată. Facebook folosește deja inteligența artificială pentru a filtra poveștile false și spammate din fluxurile utilizatorilor.
Acest proiect ML își propune să valorifice tehnicile NLP (Natural Language Processing) pentru a detecta știrile false și poveștile înșelătoare care apar din surse de rea-credință. De asemenea, puteți utiliza abordarea clasică de clasificare a textului pentru a proiecta un model care poate face diferența între știrile reale și cele false. În această din urmă metodă, puteți colecta seturi de date atât pentru știri reale, cât și pentru știri false și puteți crea un model ML folosind clasificatorul Naive Bayes pentru a clasifica o știre ca fiind frauduloasă sau reală pe baza cuvintelor și frazelor folosite în ea.
Enrol Email Project
Setul de date de e-mailuri Enron conține aproape 500k de e-mailuri de la peste 150 de utilizatori. Este un set de date extrem de valoros pentru procesarea limbajului natural. Acest proiect presupune construirea unui model ML care utilizează algoritmul de clusterizare k-means pentru a detecta acțiunile frauduloase. Modelul va separa observațiile într-un număr „k” de clustere în funcție de modelele similare din setul de date.
Proiect Parkinson
Setul de date Parkinson include 195 de înregistrări biomedicale ale unor persoane cu 23 de caracteristici variate. Ideea din spatele acestui proiect este de a proiecta un model ML care poate face diferența între persoanele sănătoase și cele care suferă de boala Parkinson. Modelul utilizează algoritmul XGboost (extreme gradient boosting) bazat pe arbori de decizie pentru a face această separare.
Proiect Flickr 30K
Setul de date Flickr 30K este format din peste 30.000 de imagini, fiecare având o legendă unică. Veți utiliza acest set de date pentru a construi un generator de legende pentru imagini. Ideea este de a construi un model CNN care poate analiza și extrage în mod eficient caracteristicile unei imagini și de a crea o legendă adecvată care să descrie imaginea în limba engleză.
Mall customers project
Așa cum sugerează și numele, setul de date privind clienții mall-ului include înregistrările persoanelor care au vizitat mall-ul, cum ar fi sexul, vârsta, ID-ul clientului, venitul anual, scorul de cheltuieli etc. Veți construi un model care va utiliza aceste date pentru a segmenta clienții în diferite grupuri pe baza tiparelor lor de comportament. O astfel de segmentare a clienților este o tactică de marketing extrem de utilă, utilizată de mărci și comercianți pentru a crește vânzările și veniturile, sporind în același timp satisfacția clienților.
Proiect Kinetics
Pentru acest proiect, veți utiliza un set de date extins care include trei seturi de date separate – Kinetics 400, Kinetics 600 și Kinetics 700 – care conțin linkuri URL de peste 6,5 milioane de videoclipuri de înaltă calitate. Scopul dvs. este de a crea un model care poate detecta și identifica acțiunile unui om prin studierea unei serii de observații diferite.
Proiect de sistem de recomandări
Aceasta este o colecție bogată de seturi de date care conține o gamă diversă de seturi de date colectate de pe site-uri web populare, cum ar fi recenzii de cărți Goodreads, recenzii de produse Amazon, social media etc. Scopul dvs. este de a construi un motor de recomandare (precum cele utilizate de Amazon și Netflix) care poate genera recomandări personalizate pentru produse, filme, muzică etc., pe baza preferințelor, nevoilor și comportamentului online al clienților.
Proiectul privind locuințele din Boston
Setul de date privind locuințele din Boston constă în detalii despre diferite case din Boston, pe baza unor factori precum rata de impozitare, rata criminalității, numărul de camere dintr-o casă etc. Este un set de date excelent pentru a prezice prețurile diferitelor case din Boston. În acest proiect, veți construi un model care poate prezice prețul unei case noi folosind regresia liniară. Regresia liniară este cea mai potrivită pentru acest proiect, deoarece este utilizată atunci când datele au o relație liniară între valorile de intrare și cele de ieșire și când datele de intrare sunt necunoscute.
Proiectul Cityscapes
Acest set de date open-source include adnotări de înaltă calitate la nivel de pixel ale secvențelor video colectate de pe străzile din 50 de orașe diferite. Este extrem de util pentru analiza semantică. Puteți utiliza acest set de date pentru a antrena rețele neuronale profunde pentru a analiza și înțelege peisajul urban. Proiectul presupune proiectarea unui model care poate efectua segmentarea imaginilor și poate identifica diverse obiecte (mașini, autobuze, camioane, copaci, drumuri, oameni etc.) dintr-o secvență video stradală.
Proiectul YouTube 8M
Proiectul Youtube 8M este un set de date uriaș care are 6,1 milioane de ID-uri video YouTube, 350.000 de ore de video, 2,6 miliarde de caracteristici audio/vizuale, 3862 de clase și o medie de 3 etichete pentru fiecare video. Acesta este utilizat pe scară largă pentru proiecte de clasificare video. În cadrul acestui proiect, veți construi un sistem de clasificare video care poate descrie cu exactitate un videoclip. Acesta va lua în considerare o serie de intrări diferite și va clasifica videoclipurile în categorii separate.
Urban sound 8K
Setul de date urban sound 8K este utilizat pentru clasificarea sunetului. Acesta include o colecție diversă de 8732 de sunete urbane aparținând unor clase diferite, cum ar fi sirene, muzică de stradă, lătratul câinilor, ciripitul păsărilor, vorbitul oamenilor etc. Veți proiecta un model de clasificare a sunetelor care poate detecta automat ce sunet urban se redă în
Proiect IMDB-Wiki
Acest set de date etichetate este probabil una dintre cele mai extinse colecții de imagini de fețe colectate de pe IMDB și Wikipedia. Are peste 5 milioane de imagini de fețe etichetate cu vârsta și sexul. cu sexul și vârsta etichetate. Veți crea un model care poate detecta fețele și le poate prezice cu precizie vârsta și sexul. Puteți crea diferite segmente/intervale de vârstă, cum ar fi 0-10, 10-20, 30-40 și așa mai departe.
Proiect Librispeech
Setul de date librispeech este o colecție masivă de discursuri în limba engleză derivate din proiectul LibriVox. Acesta conține discursuri în limba engleză citite în diferite accente care se întind pe o perioadă de peste 1000 de ore și este instrumentul perfect pentru recunoașterea vorbirii. Obiectivul acestui proiect este de a crea un model care poate traduce automat audio în text. Veți construi un sistem de recunoaștere vocală care poate detecta discursul în limba engleză și îl poate traduce în format text.
Proiectul GTSRB (German traffic sign recognition benchmark)
Acest set de date conține peste 50.000 de imagini de semne de circulație segmentate în 43 de clase și care conțin informații despre caseta de delimitare a fiecărui semn de circulație. Este ideal pentru clasificarea multiclasă, care este exact ceea ce vă veți concentra aici. Veți construi un model utilizând un cadru de învățare profundă care poate recunoaște caseta delimitatoare a semnelor și poate clasifica semnele de circulație. Proiectul poate fi extrem de util pentru vehiculele autonome, deoarece detectează semnele și îi ajută pe șoferi să ia măsurile necesare.
29. Rezumatul textului video al unui meci sportiv
Acest proiect este exact așa cum sună – obținerea unui rezumat precis și concis al unui videoclip sportiv. Este un instrument util pentru site-urile de sport care informează cititorii cu privire la momentele importante ale meciului. Deoarece rețelele neuronale sunt cele mai bune pentru rezumarea textului, veți construi acest model utilizând rețele de învățare profundă, cum ar fi 3D-CNN, RNN și LSTM. Mai întâi veți fragmenta un videoclip sportiv în mai multe secțiuni utilizând algoritmi ML corespunzători și apoi veți folosi o combinație de SVM (mașini vectoriale de suport), rețele neuronale și algoritmul k-means.
30. Generator de rezumate pentru întâlniri de afaceri
Sumarizarea presupune extragerea celor mai semnificative și valoroase fragmente de informații din conversații, fișiere audio/video etc., în mod scurt și concis. În general, se realizează prin capturarea caracteristicilor statistice, lingvistice și sentimentale cu structura dialogului conversației în cauză. În acest proiect, veți utiliza tehnici de învățare profundă și de procesare a limbajului natural pentru a crea rezumate precise ale întâlnirilor de afaceri, păstrând în același timp contextul întregii conversații.
31. Analiza sentimentelor pentru depresie
Depresia este o problemă majoră de sănătate la nivel global. În fiecare an, milioane de oameni se sinucid din cauza depresiei și a sănătății mintale precare. De obicei, stigmatul atașat problemelor de sănătate mintală și tratamentul întârziat sunt cele două cauze principale care stau la baza acestei situații. În acest proiect, veți valorifica datele colectate de pe diferite platforme de social media și veți analiza markerii lingvistici din postările din social media pentru a înțelege sănătatea mintală a indivizilor. Ideea este de a crea un model de învățare profundă care poate oferi informații valoroase și precise despre sănătatea mintală a unei persoane mult mai devreme decât metodele convenționale.
32. Rezolvarea ecuațiilor scrise de mână
Recunoașterea expresiilor matematice scrise de mână este un domeniu de studiu crucial în cercetarea în domeniul vederii computerizate. Veți construi un model și îl veți antrena pentru a rezolva ecuații matematice scrise de mână folosind rețele neuronale convoluționale. Modelul va utiliza, de asemenea, tehnici de prelucrare a imaginilor. Acest proiect presupune antrenarea modelului cu datele potrivite pentru a-l face expert în citirea cifrelor scrise de mână, a simbolurilor etc., pentru a furniza rezultate corecte pentru ecuații matematice de diferite niveluri de complexitate.
33. Recunoașterea facială pentru a detecta starea de spirit și a recomanda melodii
Este cunoscut faptul că oamenii ascultă muzică în funcție de starea lor de spirit și de sentimentele actuale. Așadar, de ce să nu creăm o aplicație care să poată detecta starea de spirit a unei persoane după expresiile sale faciale și să recomande melodii în consecință? Pentru aceasta, veți utiliza elemente și tehnici de viziune computerizată. Scopul este de a crea un model care poate valorifica în mod eficient viziunea computerizată pentru a ajuta computerele să obțină o înțelegere la nivel înalt a imaginilor și videoclipurilor.
34. Generator de muzică
O compoziție muzicală nu este altceva decât o combinație melodică de diferite niveluri de frecvență. În acest proiect, veți proiecta un generator automat de muzică care poate compune piese muzicale scurte cu o intervenție umană minimă. Veți utiliza algoritmi de învățare profundă și rețele LTSM pentru construirea acestui generator de muzică.
35. Sistem de predicție a bolilor
Acest proiect ML este conceput pentru a prezice bolile. Veți crea acest model utilizând R și R Studio și setul de date Breast Cancer Wisconsin (Diagnostic). Acest set de date include două clase de predictori – masă mamară benignă și malignă. Este esențial să aveți cunoștințe de bază despre pădurile aleatoare și XGBoost pentru a lucra la acest proiect.
36. Găsirea unei exoplanete locuibile
În ultimul deceniu, am reușit să identificăm multe planete în tranzit și exoplanete. Deoarece interpretarea manuală a potențialelor exoplanete este destul de dificilă și consumatoare de timp (să nu uităm că este, de asemenea, supusă erorilor umane), cel mai bine este să folosim învățarea profundă pentru a identifica exoplanete. Acest proiect își propune să afle dacă există exoplanete locuibile în jurul nostru folosind CNN-uri și date zgomotoase din serii temporale. Această metodă poate identifica exoplanetele locuibile cu mai multă precizie decât metoda celor mai mici pătrate.
37. Regenerarea imaginilor pentru bobine vechi & deteriorate
Restaurarea bobinelor de film vechi sau deteriorate este o sarcină dificilă. Este aproape întotdeauna imposibil să se restabilească fotografiile vechi la starea lor originală. Cu toate acestea, învățarea profundă poate rezolva această problemă. Veți construi un model de învățare profundă care poate identifica defectele unei imagini (zgârieturi, găuri, pliuri, decolorări etc.) și care, cu ajutorul algoritmilor de Inpainting, o va restaura. Puteți chiar să colorați imagini vechi B&W.
Proiecte industriale din lumea reală
Magenta
Acest proiect de cercetare se concentrează pe explorarea aplicațiilor învățării automate în procesul de creare a artei și a muzicii. Veți dezvolta algoritmi unici de învățare prin întărire și de învățare profundă care pot genera imagini, cântece, muzică și multe altele. Este un proiect perfect pentru mințile creative pasionate de artă și muzică.
BluEx
BluEx se numără printre cele mai importante companii de logistică din India, care și-a dezvoltat o bază de fani, datorită livrărilor sale rapide și eficiente. Cu toate acestea, la fel ca în cazul tuturor furnizorilor de logistică, BluEx se confruntă cu o anumită provocare care costă atât timp, cât și bani – șoferii săi nu frecventează traseele optime de livrare, ceea ce cauzează întârzieri și duce la creșterea costurilor cu combustibilul. Veți crea un model ML folosind învățarea prin întărire care poate găsi cea mai eficientă cale pentru o anumită locație de livrare. Acest lucru poate economisi până la 15% din costul combustibilului pentru BluEx.
Motion Studios
Motion Studios se mândrește cu faptul că este cea mai mare casă de producție radiofonică din Europa, cu venituri de peste un miliard de dolari. De când compania media și-a lansat reality show-ul, RJ Star, a primit un răspuns fenomenal și este inundată de clipuri vocale. Fiind un reality show, există o fereastră de timp limitată pentru alegerea candidaților. Veți construi un model care poate face diferența între vocile masculine și feminine și va clasifica clipurile vocale pentru a facilita o filtrare mai rapidă. Acest lucru va ajuta la o selecție mai rapidă, ușurând sarcina directorilor emisiunii.
LithionPower
Lithionpower construiește baterii pentru vehicule electrice. De obicei, șoferii închiriază bateriile companiei pentru o zi și le înlocuiesc cu o baterie încărcată. Durata de viață a bateriei depinde de factori precum distanța parcursă/zi, depășirea vitezei, etc. LithionPower utilizează un model de stabilire a prețurilor variabil în funcție de istoricul de conducere al șoferului. Scopul acestui proiect este de a construi un model de clustere care să grupeze șoferii în funcție de istoricul lor de conducere și să stimuleze șoferii în funcție de aceste clustere. În timp ce acest lucru va crește profiturile cu 15-20%, se va percepe, de asemenea, mai mult de la șoferii care au un istoric de conducere slab.
Concluzie
Iată o listă completă de idei de proiecte de învățare automată. Învățarea automată se află încă într-un stadiu incipient în întreaga lume. Există o mulțime de proiecte de realizat și multe de îmbunătățit. Cu minți inteligente și idei ascuțite, sistemele care sprijină afacerile devin mai bune, mai rapide și mai profitabile. Dacă doriți să excelați în Machine Learning, trebuie să adunați experiență practică cu astfel de proiecte de învățare automată.
Doar lucrând cu instrumente ML și algoritmi ML puteți înțelege cum funcționează infrastructurile ML în realitate. Acum mergeți mai departe și puneți la încercare toate cunoștințele pe care le-ați adunat prin intermediul ghidului nostru de idei de proiecte de învățare automată pentru a vă construi propriile proiecte de învățare automată!
Cât de ușor este să implementați aceste proiecte?
Aceste proiecte sunt foarte de bază, cineva cu o bună cunoaștere a învățării automate poate reuși cu ușurință să aleagă și să finalizeze oricare dintre aceste proiecte.
Pot face aceste proiecte în cadrul unui stagiu de ML?
Da, așa cum am menționat, aceste idei de proiecte sunt practic pentru studenți sau începători. Există o mare posibilitate să ajungeți să lucrați la oricare dintre aceste idei de proiect în timpul stagiului dumneavoastră.
De ce trebuie să construim proiecte de învățare automată?
Când vine vorba de cariere în dezvoltarea de software, este o necesitate pentru dezvoltatorii aspiranți să lucreze la propriile proiecte. Dezvoltarea de proiecte din lumea reală este cel mai bun mod de a vă perfecționa abilitățile și de a materializa cunoștințele teoretice în experiență practică.
Conduceți revoluția tehnologică condusă de AI
Aflați mai multe
.