15 érdekes gépi tanulási projektötlet kezdőknek [2021]

author
33 minutes, 43 seconds Read

Tartalomjegyzék

Gépi tanulási projektötletek

Amint a mesterséges intelligencia (AI) 2021-ben továbbra is gyorsan fejlődik, a gépi tanulás (ML) elsajátítása egyre fontosabbá válik a terület minden szereplője számára. Ennek oka, hogy mind a mesterséges intelligencia, mind az ML kiegészíti egymást. Tehát, ha kezdő vagy, a legjobb, amit tehetsz, hogy néhány Machine Learning-projekten dolgozol.

Mi itt az upGradnál a gyakorlati megközelítésben hiszünk, mivel az elméleti tudás önmagában nem segít a valós idejű munkakörnyezetben. Ebben a cikkben néhány érdekes Machine Learning projektet fogunk feltárni, amelyeken a kezdők is dolgozhatnak, hogy próbára tegyék Machine Learning tudásukat. Ebben a cikkben 15 legjobb gépi tanulási projektötletet találsz, amelyekkel a kezdők gyakorlati tapasztalatokat szerezhetnek.

De előbb foglalkozzunk a lényegesebb kérdéssel, amely biztosan ott lappang a fejedben: miért érdemes gépi tanulási projekteket készíteni?

Amikor a szoftverfejlesztői karrierről van szó, a feltörekvő fejlesztők számára elengedhetetlen, hogy saját projekteken dolgozzanak. A valós projektek fejlesztése a legjobb módja annak, hogy csiszolja készségeit, és az elméleti tudást gyakorlati tapasztalatokká materializálja. Minél többet kísérletezel különböző Machine Learning projektekkel, annál több tudásra teszel szert.

Míg a tankönyvek és a tananyagok minden szükséges tudást megadnak a Machine Learningről, addig az ML-t sosem sajátíthatod el igazán, ha nem fekteted az idődet valós gyakorlati kísérletekbe – a Machine Learningre vonatkozó projektekbe. Ahogy elkezd dolgozni a gépi tanulási projektötleteken, nemcsak az erősségeidet és gyengeségeidet tesztelheted, hanem olyan tapasztalatokat is szerezhetsz, amelyek rendkívül hasznosak lehetnek a karriered fellendítéséhez. Ebben az útmutatóban 15 érdekes gépi tanulási projektötletet találsz kezdők számára, hogy gyakorlati tapasztalatot szerezhess a gépi tanulással kapcsolatban.

Íme tehát néhány gépi tanulási projekt, amelyen kezdők is dolgozhatnak:

Itt van néhány menő gépi tanulási projektötlet kezdőknek

Nézze meg a gépi tanulási projektötletekről és témákról szóló videónkat…

A gépi tanulási projektötletek diákoknak című lista kezdőknek, illetve azoknak alkalmas, akik most kezdik a gépi tanulást vagy általában az adattudományt. Ezek a gépi tanulási projektötletek beindítják Önt minden olyan gyakorlati dologgal, amire szüksége van ahhoz, hogy sikeres legyen a gépi tanulással foglalkozó szakember karrierje. Ezeknek a gépi tanulási projekteknek a középpontjában a kezdőknek szóló gépi tanulási algoritmusok állnak, azaz olyan algoritmusok, amelyek nem igénylik a gépi tanulás mély megértését, és ezért tökéletesek a diákok és a kezdők számára.

Tovább, ha gépi tanulási projektötleteket keres a végzősök számára, ez a lista kell, hogy elindítsa Önt. Szóval, minden további nélkül ugorjunk egyenesen néhány Machine Learning projektötletre, amelyek megerősítik a bázisát, és lehetővé teszik, hogy feljebb lépjen a ranglétrán.

Stock Prices Predictor

Az egyik legjobb ötlet, hogy elkezdje kísérletezni a gyakorlatias Machine Learning projekteket a diákok számára, a Stock Prices Predictorral való munka. Az üzleti szervezetek és a vállalatok ma olyan szoftvereket keresnek, amelyek figyelemmel kísérik és elemzik a vállalat teljesítményét, és megjósolják a különböző részvények jövőbeli árait. És mivel annyi adat áll rendelkezésre a tőzsdén, ez a lehetőségek melegágya a pénzügyekre hajlamos adattudósok számára.

Mielőtt azonban belevágna, rendelkeznie kell megfelelő ismeretekkel a következő területeken:

  • Előrejelző elemzés: Különböző AI-technikák kihasználása különböző adatfolyamatoknál, mint például adatbányászat, adatfeltárás stb. a lehetséges eredmények viselkedésének “előrejelzésére”.
  • Regressziós elemzés: A regressziós elemzés egyfajta előrejelző technika, amely a függő (cél) és a független változó(k) (prediktor) közötti kölcsönhatáson alapul.
  • Akcióelemzés: Ebben a módszerben a fent említett két technika által végrehajtott összes műveletet elemzik, majd az eredményt betáplálják a gépi tanulás memóriájába.
  • Statisztikai modellezés: Ez magában foglalja egy valós világbeli folyamat matematikai leírásának felépítését és a folyamaton belüli bizonytalanságok kidolgozását, ha vannak ilyenek.

Mi az a gépi tanulás és miért fontos

SportsPredictor

Michael Lewis Moneyball című könyvében az Oakland Athletics csapata megváltoztatta a baseball arculatát azzal, hogy analitikus játékosmegfigyelési technikát épített be játéktervébe. És ahogy ők, úgy te is forradalmasíthatod a sportot a való világban! Ez egy kiváló gépi tanulási projekt kezdőknek.

Mivel a sportvilágban nincs hiány adatokból, ezeket az adatokat felhasználhatja szórakoztató és kreatív gépi tanulási projektek létrehozására, például az egyetemi sportstatisztikák felhasználására, hogy megjósolja, melyik játékos milyen sportágban futná be a legjobb karriert (tehetségkutatás). A csapatmenedzsment javítását is választhatja a csapatban lévő játékosok erősségeinek és gyengeségeinek elemzésével és megfelelő osztályozásával.

A rendelkezésre álló sportstatisztikák és adatok mennyisége miatt ez egy kiváló terep az adatfeltárási és vizualizációs készségek csiszolására. Akinek van érzéke a Pythonhoz, annak a Scikit-Learn lesz az ideális választás, mivel számos hasznos eszközt tartalmaz regresszióelemzéshez, osztályozáshoz, adatbevitelhez és így tovább. A gépi tanulási projektek megemlítése az utolsó évben segíthet abban, hogy önéletrajza sokkal érdekesebbnek tűnjön, mint másoké.

6 Times Artificial Intelligence Startled The World

Develop A Sentiment Analyzer

Ez az egyik érdekes gépi tanulási projektötlet. Bár a legtöbben a közösségi médiaplatformokat arra használjuk, hogy személyes érzéseinket és véleményünket a világ elé tárjuk, az egyik legnagyobb kihívás a közösségi média posztok mögötti “érzelmek” megértése.

És ez a tökéletes ötlet a következő gépi tanulási projektedhez!

A közösségi média rengeteg felhasználó által generált tartalommal virágzik. Egy olyan ML-rendszer létrehozásával, amely képes lenne elemezni a szövegek, vagy egy poszt mögötti érzelmeket, a szervezetek számára sokkal könnyebbé válna a fogyasztói viselkedés megértése. Ez pedig lehetővé tenné számukra, hogy javítsák az ügyfélszolgálatukat, ezáltal teret adva az optimális fogyasztói elégedettségnek.

Megpróbálhatja bányászni a Twitter vagy a Reddit adatait, hogy elkezdhesse a hangulatelemző gépi tanulási projektjét. Ez lehet a mélytanulási projektek azon ritka eseteinek egyike, amelyek más szempontból is segíthetnek Önnek.

Az egészségügy javítása

Az AI és az ML alkalmazások már elkezdtek behatolni az egészségügyi ágazatba, és gyorsan átalakítják a globális egészségügyi ellátás arculatát is. Az egészségügyi viselhető eszközök, a távfelügyelet, a telemedicina, a robotsebészet stb. mind-mind az AI által működtetett gépi tanulási algoritmusoknak köszönhetően válnak lehetővé. Ezek nemcsak a HCP-ket (egészségügyi szolgáltatókat) segítik a gyors és jobb egészségügyi szolgáltatások nyújtásában, hanem jelentős mértékben csökkentik az orvosok függőségét és munkaterhelését is.

Miért ne használná tehát képességeit egy lenyűgöző, az egészségügyön alapuló gépi tanulási projekt kidolgozására? A kezdőknek szóló gépi tanulási algoritmusokkal foglalkozó projekt kezelése hasznos lehet ahhoz, hogy karrierjét jó kezdéssel építse.

Az egészségügyi ágazat hatalmas mennyiségű adattal rendelkezik. Ezen adatok hasznosításával létrehozhat:

  • Diagnosztikai ellátórendszereket, amelyek automatikusan beolvassák a képeket, röntgenfelvételeket stb. és pontos diagnózist állíthatnak fel a lehetséges betegségekről.
  • Megelőző ellátó alkalmazások, amelyek képesek megjósolni az olyan járványok lehetőségeit, mint az influenza, malária stb, mind nemzeti, mind közösségi szinten.

Ez a 6 gépi tanulási technika javítja az egészségügyet

Készítsünk ML-algoritmusokat – a semmiből!

Ez az egyik kiváló gépi tanulási projektötlet kezdőknek. Az ML-algoritmusok nulláról való megírása kettős előnnyel jár:

  • Egyrészt, az ML-algoritmusok megírása a legjobb módja annak, hogy megértsd a mechanikájuk csínját-bínját.
  • Kettő, megtanulod, hogyan alakítsd át a matematikai utasításokat funkcionális kóddá. Ez a készség jól fog jönni a gépi tanulással kapcsolatos jövőbeli karriered során.

Azzal kezdheted, hogy olyan algoritmust választasz, amely egyszerű és nem túl bonyolult. Minden algoritmus készítése mögött – még a legegyszerűbbek mögött is – számos gondosan kiszámított döntés áll. Ha már elértél egy bizonyos szintű mesteri szintet az egyszerű ML-algoritmusok építésében, próbáld meg finomítani és bővíteni a funkcionalitásukat. Például foghatsz egy vanília logisztikus regressziós algoritmust, és hozzáadhatsz regularizációs paramétereket, hogy átalakítsd egy lasso/híd regressziós algoritmussá. A gépi tanulási projektek megemlítése segíthet abban, hogy önéletrajza sokkal érdekesebbnek tűnjön másoknál.

Develop A Neural Network That Can Read Handwriting

A neurális hálózaton való munka az egyik legjobb ötlet arra, hogy kísérletezni kezdjen a gyakorlati Java-projektekkel diákoknak. A mélytanulás és a neurális hálózatok a két aktuális divatszó a mesterséges intelligenciában. Ezek olyan technológiai csodákat adtak nekünk, mint a vezető nélküli autók, a képfelismerés és így tovább.
Szóval itt az ideje, hogy felfedezzük a neurális hálózatok arénáját. Kezdje neurális hálózati gépi tanulási projektjét az MNIST kézzel írt számjegyek osztályozási kihívásával. Nagyon felhasználóbarát felülettel rendelkezik, amely ideális a kezdők számára.

Gépi tanulással foglalkozó mérnökök: Myths vs. Realities

Movie Ticket Pricing System

Az OTT platformok, mint a Netflix, Amazon Prime terjedésével az emberek inkább a saját kényelmüknek megfelelő tartalmakat nézik. Az olyan tényezők, mint az árképzés, a tartalom minősége & a marketing befolyásolták e platformok sikerét.

Egy egész estés film elkészítésének költségei exponenciálisan megugrottak az elmúlt időszakban. Az elkészült filmeknek csupán 10%-a termel nyereséget. A televíziós & OTT platformok kemény versenye a magas jegyárakkal együtt még nehezebbé tette a filmek pénzkeresését. A mozijegy árának emelkedése (a popcorn költségével együtt) üresen hagyja a mozitermeket.

Egy fejlett jegyárrendszer mindenképpen segíthet a filmkészítőknek és a nézőknek. A jegyár a jegy iránti kereslet növekedésével magasabb lehet, és fordítva. Minél korábban foglalja le a néző a jegyet, annál kisebb a költség, egy nagy keresletű film esetében. A rendszernek okosan kell kiszámítania az árképzést a nézők érdeklődésétől, a társadalmi jelektől és a kereslet-kínálati tényezőktől függően.

Iris Flowers osztályozási ML projekt

Az egyik legjobb ötlet, hogy elkezdjünk kísérletezni a gyakorlati gépi tanulási projektekkel a diákok számára, az Iris Flowers osztályozási ML projekten való munka. Az Iris flowers adatkészlet az egyik legjobb adatkészlet az osztályozási feladatokhoz. Mivel az íriszvirágok változatos fajokból állnak, megkülönböztethetők a sepalisok és a szirmok hossza alapján. Ennek az ML-projektnek a célja a virágok osztályozása a három faj – Virginica, Setosa vagy Versicolor – között.

Ezt a konkrét ML-projektet a gépi tanulás “Hello World”-jeként szokták emlegetni. Az íriszvirágok adatkészlet numerikus attribútumokat tartalmaz, és tökéletes a kezdők számára, hogy megtanulják a felügyelt ML algoritmusokat, főként az adatok betöltését és kezelését. Továbbá, mivel ez egy kis adatkészlet, könnyen elfér a memóriában anélkül, hogy speciális transzformációkat vagy skálázási képességeket igényelne. És ez a tökéletes ötlet a következő gépi tanulási projektedhez!

Az írisz adatkészletet innen töltheted le.

BigMart Sales Prediction ML Project

Ez egy kiváló ML projektötlet kezdőknek. Ez az ML projekt a legjobb a felügyelet nélküli ML algoritmusok működésének megtanulására. A BigMart értékesítési adatkészlet pontosan 2013-as értékesítési adatokat tartalmaz 1559 termékre vonatkozóan tíz különböző város tíz üzletében.

A célunk az, hogy a BigMart értékesítési adatkészlet segítségével olyan regressziós modellt fejlesszünk ki, amely képes megjósolni az 1559 termék mindegyikének eladását a következő évben a tíz különböző BigMart üzletben. A BigMart értékesítési adatkészlet minden egyes termékre és üzlethelyiségre vonatkozóan konkrét attribútumokat tartalmaz, ezáltal segít megérteni a különböző termékek és üzletek azon tulajdonságait, amelyek befolyásolják a BigMart mint márka általános értékesítését.

Recommendation Engines with MovieLens Dataset

Az ajánlómotorok óriási népszerűségre tettek szert az online vásárlási és streaming oldalakon. Például az olyan online tartalomstreaming platformok, mint a Netflix és a Hulu ajánlómotorokkal rendelkeznek, amelyek az egyéni vásárlói preferenciák és a böngészési előzmények alapján testre szabják tartalmaikat. Azáltal, hogy a tartalmat a különböző ügyfelek nézési igényeihez és preferenciáihoz igazítják, ezek az oldalak képesek voltak növelni a streaming szolgáltatásaik iránti keresletet.

A kezdőként kipróbálhatja magát egy ajánlórendszer létrehozásában az interneten elérhető egyik legnépszerűbb adatkészlet – a MovieLens adatkészlet – segítségével. Ez az adatkészlet több mint “25 millió értékelést és egymillió címkealkalmazást tartalmaz, amelyeket 162 000 felhasználó 62 000 filmre alkalmazott”. Ezt a projektet a filmcímek világfelhő-vizualizációjának létrehozásával kezdheti, hogy filmajánló rendszert készíthessen a MovieLens számára.

A MovieLens-adatkészletet itt tekintheti meg.

Borminőség előrejelzése a Wine Quality Dataset segítségével

Tudott tény, hogy az életkor jobbá teszi a bort – minél idősebb a bor, annál jobb ízű lesz. Az életkor azonban nem az egyetlen dolog, ami meghatározza egy bor ízét. Számos tényező határozza meg a borminősítést, többek között olyan fiziokémiai vizsgálatok, mint az alkohol mennyisége, a fix savtartalom, az illósavtartalom, a sűrűség és a pH-szint, hogy csak néhányat említsünk.

Ebben az ML-projektben egy olyan ML-modellt kell kifejlesztenie, amely képes feltárni egy bor kémiai tulajdonságait, hogy megjósolja a minőségét. A borminőségi adathalmaz, amelyet ehhez a projekthez használni fogsz, körülbelül 4898 megfigyelésből áll, beleértve 11 független változót és egy függő változót. A gépi tanulási projektek megemlítése az utolsó évben segíthet abban, hogy az önéletrajza sokkal érdekesebbnek tűnjön, mint másoké.

MNIST Handwritten Digit Classification

Ez az egyik érdekes gépi tanulási projekt. A mélytanulás és a neurális hálózatok számos valós alkalmazásban találtak felhasználási lehetőséget, például képfelismerésben, automatikus szöveggenerálásban, vezető nélküli autókban és még sok másban. Mielőtt azonban belemerülne a Deep Learning ezen összetett területeibe, érdemes egy olyan egyszerű adatkészlettel kezdeni, mint az MNIST adatkészlet. Miért ne használhatnád a képességeidet egy lenyűgöző gépi tanulási projekt kifejlesztésére az MNIST alapján?

Az MNIST számjegyosztályozási projekt célja, hogy gépeket képezzen ki kézzel írt számjegyek felismerésére. Mivel a kezdőknek általában kihívást jelent a képi adatokkal való munka a sima relációs adatokkal szemben, az MNIST-adatkészlet a legjobb a kezdők számára. Ebben a projektben az MNIST-adatkészleteket fogja használni az ML-modell képzése során a konvolúciós neurális hálózatok (CNN-ek) használatával. Bár az MNIST-adatkészlet zökkenőmentesen elfér a számítógép memóriájában (nagyon kicsi), a kézzel írt számjegyek felismerésének feladata elég nagy kihívást jelent.

Az MNIST-adatkészletet itt érheti el.

Human Activity Recognition using Smartphone Dataset

Ez az egyik trendi gépi tanulási projektötlet. Az okostelefon-adatkészlet 30 ember fitnesztevékenységi rekordját és információit tartalmazza. Ezeket az adatokat egy inerciális érzékelőkkel felszerelt okostelefonon keresztül rögzítették.

Ez az ML-projekt célja egy olyan osztályozási modell létrehozása, amely nagy pontossággal képes azonosítani az emberi fitnesztevékenységeket. Ezen az ML-projekten dolgozva megtanulod az osztályozás alapjait, és azt is, hogyan kell több osztályozási problémát megoldani.

14. Objektumfelismerés mélytanulással

Ez az egyik legérdekesebb gépi tanulási projekt, amit létrehozhatunk. Ha képosztályozásról van szó, a mély neurális hálózatok (DNN-ek) legyenek az Ön választása. Míg a DNN-eket már számos valós képosztályozási alkalmazásban használják, ennek az ML-projektnek a célja, hogy felpörgesse azt.

Ezzel az ML-projekttel a DNN-ek felhasználásával fogod megoldani a tárgyfelismerés problémáját. Olyan modellt kell majd kifejlesztened, amely képes mind az objektumok osztályozására, mind pedig a különböző osztályú objektumok pontos lokalizálására. Itt az objektumfelismerés feladatát az objektumok határoló dobozának maszkjaira vonatkozó regressziós problémaként fogod kezelni. Emellett egy olyan több skálájú következtetési eljárást fog meghatározni, amely minimális költséggel képes nagy felbontású objektumdetektálást generálni.

Fake News Detection

Ez az egyik kiváló gépi tanulási projektötlet kezdőknek, különösen, hogy mostanában futótűzként terjednek az álhírek. Az álhírek úgy terjednek, mint a futótűz. És mivel a közösségi média mostanában uralja az életünket, minden eddiginél fontosabbá vált, hogy megkülönböztessük az álhíreket a valódi híreseményektől. Ebben segíthet a gépi tanulás. A Facebook már most is mesterséges intelligenciát használ arra, hogy kiszűrje a hamis és spammelő történeteket a felhasználók hírfolyamából.

Ez az ML-projekt célja az NLP (természetes nyelvfeldolgozási) technikák felhasználása a nem hiteles forrásokból származó álhírek és félrevezető történetek felismerésére. A klasszikus szövegosztályozási megközelítést is felhasználhatja egy olyan modell megtervezéséhez, amely képes különbséget tenni a valódi és az álhírek között. Az utóbbi módszer során valódi és hamis hírekre egyaránt gyűjthetünk adathalmazokat, és a Naive Bayes osztályozót használva létrehozhatunk egy ML-modellt, amely a benne használt szavak és kifejezések alapján hamisnak vagy valódinak minősíti a híreket.

Enron Email Project

Az Enron e-mail adathalmaz több mint 150 felhasználó közel 500 ezer e-mailjét tartalmazza. Ez egy rendkívül értékes adathalmaz a természetes nyelvi feldolgozáshoz. Ez a projekt egy ML modell építését foglalja magában, amely a k-means klaszterező algoritmust használja a csalárd cselekmények felismerésére. A modell a megfigyeléseket “k” számú klaszterekbe sorolja az adathalmazban található hasonló minták alapján.

Parkinson-projekt

A Parkinson-adatkészlet 195 biogyógyászati rekordot tartalmaz 23 különböző tulajdonságú emberről. A projekt lényege egy olyan ML-modell megtervezése, amely képes különbséget tenni az egészséges emberek és a Parkinson-kórban szenvedők között. A modell az XGboost (extreme gradient boosting) algoritmust használja döntési fákra alapozva a szétválasztáshoz.

Flickr 30K projekt

A Flickr 30K adathalmaz több mint 30 000 képből áll, amelyek mindegyike egyedi felirattal rendelkezik. Ezt az adathalmazt fogja felhasználni egy képfelirat-generátor elkészítéséhez. A cél egy olyan CNN-modell létrehozása, amely képes hatékonyan elemezni és kivonni a kép jellemzőit, és létrehozni egy megfelelő, a képet angolul leíró feliratot.

Mall customers project

Amint a neve is mutatja, a plázavásárlói adathalmaz a plázát látogató emberek adatait tartalmazza, mint például a nem, kor, vásárlói azonosító, éves jövedelem, költési pontszám, stb. Ön egy olyan modellt fog építeni, amely ezeket az adatokat felhasználva különböző csoportokba szegmentálja a vásárlókat viselkedési mintáik alapján. Az ilyen ügyfélszegmentálás rendkívül hasznos marketing taktika, amelyet a márkák és a marketingesek az értékesítés és a bevétel növelésére használnak, miközben növelik az ügyfelek elégedettségét is.

Kinetika projekt

Ezért a projektért egy kiterjedt adathalmazt fog használni, amely három különálló adathalmazt – Kinetika 400, Kinetika 600 és Kinetika 700 – tartalmaz, és több mint 6,5 millió kiváló minőségű videó URL-linkjét tartalmazza. A célod egy olyan modell létrehozása, amely képes felismerni és azonosítani egy ember cselekedeteit különböző megfigyelések sorozatának tanulmányozásával.

Elismerési rendszer projekt

Ez egy gazdag adathalmazgyűjtemény, amely népszerű webhelyekről, például a Goodreads könyvismertetőkről, az Amazon termékértékelésekről, a közösségi médiáról stb. gyűjtött sokféle adathalmazt tartalmaz. A cél egy olyan ajánlómotor létrehozása (mint amilyet az Amazon és a Netflix használ), amely képes személyre szabott ajánlásokat generálni termékekre, filmekre, zenékre stb. az ügyfelek preferenciái, igényei és online viselkedése alapján.

A bostoni lakásprojekt

A bostoni lakásadatkészlet a különböző bostoni házak adatait tartalmazza olyan tényezők alapján, mint az adókulcs, a bűnözési ráta, a házban lévő szobák száma stb. Ez egy kiváló adatkészlet a különböző bostoni házak árainak előrejelzésére. Ebben a projektben egy olyan modellt fog építeni, amely lineáris regresszió segítségével képes megjósolni egy új ház árát. A lineáris regresszió a legalkalmasabb erre a projektre, mivel akkor használható, ha az adatok lineáris kapcsolatban állnak a bemeneti és a kimeneti értékek között, és ha a bemenet ismeretlen.

Cityscapes projekt

Ez a nyílt forráskódú adathalmaz 50 különböző város utcáiról gyűjtött videószekvenciák kiváló minőségű, pixel szintű megjegyzéseit tartalmazza. Rendkívül hasznos a szemantikai elemzéshez. Ezt az adathalmazt mély neurális hálók betanítására használhatja a városi városkép elemzésére és megértésére. A projekt keretében olyan modellt tervezünk, amely képes képszegmentálást végezni és különböző objektumokat (autók, buszok, teherautók, fák, utak, emberek stb.) azonosítani egy utcai videószekvenciából.

YouTube 8M projekt

A Youtube 8M egy hatalmas adathalmaz, amely 6,1 millió Youtube videó azonosítót, 350 000 órányi videót, 2,6 milliárd audio/vizuális jellemzőt, 3862 osztályt és átlagosan 3 címkét tartalmaz minden egyes videóhoz. Széles körben használják videóosztályozási projektekhez. Ebben a projektben egy olyan videóosztályozó rendszert fogsz létrehozni, amely képes pontosan leírni egy videót. Egy sor különböző bemenetet fog figyelembe venni, és a videókat külön kategóriákba fogja besorolni.

Városi hang 8K

A városi hang 8K adathalmaz hangok osztályozására szolgál. Ez 8732 városi hang változatos gyűjteményét tartalmazza, amelyek különböző osztályokhoz tartoznak, például szirénák, utcazene, kutyaugatás, madárcsicsergés, emberek beszélgetése stb. Olyan hangosztályozó modellt tervezel, amely képes automatikusan felismerni, hogy melyik városi hang szól a

IMDB-Wiki projekt

Ez a címkézett adathalmaz valószínűleg az egyik legkiterjedtebb arcképgyűjtemény, amelyet az IMDB és a Wikipédia egészéből gyűjtöttek össze. Több mint 5 millió, életkorral és nemmel címkézett arcképet tartalmaz. címkézett nemmel és életkorral. Olyan modellt fogsz létrehozni, amely képes arcokat felismerni, és pontosan megjósolni az életkorukat és a nemüket. Különböző életkori szegmenseket/tartományokat hozhat létre, mint például 0-10, 10-20, 30-40, stb.

Librispeech projekt

A librispeech adathalmaz a LibriVox projektből származó angol beszédek hatalmas gyűjteménye. Több mint 1000 órányi angolul felolvasott beszédet tartalmaz különböző akcentusokban, és tökéletes eszköz a beszédfelismeréshez. A projekt középpontjában egy olyan modell létrehozása áll, amely képes a hangot automatikusan szöveggé fordítani. Olyan beszédfelismerő rendszert fogsz építeni, amely képes felismerni az angol beszédet és lefordítani azt szöveges formátumra.

German traffic sign recognition benchmark (GTSRB) project

Ez az adathalmaz több mint 50 000 közlekedési tábla képét tartalmazza 43 osztályba szegmentálva, és tartalmazza az egyes közlekedési táblák határoló dobozára vonatkozó információkat. Ideális a többosztályos osztályozáshoz, amire itt pontosan összpontosítani fog. Egy olyan modellt fogsz építeni egy mélytanulási keretrendszer segítségével, amely képes felismerni a táblák határoló dobozát és osztályozni a közlekedési táblákat. A projekt rendkívül hasznos lehet az autonóm járművek számára, mivel felismeri a táblákat, és segíti a járművezetőket a szükséges lépések megtételében.

29. Sportmeccsvideó szöveges összefoglalása

Ez a projekt pontosan arról szól, ahogyan hangzik: pontos és tömör összefoglalót kapunk egy sportvideóról. Hasznos eszköz olyan sportoldalak számára, amelyek tájékoztatják az olvasókat a mérkőzés csúcspontjairól. Mivel a neurális hálózatok a legjobbak a szöveges összegzéshez, ezt a modellt mély tanulási hálózatokkal, például 3D-CNN-ekkel, RNN-ekkel és LSTM-ekkel fogod felépíteni. Először egy sportvideót több részre fogsz feldarabolni a megfelelő ML algoritmusok segítségével, majd az SVM(Support vector machines), a neurális hálózatok és a k-means algoritmus kombinációját fogod használni.

30. Üzleti megbeszélés összefoglaló generátor

Az összegzés magában foglalja a beszélgetésekből, audio/videofájlokból stb. a legjelentősebb és legértékesebb információdarabok rövid és tömör kivonatát. Ez általában a statisztikai, nyelvi és érzelmi vonások jellemzőinek rögzítésével történik a szóban forgó beszélgetés párbeszédszerkezetével. Ebben a projektben mélytanulási és természetes nyelvi feldolgozási technikákat fog használni üzleti megbeszélések pontos összefoglalóinak létrehozására, miközben fenntartja a teljes beszélgetés kontextusát.

31. Érzelemelemzés a depresszióhoz

A depresszió világszerte komoly egészségügyi problémát jelent. Évente emberek milliói követnek el öngyilkosságot a depresszió és a rossz mentális egészség miatt. Általában a mentális egészségügyi problémákhoz kapcsolódó megbélyegzés és a késedelmes kezelés a két fő oka ennek. Ebben a projektben a különböző közösségi médiaplatformokról gyűjtött adatokat fogja felhasználni, és elemezni fogja a közösségi média hozzászólásokban található nyelvi markereket, hogy megértse az egyének mentális egészségét. A cél egy olyan mélytanulási modell létrehozása, amely a hagyományos módszereknél sokkal korábban értékes és pontosabb betekintést nyújt az egyén mentális egészségéről.

32. Kézzel írt egyenletmegoldó

A kézzel írt matematikai kifejezések felismerése a számítógépes látáskutatás egyik kulcsfontosságú területe. Létrehoz egy modellt, és betanítja azt kézzel írt matematikai egyenletek megoldására konvolúciós neurális hálózatok segítségével. A modell képfeldolgozási technikákat is felhasznál majd. A projekt során a modellt a megfelelő adatokkal kell betanítani, hogy a kézzel írt számjegyek, szimbólumok stb. olvasásában jártas legyen, és különböző bonyolultsági szintű matematikai egyenletek esetén helyes eredményeket szolgáltasson.

33. Arcfelismerés a hangulat felismerésére és dalok ajánlására

Tudott tény, hogy az emberek az aktuális hangulatuk és érzéseik alapján hallgatnak zenét. Miért ne lehetne tehát létrehozni egy olyan alkalmazást, amely képes az arckifejezés alapján felismerni az ember hangulatát, és ennek megfelelően dalokat ajánlani? Ehhez számítógépes látás elemeket és technikákat fog használni. A cél egy olyan modell létrehozása, amely hatékonyan tudja kihasználni a számítógépes látást, hogy a számítógépek segítségével a képek és videók magas szintű megértéséhez jussanak.

34. Zenei generátor

A zenei kompozíció nem más, mint különböző frekvenciaszintek dallamos kombinációja. Ebben a projektben egy olyan automatikus zenei generátort tervezel, amely minimális emberi beavatkozással képes rövid zenedarabokat komponálni. A zenei generátor megalkotásához mélytanulási algoritmusokat és LTSM-hálózatokat fogsz használni.

35. Betegség-előrejelző rendszer

Ez az ML-projekt a betegségek előrejelzésére szolgál. Ezt a modellt az R és az R Studio, valamint a Breast Cancer Wisconsin (Diagnostic) Dataset segítségével fogja létrehozni. Ez az adatkészlet két prediktori osztályt tartalmaz – jóindulatú és rosszindulatú emlőtömeget. A projektben való munkához elengedhetetlen a véletlen erdők és az XGBoost alapszintű ismerete.

36. Lakható exobolygó megtalálása

Az elmúlt évtizedben számos tranzit- és exobolygót sikerült azonosítani. Mivel a potenciális exobolygók kézi értelmezése elég nagy kihívás és időigényes (nem beszélve arról, hogy emberi hibáknak is ki van téve), a legjobb, ha mély tanulást használunk az exobolygók azonosítására. A projekt célja, hogy CNN-ek és zajos idősoros adatok segítségével kiderítse, vannak-e körülöttünk lakható exobolygók. Ez a módszer nagyobb pontossággal képes azonosítani a lakható exobolygókat, mint a legkisebb négyzetek módszere.

37. Régi & sérült képtekercsek képregenerálása

A régi vagy sérült képtekercsek helyreállítása kihívást jelentő feladat. A régi képeket szinte mindig lehetetlen eredeti állapotukba visszaállítani. A mélytanulás azonban megoldhatja ezt a problémát. Olyan mélytanulási modellt készít, amely képes azonosítani a képen lévő hibákat (karcolások, lyukak, gyűrődések, elszíneződések stb.), és Inpainting algoritmusok segítségével helyreállítani azt. Még a régi B&W képeket is színezheted.

Reális ipari projektek

Magenta

Ez a kutatási projekt a gépi tanulás alkalmazásainak feltárására összpontosít a művészet és a zene alkotási folyamatában. Egyedi megerősítéses tanulási és mélytanulási algoritmusokat fogsz kifejleszteni, amelyek képeket, dalokat, zenét és még sok mást is képesek létrehozni. Ez a projekt tökéletes a művészet és a zene iránt szenvedélyesen érdeklődő kreatív elmék számára.

BluEx

A BluEx India vezető logisztikai vállalatai közé tartozik, amely meglehetősen nagy rajongótábort alakított ki, köszönhetően a pontos és hatékony kiszállításoknak. Azonban, mint minden logisztikai szolgáltatónak, a BluExnek is szembe kell néznie egy különleges kihívással, amely időbe és pénzbe kerül – sofőrjei nem gyakran járják az optimális szállítási útvonalakat, ami késéseket okoz, és magasabb üzemanyagköltségekhez vezet. Létrehoz egy ML-modellt megerősített tanulás segítségével, amely képes megtalálni a leghatékonyabb útvonalat egy adott szállítási helyhez. Ez a BluEx üzemanyagköltségeinek akár 15%-át is megtakaríthatja.

Motion Studios

A Motion Studios büszkélkedhet azzal, hogy egymilliárd dollárt meghaladó bevétellel Európa legnagyobb rádiós produkciós háza. Amióta a médiavállalat elindította RJ Star című valóságshow-ját, fenomenális visszhangot kapott, és elárasztották őket a hangfelvételek. Mivel valóságshow-ról van szó, a jelöltek kiválasztására korlátozott idő áll rendelkezésre. Ön egy olyan modellt épít, amely képes megkülönböztetni a férfi és női hangokat, és osztályozni a hangklipeket a gyorsabb szűrés megkönnyítése érdekében. Ez segít a gyorsabb kiválasztásban, megkönnyítve a műsorvezetők dolgát.

LithionPower

A Lithionpower akkumulátorokat épít elektromos járművekhez. Általában a sofőrök egy napra bérlik a cég akkumulátorait, és egy feltöltött akkumulátorral cserélik ki őket. Az akkumulátor élettartama olyan tényezőktől függ, mint a megtett távolság/nap, gyorshajtás stb. A LithionPower változó árképzési modellt alkalmaz, amely a járművezető vezetési múltján alapul. A projekt célja egy olyan klasztermodell létrehozása, amely a vezetési előzmények alapján csoportosítja a járművezetőket, és e klaszterek alapján ösztönzi a járművezetőket. Miközben ez 15-20%-kal növeli a nyereséget, a rossz vezetési múlttal rendelkező sofőröktől is többet számol fel.

Következtetés

Itt a gépi tanulási projektötletek átfogó listája. A gépi tanulás még mindig korai stádiumban van az egész világon. Rengeteg projekt van még hátra, és sok mindent kell még fejleszteni. Okos elmékkel és éles eszmékkel az üzletet támogató rendszerek jobbá, gyorsabbá és jövedelmezőbbé válnak. Ha a gépi tanulásban szeretne kitűnni, gyakorlati tapasztalatokat kell gyűjtenie az ilyen gépi tanulási projektekben.

Kizárólag az ML-eszközökkel és ML-algoritmusokkal való munka révén értheti meg, hogyan működnek az ML-infrastruktúrák a valóságban. Most menjen előre, és tegye próbára mindazt a tudást, amit a gépi tanulási projektötletek útmutatóján keresztül összegyűjtött, hogy saját gépi tanulási projekteket építsen!

Milyen könnyű megvalósítani ezeket a projekteket?

Ezek a projektek nagyon alapszintűek, valaki, aki jól ismeri a gépi tanulást, könnyen megoldhatja, hogy kiválassza és befejezze bármelyik projektet.

Megvalósíthatom ezeket a projekteket az ML Gyakorlaton?

Igen, mint említettük, ezek a projektötletek alapvetően diákoknak vagy kezdőknek szólnak. Nagy a valószínűsége annak, hogy a gyakornoki idő alatt bármelyik projektötleten dolgozhatsz.

Miért kell gépi tanulási projekteket készíteni?

Ha a szoftverfejlesztői karrierről van szó, a feltörekvő fejlesztők számára elengedhetetlen, hogy saját projekteken dolgozzanak. A valós projektek fejlesztése a legjobb módja annak, hogy csiszoljuk képességeinket, és elméleti tudásunkat gyakorlati tapasztalatokká materializáljuk.

Vezesd az AI által vezérelt technológiai forradalmat

PG Diploma in Machine Learning and Artificial Intelligence

Learn More

Similar Posts

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.