15 zajímavých nápadů na projekty strojového učení pro začátečníky [2021]

author
31 minutes, 21 seconds Read

Obsah

Nápady na projekty strojového učení

Jak umělá inteligence (AI) v roce 2021 rychle postupuje, je dosažení mistrovství v oblasti strojového učení (ML) pro všechny hráče v této oblasti stále důležitější. Je tomu tak proto, že jak AI, tak ML se vzájemně doplňují. Pokud jste tedy začátečník, nejlepší, co můžete udělat, je pracovat na některých projektech strojového učení.

Ve společnosti upGrad věříme v praktický přístup, protože samotné teoretické znalosti vám v pracovním prostředí v reálném čase nepomohou. V tomto článku se budeme zabývat několika zajímavými projekty strojového učení, na kterých mohou pracovat začátečníci, aby si vyzkoušeli své znalosti strojového učení. V tomto článku najdete 15 nejlepších nápadů na projekty strojového učení pro začátečníky, aby získali praktické zkušenosti.

Nejprve se však věnujme aktuálnější otázce, která vám jistě vrtá hlavou: proč vytvářet projekty strojového učení?

Pokud jde o kariéru v oblasti vývoje softwaru, je pro začínající vývojáře nutností pracovat na vlastních projektech. Vývoj reálných projektů je nejlepší způsob, jak zdokonalit své dovednosti a zhmotnit teoretické znalosti do praktických zkušeností. Čím více budete experimentovat s různými projekty strojového učení, tím více znalostí získáte.

Ačkoli vám učebnice a studijní materiály poskytnou všechny potřebné znalosti o strojovém učení, nikdy nemůžete skutečně zvládnout ML, pokud neinvestujete svůj čas do reálných praktických experimentů – projektů strojového učení. Jakmile začnete pracovat na nápadech projektů strojového učení, budete moci nejen otestovat své silné a slabé stránky, ale také získáte zkušenosti, které mohou být nesmírně užitečné pro zvýšení vaší kariéry. V tomto tutoriálu najdete 15 zajímavých nápadů na projekty strojového učení pro začátečníky, které vám umožní získat praktické zkušenosti v oblasti strojového učení.

Tady je několik projektů strojového učení, na kterých mohou pracovat začátečníci:

Tady je několik zajímavých nápadů na projekty strojového učení pro začátečníky

Podívejte se na naše video o nápadech a tématech projektů strojového učení…

Tento seznam nápadů na projekty strojového učení pro studenty je vhodný pro začátečníky a pro ty, kteří se strojovým učením nebo datovou vědou obecně teprve začínají. Tyto nápady na projekty strojového učení vás seznámí se všemi praktickými záležitostmi, které potřebujete k tomu, abyste uspěli ve své kariéře profesionála v oblasti strojového učení. Ústředním bodem těchto projektů strojového učení jsou algoritmy strojového učení pro začátečníky, tj. algoritmy, které nevyžadují hluboké znalosti strojového učení, a proto jsou ideální pro studenty a začátečníky.

Pokud hledáte nápady na projekty strojového učení pro poslední ročník, tento seznam by vás měl zaujmout. Takže se bez dalších řečí vrhněme rovnou na několik nápadů na projekty strojového učení, které posílí váš základ a umožní vám stoupat po žebříčku.

Prediktor cen akcií

Jedním z nejlepších nápadů, jak začít experimentovat vy praktické projekty strojového učení pro studenty, je práce na Prediktoru cen akcií. Obchodní organizace a společnosti dnes hledají software, který dokáže sledovat a analyzovat výkonnost společnosti a předpovídat budoucí ceny různých akcií. A vzhledem k tomu, že na burze je k dispozici tolik dat, je to pro datové vědce se sklonem k financím horká půda příležitostí.

Než však začnete, musíte mít dostatečný podíl znalostí v následujících oblastech:

  • Prediktivní analýza: Využití různých technik umělé inteligence pro různé datové procesy, jako je dolování dat, průzkum dat atd. k „předvídání“ chování možných výsledků.
  • Regresní analýza: Regresní analýza je druh prediktivní techniky založené na interakci mezi závislou (cílovou) a nezávislou proměnnou/y (prediktorem).
  • Akční analýza: V této metodě se analyzují všechny akce provedené oběma výše uvedenými technikami, načež se výsledek vloží do paměti strojového učení.
  • Statistické modelování: Jedná se o sestavení matematického popisu reálného procesu a rozpracování případných nejistot v rámci tohoto procesu.

Co je strojové učení a proč je důležité

SportsPredictor

V knize Michaela Lewise Moneyball změnil tým Oakland Athletics tvář baseballu tím, že do svého herního plánu začlenil analytickou techniku průzkumu hráčů. A stejně jako oni můžete i vy způsobit revoluci ve sportu v reálném světě! Jedná se o vynikající projekty strojového učení pro začátečníky.

Jelikož ve světě sportu není nouze o data, můžete tato data využít k vytvoření zábavných a kreativních projektů strojového učení, jako je například využití vysokoškolských sportovních statistik k předpovědi, který hráč by měl nejlepší kariéru v tom kterém sportu (vyhledávání talentů). Můžete se také rozhodnout pro vylepšení řízení týmu tím, že budete analyzovat silné a slabé stránky hráčů v týmu a podle toho je klasifikovat.

Vzhledem k množství dostupných sportovních statistik a dat se jedná o vynikající arénu pro zdokonalení vašich dovedností v oblasti zkoumání a vizualizace dat. Pro každého, kdo má cit pro jazyk Python, bude ideální volbou Scikit-Learn, protože obsahuje řadu užitečných nástrojů pro regresní analýzu, klasifikace, načítání dat atd. Zmínka o projektech strojového učení pro závěrečný ročník může pomoci vašemu životopisu vypadat mnohem zajímavěji než ostatní.

6 Times Artificial Intelligence Startled The World

Develop A Sentiment Analyzer

To je jeden ze zajímavých nápadů na projekty strojového učení. Ačkoli většina z nás používá platformy sociálních médií ke sdělování svých osobních pocitů a názorů, aby je viděl celý svět, jedna z největších výzev spočívá v pochopení „sentimentů“, které se skrývají za příspěvky na sociálních médiích.

A to je ideální nápad pro váš další projekt strojového učení!

Sociální média vzkvétají díky tunám obsahu vytvářeného uživateli. Vytvořením systému ML, který by dokázal analyzovat sentiment za texty nebo příspěvky, by bylo pro organizace mnohem snazší pochopit chování spotřebitelů. To by jim následně umožnilo zlepšit služby zákazníkům, a tím poskytnout prostor pro optimální spokojenost spotřebitelů.

Můžete zkusit vytěžit data z Twitteru nebo Redditu a začít s projektem strojového učení analyzujícího sentiment. Může to být jeden z těch vzácných případů projektů hlubokého učení, které vám mohou pomoci i v jiných aspektech.

Zlepšení zdravotní péče

Aplikace AI a ML již začaly pronikat do zdravotnictví a také rychle mění tvář globální zdravotní péče. Zdravotnická nositelná zařízení, vzdálené monitorování, telemedicína, robotická chirurgie atd. jsou možné díky algoritmům strojového učení poháněným umělou inteligencí. Pomáhají nejen HCP (Health Care Providers) poskytovat rychlé a lepší zdravotnické služby, ale také do značné míry snižují závislost a pracovní zátěž lékařů.

Proč tedy nevyužít své dovednosti k vytvoření působivého projektu strojového učení založeného na zdravotnictví? Zpracovat projekt s algoritmy strojového učení pro začátečníky může být užitečné pro budování vaší kariéry s dobrým startem.

Zdravotnictví má k dispozici obrovské množství dat. Využitím těchto dat můžete vytvořit:

  • Systémy diagnostické péče, které mohou automaticky skenovat snímky, rentgenové snímky atd. a poskytovat přesnou diagnózu možných onemocnění.
  • Aplikace preventivní péče, které mohou předpovídat možnosti epidemií, jako je chřipka, malárie atd, jak na celostátní, tak na komunitní úrovni.

Těchto 6 technik strojového učení zlepšuje zdravotní péči

Připravte si algoritmy ML – od nuly!“

Jedná se o jeden z vynikajících nápadů na projekt strojového učení pro začátečníky. Psaní algoritmů ML od nuly vám nabídne dvě výhody:

  • Za prvé, psaní algoritmů ML je nejlepším způsobem, jak porozumět hloubce jejich mechaniky.
  • Za druhé, naučíte se, jak převést matematické instrukce do funkčního kódu. Tato dovednost se vám bude hodit v budoucí kariéře v oblasti strojového učení.

Začít můžete výběrem jednoduchého a nepříliš složitého algoritmu. Za tvorbou každého algoritmu – i toho nejjednoduššího – stojí několik pečlivě propočítaných rozhodnutí. Jakmile dosáhnete určité úrovně mistrovství v sestavování jednoduchých ML algoritmů, zkuste jejich funkčnost vylepšit a rozšířit. Můžete například vzít vanilkový algoritmus logistické regrese a přidat k němu regularizační parametry, abyste jej přeměnili na algoritmus lasso/ridge regrese. Zmínka o projektech strojového učení může pomoci vašemu životopisu vypadat mnohem zajímavěji než ostatní.

Vyvíjejte neuronovou síť, která umí číst rukopis

Jedním z nejlepších nápadů, jak začít experimentovat vy praktické projekty Java pro studenty, je práce na neuronové síti. Hluboké učení a neuronové sítě jsou dvě aktuální módní slova v oblasti umělé inteligence. Díky nim jsme se dočkali technologických zázraků, jako jsou auta bez řidiče, rozpoznávání obrazu atd.
Nadešel tedy čas prozkoumat arénu neuronových sítí. Začněte svůj projekt strojového učení neuronových sítí s výzvou MNIST Handwritten Digit Classification Challenge. Má velmi přívětivé uživatelské rozhraní, které je ideální pro začátečníky.

Inženýři strojového učení: Mýty vs. realita

Systém stanovování cen vstupenek do kina

S rozšířením platforem OTT, jako je Netflix, Amazon Prime, lidé preferují sledování obsahu podle svého pohodlí. Úspěch těchto platforem ovlivnily faktory, jako jsou ceny, kvalita obsahu & a marketing.

Náklady na natočení celovečerního filmu v nedávné minulosti exponenciálně vzrostly. Pouze 10 % natočených filmů přináší zisk. Tvrdá konkurence televizních & OTT platforem spolu s vysokými náklady na vstupenky ještě více ztížila vydělávání filmů. Rostoucí cena vstupenky do kina (spolu s cenou popcornu) nechává kinosály prázdné.

Pokročilý systém tvorby cen vstupenek může rozhodně pomoci filmovým tvůrcům i divákům. Cena vstupenky může být vyšší s rostoucí poptávkou po vstupence a naopak. Čím dříve si divák rezervuje vstupenku, tím nižší je cena, a to u filmu s vysokou poptávkou. Systém by měl chytře vypočítat cenu v závislosti na zájmu diváků, sociálních signálech a faktorech nabídky a poptávky.

Projekt ML klasifikace Iris Flowers

Jedním z nejlepších nápadů, jak začít experimentovat vy praktické projekty strojového učení pro studenty, je práce na projektu ML klasifikace Iris Flowers. Datová sada Iris Flowers je jednou z nejlepších datových sad pro klasifikační úlohy. Vzhledem k tomu, že květy kosatců patří k různým druhům, lze je rozlišit na základě délky kališních a okvětních lístků. Cílem tohoto ML projektu je klasifikovat květy mezi tři druhy – Virginica, Setosa nebo Versicolor.

Tento konkrétní ML projekt se obvykle označuje jako „Hello World“ strojového učení. Datová sada květů kosatce obsahuje číselné atributy a je ideální pro začátečníky, kteří se chtějí seznámit s algoritmy ML pod dohledem, především s tím, jak načítat a zpracovávat data. Protože se navíc jedná o malou datovou sadu, snadno se vejde do paměti, aniž by vyžadovala speciální transformace nebo možnosti škálování. A to je perfektní nápad pro váš příští projekt strojového učení!

Datovou sadu oční duhovky si můžete stáhnout zde.

Projekt ML predikce prodeje BigMart

Jedná se o vynikající nápad na projekt ML pro začátečníky. Tento ML projekt je nejvhodnější pro výuku fungování nesupervisovaných ML algoritmů. Datová sada prodejů BigMart obsahuje přesně údaje o prodejích za rok 2013 pro 1559 produktů v deseti prodejnách v různých městech.

Cílem je použít soubor prodejních dat BigMart k vytvoření regresního modelu, který dokáže předpovědět prodej každého z 1559 výrobků v nadcházejícím roce v deseti různých prodejnách BigMart. Datový soubor prodejů BigMart obsahuje specifické atributy pro každý výrobek a prodejnu, čímž pomáhá pochopit vlastnosti různých výrobků a prodejen, které ovlivňují celkový prodej značky BigMart.

Doporučovací enginy s datovou sadou MovieLens

Doporučovací enginy se staly nesmírně populárními na webech pro online nakupování a streamování. Například online platformy pro streamování obsahu, jako jsou Netflix a Hulu, mají doporučovací motory, které přizpůsobují svůj obsah podle individuálních preferencí zákazníků a historie prohlížení. Přizpůsobením obsahu tak, aby vyhovoval potřebám a preferencím různých zákazníků při sledování, dokázaly tyto weby zvýšit poptávku po svých streamovacích službách.

Jako začátečníci si můžete vyzkoušet sestavení doporučovacího systému pomocí jedné z nejpopulárnějších datových sad dostupných na webu – datové sady MovieLens. Tato datová sada obsahuje více než „25 milionů hodnocení a milion aplikací značek aplikovaných na 62 000 filmů 162 000 uživateli“. Tento projekt můžete začít tím, že vytvoříte vizualizaci světového mraku filmových titulů a vytvoříte tak doporučovací systém pro MovieLens.

Datovou sadu MovieLens si můžete prohlédnout zde.

Předpovídání kvality vína pomocí datové sady kvality vína

Je prokázáno, že stáří dělá víno lepším – čím je víno starší, tím lépe chutná. Stáří však není jedinou věcí, která určuje chuť vína. O certifikaci kvality vína rozhoduje řada faktorů, mezi něž patří například fyziochemické testy, jako je množství alkoholu, pevná kyselost, těkavé kyseliny, hustota a úroveň pH.

V tomto ML projektu musíte vyvinout ML model, který dokáže prozkoumat chemické vlastnosti vína a předpovědět jeho kvalitu. Soubor dat o kvalitě vína, který budete pro tento projekt používat, obsahuje přibližně 4898 pozorování, včetně 11 nezávislých proměnných a jedné závislé proměnné. Zmínka o projektech strojového učení pro závěrečný ročník může pomoci vašemu životopisu vypadat mnohem zajímavěji než ostatní.

Klasifikace ručně psaných číslic NMIST

Tento projekt je jedním ze zajímavých projektů strojového učení. Hluboké učení a neuronové sítě našly uplatnění v mnoha reálných aplikacích, jako je rozpoznávání obrazu, automatické generování textu, auta bez řidiče a mnoho dalších. Než se však pustíte do těchto složitých oblastí hlubokého učení, měli byste začít s jednoduchou datovou sadou, jako je datová sada MNIST. Proč tedy nevyužít své schopnosti a nevyvinout působivý projekt strojového učení založený na MNIST?

Projekt klasifikace číslic MNIST je určen k trénování strojů pro rozpoznávání ručně psaných číslic. Protože pro začátečníky je obvykle náročnější pracovat s obrazovými daty než s plochými relačními daty, je datová sada MNIST pro začátečníky nejlepší. V tomto projektu použijete datovou sadu MNIST k trénování ML modelu pomocí konvolučních neuronových sítí (CNN). Přestože se datová sada MNIST bez problémů vejde do paměti počítače (je velmi malá), úloha rozpoznávání ručně psaných číslic je poměrně náročná.

Datovou sadu MNIST můžete získat zde.

Rozpoznávání lidské činnosti pomocí datové sady chytrých telefonů

Jedná se o jeden z trendových nápadů na projekt strojového učení. Datová sada chytrých telefonů obsahuje záznamy a informace o fitness aktivitách 30 lidí. Tato data byla pořízena prostřednictvím chytrého telefonu vybaveného inerciálními snímači.

Tento ML projekt si klade za cíl vytvořit klasifikační model, který dokáže identifikovat fitness aktivity člověka s vysokou mírou přesnosti. Při práci na tomto projektu ML se naučíte základy klasifikace a také řešit problémy s více klasifikacemi.

14. Detekce objektů pomocí hlubokého učení

Jedná se o jeden ze zajímavých projektů strojového učení, který je třeba vytvořit. Pokud jde o klasifikaci obrázků, měly by být vaší volbou hluboké neuronové sítě (DNN). Zatímco DNN se již používají v mnoha reálných aplikacích pro klasifikaci obrázků, tento ML projekt si klade za cíl posunout je o stupeň výš.

V tomto ML projektu budete řešit problém detekce objektů s využitím DNN. Budete muset vyvinout model, který dokáže klasifikovat objekty a také přesně lokalizovat objekty různých tříd. Úlohu detekce objektů zde budete řešit jako problém regrese na masky ohraničujících boxů objektů. Také budete definovat víceškálový inferenční postup, který dokáže generovat detekce objektů s vysokým rozlišením při minimálních nákladech.

Detekce falešných zpráv

Jedná se o jeden z výborných nápadů na projekt strojového učení pro začátečníky, zejména proto, jak se nyní falešné zprávy šíří rychlostí blesku. Falešné zprávy se umí šířit jako požár. A vzhledem k tomu, že naše životy nyní ovládají sociální média, je nyní více než kdy jindy důležité odlišit falešné zprávy od skutečných zpravodajských událostí. Zde může pomoci strojové učení. Facebook již používá umělou inteligenci k filtrování falešných a spamových zpráv z kanálů uživatelů.

Tento ML projekt má za cíl využít techniky NLP (Natural Language Processing) k odhalování falešných zpráv a zavádějících příběhů, které se objevují z nedůvěryhodných zdrojů. K návrhu modelu, který dokáže rozlišit mezi skutečnými a falešnými zprávami, lze použít i klasický přístup klasifikace textu. Při druhém způsobu můžete shromáždit soubory dat pro skutečné i falešné zprávy a vytvořit ML model pomocí klasifikátoru Naive Bayes, který na základě slov a frází v něm použitých klasifikuje zprávu jako podvodnou nebo skutečnou.

Projekt e-mailu Enron

Soubor dat e-mailu Enron obsahuje téměř 500 tisíc e-mailů více než 150 uživatelů. Jedná se o mimořádně cenný soubor dat pro zpracování přirozeného jazyka. Tento projekt zahrnuje sestavení ML modelu, který využívá algoritmus shlukování k-means k detekci podvodného jednání. Model rozdělí pozorování do „k“ počtu shluků podle podobných vzorů v souboru dat.

Parkinsonův projekt

Soubor parkinsonských dat obsahuje 195 biomedicínských záznamů osob s 23 různými charakteristikami. Smyslem tohoto projektu je navrhnout ML model, který dokáže rozlišit mezi zdravými lidmi a lidmi trpícími Parkinsonovou chorobou. Model k tomuto oddělení využívá algoritmus XGboost (extreme gradient boosting) založený na rozhodovacích stromech.

Projekt Flickr 30K

Soubor dat Flickr 30K se skládá z více než 30 000 obrázků, z nichž každý má jedinečný popisek. Tuto datovou sadu použijete k vytvoření generátoru popisků obrázků. Cílem je vytvořit model CNN, který dokáže efektivně analyzovat a extrahovat vlastnosti z obrázku a vytvořit vhodný popisek popisující obrázek v angličtině.

Projekt zákazníci nákupního centra

Jak již název napovídá, datová sada zákazníci nákupního centra obsahuje záznamy o lidech, kteří navštívili nákupní centrum, jako je pohlaví, věk, ID zákazníka, roční příjem, skóre výdajů atd. Vytvoříte model, který bude tato data používat k segmentaci zákazníků do různých skupin na základě jejich vzorců chování. Taková segmentace zákazníků je velmi užitečná marketingová taktika, kterou značky a obchodníci používají ke zvýšení prodeje a příjmů a zároveň ke zvýšení spokojenosti zákazníků.

Projekt Kinetics

Pro tento projekt použijete rozsáhlý soubor dat, který obsahuje tři samostatné soubory dat – Kinetics 400, Kinetics 600 a Kinetics 700 – obsahující URL odkazy na více než 6,5 milionu vysoce kvalitních videí. Vaším cílem je vytvořit model, který na základě studia řady různých pozorování dokáže detekovat a identifikovat činnosti člověka.

Projekt doporučovacího systému

Jedná se o bohatou sbírku dat obsahující různorodé datové soubory shromážděné z populárních webových stránek, jako jsou recenze knih na Goodreads, recenze produktů na Amazonu, sociální média atd. Vaším cílem je vytvořit doporučovací systém (podobný těm, které používají Amazon a Netflix), který dokáže generovat personalizovaná doporučení produktů, filmů, hudby atd. na základě preferencí, potřeb a chování zákazníků na internetu.

Bostonský projekt bydlení

Soubor dat o bydlení v Bostonu se skládá z podrobností o různých domech v Bostonu na základě faktorů, jako je míra zdanění, míra kriminality, počet místností v domě atd. Jedná se o vynikající datovou sadu pro předpovídání cen různých domů v Bostonu. V tomto projektu sestavíte model, který dokáže předpovědět cenu nového domu pomocí lineární regrese. Lineární regrese je pro tento projekt nejvhodnější, protože se používá v případech, kdy data mají lineární vztah mezi vstupními a výstupními hodnotami a kdy jsou vstupní hodnoty neznámé.

Projekt Cityscapes

Tato datová sada s otevřeným zdrojovým kódem obsahuje vysoce kvalitní anotace na úrovni pixelů videosekvencí shromážděných z ulic v 50 různých městech. Je nesmírně užitečná pro sémantickou analýzu. Tuto datovou sadu můžete použít k trénování hlubokých neuronových sítí pro analýzu a pochopení městské krajiny. Projekt zahrnuje návrh modelu, který dokáže provádět segmentaci obrazu a identifikovat různé objekty (auta, autobusy, nákladní auta, stromy, silnice, lidi atd.) z pouliční videosekvence.

Projekt Youtube 8M

Youtube 8M je obrovský soubor dat, který obsahuje 6,1 milionu ID videí na YouTube, 350 000 hodin videa, 2,6 miliardy audio/vizuálních prvků, 3862 tříd a v průměru 3 štítky pro každé video. Je široce používán pro projekty klasifikace videa. V tomto projektu vytvoříte systém klasifikace videa, který dokáže přesně popsat video. Bude brát v úvahu řadu různých vstupů a klasifikovat videa do jednotlivých kategorií.

Městský zvuk 8K

Pro klasifikaci zvuku se používá datová sada městský zvuk 8K. Obsahuje rozmanitou kolekci 8732 městských zvuků patřících do různých tříd, jako jsou sirény, pouliční hudba, štěkot psů, cvrlikání ptáků, mluvení lidí atd. Navrhnete model klasifikace zvuku, který dokáže automaticky rozpoznat, který městský zvuk hraje v

projektu IMDB-Wiki

Tato označená datová sada je pravděpodobně jednou z nejrozsáhlejších sbírek obrázků obličejů shromážděných z celé IMDB a Wikipedie. Obsahuje více než 5 milionů obrázků obličejů označených věkem a pohlavím. with labeled gender and age. Vytvoříte model, který dokáže detekovat obličeje a předpovídat jejich věk a pohlaví s přesností. Můžete vytvořit různé věkové segmenty/rozsahy, například 0-10, 10-20, 30-40 atd.

Projekt Librispeech

Soubor dat Librispeech je rozsáhlá sbírka anglických projevů odvozená z projektu LibriVox. Obsahuje anglicky čtené projevy s různými přízvuky, které zahrnují více než 1000 hodin a jsou ideálním nástrojem pro rozpoznávání řeči. Tento projekt se zaměřuje na vytvoření modelu, který dokáže automaticky převádět zvuk na text. Vytvoříte systém rozpoznávání řeči, který dokáže detekovat anglickou řeč a převést ji do textového formátu.

Německý srovnávací projekt rozpoznávání dopravních značek (GTSRB)

Tato datová sada obsahuje více než 50 000 obrázků dopravních značek rozdělených do 43 tříd a obsahuje informace o ohraničení každé dopravní značky. Je ideální pro klasifikaci více tříd, což je přesně to, na co se zde zaměříte. Pomocí rámce hlubokého učení vytvoříte model, který dokáže rozpoznat ohraničující rámeček značek a klasifikovat dopravní značky. Tento projekt může být velmi užitečný pro autonomní vozidla, protože rozpozná značky a pomůže řidičům provést potřebné kroky.

29. Shrnutí textu sportovního zápasu

Tento projekt je přesně takový, jak zní – získání přesného a stručného shrnutí sportovního videa. Je to užitečný nástroj pro sportovní webové stránky, které informují čtenáře o nejzajímavějších momentech zápasu. Protože pro shrnutí textu jsou nejlepší neuronové sítě, vytvoříte tento model pomocí sítí hlubokého učení, jako jsou 3D-CNN, RNN a LSTM. Nejprve rozdělíte sportovní video na více částí pomocí příslušných ML algoritmů a poté použijete kombinaci SVM(Support vector machines), neuronových sítí a algoritmu k-means.

30. Generátor shrnutí obchodních schůzek

Sumarizace zahrnuje stručné a výstižné extrahování nejvýznamnějších a nejcennějších kousků informací z rozhovorů, audio/video souborů atd. Obvykle se provádí pomocí zachycení statistických, jazykových a pocitových rysů s dialogovou strukturou dané konverzace. V tomto projektu budete používat techniky hlubokého učení a zpracování přirozeného jazyka k vytváření přesných shrnutí obchodních schůzek při zachování kontextu celé konverzace.

31. Analýza sentimentu u deprese

Deprese je celosvětově velkým zdravotním problémem. Každý rok spáchají miliony lidí sebevraždu v důsledku deprese a špatného duševního zdraví. Obvykle za tím stojí stigma spojené s problémy duševního zdraví a opožděná léčba. V tomto projektu využijete data získaná z různých platforem sociálních médií a budete analyzovat jazykové znaky v příspěvcích na sociálních médiích, abyste pochopili duševní zdraví jednotlivců. Cílem je vytvořit model hlubokého učení, který dokáže nabídnout cenné a přesné poznatky o duševním zdraví člověka mnohem dříve než běžné metody.

32. Řešitel ručně psaných rovnic

Rozpoznávání ručně psaných matematických výrazů je klíčovou oblastí výzkumu v oblasti počítačového vidění. Sestavíte model a vycvičíte jej k řešení ručně psaných matematických rovnic pomocí konvolučních neuronových sítí. Model bude také využívat techniky zpracování obrazu. Tento projekt zahrnuje trénování modelu pomocí správných dat, aby byl schopen číst ručně psané číslice, symboly atd. a poskytovat správné výsledky pro matematické rovnice různých úrovní složitosti.

33. Rozpoznávání obličeje pro zjišťování nálady a doporučování skladeb

Je známo, že lidé poslouchají hudbu podle své aktuální nálady a pocitů. Proč tedy nevytvořit aplikaci, která dokáže rozpoznat náladu člověka podle výrazu jeho obličeje a podle toho mu doporučit skladby? K tomu využijete prvky a techniky počítačového vidění. Cílem je vytvořit model, který dokáže efektivně využít počítačové vidění, aby pomohl počítačům získat porozumění obrázkům a videím na vysoké úrovni.

34. Generátor hudby

Hudební skladba není nic jiného než melodická kombinace různých frekvenčních úrovní. V tomto projektu navrhnete automatický generátor hudby, který dokáže skládat krátké hudební skladby s minimálním zásahem člověka. K sestavení tohoto hudebního generátoru použijete algoritmy hlubokého učení a sítě LTSM.

35. Systém pro předpovídání nemocí

Tento ML projekt je určen k předpovídání nemocí. Tento model vytvoříte pomocí programů R a R Studio a datové sady Breast Cancer Wisconsin (Diagnostic) Dataset. Tato datová sada obsahuje dvě třídy prediktorů – nezhoubný a zhoubný útvar prsu. Pro práci na tomto projektu je nezbytné mít základní znalosti o náhodných lesích a XGBoost.

36. Nalezení obyvatelné exoplanety

V posledním desetiletí se nám podařilo identifikovat mnoho tranzitujících a exoplanet. Vzhledem k tomu, že ruční interpretace potenciálních exoplanet je poměrně náročná a zdlouhavá (abychom nezapomněli, je také zatížena lidskou chybou), je nejlepší použít k identifikaci exoplanet hluboké učení. Cílem tohoto projektu je zjistit, zda kolem nás existují obyvatelné exoplanety, a to pomocí CNN a zašuměných časových řad dat. Tato metoda dokáže identifikovat obyvatelné exoplanety s větší přesností než metoda nejmenších čtverců.

37. Regenerace starých &poškozených obrazových kotoučů

Obnova starých nebo poškozených obrazových kotoučů je náročný úkol. Obnovit staré fotografie do původního stavu je téměř vždy nemožné. Hluboké učení však může tento problém vyřešit. Vytvoříte model hlubokého učení, který dokáže identifikovat vady obrazu (oděrky, díry, záhyby, odbarvení atd.) a pomocí algoritmů Inpainting je obnovit. Můžete dokonce kolorovat staré B&W obrázky.

Reálné průmyslové projekty

Magenta

Tento výzkumný projekt se zaměřuje na zkoumání aplikací strojového učení v procesu tvorby umění a hudby. Budete vyvíjet jedinečné algoritmy posilování učení a hlubokého učení, které mohou generovat obrázky, písně, hudbu a mnoho dalšího. Je to ideální projekt pro kreativní mozky zapálené pro umění a hudbu.

BluEx

BluEx patří mezi přední logistické společnosti v Indii, které si díky včasným a efektivním dodávkám vytvořily slušnou fanouškovskou základnu. Stejně jako všichni poskytovatelé logistických služeb se však i společnost BluEx potýká s jedním konkrétním problémem, který stojí čas i peníze – její řidiči nejezdí často po optimálních trasách, což způsobuje zpoždění a vede k vyšším nákladům na pohonné hmoty. Vytvoříte ML model využívající reinforcement learning, který dokáže najít nejefektivnější cestu pro konkrétní místo doručení. Díky tomu může společnost BluEx ušetřit až 15 % nákladů na pohonné hmoty.

Motion Studios

Motion Studios se může pochlubit tím, že je největším evropským rozhlasovým produkčním domem s příjmy přesahujícími miliardu dolarů. Od chvíle, kdy mediální společnost spustila svou reality show RJ Star, zaznamenala fenomenální ohlas a je zaplavena hlasovými klipy. Vzhledem k tomu, že se jedná o reality show, je časový prostor pro výběr kandidátů omezený. Vytvoříte model, který dokáže rozlišovat mezi mužskými a ženskými hlasy a klasifikovat hlasové klipy, abyste usnadnili rychlejší filtraci. To pomůže je rychlejší výběr, což usnadní práci vedoucím pořadu.

LithionPower

Lithionpower vyrábí baterie pro elektromobily. Řidiči si obvykle na jeden den pronajmou baterie této společnosti a vymění je za nabité. Životnost baterie závisí na faktorech, jako je ujetá vzdálenost/den, překročení rychlosti atd. Společnost LithionPower používá variabilní cenový model založený na historii jízdy řidiče. Cílem tohoto projektu je vytvořit shlukový model, který bude řidiče seskupovat podle jejich historie řízení a na základě těchto shluků je motivovat. To sice zvýší zisky o 15-20 %, ale zároveň bude účtovat vyšší poplatky od řidičů se špatnou jízdní historií.

Závěr

Zde je ucelený seznam nápadů na projekty strojového učení. Strojové učení je v celém světě stále v rané fázi. Existuje mnoho projektů, které je třeba realizovat, a mnoho projektů, které je třeba vylepšit. Díky chytrým hlavám a bystrým nápadům budou systémy s podporou podnikání lepší, rychlejší a ziskovější. Pokud chcete v oblasti strojového učení vyniknout, musíte sbírat praktické zkušenosti s takovými projekty strojového učení.

Jedině prací s ML nástroji a ML algoritmy můžete pochopit, jak ML infrastruktury fungují ve skutečnosti. Nyní se pusťte do testování všech znalostí, které jste získali prostřednictvím našeho průvodce nápady na projekty strojového učení, a vytvořte si vlastní projekty strojového učení!“

Jak snadné je tyto projekty realizovat?

Tyto projekty jsou velmi základní, někdo s dobrými znalostmi strojového učení může snadno zvládnout vybrat a dokončit některý z těchto projektů.

Můžu tyto projekty realizovat na stáži ML?

Ano, jak už bylo řečeno, tyto nápady na projekty jsou v podstatě pro studenty nebo začátečníky. Existuje vysoká pravděpodobnost, že se během stáže dostanete k práci na některém z těchto projektových nápadů.

Proč potřebujeme vytvářet projekty strojového učení

Pokud jde o kariéru v oblasti vývoje softwaru, je pro začínající vývojáře nutností pracovat na vlastních projektech. Vývoj reálných projektů je nejlepší způsob, jak zdokonalit své dovednosti a zhmotnit teoretické znalosti do praktických zkušeností.

Vedení technologické revoluce poháněné umělou inteligencí

PG Diploma in Machine Learning and Artificial Intelligence

Zjistěte více

.

Similar Posts

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.