Tabla de Contenidos
- Ideas de Proyectos de Aprendizaje de Máquinas
- Aquí hay algunas ideas geniales de proyectos de aprendizaje automático para principiantes
- Predictor de precios de acciones
- SportsPredictor
- Develop A Sentiment Analyzer
- Mejorar la asistencia sanitaria
- ¡Preparar algoritmos de ML – desde cero!
- Desarrolla una red neuronal que pueda leer la escritura
- Sistema de precios de entradas de cine
- Proyecto ML de clasificación de flores de Iris
- Proyecto ML de predicción de ventas de BigMart
- Motores de recomendación con el conjunto de datos de MovieLens
- Predecir la calidad del vino utilizando el conjunto de datos de calidad del vino
- Clasificación de dígitos manuscritos del MNIST
- Reconocimiento de la actividad humana utilizando el conjunto de datos del teléfono inteligente
- 14. Object Detection with Deep Learning
- Detección de noticias falsas
- Proyecto de correo electrónico de Enron
- Proyecto Parkinson
- Proyecto Flickr 30K
- Proyecto de clientes del centro comercial
- Proyecto Kinetics
- Proyecto de sistema de recomendación
- El proyecto de viviendas de Boston
- Proyecto Cityscapes
- Proyecto Youtube 8M
- Sonido urbano 8K
- IMDB-Wiki
- Proyecto librispeech
- Proyecto de referencia de reconocimiento de señales de tráfico alemanas (GTSRB)
- Proyectos de la industria del mundo real
- Magenta
- BluEx
- Motion Studios
- LithionPower
- Conclusión
- ¿Qué tan fácil es implementar estos proyectos?
- ¿Puedo hacer estos proyectos en ML Internship?
- ¿Por qué necesitamos construir proyectos de aprendizaje automático?
- Lidera la revolución tecnológica impulsada por la IA
Ideas de Proyectos de Aprendizaje de Máquinas
A medida que la Inteligencia Artificial (IA) continúa progresando rápidamente en 2021, lograr el dominio del Aprendizaje de Máquinas (ML) es cada vez más importante para todos los jugadores en este campo. Esto se debe a que tanto la IA como el ML se complementan entre sí. Así que, si eres un principiante, lo mejor que puedes hacer es trabajar en algunos proyectos de Machine Learning.
Nosotros, aquí en upGrad, creemos en un enfoque práctico ya que el conocimiento teórico por sí solo no será de ayuda en un entorno de trabajo en tiempo real. En este artículo, vamos a explorar algunos proyectos interesantes de Machine Learning en los que los principiantes pueden trabajar para poner a prueba sus conocimientos de Machine Learning. En este artículo, encontrarás 15 ideas de proyectos de aprendizaje automático para que los principiantes obtengan experiencia práctica.
Pero primero, abordemos la pregunta más pertinente que debe estar acechando en tu mente: ¿por qué construir proyectos de aprendizaje automático?
Cuando se trata de carreras en el desarrollo de software, es una necesidad para los aspirantes a desarrolladores trabajar en sus propios proyectos. Desarrollar proyectos del mundo real es la mejor manera de perfeccionar tus habilidades y materializar tus conocimientos teóricos en experiencia práctica. Cuanto más experimentes con diferentes proyectos de Aprendizaje Automático, más conocimiento ganarás.
Aunque los libros de texto y los materiales de estudio te darán todo el conocimiento que necesitas saber sobre el Aprendizaje Automático, nunca podrás dominar realmente el ML a menos que inviertas tu tiempo en experimentos prácticos de la vida real – proyectos sobre Aprendizaje Automático. Al empezar a trabajar en ideas de proyectos de aprendizaje automático, no sólo podrás poner a prueba tus puntos fuertes y débiles, sino que también ganarás una exposición que puede ser inmensamente útil para impulsar tu carrera. En este tutorial, encontrará 15 interesantes ideas de proyectos de aprendizaje automático para que los principiantes obtengan experiencia práctica en el aprendizaje automático.
Así que, aquí hay algunos proyectos de aprendizaje automático en los que los principiantes pueden trabajar:
Aquí hay algunas ideas geniales de proyectos de aprendizaje automático para principiantes
Mira nuestro vídeo sobre ideas de proyectos de aprendizaje automático y temas…
Esta lista de ideas de proyectos de aprendizaje automático para estudiantes es adecuada para principiantes, y para aquellos que acaban de empezar con el aprendizaje automático o la ciencia de datos en general. Estas ideas de proyectos de machine learning te pondrán en marcha con todos los aspectos prácticos que necesitas para tener éxito en tu carrera como profesional del Machine Learning. El punto central de estos proyectos de aprendizaje automático son los algoritmos de aprendizaje automático para principiantes, es decir, algoritmos que no requieren que tengas una comprensión profunda del Aprendizaje Automático, y por lo tanto son perfectos para estudiantes y principiantes.
Además, si estás buscando ideas de proyectos de Aprendizaje Automático para el último año, esta lista debería ponerte en marcha. Así que, sin más preámbulos, vamos a saltar directamente a algunas ideas de proyectos de Machine Learning que fortalecerán tu base y te permitirán escalar la escalera.
Predictor de precios de acciones
Una de las mejores ideas para empezar a experimentar con proyectos prácticos de Aprendizaje Automático para estudiantes es trabajar en Predictor de precios de acciones. Las organizaciones empresariales y las empresas hoy en día están en la búsqueda de un software que pueda monitorear y analizar el rendimiento de la empresa y predecir los precios futuros de varias acciones. Y con tantos datos disponibles en el mercado de valores, es un semillero de oportunidades para los científicos de datos con inclinación por las finanzas.
Sin embargo, antes de empezar, debes tener una buena cuota de conocimiento en las siguientes áreas:
- Análisis predictivo: Aprovechamiento de varias técnicas de IA para diferentes procesos de datos como la minería de datos, la exploración de datos, etc. para «predecir» el comportamiento de posibles resultados.
- Análisis Regresivo: El análisis regresivo es un tipo de técnica predictiva basada en la interacción entre una variable dependiente (objetivo) y una/s independiente/s (predictor).
- Análisis de Acciones: En este método se analizan todas las acciones realizadas por las dos técnicas mencionadas anteriormente tras lo cual el resultado se introduce en la memoria de aprendizaje automático.
- Modelado estadístico: Implica la construcción de una descripción matemática de un proceso del mundo real y la elaboración de las incertidumbres, si las hay, dentro de ese proceso.
Qué es el aprendizaje automático y por qué es importante
SportsPredictor
En la obra Moneyball de Michael Lewis, el equipo de los Atléticos de Oakland transformó la faz del béisbol al incorporar la técnica de exploración analítica de jugadores en su plan de juego. Y al igual que ellos, ¡tú también puedes revolucionar el deporte en el mundo real! Este es un excelente proyecto de aprendizaje automático para principiantes.
Dado que no hay escasez de datos en el mundo del deporte, puede utilizar estos datos para construir proyectos de aprendizaje automático divertidos y creativos, como el uso de las estadísticas de los deportes universitarios para predecir qué jugador tendría la mejor carrera en qué deportes en particular (búsqueda de talentos). También podrías optar por mejorar la gestión de equipos analizando los puntos fuertes y débiles de los jugadores de un equipo y clasificándolos en consecuencia.
Con la cantidad de estadísticas y datos deportivos disponibles, este es un excelente campo para perfeccionar tus habilidades de exploración y visualización de datos. Para cualquiera que tenga un don para Python, Scikit-Learn será la opción ideal, ya que incluye una serie de herramientas útiles para el análisis de regresión, clasificaciones, ingestión de datos, etc. Mencionar proyectos de Machine Learning para el último año puede ayudar a que tu currículum se vea mucho más interesante que otros.
6 Times Artificial Intelligence Startled The World
Develop A Sentiment Analyzer
Esta es una de las interesantes ideas de proyectos de machine learning. Aunque la mayoría de nosotros utilizamos las plataformas de medios sociales para transmitir nuestros sentimientos y opiniones personales para que el mundo los vea, uno de los mayores desafíos radica en la comprensión de los «sentimientos» detrás de las publicaciones en los medios sociales.
¡Y esta es la idea perfecta para su próximo proyecto de aprendizaje automático!
Las redes sociales prosperan con toneladas de contenido generado por los usuarios. Al crear un sistema de ML que pueda analizar el sentimiento detrás de los textos, o un post, sería mucho más fácil para las organizaciones entender el comportamiento del consumidor. Esto, a su vez, les permitiría mejorar su servicio al cliente, proporcionando así el alcance de la satisfacción óptima del consumidor.
Puedes intentar extraer los datos de Twitter o Reddit para empezar con tu proyecto de aprendizaje automático de análisis de sentimientos. Este podría ser uno de esos raros casos de proyectos de aprendizaje profundo que pueden ayudarte también en otros aspectos.
Mejorar la asistencia sanitaria
Las aplicaciones de IA y ML ya han empezado a penetrar en la industria sanitaria y también están transformando rápidamente la cara de la asistencia sanitaria mundial. Los wearables sanitarios, la monitorización remota, la telemedicina, la cirugía robótica, etc., son posibles gracias a los algoritmos de aprendizaje automático impulsados por la IA. No solo están ayudando a los HCP (proveedores de atención médica) a ofrecer servicios de atención médica rápidos y mejores, sino que también están reduciendo la dependencia y la carga de trabajo de los médicos en gran medida.
Así que, ¿por qué no utilizar sus habilidades para desarrollar un impresionante proyecto de aprendizaje automático basado en la atención médica? Manejar un proyecto con algoritmos de Machine Learning para principiantes puede ser útil para construir su carrera con un buen comienzo.
La industria de la salud tiene enormes cantidades de datos a su disposición. Aprovechando estos datos, se pueden crear:
- Sistemas de atención diagnóstica que puedan escanear automáticamente imágenes, radiografías, etc., y proporcionar un diagnóstico preciso de posibles enfermedades.
- Aplicaciones de atención preventiva que puedan predecir las posibilidades de epidemias como la gripe, la malaria, etc, tanto a nivel nacional como comunitario.
Estas 6 técnicas de aprendizaje automático están mejorando la atención sanitaria
¡Preparar algoritmos de ML – desde cero!
Esta es una de las excelentes ideas de proyectos de aprendizaje automático para principiantes. Escribir algoritmos de ML desde cero ofrecerá dos beneficios:
- Uno, escribir algoritmos de ML es la mejor manera de entender el meollo de su mecánica.
- Dos, aprenderás a transformar instrucciones matemáticas en código funcional. Esta habilidad le será muy útil en su futura carrera en el Aprendizaje Automático.
Puede comenzar eligiendo un algoritmo que sea sencillo y no demasiado complejo. Detrás de la elaboración de cada algoritmo -incluso de los más sencillos- hay varias decisiones cuidadosamente calculadas. Una vez que hayas alcanzado un cierto nivel de dominio en la construcción de algoritmos simples de ML, trata de ajustar y ampliar su funcionalidad. Por ejemplo, puedes tomar un algoritmo de regresión logística de vainilla y añadirle parámetros de regularización para transformarlo en un algoritmo de regresión lasso/ridge. Mencionar proyectos de aprendizaje automático puede ayudar a que tu currículum parezca mucho más interesante que otros.
Desarrolla una red neuronal que pueda leer la escritura
Una de las mejores ideas para empezar a experimentar que proyectos prácticos de Java para estudiantes es trabajar en redes neuronales. El aprendizaje profundo y las redes neuronales son las dos palabras de moda en la IA. Estos nos han dado maravillas tecnológicas como los coches sin conductor, el reconocimiento de imágenes, y así sucesivamente.
Así que ahora es el momento de explorar el ámbito de las redes neuronales. Comience su proyecto de aprendizaje automático de redes neuronales con el desafío de clasificación de dígitos escritos a mano del MNIST. Tiene una interfaz muy fácil de usar que es ideal para los principiantes.
Ingenieros de aprendizaje automático: Mitos vs. Realidades
Sistema de precios de entradas de cine
Con la expansión de las plataformas OTT como Netflix, Amazon Prime, la gente prefiere ver el contenido según su conveniencia. Factores como el precio, la calidad del contenido y el marketing han influido en el éxito de estas plataformas.
El coste de hacer una película completa se ha disparado exponencialmente en el pasado reciente. Sólo el 10% de las películas que se hacen obtienen beneficios. La dura competencia de las plataformas de televisión & OTT junto con el elevado coste de las entradas ha dificultado aún más la obtención de beneficios por parte de las películas. El aumento del coste de la entrada al teatro (junto con el coste de las palomitas) deja la sala de cine vacía.
Un sistema avanzado de precios de las entradas puede ayudar definitivamente a los cineastas y a los espectadores. El precio de las entradas puede ser más alto con el aumento de la demanda de entradas y viceversa. Cuanto antes reserve el espectador la entrada, menor será el coste, para una película con gran demanda. El sistema debe calcular inteligentemente el precio en función del interés de los espectadores, las señales sociales y los factores de oferta-demanda.
Proyecto ML de clasificación de flores de Iris
Una de las mejores ideas para empezar a experimentar con proyectos prácticos de aprendizaje automático para estudiantes es trabajar en el proyecto ML de clasificación de flores de Iris. Iris flores conjunto de datos es uno de los mejores conjuntos de datos para las tareas de clasificación. Dado que las flores del iris son de especies variadas, pueden distinguirse en función de la longitud de los sépalos y los pétalos. Este proyecto de ML tiene como objetivo clasificar las flores entre las tres especies: Virginica, Setosa o Versicolor.
Este proyecto de ML en particular se suele denominar el «Hello World» del aprendizaje automático. El conjunto de datos de las flores del iris contiene atributos numéricos, y es perfecto para que los principiantes aprendan sobre los algoritmos de ML supervisado, principalmente cómo cargar y manejar los datos. Además, al ser un conjunto de datos pequeño, puede caber fácilmente en la memoria sin requerir transformaciones especiales o capacidades de escalado. Y esta es la idea perfecta para su próximo proyecto de aprendizaje automático!
Puede descargar el conjunto de datos del iris aquí.
Proyecto ML de predicción de ventas de BigMart
Esta es una excelente idea de proyecto ML para principiantes. Este proyecto ML es el mejor para aprender cómo funcionan los algoritmos ML no supervisados. El conjunto de datos de ventas de BigMart comprende precisamente los datos de ventas de 2013 para 1559 productos a través de diez puntos de venta en varias ciudades.
El objetivo aquí es utilizar el conjunto de datos de ventas de BigMart para desarrollar un modelo de regresión que pueda predecir la venta de cada uno de los 1559 productos en el próximo año en los diez diferentes puntos de venta de BigMart. El conjunto de datos de ventas de BigMart contiene atributos específicos para cada producto y punto de venta, lo que ayuda a comprender las propiedades de los diferentes productos y tiendas que influyen en las ventas globales de BigMart como marca.
Motores de recomendación con el conjunto de datos de MovieLens
Los motores de recomendación se han hecho enormemente populares en los sitios de compra y transmisión en línea. Por ejemplo, las plataformas de streaming de contenidos online como Netflix y Hulu cuentan con motores de recomendación para personalizar sus contenidos según las preferencias individuales de los clientes y su historial de navegación. Al adaptar el contenido para satisfacer las necesidades y preferencias de los diferentes clientes, estos sitios han sido capaces de aumentar la demanda de sus servicios de streaming.
Como principiante, puedes probar a construir un sistema de recomendación utilizando uno de los conjuntos de datos más populares disponibles en la web: el conjunto de datos MovieLens. Este conjunto de datos incluye más de «25 millones de valoraciones y un millón de aplicaciones de etiquetas aplicadas a 62.000 películas por 162.000 usuarios». Puedes comenzar este proyecto construyendo una visualización de la nube mundial de títulos de películas para hacer un motor de recomendación de películas para MovieLens.
Puedes consultar el conjunto de datos de MovieLens aquí.
Predecir la calidad del vino utilizando el conjunto de datos de calidad del vino
Es un hecho bien establecido que la edad hace que el vino sea mejor – cuanto más viejo sea el vino, mejor será su sabor. Sin embargo, la edad no es lo único que determina el sabor de un vino. Numerosos factores determinan la certificación de la calidad del vino, incluyendo pruebas fisicoquímicas como la cantidad de alcohol, la acidez fija, la acidez volátil, la densidad y el nivel de pH, por nombrar algunos.
En este proyecto de ML, necesita desarrollar un modelo de ML que pueda explorar las propiedades químicas de un vino para predecir su calidad. El conjunto de datos de calidad del vino que utilizarás para este proyecto consta de aproximadamente 4898 observaciones, incluyendo 11 variables independientes y una variable dependiente. Mencionar proyectos de Machine Learning para el último año puede ayudar a que tu currículum se vea mucho más interesante que otros.
Clasificación de dígitos manuscritos del MNIST
Este es uno de los proyectos de machine learning interesantes. El aprendizaje profundo y las redes neuronales han encontrado casos de uso en muchas aplicaciones del mundo real como el reconocimiento de imágenes, la generación automática de texto, los coches sin conductor y mucho más. Sin embargo, antes de profundizar en estas complejas áreas de Deep Learning, deberías comenzar con un conjunto de datos simple como el conjunto de datos MNIST. Así que, ¿por qué no usar tus habilidades para desarrollar un impresionante proyecto de aprendizaje automático basado en MNIST?
El proyecto de clasificación de dígitos de MNIST está diseñado para entrenar a las máquinas a reconocer dígitos escritos a mano. Dado que para los principiantes suele ser un reto trabajar con datos de imágenes sobre datos relacionales planos, el conjunto de datos MNIST es el mejor para los principiantes. En este proyecto, utilizarás los conjuntos de datos MNIST para entrenar tu modelo ML utilizando redes neuronales convolucionales (CNN). Aunque el conjunto de datos MNIST puede caber sin problemas en la memoria de su PC (es muy pequeño), la tarea de reconocimiento de dígitos escritos a mano es bastante desafiante.
Puede acceder al conjunto de datos MNIST aquí.
Reconocimiento de la actividad humana utilizando el conjunto de datos del teléfono inteligente
Esta es una de las ideas de proyectos de aprendizaje automático de tendencia. El conjunto de datos de teléfonos inteligentes incluye el registro de la actividad física y la información de 30 personas. Estos datos fueron capturados a través de un smartphone equipado con sensores inerciales.
Este proyecto de ML tiene como objetivo construir un modelo de clasificación que pueda identificar las actividades de fitness humanas con un alto grado de precisión. Al trabajar en este proyecto de ML, aprenderás los fundamentos de la clasificación y también cómo resolver problemas de multiclasificación.
14. Object Detection with Deep Learning
Este es uno de los proyectos de machine learning interesantes para crear. Cuando se trata de la clasificación de imágenes, las Redes Neuronales Profundas (DNNs) deben ser su elección. Mientras que las DNNs ya se utilizan en muchas aplicaciones de clasificación de imágenes del mundo real, este proyecto de ML tiene como objetivo subir de nivel.
En este proyecto de ML, resolverás el problema de la detección de objetos aprovechando las DNNs. Tendrás que desarrollar un modelo que pueda tanto clasificar objetos como localizar con precisión objetos de diferentes clases. En este caso, tratará la tarea de detección de objetos como un problema de regresión a las máscaras de los cuadros delimitadores de los objetos. Además, definirá un procedimiento de inferencia multiescala que pueda generar detecciones de objetos de alta resolución a un coste mínimo.
Detección de noticias falsas
Esta es una de las excelentes ideas de proyectos de aprendizaje automático para principiantes, especialmente por la forma en que las noticias falsas se están propagando como un incendio. Las noticias falsas tienen la habilidad de propagarse como un incendio. Y con las redes sociales dominando nuestras vidas en este momento, se ha vuelto más crítico que nunca distinguir las noticias falsas de los eventos de noticias reales. Aquí es donde el aprendizaje automático puede ayudar. Facebook ya utiliza la IA para filtrar las historias falsas y de spam de los feeds de los usuarios.
Este proyecto de ML pretende aprovechar las técnicas de PNL (Procesamiento del Lenguaje Natural) para detectar las noticias falsas y las historias engañosas que surgen de fuentes no fiables. También puede utilizar el enfoque clásico de clasificación de textos para diseñar un modelo que pueda diferenciar entre noticias reales y falsas. En este último método, puede recopilar conjuntos de datos de noticias reales y falsas y crear un modelo ML utilizando el clasificador Naive Bayes para clasificar una noticia como fraudulenta o real basándose en las palabras y frases utilizadas en ella.
Proyecto de correo electrónico de Enron
El conjunto de datos de correo electrónico de Enron contiene casi 500k correos electrónicos de más de 150 usuarios. Es un conjunto de datos extremadamente valioso para el procesamiento del lenguaje natural. Este proyecto consiste en la construcción de un modelo ML que utiliza el algoritmo de clustering k-means para detectar acciones fraudulentas. El modelo separará las observaciones en un número ‘k’ de clusters según patrones similares en el conjunto de datos.
Proyecto Parkinson
El conjunto de datos de Parkinson incluye 195 registros biomédicos de personas con 23 características variadas. La idea de este proyecto es diseñar un modelo de ML que pueda diferenciar entre personas sanas y las que padecen la enfermedad de Parkinson. El modelo utiliza el algoritmo XGboost (extreme gradient boosting) basado en árboles de decisión para realizar la separación.
Proyecto Flickr 30K
El conjunto de datos Flickr 30K está formado por más de 30.000 imágenes, cada una de las cuales tiene un pie de foto único. Utilizarás este conjunto de datos para construir un generador de pies de foto. La idea es construir un modelo CNN que pueda analizar y extraer eficazmente las características de una imagen y crear un pie de foto adecuado que describa la imagen en inglés.
Proyecto de clientes del centro comercial
Como su nombre indica, el conjunto de datos de clientes del centro comercial incluye los registros de las personas que visitaron el centro comercial, como el género, la edad, la identificación del cliente, los ingresos anuales, la puntuación de gasto, etc. Usted construirá un modelo que utilizará estos datos para segmentar a los clientes en diferentes grupos basados en sus patrones de comportamiento. Esta segmentación de clientes es una táctica de marketing muy útil que utilizan las marcas y los profesionales del marketing para aumentar las ventas y los ingresos y, al mismo tiempo, incrementar la satisfacción de los clientes.
Proyecto Kinetics
Para este proyecto, utilizarás un amplio conjunto de datos que incluye tres conjuntos de datos separados – Kinetics 400, Kinetics 600 y Kinetics 700 – que contienen enlaces URL de más de 6,5 millones de vídeos de alta calidad. Su objetivo es crear un modelo que pueda detectar e identificar las acciones de un humano mediante el estudio de una serie de observaciones diferentes.
Proyecto de sistema de recomendación
Esta es una rica colección de conjuntos de datos que contiene una diversa gama de conjuntos de datos recopilados de sitios web populares como las reseñas de libros de Goodreads, las reseñas de productos de Amazon, los medios sociales, etc. Su objetivo es construir un motor de recomendación (como los utilizados por Amazon y Netflix) que puede generar recomendaciones personalizadas para los productos, películas, música, etc, sobre la base de las preferencias del cliente, las necesidades y el comportamiento en línea.
El proyecto de viviendas de Boston
El conjunto de datos de viviendas de Boston consiste en los detalles de diferentes casas en Boston basados en factores como la tasa de impuestos, la tasa de criminalidad, el número de habitaciones en una casa, etc. Es un excelente conjunto de datos para predecir los precios de diferentes casas en Boston. En este proyecto, construirás un modelo que pueda predecir el precio de una casa nueva utilizando la regresión lineal. La regresión lineal es la más adecuada para este proyecto, ya que se utiliza cuando los datos tienen una relación lineal entre los valores de entrada y de salida y cuando la entrada es desconocida.
Proyecto Cityscapes
Este conjunto de datos de código abierto incluye anotaciones de alta calidad a nivel de píxel de secuencias de vídeo recogidas de las calles de 50 ciudades diferentes. Es inmensamente útil para el análisis semántico. Se puede utilizar este conjunto de datos para entrenar redes neuronales profundas para analizar y comprender el paisaje urbano. El proyecto consiste en diseñar un modelo que pueda realizar la segmentación de imágenes e identificar varios objetos (coches, autobuses, camiones, árboles, carreteras, personas, etc.) a partir de una secuencia de vídeo de calles.
Proyecto Youtube 8M
El Youtube 8M es un enorme conjunto de datos que cuenta con 6,1 millones de ID de vídeos de YouTube, 350.000 horas de vídeo, 2.600 millones de características audiovisuales, 3862 clases y una media de 3 etiquetas para cada vídeo. Se utiliza ampliamente para proyectos de clasificación de vídeos. En este proyecto, construirá un sistema de clasificación de vídeo que pueda describir con precisión un vídeo. Considerará una serie de entradas diferentes y clasificará los vídeos en categorías distintas.
Sonido urbano 8K
El conjunto de datos de sonido urbano 8K se utiliza para la clasificación del sonido. Incluye una colección diversa de 8732 sonidos urbanos que pertenecen a diferentes clases como sirenas, música callejera, ladridos de perros, piar de pájaros, gente hablando, etc. Diseñará un modelo de clasificación de sonidos que pueda detectar automáticamente qué sonido urbano se está reproduciendo en el proyecto
IMDB-Wiki
Este conjunto de datos etiquetados es probablemente una de las colecciones más extensas de imágenes de caras recopiladas a través de IMDB y Wikipedia. Tiene más de 5 millones de imágenes de caras etiquetadas con la edad y el género. con el género y la edad etiquetados. Crearás un modelo que pueda detectar caras y predecir su edad y género con precisión. Puedes hacer diferentes segmentos/rangos de edad como 0-10, 10-20, 30-40, etc.
Proyecto librispeech
El conjunto de datos librispeech es una colección masiva de discursos en inglés derivada del proyecto LibriVox. Contiene discursos leídos en inglés en varios acentos que abarcan más de 1000 horas y es la herramienta perfecta para el reconocimiento del habla. El objetivo de este proyecto es crear un modelo que pueda traducir automáticamente el audio en texto. Construirá un sistema de reconocimiento de voz que pueda detectar el discurso en inglés y traducirlo a formato de texto.
Proyecto de referencia de reconocimiento de señales de tráfico alemanas (GTSRB)
Este conjunto de datos contiene más de 50.000 imágenes de señales de tráfico segmentadas en 43 clases y que contienen información sobre el cuadro delimitador de cada señal de tráfico. Es ideal para la clasificación multiclase, que es exactamente en lo que te centrarás aquí. Construirás un modelo utilizando un marco de aprendizaje profundo que pueda reconocer el cuadro delimitador de las señales y clasificar las señales de tráfico. El proyecto puede ser extremadamente útil para los vehículos autónomos, ya que detecta las señales y ayuda a los conductores a tomar las acciones necesarias.
29. Resumen de textos de vídeos de partidos deportivos
Este proyecto es exactamente como suena: obtener un resumen preciso y conciso de un vídeo deportivo. Es una herramienta útil para los sitios web de deportes que informan a los lectores sobre los aspectos más destacados del partido. Dado que las redes neuronales son las mejores para resumir textos, construirás este modelo utilizando redes de aprendizaje profundo como 3D-CNNs, RNNs y LSTMs. Primero fragmentarás un vídeo deportivo en múltiples secciones utilizando los algoritmos de ML apropiados y luego utilizarás una combinación de SVM(Support vector machines), redes neuronales y el algoritmo k-means.
30. Generador de resúmenes de reuniones de negocios
La resumización consiste en extraer los trozos de información más significativos y valiosos de las conversaciones, archivos de audio/vídeo, etc., de forma breve y concisa. Generalmente se realiza mediante la captura de rasgos estadísticos, lingüísticos y sentimentales con la estructura de diálogo de la conversación en cuestión. En este proyecto, utilizará técnicas de aprendizaje profundo y de procesamiento del lenguaje natural para crear resúmenes precisos de reuniones de negocios manteniendo el contexto de toda la conversación.
31. Análisis de sentimiento para la depresión
La depresión es una de las principales preocupaciones de salud a nivel mundial. Cada año, millones de personas se suicidan debido a la depresión y la mala salud mental. Por lo general, el estigma vinculado a los problemas de salud mental y el retraso en el tratamiento son las dos causas principales detrás de esto. En este proyecto, aprovecharás los datos recopilados de diferentes plataformas de medios sociales y analizarás los marcadores lingüísticos en las publicaciones de los medios sociales para comprender la salud mental de las personas. La idea es crear un modelo de aprendizaje profundo que pueda ofrecer información valiosa y precisa sobre la salud mental de una persona mucho antes que los métodos convencionales.
32. Solucionador de ecuaciones escritas a mano
El reconocimiento de expresiones matemáticas escritas a mano es un campo de estudio crucial en la investigación de la visión por ordenador. Construirá un modelo y lo entrenará para resolver ecuaciones matemáticas escritas a mano utilizando redes neuronales convolucionales. El modelo también hará uso de técnicas de procesamiento de imágenes. Este proyecto consiste en entrenar el modelo con los datos adecuados para que sea capaz de leer dígitos escritos a mano, símbolos, etc., para ofrecer resultados correctos para ecuaciones matemáticas de diferentes niveles de complejidad.
33. Reconocimiento facial para detectar el estado de ánimo y recomendar canciones
Es un hecho conocido que las personas escuchan música en función de su estado de ánimo y sentimientos actuales. Entonces, ¿por qué no crear una aplicación que pueda detectar el estado de ánimo de una persona por sus expresiones faciales y recomendar canciones en consecuencia? Para ello, utilizarás elementos y técnicas de visión por ordenador. El objetivo es crear un modelo que pueda aprovechar eficazmente la visión por ordenador para ayudar a los ordenadores a obtener una comprensión de alto nivel de las imágenes y los vídeos.
34. Generador de música
Una composición musical no es más que una combinación melodiosa de diferentes niveles de frecuencia. En este proyecto, diseñarás un generador de música automático que pueda componer piezas musicales cortas con una mínima intervención humana. Utilizarás algoritmos de aprendizaje profundo y redes LTSM para construir este generador de música.
35. Sistema de predicción de enfermedades
Este proyecto ML está diseñado para predecir enfermedades. Creará este modelo utilizando R y R Studio y el conjunto de datos de cáncer de mama de Wisconsin (diagnóstico). Este conjunto de datos incluye dos clases de predictores: masa mamaria benigna y maligna. Es esencial tener un conocimiento básico de los bosques aleatorios y XGBoost para trabajar en este proyecto.
36. Encontrar un exoplaneta habitable
En la última década, hemos tenido éxito en la identificación de muchos exoplanetas en tránsito y exoplanetas. Dado que la interpretación manual de posibles exoplanetas es bastante desafiante y requiere mucho tiempo (sin olvidar que también está sujeta a errores humanos), lo mejor es utilizar el aprendizaje profundo para identificar exoplanetas. Este proyecto pretende averiguar si hay exoplanetas habitables a nuestro alrededor utilizando CNNs y datos de series temporales ruidosas. Este método puede identificar exoplanetas habitables con más precisión que el método de mínimos cuadrados.
37. Regeneración de imágenes para carretes antiguos & dañados
La restauración de carretes de imágenes antiguos o dañados es una tarea difícil. Casi siempre es imposible restaurar las fotos antiguas a su estado original. Sin embargo, el aprendizaje profundo puede resolver este problema. Construirás un modelo de aprendizaje profundo que pueda identificar los defectos de una imagen (rozaduras, agujeros, pliegues, decoloración, etc.) y utilizarás algoritmos de Inpainting para restaurarla. Incluso puede colorear imágenes antiguas en B&W.
Proyectos de la industria del mundo real
Magenta
Este proyecto de investigación se centra en explorar las aplicaciones del aprendizaje automático en el proceso de creación del arte y la música. Desarrollarás algoritmos únicos de aprendizaje por refuerzo y aprendizaje profundo que pueden generar imágenes, canciones, música y mucho más. Es el proyecto perfecto para mentes creativas apasionadas por el arte y la música.
BluEx
BluEx es una de las principales empresas de logística de la India que ha desarrollado una gran base de fans, gracias a sus entregas puntuales y eficientes. Sin embargo, como ocurre con todos los proveedores de servicios logísticos, BluEx se enfrenta a un reto particular que cuesta tiempo y dinero: sus conductores no frecuentan las rutas de entrega óptimas, lo que provoca retrasos y conlleva mayores costes de combustible. Creará un modelo ML utilizando el aprendizaje por refuerzo que puede encontrar la ruta más eficiente para un lugar de entrega concreto. Esto puede ahorrar hasta un 15% del coste de combustible para BluEx.
Motion Studios
Motion Studios presume de ser la mayor productora de radio de Europa con unos ingresos que superan los mil millones de dólares. Desde que la empresa de medios de comunicación lanzó su reality show, RJ Star, han recibido una respuesta fenomenal y están inundados de clips de voz. Al tratarse de un reality show, hay un plazo limitado para elegir a los candidatos. Se va a construir un modelo que pueda diferenciar entre voces masculinas y femeninas y clasificar los clips de voz para facilitar un filtrado más rápido. Esto ayudará es una selección más rápida, facilitando la tarea de los ejecutivos del programa.
LithionPower
Lithionpower construye baterías para vehículos eléctricos. Normalmente, los conductores alquilan las baterías de la empresa durante un día y las sustituyen por otras cargadas. La duración de la batería depende de factores como la distancia recorrida/día, el exceso de velocidad, etc. LithionPower emplea un modelo de precios variable basado en el historial de conducción del conductor. El objetivo de este proyecto es construir un modelo de cluster que agrupará a los conductores según su historial de conducción e incentivará a los conductores en función de esos clusters. Aunque esto aumentará los beneficios entre un 15 y un 20%, también cobrará más a los conductores que tengan un mal historial de conducción.
Conclusión
Esta es una lista completa de ideas de proyectos de aprendizaje automático. El aprendizaje automático está todavía en una fase inicial en todo el mundo. Hay muchos proyectos por hacer, y mucho por mejorar. Con mentes inteligentes e ideas afiladas, los sistemas de apoyo a las empresas mejoran, son más rápidos y rentables. Si desea sobresalir en el aprendizaje automático, debe reunir experiencia práctica con dichos proyectos de aprendizaje automático.
Sólo trabajando con herramientas de ML y algoritmos de ML puedes entender cómo funcionan las infraestructuras de ML en la realidad. Ahora siga adelante y ponga a prueba todo el conocimiento que ha reunido a través de nuestra guía de ideas de proyectos de aprendizaje automático para construir sus propios proyectos de aprendizaje automático!
¿Qué tan fácil es implementar estos proyectos?
Estos proyectos son muy básicos, alguien con un buen conocimiento de Aprendizaje Automático puede manejar fácilmente para elegir y terminar cualquiera de estos proyectos.
¿Puedo hacer estos proyectos en ML Internship?
Sí, como se ha mencionado, estas ideas de proyectos son básicamente para Estudiantes o Principiantes. Hay una alta posibilidad de que llegue a trabajar en cualquiera de estas ideas de proyectos durante su pasantía.
¿Por qué necesitamos construir proyectos de aprendizaje automático?
Cuando se trata de carreras de desarrollo de software, es una necesidad para los aspirantes a desarrolladores trabajar en sus propios proyectos. Desarrollar proyectos del mundo real es la mejor manera de perfeccionar tus habilidades y materializar tus conocimientos teóricos en experiencia práctica.
Lidera la revolución tecnológica impulsada por la IA
Más información