Tantas personas están aprendiendo aprendizaje automático. ¿Qué debo hacer para destacar?

He hablado de esto antes. Esta respuesta tiene extractos de mi respuesta anterior.

Sí, es cierto que muchas personas están tratando de aprender Aprendizaje automático. Sin embargo, la mayoría de la gente abandona sus esfuerzos realmente rápido porque:

  • Escribir código para preparar datos no es atractivo, sin embargo, eso es una gran parte del éxito.
  • Aprender matemáticas y ser realmente bueno en ingeniería de software es necesario si quieres pasar del nivel de principiante del juego.
  • Altos índices de fracaso de las ideas. Todo lo que vemos en los medios populares es la versión final del documento y las cosas asombrosas que está haciendo el modelo. A menudo, hay muchos intentos fallidos antes de un éxito. Muchas personas se desaniman cuando su primera idea no funciona y se van. Deseo que algunos de los investigadores famosos escriban un blog sobre su viaje del fracaso al éxito.

Como resultado, no hay muchos talentos de Aprendizaje automático por ahí.

Ahora, para la segunda parte de su pregunta : puede sobresalir simplemente con la tarea de aprender ML :). He escrito algunas respuestas sobre cómo enfocar el aprendizaje del LD, a continuación de extractos de mi respuesta anterior.

Material fundacional

Matemáticas

Se requerirá álgebra lineal, probabilidad y cálculo. Enfoque su estudio desde una perspectiva de herramientas, es decir, aprenda sobre un tema cuando lo encuentre y tenga muy claro por qué ese tema es importante.

  • Primera sección del libro Deep Learning. Agradable y gentil introducción a los conceptos matemáticos relacionados con el Aprendizaje Automático.
  • Esencia de álgebra lineal y esencia de cálculo. Serie de videos cortos de Youtube que brindan una intuición muy hermosa sobre el álgebra lineal y el cálculo. Por ejemplo, ¿sabías que el determinante describe cómo se escala y se transforma el espacio mediante una matriz?
  • Calculus Made Easy de Thompson. Recientemente me topé con este texto (alguien publicado en Twitter) y me enamoré de él. Da una buena introducción superficial al cálculo.
  • Análisis de sistemas de probabilidad MIT y probabilidad aplicada. Va un poco lento para mi gusto pero cubre todos los temas principales.
  • Métodos matemáticos para la visión artificial, robótica y gráficos. Recomiendo volver a Khan Academy para materiales suplementarios.
  • Métodos matemáticos para ingenieros 1 y 2. Curso MIT sobre matemáticas aplicadas. Algunos métodos relevantes para la IA y otros no. Veo conferencias seleccionadas cuando estoy revisando algún material.

Ingeniería de software

  • Aprende Python. La mayoría de las bibliotecas de AI y el código de ejemplo que hay por ahí se implementa en Python. Vengo de un contexto de JAVA y este libro me ayudó enormemente a comprender las formas de Pythonic.
  • Una vez que se sienta cómodo con lo básico, comience a sentirse cómodo con la programación paralela en Python. Tendrá que usarlo para crear datos de entrenamiento en paralelo o acelerar las tareas de cocción de datos mundanos. Este blog te dará un buen comienzo. Te encontrarás con el maravilloso mundo de GIL :).
  • Sé bueno usando NumPy y Scipy. Estas herramientas implementan las matemáticas en las computadoras. Esta introducción de Stanford es un gran comienzo. Un punto sutil es este: NumPy parece haber establecido los estándares sobre cómo se debería pensar acerca del Álgebra Lineal en las computadoras. Así que los conceptos aprendidos aquí se transfieren a la mayoría de los otros kits de herramientas de inteligencia artificial.

Aprendizaje automático acelerado de GPU

La mayor parte del aprendizaje automático son transformaciones matriciales. Matrix Matemix puede ser masivamente acelerado en GPUs. Recomiendo explorar GPU para acelerar sus modelos ML.

  • A la larga, construir tu propia caja de GPU será más barato. Consulte estas guías: Una guía completa de hardware para el aprendizaje profundo: Tim Dettmers y la creación de su propio cuadro de aprendizaje profundo: Hacia la ciencia de los datos: Medio.
  • Recomiendo este libro y este curso. Recuerde, no necesita saberlo todo, pero la comodidad con este material lo ayudará a ejecutar sus redes más rápido y a solucionar problemas.
  • También necesitarás aprender un marco basado en GPU. Hay muchos para elegir, como MXNet, Theano, Tensorflow y PyTorch. Todos estos marcos son motores de álgebra lineal. Sus sitios web están llenos de guías y tutoriales. Elige uno y hazlo bien.

Aprendizaje automático de materiales específicos

El aprendizaje automático es un campo vasto. Esta sección variará según el tipo de Aprendizaje automático que desee seguir. Utilizo las redes neuronales para perseguir el aprendizaje automático, por lo que mi descripción estará sesgada a esas técnicas.

En mi humilde opinión, la progresión de los materiales de digestión es conferencias -> blogs / libros -> artículos. Algunos de mis favoritos.

Conferencias

  • Aprendiendo de los datos.
  • Redes neuronales para el aprendizaje automático.
  • Redes neuronales convolucionales para el reconocimiento visual.
  • Aprendizaje profundo para el procesamiento del lenguaje natural
  • Oxford CS Deep NLP
  • Redes neuronales

Blogs / Libros

  • Libro de aprendizaje profundo
  • Andrej Karapathy
  • Colah
  • Sebastian Ruder
  • WildML
  • Destilar

Papeles

  • Gran lista compilada por Terry Taewoong Um
  • Crea una cuenta en Arxiv Sanity Preserver y vuélvete loco

Este campo se está moviendo tan rápido que la mejor manera de “mantenerse informado” es seguir a los líderes del campo. La mejor manera de hacerlo es en las redes sociales. Algunas recomendaciones y, probablemente, las redes sociales que elijas (la mayoría de ellas están activas en Twitter) comenzarán a mostrarte personas más relevantes 🙂

  • Andrew Ng
  • Yoshua Bengio
  • Yann LeCun
  • Fei-Fei Li
  • Andrej Karpathy

Organizando tu material de lectura (opcional)

Intento constantemente optimizar cómo organizo mi material. En un momento me había impreso papeles por todas partes. Luego, con el iPad Pro y el Apple Pencil, “intenté” ir sin papel pero revertí. Pero, en el último mes (después del lanzamiento de iPad de 10.5 pulgadas) creo que finalmente encontré un sistema que me funciona.

  • Yo uso Papers para organizar mis archivos PDF. Puede importar archivos PDF de fuentes como Arxiv.
  • Uso LiquidText para leer y anotar mis archivos PDF. Lo bueno aquí es que puedes abrir archivos PDF desde Papers en LiquidText y cuando hayas terminado, puedes enviarlos nuevamente a Papers con tus anotaciones intactas.
  • Utilizo Google Keep para los marcadores sobre la marcha. Luego, cuando tengo tiempo, importo cosas en Papers o LiquidText para futuras lecturas.

Espero que esto ayude 🙂

“Acércate con una mentalidad de resolución de problemas”

La mayoría de la gente en este punto está tratando de aprender estas tecnologías solo para entender las piezas técnicas de la misma (o es algo genial en este momento).

Si te gusta sobresalir, enfócate en el problema que podría resolver. Intenta resolver un problema convincente que ayude a las personas.

Los datos son su activo

Hasta hoy seguimos buscando la información correcta para tomar muchas decisiones críticas. Todo el proceso complejo para tomar esa decisión se realiza dentro de los cerebros humanos.

Pero los humanos no son consistentes, pueden mezclar otras variables como los sentimientos humanos para alterar las decisiones.

En el futuro (no tan lejos), tendremos máquinas para pensar y tomar algunas de las decisiones por nosotros. (nos guste o no, esto está sucediendo)

Y ese es el propósito exacto que existen hoy en día estas tecnologías.

Como tecnólogo en aprendizaje automático, nuestro trabajo consiste en enseñar a estas máquinas a aprender los datos y patrones existentes de manera eficiente para ayudarlo a tomar decisiones más inteligentes.

A medida que aprendemos y mejoremos en el entrenamiento de las máquinas, nos resolverá problemas más complejos.

Así que comience a trabajar con los datos y los patrones de comportamiento en torno a esos datos.

Determine una industria que dependa de los datos para tomar decisiones e intente replicar eso con tecnologías de ML.

Si puedes hacer que la máquina tome una decisión mejor o incluso similar a la de los humanos, es una victoria.

Con más práctica, sería más fácil trabajar con la tecnología.

Pero la idea de dónde aplicamos esta tecnología sería una habilidad crítica y es posible que no tengas una competencia mayor para esta habilidad.

Piense fuera de “tecnología” .

Piense en cómo los conceptos de aprendizaje automático pueden aplicarse a campos que tradicionalmente han ignorado completamente el poder de los datos.

  • Caso en el punto # 1: Política.

    FiveThirtyEight de Nate Silver se convirtió en una sensación al aplicar los conceptos de aprendizaje automático existentes a los datos políticos, porque la política simplemente no había alcanzado los avances en el aprendizaje automático. Y eso es en gran parte cierto incluso hoy. Un profesor de Ciencias Políticas de Stanford que conozco todavía dice que Washington DC lleva al menos 10 años detrás de Silicon Valley en cada etapa.

  • Caso en el punto # 2: Periodismo.

    El New York Times fue probablemente el primer proveedor de noticias importante en contratar un gran equipo de científicos de datos y un Jefe de datos científicos (Chris Wiggins), porque querían entender a sus lectores. ¡Y parece que funciona!

Algunos otros campos similares que tradicionalmente habían ignorado los datos (en gran parte porque no tenían ninguno) son Deportes , Energía y Venta minorista .

El futuro del aprendizaje automático aplicado vendrá en gran parte de personas que tienen campos de experiencia adicionales fuera de la tecnología.

Entonces, si quieres sobresalir, te animo a mirar el mundo a través de la lente de los datos. Para cada actividad que vea en el mundo real, piense “ ¿Cómo puede mejorarse esto usando datos? “. Sin embargo, no lo verbalices. Eso sería raro.

Mantente ocupado con proyectos. Aprenda sobre cada paso en el proceso de análisis estadístico.

Recopilación de datos : no siempre tendrás un conjunto de datos lindo con el que trabajar. Cree web scrapers para extraer información de diferentes fuentes en línea. Aunque es la menos matemática, es la parte de la tubería que más tiempo consume.

Imputación de datos : identifique valores atípicos y puntos de alto apalancamiento y decida cómo tratarlos. ¿Simplemente deshacerse de ellos? Introducir valores por defecto? ¿Qué funciona mejor?

Visualización de datos : entienda mejor sus datos a través de gráficos visuales como histogramas para obtener la distribución de las variables de respuesta, parcelas de dispersión por pares para determinar la relación entre las covariables y la variable de respuesta o entre las covariables en sí. Los diagramas de caja por pares entre covariables y variables de respuesta son útiles si cualquiera de las dos es cualitativa (categórica).

Esta es una esencia de la etapa de análisis. Estas son las partes menos valoradas del proceso de aprendizaje automático. ML no se trata solo de tomar datos y lanzarlos a un modelo. Se debe realizar un preprocesamiento adecuado antes de tocar un modelo estadístico.

El modelado estadístico se ha convertido más en una caja negra con la aparición de innumerables bibliotecas y marcos que lo ayudan a configurar un modelo con una sola línea de código. Sin embargo, comprender las tuercas y los pernos te permitirá ajustar mejor los hiperparámetros como:

  • tasa de aprendizaje [math] \ alpha [/ math] en el caso de SVM, o
  • término de penalización [math] \ lambda [/ math] en el caso de regresión de la cresta y lazo, o
  • Número de neuronas de capa oculta en una red neuronal totalmente conectada

Si sabes cómo configurar un modelo, estás en el 50% superior. Si sabes cómo ajustar un modelo, estás en el 5% superior. Si también sabe cómo analizar sus datos, se encuentra en el 1% superior.

Simplemente siga analizando datos del mundo real, conozca las soluciones de última generación para el análisis y vea si puede construir sobre eso.

También puede Destacar si tiene interés y pasión en este campo.

Para aprender el aprendizaje automático, debes ser mejor que el promedio en matemáticas. Aquí están las matemáticas que debe aprender teniendo en cuenta el objetivo final para estar preparado.

  • Álgebra lineal-Álgebra lineal – MIT 18.06 Álgebra lineal por Gilbert Strang
  • Teoría de probabilidad-Probabilidad y estadística – MIT 6.041 Análisis probabilístico de sistemas y probabilidad aplicada por John Tsitsiklis
  • Cálculo
  • Cálculo de variaciones
  • Teoría de grafos
  • Métodos de optimización (multiplicadores de Lagrange)
  • Cualquier lenguaje de programación que sea ampliamente utilizado para ML como python, MATLAB o C ++.

PD: recomendaría Python aquí como idioma y recomendaría los siguientes enlaces:

  • Aprendizaje automático con texto en scikit-learn (PyCon 2016)
  • Aprendizaje automático en Python con scikit-learn

Una vez cumplidos estos requisitos, por fin puede comenzar a considerar el Aprendizaje automático.

6 PASOS FÁCILES PARA UTILIZAR EL APRENDIZAJE EN MÁQUINA?

Este es el lugar donde comienza la diversión. Ahora, se espera que la fundación comience a echar un vistazo a algunos datos. La mayoría de las empresas de aprendizaje automático tienen básicamente el mismo proceso de trabajo:

PASO 1.) Fabrique sus fundamentos de aprendizaje automático estudiando algunos materiales relacionados con el tema:

a.) Las conferencias de Aprendizaje automático de Andrew Ng son un gran comienzo:

Colección de conferencias | Aprendizaje automático – YouTube

b.) Certificado de aplicaciones y minería de datos de Stanford:

Certificado de postgrado en minería de datos y solicitudes

c.) Escuela de verano de aprendizaje automático:

https://www.youtube.com/playlist

d.) Un enlace a la lista de reproducción completa está aquí (Lecture Collection | Machine Learning)
https://www.youtube.com/view_pla

e.) Introducción a la inteligencia artificial por el Prof. Deepak Khemani IIT Madras

http://nptel.ac.in/courses/10610

e.) “La mejor introducción de aprendizaje automático que he visto hasta ahora”.

PASO 2.) Toma un curso en línea

Lo principal que aconsejo a alguien que necesita aprender aprendizaje automático es tomar el curso en línea de Andrew Ng.

Creo que el curso de Ng es especialmente puntual y excepcionalmente eficiente, por lo que es un conocido extraordinario para alguien que necesita ingresar a ML. Me sorprende cuando los individuos me revelan que el curso es “excesivamente fundamental” o “excesivamente superficial”. Ante la posibilidad de que me revelen que solicito que aclaren el contraste entre Regresión logística y SVM de kernel lineal, PCA versus Factorización matricial, regularización o pendiente de gradiente. He hablado con los aspirantes que afirmaron años de encuentro de ML que no sabían la respuesta a estas preguntas. En su mayor parte están claramente aclarados en el curso de Ng. Hay muchos otros cursos en línea que puede tomar después de este, pero ahora está en su mayor parte preparado para pasar a la siguiente etapa.

Vea mi publicación anterior Los 10 mejores videos, profesores y cursos sobre aprendizaje automático para principiantes y avanzados

PASO 3.) Algunas sugerencias de libros.

Mi paso subsiguiente sugerido es obtener un libro decente de LD (mi resumen más abajo), leer las secciones principales de introducción, y después de que el rebote a cualquier parte incorpore un algoritmo, está interesado. Cuando hayas descubierto que algo, salta a él, observa cada uno de los puntos de interés y, en particular, implementalo. En el último paso del curso en línea, a partir de ahora, habría actualizado algunos algoritmos en Octave. Sea como sea, aquí estoy mirando la ejecución de un algoritmo sin ninguna preparación en un lenguaje de programación “real”. En cualquier caso, puede comenzar con uno simple, por ejemplo, Regresión logística regularizada por L2, o k-means, pero también debería esforzarse para actualizar todos los más interesantes, por ejemplo, SVM. Puede utilizar una implementación de referencia en una de las muchas bibliotecas existentes para asegurarse de que está obteniendo resultados equivalentes.

  • El razonamiento bayesiano de David Barber y el aprendizaje automático
  • Aprendizaje automático de Kevin Murphy: una perspectiva probabilística
  • Los elementos del aprendizaje estadístico de Hastie, Tibshirani y Friedman
  • Reconocimiento de patrones del obispo y aprendizaje automático
  • Aprendizaje de máquina de Mitchell

También hay numerosos libros geniales que se centran en un tema específico. Por ejemplo, Sutton and Re-Inforcement Learning es una obra de arte. Además, el libro Deep Learning (accesible en la web) prácticamente se está convirtiendo en un ejemplar antes de su distribución. Sea como sea, necesita un par de esos libros para reunir un grado de comprensión de gran alcance y equilibrado del campo.

Ver mi publicación anterior 10 libros electrónicos gratuitos que debes leer sobre los conceptos básicos del aprendizaje automático.

Asimismo, puede ir específicamente a un trabajo de investigación que presente un algoritmo o enfoque que le interese y se sumerja en él.

PASO 4.) La mayoría de los algoritmos esenciales

Se confía en usted para conocer las tuercas y los tornillos de un algoritmo esencial.

Ver mis algoritmos posteriores a 15 algoritmos que los ingenieros de aprendizaje deben conocer.

En cualquier caso, además de los algoritmos, también es fundamental saber cómo configurar sus datos (selección de características, transformación y compresión) y cómo evaluar sus modelos. Tal vez, como iniciador, podría ver nuestro Aprendizaje de máquina en el ejercicio de instrucción scikit-learn en SciPy 2016. Condensa una gran parte de los rudimentos al presentar la biblioteca de scikit-learn, que puede resultar útil para la ejecución y otros exámenes. :

PASO 5.) Juega con unos enormes conjuntos de datos que son accesibles de forma abierta.

Descubra un conjunto de datos que le parezca especialmente intrigante o sobre el que tenga hipótesis y verifique si tiene razón.

Datos del gobierno de los Estados Unidos http://www.data.gov/

Empresa Ferroviaria de Catering y Turismo http://www.irctc.co.in

PASO 6.) Participe en un equipo de aprendizaje automático o personalización centrado en el producto.

El grupo que busca debe estar cargado de ingenieros a los que desea instruir y aprender. Esto te ayudará a convertirte en un buen ingeniero de aprendizaje automático. Del mismo modo, al separar un grupo de productos, rápidamente descubrirás cómo la ciencia y la hipótesis del aprendizaje automático varían de la capacitación. Específicamente, cómo la conducta del cliente le mostrará algo nuevo cada día.

Esta es la primera respuesta que he hecho en Quora … Espero que sea útil.

Muchas personas mencionan una gran cantidad de habilidades técnicas, que pueden ser intimidantes y desalentadoras. Sin embargo, esto es sólo un comienzo. Un científico de datos exitoso debería crecer sobre estas bases y desarrollar su propia intuición más allá de todas estas palabras geek, es decir, debería poder usar todas estas técnicas sin problemas reales de forma libre y adecuada .

Esto es lo que realmente hace al científico de datos una carrera aparentemente popular pero en realidad difícil. Solo cuando puede emplear intuitivamente una metodología en un problema real y resolverla (o al menos mitigarla) puede decir con orgullo que usted es un maestro / experto en ello. Esto debería excluir :

  1. Interpretación errónea del resultado del método.
  2. Asunción errónea que encaja en el problema real
  3. Método correcto pero demasiado complicado aplicado intencionalmente a un problema simple
  4. Método correcto pero aplicado a un problema que tiene poco impacto en el negocio

En conclusión, es difícil, ya que las fáciles son hechas por otras personas, o por AI. Debemos buscar continuamente cosas fuera de la caja. Esto es lo que realmente nos hace destacar.

  • Construye algunos proyectos para demostrar tu aprendizaje. Empuje el código a github y esos a su cv. Esto lo hará consciente de los problemas que ocurren cuando convierte los conceptos teóricos de un algoritmo en código.
  • Empieza a participar en las competiciones de Kaggle. Descargue los conjuntos de datos e intente averiguar un modelo de datos / algoritmo para resolver ese problema. A partir de esto, sabrás que lo que sabes es solo la punta del iceberg. Además, es posible que conozcas a muchos entusiastas de los datos científicos y la inteligencia artificial. Esto también puede ayudarlo a conseguir un trabajo en 4 grandes.
  • Lea blogs, escuche podcasts, haga MOOCs para que siempre esté al tanto de las últimas cosas que suceden en el mundo de ML.
  • Y por último, pero no menos importante, responda a las preguntas sobre el desbordamiento de quora y pila. ¡Ayuden, establezcan redes, participen, ayuden a otras personas a crecer y ustedes mismos crecerán!

En la “programación” de aprendizaje automático = codificar un algoritmo, en la “programación” de investigación de operaciones = ¿optimización?

Respuesta más seria, creo que las diferencias son más linaje histórico y área de aplicación que las técnicas per se. Una perspectiva sobre las culturas de las estadísticas (académicas) frente al aprendizaje automático que encontré interesante es “La desventaja de las estadísticas”.

La estadística es la más antigua, y se originó a partir de las matemáticas y la probabilidad, tal vez surgiendo como una disciplina distinta a fines del siglo XIX (aunque gran parte de la teoría es más antigua). De los tres, las estadísticas son quizás las más asociadas con la “ciencia académica”, y ciertamente son las más preocupadas por los enfoques rigurosos del diseño experimental y la recopilación de datos.

La investigación de operaciones parece originarse más cerca de la Segunda Guerra Mundial, y generalmente se asocia con grandes organizaciones (por ejemplo, militar, logística / cadena de suministro, ingeniería industrial), centrándose en la gestión y optimización de sus “operaciones”, por así decirlo.

(En términos de las tradiciones de “ciencia de datos” con una larga historia, otra importante sería la econometría. Wikipedia dice que es economía, mientras que CV dice que son estadísticas, ¡para lo que vale!)

El aprendizaje automático es el más reciente, pero para mí es más ambiguo, y al menos en los medios populares es esencialmente un cambio de marca de “AI”. Este sentido más amplio incluye muchos aspectos, incluida la visión por ordenador y la robótica probabilística. Sin embargo, la informática es una parte integral de todo esto.

Finalmente, diría que las palabras de moda como “Data Science” y “Analytics” son en gran medida términos de marketing. Es menos probable que se usen entre los miembros de estas comunidades, en comparación con cuando se comunican con personas externas (o cuando las personas externas están hablando entre sí).

En estos días, a menudo recibo consultas como esta: ¿Cómo comienzo el aprendizaje automático? ¿Cuáles son los recursos para aprender?

Todo el mundo quiere aprender Aprendizaje automático, ya que hay algo de revuelo entre todos los estudiantes de ciencias informáticas. Todos piensan que los demás están haciendo y siguen el mismo camino.

¡Nadie se entusiasma con hacerlo y aplicarlo, nadie está intrigado por lo que ML puede hacer!

Me emocioné de nuevo durante mi año más fresco durante mi licenciatura y no tomé ninguna ayuda y mi único amigo era Google y ahora también. Solo busco cosas y vengo con varios blogs, reddit y sub-reddit para aprender.

Más que aprender, toma el cuaderno de jupyter y aplícalo. En realidad, no sabrá qué algoritmo funciona bien para conjuntos de datos particulares o muestra mejores resultados.

Durante ML Nanodegree, en uno de los proyectos habrían pedido implementar tres algoritmos ML diferentes para maximizar y explicar cómo se comporta cada uno.

Utilice Tensorflow e implemente algoritmos con tensorflow y vea cómo se optimiza.

Cuando se trata de redes neuronales, use GPU para analizarlo y ver cómo se optimizan los resultados.

Más que aprender, aplicarlo y analizarlo.

Puedes sobresalir por ser bueno en eso.

prerrequisito: asegúrese de no estar aprendiendo ML solo porque está de moda o porque todos los demás lo están haciendo, en cuyo caso Donald Knuth tiene algo que decirle:

“No solo crea eso porque algo está de moda, es bueno. Probablemente vaya al otro extremo, si encuentro que mucha gente está adoptando cierta idea, probablemente pensaría que está mal … esto es, por supuesto, ridículo, pero veo la otra parte con demasiada frecuencia donde la gente hará algo contra ellos mismos. instintos, porque piensan que la comunidad quiere que lo hagan de esa manera, por lo que las personas trabajarán en un tema determinado a pesar de que no están muy interesadas en él porque piensan que obtendrán más prestigio al trabajar en ello “.

Ahora que lo hemos eliminado, puedo asumir que estás aprendiendo ML por las razones correctas. Así que aquí está lo que debes hacer para destacar:

Aprende los fundamentos. Olvídate de scikit-learn, keras o cualquier biblioteca que esté de moda hoy. Codifica tus propios algoritmos. Será muy doloroso al principio. Pero el dolor es bueno. Te ayudará a descubrir lo que no sabes.

Trate de ser el mejor en el campo que está haciendo, ya que nadie para ser el mejor en su trabajo es la única manera de estar entre otros competidores y no en el mismo campo.

Lo mejor de su Feild es un trabajo arduo, además de contar con excelentes mentores y leer libros y conferencias estándar de la experiencia en aprendizaje automático.

https://www.google.co.in/url?sa=… o https://www.google.co.in/url?sa=… se considera el mejor curso para el aprendizaje automático, ya que muchos de los expertos A quien he conocido me sugirió esto.

También debe actualizarse acerca de los desarrollos recientes y el progreso que se está realizando en el campo.

Comience desde el principio dejando todos sus conceptos claros participando en hckathon organizado por

  1. HACKERRANK: https://www.google.co.in/url?sa=…
  2. Hackerearth: https://www.google.co.in/url?sa=…
  3. También debería tener al menos un comando sobre un idioma con gran detalle. Mi sugerencia es python, ya que solo trabajo en python.

La mayoría de la gente está aprendiendo a usar bibliotecas en lugar de aprender ML desde Ground UP.

La mayoría de las personas se centran en cómo usar Scikit Learn o Tensorflow o TfLearn o Keras …

La verdadera esencia del Aprendizaje automático reside en las Matemáticas, Estadísticas, Derivados subyacentes …

  • Aprende cómo vino la ecuación normal .
  • Aprende cómo funciona Gradient Descent
  • Aprende diferentes sabores de Gradient Descent (Batch, SGD, adam, adadelta)
  • Aprende el algoritmo Back-propogation .
  • Aprende a visualizar mejor los datos.
  • Aprende cómo funciona el truco del kernel en SVMs

Es mejor leer un libro para obtener una visión completa del aprendizaje automático.

Lo mejor de la suerte 🙂

Considera a Walmart y Amazon. La IA profunda que afecta a los inventarios es probable que el 5% valga más de mil millones de dólares como una aplicación de computadora cada año. a lo largo de la vida de una patente que tiene un valor de más de $ 20 mil millones

Ahora considere los algoritmos de empaque de camiones, o incluso el reajuste del “plan o gramo” de los productos que se encuentran en el punto de walmart, con un reajuste individual para cada ubicación por separado.

También considere un algoritmo de reparto de ingresos entre la publicidad del sitio web. en una pestaña recibo anuncios que parecen ser para almuerzos escolares, otra pestaña tiene un anuncio de juegos. ¿Cuál es la forma fiscalmente más ventajosa de promediar los perfiles de publicidad entre diferentes compañías (pestañas)? Aunque podría decir que esto ya existe, mis pestañas dicen lo contrario.

**actualizar**

Acabo de leer un artículo científico estadounidense de este mes sobre los nuevos microbiomas diseñados de plantas agrícolas. Tienen enormes conjuntos de datos y quieren descubrir qué cosas, similares a los probióticos, aumentan el rendimiento de los cultivos. El aprendizaje automático es muy probablemente una gran parte de eso. podría ser uno de unos pocos cientos de ingenieros que aumentan los rendimientos mundiales de alimentos en más del 10%, lo que es realmente impresionante, especialmente en comparación con la publicidad.

Para comprender lo básico en el aprendizaje automático, basta con comprender Álgebra Lineal, estadísticas (nivel A) y cómo aplicar todo esto en python, o cualquier otro lenguaje de alto nivel que elija.

Para destacar (como ingeniero aprendió la máquina)

Análisis numérico

Integracion numerica

Método simplex

Matemáticas de nivel de pregrado incluyendo

Cálculo y geometría analítica.

Sistema lineal de ecuaciones,

Cálculo multivariable

Temas de métodos matemáticos:

Series y series de Fourier.

Fourform Tranform

Ecuaciones diferenciales ordinarias y de alto orden.

Estadística, probabilidad, cadena de Markov, filtros de convolución.

También debe saber programación robusta y optimización de código.

Refractorización

Examen de la unidad

Estos son los cimientos.

Aprende a comunicarte con claridad. La habilidad de traducir su trabajo al idioma hablado por su cliente es una habilidad rara. Muy pocos quants lo tienen. Esto incluye no solo un enfoque de láser en la línea de fondo (¿cuál es el impacto de negocio deseado?), Sino también la atención a la presentación de sus resultados (¿este informe convencerá al cliente de que realmente use mis resultados?) Si no puede hacer Un caso sólido para el valor de su análisis, a nadie le importará lo que haya hecho.

Conozca la práctica diaria de la minería de datos. La mayor parte del trabajo no es atractivo: extracción de información, limpieza, regresión, correlación, límites de error, intervalos de confianza, validación, etc. Si no domina las habilidades esenciales por debajo del 90% del trabajo, no será útil. No importa cuánto aprendas en profundidad. Hacer ciencia de datos es útil para este fin.

Gracias por el A2A; Sé que estoy un poco tarde.

Ya hay muchas cosas buenas aquí, así que mencionaré eso y con suerte agregaré algunas de las mías.

Lo primero y más importante, como han dicho otros, en realidad aprende las matemáticas subyacentes, y eso es doblemente importante si quieres investigar.

Para Python, que es el rey indiscutible del aprendizaje automático en cuanto a idiomas, hay excelentes bibliotecas de aprendizaje automático como Keras y SKLearn. Y eso es genial, pero también es una espada de doble filo porque le permite simplemente agarrar modelos de la estantería sin entender realmente por qué esa elección tiene sentido, incluso si lo es.

Como investigador, ni siquiera pensarás en términos de código la mayor parte del tiempo; la única vez que codificarías un modelo, idealmente, es cuando tienes las matemáticas resueltas y solo estás probando la idea. Nuevamente, las bibliotecas pueden hacer que el proceso de prueba sea más rápido y más fácil, pero no pueden construir el modelo para usted porque necesita matemáticas para hacer eso …

Lo segundo que diría es aprender sobre los modelos en sí mismos: a qué problemas se pueden aplicar, cómo se pueden aplicar de manera efectiva a esos problemas y por qué son efectivos en esos problemas. Un buen ejemplo de esto sería el aprendizaje profundo; Los novatos quieren usar el aprendizaje profundo para todo porque es atractivo, incluso cuando hay mejores soluciones. Para dar un ejemplo de donde el aprendizaje profundo es la elección equivocada, piense en el conjunto de datos MMIST. En MNIST, un algoritmo simple de máquina de vectores de soporte funcionará casi tan bien como una red neuronal convolucional, pero el SVM tarda menos tiempo en entrenar y no requiere una GPU.

La tercera y última cosa que diría es simplemente practicar. Desafortunadamente, los modelos ML tienen muchos hiperparámetros, especialmente redes neuronales, y no parece que vaya a cambiar en el corto plazo. Esos hiperparámetros pueden literalmente hacer o deshacer su modelo si usa valores incorrectos y, a veces, incluso si elige el modelo correcto, todavía puede decepcionar. No porque eligió el modelo incorrecto, sino porque eligió los hiperparámetros incorrectos, así que practique la construcción de modelos.

Espero que esto ayude.

Del Dr. Patrick Lucey, director de ciencia de datos en STATS LLC, una destacada compañía de analistas deportivos, en un artículo: Cómo la analítica deportiva basada en la IA está cambiando el juego – ADTmag

“Una buena manera de comenzar es en realidad intentar responder una pregunta específica”, dijo Lucey. “Muchas personas que consiguen trabajo en estas industrias han escrito un blog o han escrito un artículo para mostrar sus características técnicas”.

“Hay dos cosas importantes” que los desarrolladores pueden hacer para mejorar la ciencia de la información, dijo Lucey. “En primer lugar, con el aprendizaje automático es crucial tener una base en lo básico. Hay muchos cursos en línea realmente buenos disponibles que pueden ayudarlo a comenzar en esa área. El aprendizaje profundo también es un área grande, pero no todo depende sobre el tipo de datos que tiene. Aprender qué herramienta usar y cuándo es muy importante.

“Lo segundo es obtener una herramienta de demostración / visualización interactiva que pueda permitirle depurar rápidamente y ver si su modelo está haciendo lo que se espera”.

Aprende a hacerlo correctamente. Mucha gente aprende a aplicar los paquetes, pero no sabe cuándo usar qué algoritmo o cuáles son las limitaciones de un método determinado. Aprender las matemáticas te llevará por un largo camino. Si necesita un recurso para comenzar, tengo algunos tutoriales y documentos publicados aquí: https://www.slideshare.net/Colle

Céntrese en un dominio (área de problemas en particular) durante algunos años para desarrollar una especialización en el negocio y los datos.

Hay científicos de ML que solo usan los paquetes y hacen una salida. Luego, hay un subconjunto que comprende las matemáticas, las estadísticas y la optimización subyacentes que se utilizan para construir el algoritmo. Un subconjunto más pequeño de este intento realmente va más allá del uso de un paquete y puede codificar un paquete desde cero que se adapta a su declaración de problema.

Pero los verdaderos ganadores son quienes pueden hacer todo lo anterior y vender la historia a un público lego. Confíe en mí aquí, conocer el idioma de los negocios y obtener una sensación intuitiva de los datos es de gran ayuda.

Como científico e investigador de EM, puede trabajar en una amplia gama de problemas. Elija si desea trabajar en el procesamiento de imágenes, la optimización de precios o el comercio algorítmico y desarrollar su capacidad en ese dominio. Esta especialización adicional además de su ML le ayuda a crear un nicho para usted. Supongamos que, como científico de ML, trabajará específicamente en modelos de optimización de inventario durante un par de años, usted se destacará como uno de los cientos de científicos de ML que han probado en todo, desde la construcción. Un bot de chat para la visión por ordenador.

Realmente estar interesado en el tema, como con cualquier cosa en la vida. Solo tendrás éxito en aquello que realmente te apasiona, y realmente solo puedes ser apasionado por una cosa. Tienes que ser el Miguel Ángel del Aprendizaje Automático. Tienes que poder pasar el día y la noche sin comer ni beber solo creando tu David. Eso es lo que es el éxito. A menos que encuentre lo que es algo, luchará con el éxito.

No es por accidente que la gente siempre diga que el mejor trabajo es el que es tu pasatiempo. Así que haz de AI tu pasatiempo, hazlo en tu tiempo libre para que se convierta en tu único interés en la vida. Si puede hacer todo eso, sin duda, alguien vendrá y reconocerá su pasión, porque las personas que realmente lo son son una en millones. Realmente no importa cuál sea su experiencia en AI, lo que importa es que demuestre entusiasmo por su trabajo. Lo cual será evidente en función de lo lejos que pueda llegar en ese tema. Si puedes enseñarle algo a tu entrevistador, no sabían que has llegado hasta la mitad. Si solo puede enseñarles información fácilmente Googalable, entonces es probable que no queden impresionados ya que es probable que hayan hecho las mismas búsquedas en Google. El verdadero talento es evidente cuando escuchas el proceso de pensamiento de alguien cuando hablan de un problema particular que han resuelto.