Comunidad de Machine Learning / Deep learning

c0b4c #91 May '22

#90 diria que podrias usar mejor algo tipo simulated annealing or genetic algorithms. Si proporcionas mas detalles quiza pueda darte una respuesta mas concreta.

edit: me sonaba que ya planteaste el problema en otro hilo y lo he buscado https://www.mediavida.com/foro/dev/python-hilo-general-551473/28
está bien saber que lo que te he dicho yo casa con lo que te dijeron entonces XD voy aprendiendo

1 respuesta

CaNaRy_r00lz #92 May '22 Inocente

#91 Si lo pregunte hace tiempo, pero como las cosas cambian y a veces aparecen nuevos enfoques por eso preguntaba de nuevo que en 2 años quizas algo nuevo habia salido, thanks

NocAB #93 May '22

¿Tenéis experiencia haciendo undersampling con Condensed Nearest Neighbor?

Lo tengo ejecutando desde hace 10h en colab y no sé si es normal porque, aunque sé que es un algoritmo lento, otros de undersampling me han tardado una media hora.

Lo tengo con n=1 y sampling_strategy='majority' para un dataset de (367705, 11).

refresco #94 May '22

#84 consegui llegar a un 76% en el test con una red muy simple. Aunque en el training estaba a 93% vaya overfiting xD

gonya707 #95 Jun '22 Moderador

Estoy ya preparando los archivos para una segunda competicion, va a ser de clasificacion de imagenes y el modo que usé para clasificarlas manualmente hacia el trabajo manual facil pero ahora importarlos a tensorflow o lo que sea es un coñazo, asi que tengo que cambiar la estructura.

Si no muero de calor antes para este fin de semana comenzamos

gonya707 #96 Jun '22 Moderador

Dobleposteo porque estoy teniendo un problemilla que ya me está irritando para montar la competi en kaggle. He puesto los detalles en este post en el foro pero nadie responde

https://www.kaggle.com/discussions/questions-and-answers/331338

Algun alma caritativa puede echarle un vistazo? Ya no se que intentar

2 respuestas

NocAB #97 Jun '22

No creo que participe en esta edición porque una clasificación multinomial de imágenes me queda un poco grande. De hecho quiero mirarme cómo funcionan pero con datos numéricos/categóricos y hacer alguna prueba con scikit-multilearn cuando termine con las series temporales.

#96 haciendo una búsqueda rápida me ha parecido que kaggle no se lleva bien con las métricas para este tipo de clasificaciones pero sí que hay algunas competiciones parecidas así que se tiene que poder hacer algo.

Phil_Rich #98 Jul '22

#96 Acabo de ver esto, sigues atascado? Te puedo intentar echar una mano

1 respuesta

ercabesa #99 Jul '22

No sabía si ponerlo, es un notición

4

gonya707 #100 Jul '22 Moderador

#98 La verdad es que si, luego te paso un dataset dummy a ver si puedes dar con la tecla, yo ya estoy desesperado

1

gonya707 #101 Jul '22 Moderador

Preparad vuestras mejores galas que esto vuelve en unos dias, gracias a @Phil_Rich he conseguido montar el tinglado finalmente

3

gonya707 #102 Jul '22 Moderador

https://www.mediavida.com/foro/dev/segunda-competicion-machine-learning-futurama-689127 alle vamos

Millonet1 #103 Sep '22 Inocente

Hace poco más de un año estaba haciendo cursos de Udemy para aprender machine learning de 0 y hoy han aceptado mi primer paper en una conferencia internacional, estoy exultante

19 2 respuestas

hda #104 Sep '22 Agujeros negros ( ͡° ͜ʖ ͡°)

#103 Infinitas felicidades, tío bueno. Te mereces todo lo genial que te pase. Ejemplo de tesón e inteligencia

2 1 respuesta

khaxal #105 Sep '22

#103 Puedes comentar un poco cómo ha sido tu proceso de aprendizaje? Cursos, libros?
Este es un tema que siempre me ha interesado pero nunca paso de leer artículos que arañan la superficie.
(Sí, sé que en el primer post hay una lista de recursos estupenda)

1 respuesta

Millonet1 #106 Sep '22 Inocente

#104 gracias tío! Ya sabes que eres un referente.

#105 primero decir que cuento con la ventaja de tener una base de matemáticas que me ha permitido avanzar más rápido (por ejemplo, entender el libro de Bishop). En lo que me centré es en aprender a usar las librerías básicas de Python: numpy, scipy, tensorflow... y en hacer mis propias implementaciones de algoritmos básicos, como K-Means o expectation-maximization.

Por mi formación como matemático encontré un puesto de investigación en machine learning y ahí he ido centrándome en un tema (https://en.m.wikipedia.org/wiki/Dirichlet_process) leyendo la literatura académica. Precisamente por mi trayectoria donde más flojeo es en la parte de manejo de bases de datos y programación, que suele ser lo más importante a la hora de hacer Data Science en "el mundo real".

En machine learning hay muchos backgrounds diferentes, por lo que mi experiencia quizás no te sirva, pero sí que diría que una buena base de matemáticas (estadística, probabilidad, análisis, métodos numéricos...) facilita muchísimo las cosas.

1 1 respuesta

khaxal #107 Sep '22

#106 Probablemente controlo más de programación, de mates más allá de cálculo matricial, álgebra lineal y Monte Carlo, poco. Envidio tu base
Muchas gracias por la respuesta tan detallada!

1 respuesta

Millonet1 #108 Sep '22 Inocente

#107 bueno, piensa que lo que hago tira hacia lo académico, donde se usas matemáticas más sofisticadas. Para trabajar como ML engineer o cosas así se valoran otras cosas, y con lo que comentas yo creo que vas muy bien.

2 1 respuesta

hda #109 Sep '22 Agujeros negros ( ͡° ͜ʖ ͡°)

#108 pon por aquí o por MP si quieres, cuando estés online. Tengo ganas de ver ese papel. ¿Procesos de dirichlet? Suena sexy

1 respuesta

Millonet1 #110 Sep '22 Inocente

#109 cuando esté lista la versión definitiva lo dejaré por aquí

2 1 respuesta

NocAB #111 Sep '22

#110 me da que será algo muy avanzado para mí (lo mío es mucho más aplicado) pero me gustará poder verlo (e intentar entenderte xd).

Sk8eR #112 Sep '22

muchachos os hago un par de preguntas, estoy por iniciarme en el mundo de DL:

He estado aprendiendo los algoritmos basicos y ahora me pillare dos cursos de udemy que me parecieron interesantes. Si alguno tiene alguno que le haya gustado que lo recomiente pls.
https://www.udemy.com/course/unsupervised-deep-learning-in-python/
https://www.udemy.com/course/aprendizaje-por-refuerzo-profundo/#instructor-1
(siempre suelo pillar uno en español para poner las bases para el lenguaje tecnico en ingles, una mala costumbre, que sino mucho ingles y si son mil cosas nuevas me saturo un poco)
Mi principal objetivo es tener una maquina dedicada para entrenarla, tengo una 2070, y me puedo comprar una 3090TI... realmente haría falta?

1 respuesta

gonya707 #113 Sep '22 Moderador

#112 Sobre lo segundo: no. Las graficas para jugar no son las adecuadas para calcular tensores, si ves las GPU que usan los equipos en google colab ves que son cosas como Nvidia Tesla K80 (3.498 euros), Nvidia T4 (2.901 euros) etc. Graficas pensadas exclusivamente para computar estas cosas y que por no tener no tienen ni salida HDMI, no la necesitan.

A no ser que necesites tener un equipo 24/7 entrenando no te merece la pena comprar tu propia GPU/TPU, si en alguna ocasión necesitas unas horas o dias de GPU los servicios como colab pro y colab pro+, que las alquilan por calderilla. Incluso si es para algo puntual en kaggle tienes 35 horas semanales de GPU gratis

4

crb2222 #114 Sep '22

Aprovecho este hilo a ver si alguien puede contarme experiencias en un caso similar al mio.

Siempre me ha interesado este mundillo, en la carrera (ing informática) las asignaturas relacionadas fueron mis favoritas, pero por cosas de la vida llevo 6 años currando de programador fullstack, lo típico

Llegue a hacer la pre matrícula al master de la UOC, pero acabé tirándome atrás, ya que en ese momento no me apetecía meterme a un master de 2 año (no planteo el itinerario de 1 año)

La cosa es, aunque me interesa mucho el sector , especialmente tema de machine learning, no se si me gustaría el trabajo para el día a día. Alguien puede contar su experiencia trabajando en el sector? Sus tareas diarias etc

Que tal la transición de front/back a un puesto de data science? Lo que mas me tira para atrás es la “perdida” de la experiencia en mi sector, empezar de junior (tal vez paso atrás en sueldo inicialmente)

telemaco103 #115 Oct '22 Inocente

Alguno conoce o sabe de algún recurso bueno sobre Reinforcement Learning y Python? Quiero probar a ver si puedo aplicarlo a un proyecto de investigación de la uni.

gonya707 #116 Oct '22 Moderador

Me han mandado de Mathworks un pdf sobre ML en Matlab, pero la verdad es que es bastante teorico y puede aplicarse a cualquier cosa, una buena lectura introductoria:

https://es.mathworks.com/content/dam/mathworks/ebook/gated/machine-learning-ebook-all-chapters.pdf

1 respuesta

Kike_Knoxvil #117 Oct '22

#116 Si quieres te mando el Quick Reference del curso, que es donde viene las cosas y los comandos a usar

1 respuesta

gonya707 #118 Oct '22 Moderador

#117 a mi personalmente no me hace falta, hace mucho tiempo que no tengo matlab instalado, y para asuntos de ML ya estoy con python, pero gracias. Simplemente creo que el pdf introductorio ese esta bastante bien

1

Maaarc #119 Oct '22 Penitente

Edit: Lo he resuelto con "xticks"

No se si preguntar esto aquí o por el hilo de Python. Pero bueno, lo pongo por aquí por si es algo que habéis tenido que hacer.

Tengo el siguiente subset que quiero printar ya que es un value_counts() de una columna de un dataframe.

freqDiabetesSex = df_diabetes['sex'].value_counts()

-0.044642    235
 0.050680    207

Y lo que quiero al sacar el print es que en las columnas me muestre "Hombre" o "Mujer" en vez de esos números que no tienen ningún sentido a la hora de representar-se.

La duda viene de que no se que es mejor, si buscar la manera de cambiar el nombre desde matplotlib o si modificar ese subset con un replace.

Que consideráis mejor practica? Creo que lo de matplotlib es más elegante, pero no he visto como hacerlo aún. Se agradecen consejos!

1 respuesta

CarlosML27 #120 Oct '22

#119 Hombre yo si esos datos que dices son resultados de una predicción y el único sentido que tiene es categórico, yo lo cambiaría como tal a la categoría que corresponda y luego ya trabajaría con ellos siendo algo más legible y entendible.

Si por contra los necesitas así por algún motivo, como bien has puesto en el edit, puedes simplemente cambiar las labels en la representación.

Usuarios habituales

Tags