Estadística práctica para ciencia de datos con R y Python (Spanish Edition) - DeandreVillegas/DeandreVillegasbookpdf GitHub Wiki
Los m233todos estad237sticos son una parte fundamental de la ciencia de datos, pero pocos cient237ficos de datos tienen una formaci243n avanzada en estad237stica. Los cursos y libros sobre estad237stica b225sica rara vez tratan el tema desde la perspectiva de la ciencia de datos. La segunda edici243n de este libro incluye ejemplos detallados de Python, ofrece una orientaci243n pr225ctica sobre la aplicaci243n de los m233todos estad237sticos a la ciencia de datos, te indica c243mo evitar su uso incorrecto y te aconseja sobre lo que es y lo que no es importante.Muchos recursos de la ciencia de datos incorporan m233todos estad237sticos, pero carecen de una perspectiva estad237stica m225s profunda. Si est225s familiarizado con los lenguajes de programaci243n R o Python y tienes alg250n conocimiento de estad237stica, este libro suple esas carencias de una forma pr225ctica, accesible y clara.Con este libro aprender225s:Por qu233 el an225lisis exploratorio de datos es un paso preliminar clave en la ciencia de datosC243mo el muestreo aleatorio puede reducir el sesgo y ofrecer un conjunto de datos de mayor calidad, incluso con Big DataC243mo los principios del dise241o experimental ofrecen respuestas definitivas a preguntasC243mo utilizar la regresi243n para estimar resultados y detectar anomal237asT233cnicas de clasificaci243n esenciales para predecir a qu233 categor237as pertenece un registroM233todos estad237sticos de aprendizaje autom225tico que quotaprendenquot a partir de los datosM233todos de aprendizaje no supervisados para extraer significado de datos sin etiquetarPeter Bruce es el fundador del Institute for Statistics Education en Statistics.com.Andrew Bruce es cient237fico investigador jefe en Amazon y tiene m225s de 30 a241os de experiencia en estad237stica y ciencia de datos.Peter Gedeck es cient237fico de datos senior en Collaborative Drug Discovery, desarrolla algoritmos de aprendizaje autom225tico para pronosticar propiedades de posibles futuros f225rmacos.