Backend Developer orientación a Web Scraping (€45 − 55K) para StyleSage 👜 (en Madrid) - getmanfred/offers GitHub Wiki

PROCESO FINALIZADO ^^ STYLESAGE ya tiene a su nuevo Back Developer


Estamos colaborando en exclusiva con nuestros amigos de StyleSage para ayudarles a encontrar un/a Backend Developer, con sólidos conocimientos de Python y que conozca el apasionante mundillo del web scraping.

StyleSage es una startup (bueno, ya no 😅), fundada en 2014 y cuyo despegue empezó en 2015, con los primeros clientes y se ha convertido en la referencia para clientes como H&M, Zalando, ASOS, Gap... A nivel de producto, se trata de una plataforma web de análisis de datos a gran escala que ayuda a minoristas y marcas de moda a tomar decisiones críticas acerca de las nuevas temporadas a nivel local y global. Esta plataforma, a menudo aclamada como "El Bloomberg de la moda", analiza más de 1.000 minoristas, 23.000 marcas y 35 millones de productos diariamente en los mercados globales tanto maduros como emergentes. Son una empresa de ámbito global, con nuestros ojos y oídos en Nueva York y cerebros en Madrid.

Son simplemente "frikis apasionados de los datos" trabajando en moda (no es tan raro, no? 🤔😅) y que tienen claro el aporte de valor que pueden ofrecer a la industria a través del uso único del análisis de datos. Están creciendo mucho y han salido reforzados del año de la pandemia por el auge del comercio electrónico

Los equipos de negocio están en Nueva York (ventas, marketing, customer success, CEO), pero el equipo técnico core está en Madrid (backend, data-science, product engineering, data-operations).

Los co-fundadores -Jade Huang, -USA- actual CEO, y Robert Figiel -Alemania- actual CTO-, se conocieron cursando un MBA en INSEAD en Singapur, donde surgió la idea de la empresa. Al terminar el MBA Jade volvió a New York y Rob se estableció en Madrid por razones personales, donde empezó a reclutar el equipo técnico. Y de ahí… hasta hoy 🚀.


Fashion StyleSage

Si te interesa esta oportunidad, ¡haznos un PING! Desde Manfred estaremos encantados de ayudarte con todo, tu aplicación, resolviendo todas las preguntas que tengas y dándote un apoyo cercano durante todo el proceso. Buscamos procesos de selección ágiles, justos y transparentes.

Qué harás

Junto con el resto del equipo de Backend, tu misión será seguir desarrollando y mejorando el pipeline de datos que alimenta su plataforma de analíticas.

El stack tecnológico es muy variado, pero centrado principalmente sobre el ecosistema de Python y bases de datos relacionales (PostgreSQL) y analíticas (EXASOL). Igualmente tendrás la oportunidad de trabajar con tecnologías como RabbitMQ, Django, Scrapy, Docker… Y todo ello corriendo en la infraestructura que tienen montada en AWS.

La plataforma se alimenta de varios “feeds de datos”. El feed principal es la información scrapeada de sitios de e-commerce de moda (ropa, calzado, complementos, belleza, hogar). Todos los días se scrapean varios miles de sitios web y se recogen los datos de millones de productos. De cada producto se recoge toda la información disponible (fotos, título, descripción, materiales, tallas disponibles, precio, descuentos, …) y se normaliza para que la plataforma pueda analizarlos de forma consistente. A cada producto se le aplican una serie de algoritmos de ML para clasificarlos en categorías (p.ej. separar vestidos de noche de vestidos para trabajar) y para extraer atributos (p.ej. detectar el tipo de cuello de una camiseta: cuello de pico, cuello redondo, cuello de barco… hasta 9 tipos de cuello), y finalmente se almacena en la base de datos junto con el histórico de todos los demás productos.

Hay otros feeds secundarios, pero no por ello menos interesantes: redes sociales, frecuencia de búsqueda para detectar tendencias, cupones de descuento, capturas de home-pages, newsletters… Cada uno de ellos tiene sus particularidades y sus herramientas para extraer la información de la forma más fiable y eficiente posible.

En 1 mes...

Lo importante para StyleSage son las personas, así que no hay nada mejor que compartir desayuno el primer día con tus compañeros de equipo. A la vuelta del desayuno, tendrás listo tu portátil (plataforma a elegir, recomendable Mac o Linux) listo para empezar a trabajar.


Breakfast StyleSage

Además de la reunión semanal con el equipo (60 min el lunes) y los dailies (10-15 min de M a V) tendrás una reunión de seguimiento con tu responsable de equipo para ver cómo está siendo el aterrizaje

Durante el primer mes trabajarás en tareas relacionadas con los sistemas de recogida de datos del backend, implementando nuevas funcionalidades o resolviendo bugs que hayamos identificado. Esto te servirá para ir conociendo las distintas partes de la base de código, asimilando las prácticas de desarrollo, la cultura del equipo, las preferencias. En todo momento estarás acompañado (aunque sea virtualmente) de otros miembros del equipo para que puedas encontrar dónde está todo.

Seguramente durante la primera semana te sentirás que ya estás preparado para hacer tu primer despliegue a producción (posiblemente hagas incluso más de uno).

Además conocerás el resto de equipos de la empresa, tanto los equipos técnicos de Madrid como los de negocio en New York

En 3 meses...

Seguramente ya conozcas la mayor parte de las piezas del sistema y te moverás con soltura por ellas, siendo capaz de diagnosticar problemas complejos y de proponer soluciones que alcancen a más piezas. Seguirás aprendiendo los entresijos de algunas de las tecnologías con las que inicialmente estuvieras menos familiarizado.

También serás capaz de entender a los miembros del resto de los equipos cuando hablan de sus sistemas, su trabajo, sus dificultades, y empezarás a detectar cómo aplicar mejoras en tu parcela que hagan la vida más fácil a otros equipos.

En 6 meses...

A estas alturas el backend no tendrá secretos para ti. Junto con el resto de miembros del equipo habréis identificado los puntos débiles de la infraestructura y estaréis proponiendo soluciones y mejoras, tales como mejorar la monitorización, la automatización de más tareas, refactorizar algún módulo que da mucho trabajo o genera problemas en otros equipos…

Es posible que ya te hayan propuesto formar parte de un squad (equipo temporal formado por miembros de distintos equipos para construir una funcionalidad concreta).

Cómo lo harás

En StyleSage tienen un equipo muy compacto y versátil. Esperan que cada miembro del equipo aporte su trabajo, conocimiento e iniciativa. Todos los sistemas están interrelacionados y el trabajo de un equipo afecta de forma sustancial al trabajo de los demás equipos. Es importante tener esa visión de equipo / conjunto.

Aprendizaje interno, hacen charlas internas semanales, a las que llaman “Monday Bananas”... Aunque se hacen los Jueves 😂 😂. Verás, tiene su historia: Inicialmente eran los lunes por la tarde y alguien propuso acompañarlos de galletitas y croissants. Tras varias semanas, tenían claro que para mantener la salud del equipo había que cambiar a algo más sano, así que se pasaron a la fruta (principalmente plátanos 🍌🍌). Luego, por razones organizativas pasaron a hacer las reuniones los jueves, pero mantuvieron el nombre.


Banana Mondays StyleSage

Respecto a la metodología, no son muy puristas, pero sí tienen unos principios de desarrollo de software muy claros:

  • El trabajo se organiza en “waves” de 6-8 semanas: en cada “wave” se planifican una serie de iniciativas que se ejecutan durante la wave. Si surge una nueva idea, tendrá que esperar a la siguiente wave (basado en la metodología Shape Up, de Basecamp).
  • Dentro de cada wave, el trabajo se hace en slices verticales, incrementos muy cortos y con entregas muy frecuentes (típicamente menos de un día, 2-3 días como mucho)
  • La mayoría de las piezas tienen su pipeline de CI (hay excepciones), y las pruebas forman parte indispensable del desarrollo.
  • Todo el código se revisa por 2-3 miembros del equipo antes de mergear: las revisiones de Pull Request son un mecanismo de control de calidad, pero principalmente una herramienta para compartir información y una oportunidad de aprendizaje para todos
  • La calidad del código es un valor fundamental: todo el código debe ser legible y entendible, los atajos se toman en otros sitios (no implementar funcionalidad que no es necesaria, no complicarse la vida con sobre-abstracciones, …)
  • El camino se demuestra andando: la mejor forma de planificar una feature grande es desarrollar un POC (prueba de concepto)

Con quién lo harás

Seguramente te suenen muchos de los nombres que vas a ver a continuación. Cuando se podían hacer eventos físicos, estaban presentes, tanto individual como colectivamente, en muchos de ellos: La PyCon, Codemotion, CommitConf, T3chfest, Django Girls, R-Ladies, Python Madrid, VueJS Madrid…


Events StyleSage

Dentro del equipo de Backend, currarás mano a mano con las siguientes personas:

  • Andrés Orcajo: Backend Engineer, en StyleSage más de 3 años, ha participado en todos los proyectos del equipo incluso las partes más oscuras. También en DevOps (🤖). En su tiempo libre se dedica a trastear con impresoras 3D.
  • Luis Laguna: Backend Engineer, recién incorporado a StyleSage en plena pandemia. Open Source Contributor desde hace 10 años. Le motivan las tendencias acerca de Developer eXperience y Quality Assurance. En su tiempo libre hace deportes de aventura y voluntariado
  • Vitaliy Burdenyuk: Backend Engineer, en StyleSage desde 2019. Desarrollador resolutivo y directo, experto en Python, Django y SQL. Tiene un perro que parece un oso.
  • Ana Jurado: Lleva casi tres años en StyleSage y ha pasado por Backend y Data Operations. Le encanta analizar problemas relacionados con los datos y proponer soluciones, bien desarrollando con Python o contando con la ayuda de otros equipos. Fuera de la oficina se dedica a pintar con acrílico y acuarelas pero sobre todo a hacer música. Toca el violín y ahora está aprendiendo más teoría musical y a tocar bien el piano.
  • Javier Abadía: VP de Ingeniería, ha trabajado en distintos puestos técnicos y de gestión durante + de 20 años; llevando equipos, evangelizando sobre SIG, escribiendo software para aviones de combate... Sus ideales son el software con 0 bugs, testeo en modo paranoide, automatización, metodologías ágiles y trabajo en equipo. Desde que se unió a StyleSage hace más de 6 años está divirtiéndose con la mejor plataforma de visualización de analíticas de big data que se haya construido jamás (o casi). Ingeniero en Informática por la Universidad de Zaragoza y MBA del IE Business School. Con frecuencia se le podía ver dando charlas en PyConEs, CommitConf, Codemotion, Madrid VueJS, Python Madrid y otros saraos del circuito. Además le encanta patinar, esquiar y caminar por la montaña.

Team StyleSage

Te presentamos también algunos compañeros/as de otros equipos:

  • Javier Ordoñez: Doctor en Inteligencia artificial y Lead Data Scientist en StyleSage desde hace +4 años. Trabaja en IA desde que ni siquiera se denominaba así (+12 años) como investigador, ingeniero, profesor y consultor en distintos países colaborando con compañías punteras como Qualcomm, Google, y Huawei. Ponente habitual en conferencias como Big Data Spain, T3chFest y PyConES (donde fue invitado a dar la keynote en Alicante 2019). Cuando no está entrenando modelos de ML dedica su tiempo a bucear, leer o ir de ruta con la moto.
  • Alicia Pérez: manchega e Ingeniera Informática por la Universidad Complutense de Madrid. Durante muchos años trabajó en proyectos de consultoría para grandes clientes como Repsol o el Canal de Isabel II, hasta que se pasó al mundo startup hace más de 5 años. Además de ser Data Scientist en StyleSage, es co-organizadora de PyLadies Madrid y mentora en varios programas que fomentan la diversidad en ámbitos tenológicos como DjangoGirls, TechShessions o Adalab. En el tiempo libre que le dejan sus gatos no le da la vida para tantos hobbies: patinaje, pintura, padel, restauración... Y lo que se deje hacer en pandemia.
  • Beatriz Gómez: Data Scientist en Stylesage desde hace 2 años y medio, y ahora se encarga del Product Matching. Desarrollan prácticamente toda la parte de la lógica en python y la parte de IA en keras y tensorflow. Estudió teleco en Cuenca y al acabar la carrera (2015) se vino a madrid a hacer un master de visión artificial, ahí fue donde decidió que quería dedicarse a la inteligencia artificial. Fuera de stylesage, le gusta pasear, disfrutar del terraceo, leer, descubrir Madrid, hacer deporte... Vamos, no parar quieta.
  • Héctor Pablos: Product Engineering Team Lead. Estudió ingeniería de software en Valladolid y estuvo trabajando allí durante varios años para consultoras, en proyectos gubernamentales y bancarios y con todo tipo de tecnologías. Hace cinco años dio un giro a su vida y se unió a StyleSage en Madrid, donde lidera el equipo de Product Engineering construyendo con Django, Vue.JS y d3.js la plataforma web que usan clientes y otros equipos. En su tiempo libre suele estar en un concierto o festival de música.
  • Joaquín Bernal: Full Stack Engineer en el equipo de producto, aunque también ha tenido su pasado oscuro en el Backend. Nació en la Mancha hace 47 años. A los once dio tanto la tabarra a sus padres que acabaron por comprarle un Spectrum: aquel fue su primer contacto con la programación. Ha pasado por consultoras y por empresas de producto, hasta encontrar StyleSage, donde lleva casi tres años. Aquí programa en Python y en Javascript (Django, Vue, d3...) y dice que se lo pasa pipa. Fuera del trabajo le gusta escribir ficción, pintar acuarelas y otras cuantas cosas más (entre ellas las croquetas, le gustan mucho).
  • Rober Figiel: CTO y Co-fundador of StyleSage. Estudió Ingeniería Industrial en Berlín y Atlanta con especialización en estadística, informática y administración de empresas. Durante la universidad, Robert trabajó en un centro de investigación sobre el cáncer, desarrollando software para detectar automáticamente estructuras cancerosas en imágenes MRI 3D MRI. Como consultor en McKinsey, Robert trabajó en proyectos muy variados sobre procesos y logística en Europa y Africa. Hizo un MBA en INSEAD in Singapur, donde conoció a Jade que le convenció para fundar StyleSage en 2013. Orgulloso de ser un ciudadano del mundo, le encanta viajar (ha visitado +50 países). Habla 5 idiomas y ha vivido y trabajado en 9 países antes de enamorarse definitivamente de Madrid por su gente, su sol y su jamón.

Team StyleSage

También trabajarás codo con codo con otros equipos remotos, como un equipo de desarrollo y un equipo de QA ubicados fuera de España, por lo que es importante tener cierta soltura hablando en inglés. Les gusta organizar actividades conjuntas de vez en cuando (aunque desde que empezó el COVID no han podido hacer tantas):

  • Viajes a conferencias
  • Cenas
  • Juegos de lógica al aire libre
  • Montar a caballo
  • Tirolinas
  • Clases de trapecio
  • Quedar a patinar
  • Día deportivo al aire libre
  • Karts …¡Toda sugerencia es bienvenida!

Team StyleSage

Cuándo lo harás

Horario flexible: no hay una normativa, se espera que asistas a las reuniones del equipo y que los demás sepan cuándo pueden encontrarte trabajando

Se adaptan para que las obligaciones personales de cada uno sean compatibles con hacer un gran trabajo

Dónde lo harás

Mientras sigamos inmersos en el COVIDgedón, el trabajo es 100% remoto, pero cuando termine, su intención es volver a verse las caras (al menos semanalmente) por la oficina. Tienen pensado volver a un modelo híbrido, donde podrás compaginar el trabajo remoto (1 o 2 días por semana) con el presencial.

La oficina está en GlueWork, junto al intercambiador de Avenida de América.

Actualmente cada uno/a trabaja desde casa y StyleSage colabora con un presupuesto para adaptar tu puesto de trabajo y un complemento económico para los costes adicionales (luz, calefacción, etc., mientras dure esta situación).

Qué piden

Están buscando a una persona metódica, con ganas de aprender y trabajar en equipo. En cuanto a requisitos técnicos, les gustaría alguien que disponga de las siguientes competencias:

  • Entre 3-7 años de experiencia
  • Sólidos conocimientos de Python
  • Django, especialmente el ORM
  • Sólida base de cómo funciona internet y los entresijos de los protocolos HTTP (verbos, códigos, headers, proxies…)
  • Haber tenido experiencia con Scrapy (aunque tu misión no será escribir "scrapers")
  • Buen nivel de SQL: cómo hacer queries complejas, como insertar datos de forma eficiente, especialmente PostgreSQL
  • Linux shell (casi se da por supuesto)
  • Buen manejo y soltura con el idioma de Shakespeare
  • Conocimientos en gestión de colas de mensajes (Celery, RabbitMQ,...)
  • Haber trabajado con AWS en tareas tales como:
  • Acceso y manipulación de ficheros en S3.
  • Levantar y parar máquinas de EC2.
  • Desplegar tareas en ECS

Kudos para quien además aporte conocimientos en cualquiera de las siguientes áreas:

  • sistemas de protección anti-bot
  • Node.js, Puppeteer
  • Docker
  • Ansible
  • JIRA (automatización, API)
  • MongoDB

Si no cumples con todo al 100%, pero tienes claro que podrías cuadrar con el puesto, no dudes en pegarle un toque a nuestro compañero Juanan ([email protected]).

Qué ofrecen

  • 💸 Salario entre €45 y 55K.
  • 🕔 Conciliación, flexibilidad horaria y humana.
  • 📆 23 días de vacaciones al año
  • 🤓 Presupuesto de formación individual:presupuesto anual de 1.500 € para cursos, formación, asistencia a conferencias.
  • 2.5 días al año para asistencia a conferencias
  • 🌍 Ambiente diverso e inclusivo: % masculino / femenino, distintas nacionalidades, backgrounds...

¿Cómo aplico?

Si ya eres manfredita, simplemente péganos un toque. Si aún no lo eres, sólo tienes que rellenar este sencillo formulario. Por favor, indica en tu "Dream Job" que aplicas para el puesto de Backend Developer para StyleSage ¡Graciñas!

Este proceso está gestionado por Juanan, así que, si tienes cualquier pregunta, no dudes en contactarle en [email protected] :)

⚠️ **GitHub.com Fallback** ⚠️