Estimaciones de cantidad de datos - mgaitan/preciosa GitHub Wiki

Todo muy bonito, pero ¿tenemos claro que si no conseguimos suficientes datos todo esto no va a funcionar? ¿cuántos datos? eso, ¿cuantos usuarios significa?

Las estimaciones dicen que en los hipermercados hay alrededor de 30mil productos distintos en góndola (alguien puede confirmar este dato?) y muy probablemente la cantidad de productos en el mercado minorista sea un 50% mas , digo yo, a ojo de buen cubero (o sea, no todos los supers grandes venden los mismos 30mil productos)

(esto lo infiero considerando las "marcas propias" que son exclusivas de cada super, que tienen al menos un producto de cada categoria, y otros productos que están segmentados por poder adquisitivo, y por lo tanto no se ofrencen en todos los supers: en un super de recoleta muy probablemente no encuentres )

es decir, que preciosdeargentina.com.ar debe llegar a tener, en algun momento, unos 45mil codigos de barra conocidos.

Ahora hay poco más de 10mil.

Ahora supongamos que consideramos unas 250 sucursales de super/hipers muy activas (en la base actual hay 280 sucursales, y faltan todas las de carrefour y la figurita dificil pero infaltable: ¡los super chinos!). Pero digamos que sólo serán 250 las realmente importantes, donde se concentrará el grueso de los usuarios de Preciosa

Un precio, si hicieron los deberes de estudiar los modelos, está asociado al producto y a la sucursal (y al usuario que lo envio).

Entonces, pensando en que realmente queremos que la app "le funcione siempre" a un usuario de estas sucursales, tendremos que tener algo asi

30mil x 250 = 7.500.000 de escaneadas de precio, supongamos, dándonos algo de margen, por mes. (relevar el precio al menos una vez por mes, de cada producto, en cada sucursal) Cuantos usuarios super activos tiene que haber para hacer eso?

tenemos 30mil productos a escanear, en un mes, hace un promedio de 1000 por dia, pero siempre habrá "dispersión" (si no los 1000 escaneos por dia justo tendrian que ser seleccionadamente de productos distintos a los del dia anterior). Asi que pongamos que son 2000 escaneos por dia (?)

Ponele que un usuario vaya al super 2 veces por mes. Entonces se necesitan 100 usuarios por sucursal que activamente escaneen 10 productos cada vez que van. Es decir, 100*250 = 25000 usuarios


(estoy muy cansado --- dias de pocas horas de sueño -- asi que muy probablemente le esté pifiando fiero en ordenes de magnitu para arriba o abajo. Me quiero hacer el Fermi y no me sale.

¿alguien puede meterle un poco de seriedad y matemática de verdad a esto?