Sesion 8 Codificacion Multimedia I - jesusgpa/2023-2024-CSAAI GitHub Wiki

Sesión 8: Codificación Multimedia I

  • Tiempo: 2h (50 + 50min)
  • Fecha: Martes 9 de Abril de 2024
  • Objetivos de la sesión:
    • Visión general del funcionamiento del Audio
    • Viaje desde el Audio físico hasta el audio digital

Contenido

Introducción

En esa sesión se muestra una panorámica general del mundo multimedia, usando el audio como ejemplo, pero que también es aplicable al vídeo: Desde el fenómeno físico hasta la parte digital, haciendo hincapié en los fundamentos y en las tecnologías existentes.

Audio físico

Las señales acústicas son ondas de presión que se propagan por el aire.

Las moléculas del aire vibran perpendicularmente a la propagación de la onda.

Cuando hablamos, nuestras cuerdas vocales se ponen a vibrar.

Golpean a las moléculas de aire y estas a su vez a otras, por lo que el sonido se va propagando.

Si medimos lo que se mueve una molécula (su vibración) con respecto al tiempo, obtenemos una gráfica que tiene una determinada forma.

Atenuación

Una propiedad muy importante del sonido es que la frecuencia sólo depende de la fuente.

Esto significa que si emitimos un tono puro de frecuencia f, esta frecuencia se propagará tal cual.

No aparecerán nuevas componentes de frecuencia, ni esta frecuencia se verá alterada por ningún fenómeno natural.

Si medimos el movimiento de las moléculas a diferentes distancias, sí apreciaremos una atenuación: la forma de la onda se va haciendo cada vez más pequeña, pero la frecuencia permanece inalterable: NO CAMBIA.

La forma de onda que veríamos sería exactamente la misma que la original, pero más pequeña.

La frecuencia sería exactamente f, que es la de la fuente.

Cambio de medio

¿Y qué ocurre cuando el sonido pasa de un medio a otro?

¿Se modifica la frecuencia?

La frecuencia es un invariante: el medio NO la cambia.

Sólo depende de la fuente.

Cualquier onda al pasar de un medio a otro NO cambia su frecuencia.

Por tanto, al pasar por los diferentes medios, cambiará su velocidad de propagación, y su atenuación, pero al final, en el medio 3, mediremos exactamente el mismo tono original, con la misma frecuencia f, pero más atenuado.

Por ello, dado un tono puro de frecuencia f, su forma no cambia nunca, aunque sí su tamaño, ya que se va atenuando

Distorsión

Seguimos con el ejemplo de la señal acústica producida al hablar.

Cuando lo hacemos, no emitimos tonos puros, sino señales con formas más complejas.

¿Y qué ocurre en estos casos? ¿La forma de la onda recibida en un punto más lejano es igual a la forma original, aunque atenuada?

Estas formas, en realidad, las podemos descomponer como combinaciones lineales de tonos.

Sabemos que cada tono mantiene su forma, sólo sufre atenuación.

Para calcular la forma final podeos basarnos en los tonos individuales, de los que conocemos sus propiedades y luego sumarlos para recomponer la señal final.

La nueva forma obtenida, ¿es igual a la original pero atenuada?

Desafortunadamente la respuest es NO.

Aunque existe un caso en el que sí que se cumple: ¿Cómo conseguimos que la forma de la onda original se mantenga?

Esto ocurre si los tonos que componen la onda sufren la misma atenuación al propagarse.

Cuando la forma de la onda cambia, decimos que hay distorsión.

Y se produce porque las atenuaciones son diferentes para las frecuencias que componen la forma original.

Unas frecuencias se atenúan más que otras, para la misma distancia.

Fijaros en un efecto muy importante de esto.

Si la forma de onda transporta información, nos interesa que esta forma no cambie.

O lo que es lo mismo, si la forma cambia, perdemos información

Ejemplos de distorsión utilizando la Web Audio API de JavaScript

En este ejemplo vemos (escuchamos) como se puede cambiar la voz utilizando diferentes filtros.

Voice Change o Matic

Este es el enlace al código completo en git:

Git: Voice Change o Matic

WooClap Time!

Audio electrónico

¿Cómo podemos llevar una señal de audio físico a un sitio lejano?

¿Cómo llevamos ese movimiento de las moléculas de aire a otro sitio?

Una solución podría ser poner un altavoz ENORME, que transmita a las moléculas muchísima energía :)

No parece una opción muy seria

La solución es crear una señal análoga a la física, pero en otro medio.

Una señal que tenga la misma forma de onda, pero que represente otra magnitud que no sea la presión.

¿Qué tal voltaje?

Eso es precisamente lo que hace un micrófono: Es un transductor piezo-electrico. Convierte la señal de presión a voltaje.

Aparece un voltaje que tiene una forma análoga a la forma de onda de la señal de presión del sonido recibido.

Esta nueva señal que aparece en el cable, que es análoga a la señal de sonido, se denomina señal analógica.

Y como es una señal que representa audio, se denomina audio analógico.

La señal acústica se ha convertido en una señal de voltaje.

Al colocar una carga y cerrar el circuito, se convierte la señal de voltaje en una señal de corriente.

Lo que se consigue es que ... Los electrones vibren de manera análoga a como lo hacen las moléculas del aire

Hemos transmitido la vibración de las moléculas a los electrones.

Hemos copiado la señal acústica en señal eléctrica.

Electrónica analógica

¿Sabes en qué consiste la electrónica?

En lograr que los electrones hagan lo que nosotros queremos.

Un ingeniero electrónico es en realidad ... ¡Un domador de electrones!.

Los científicos (físicos) descubren las "reglas" de cómo se comportan los electrones, y el ingeniero las usa para domar los electrones, y lograr que se mueven de la forma que el ingeniero necesita.

Como ejemplo para ilustrar estas ideas vamos a usar un circuito muy sencillo: encender un diodo LED.

Si conectamos un LED directamente a una fuente de alimentación (a una pila), se cierra el circuito y empieza a circular una cantidad ENORME de corriente.

Tanta que al cabo de pocos segundos el LED se destruye.

¿Cómo lograr que el LED se encienda sin que se rompa? Hay que domar los electrones, para hacer que circulen menos.

Esto lo logramos colocando una resistencia en serie.

Este proceso de regular la corriente se denomina polarizar un LED.

En este caso, la misión del ingeniero domador es encontrar el valor óptimo de la resistencia que optimiza la solución.

Si colocamos una resistencia pequeña, el LED luce más, pero también consume más.

Si colocamos una resistencia mayor, el LED luce menos, y además consume menos.

Gracias a la electrónica analógica tenemos una capacidad enorme para captar, manipular, almacenar, transportar y reconstruir la señal de Audio.

Ahora sí que podemos llevar el audio a lugares lejanos sin tener que usar un altavoz enorme :)

Esta figura resume el proceso de transmisión.

Captura

Al hablar se genera la señal acústica (física) que tiene una forma de onda determinada.

El micrófono la convierte a una señal de electrónica analógica, de manera que aparece una señal eléctrica "análoga" a la acústica: tiene su misma forma, pero ahora son los electrones los que vibran en vez de las moléculas.

O dicho de otra forma, los electrones vibran de manera análoga a las moléculas del aire.

Manipulación

La señal analógica se puede modificar.

Por ejemplo para amplificarla.

La salidas de los micrófonos es una señal electrónica muy pequeña.

Hay que amplificarla para poder tratarse en los sistemas siguientes.

Almacenamiento

La señal analógica se puede almacenar en sistemas de almacenamiento magnéticos: Se convierte a una señal magnética, que es análoga a la eléctrica.

Y también se puede leer: es el paso inverso.

Convertir la señal magnética otra vez en señal eléctrica.

Transmisión

La señal analógica se transmite hacia un lugar lejano, usando un medio de transmisión, que pueden ser ondas electromagnéticas que se propagan por el vacío o señales eléctricas por un cable.

Para hacer esto la señal analógica hay que modificarla y transformarla.

Recepción

La señal se recibe en la otra parte del mundo, a través de un receptor.

Lo que se obtiene es una señal igual a la enviada, aunque puede estar más atenuada o amplificada.

Reconstrucción

Finalmente, la señal se convierte nuevamente a una señal acústica a través de un altavoz.

Los electrones que vibran de forma análoga a las moléculas de aire siguiendo la forma de la onda original, pasan por un electroimán que genera un campo magnético que hace a su vez vibrar una membrana que golpea las moléculas de aire transmitiendoles el patrón original de movimiento, y por tanto nuestro oído humano escucha el mismo sonido (o al menos, algo muy parecido).

Señales analógicas e información

La información que contienen estas señales analógicas es el patrón de movimiento de las moléculas de aire que representa un sonido que nosotros entendemos: una palabra, una frase, etc...

Es decir, que la información está ligada a la forma de la onda.

¿Y qué ocurre si esta forma de la onda cambia? Pues que perdemos información o perdemos calidad.

Una palabra dejaremos de entenderla si su forma de onda cambia mucho.

Y estos cambios en la forma de la onda son inevitables.

Los dos más importantes son:

La distorsión

Las diferentes frecuencias de la señal sufren diferentes atenuaciones.

Este efecto se va acumulando.

El ruido

Los electrones no son entes estáticos, sino que vibran.

Y esta vibración cambia con la temperatura.

Los electrones que transportan la señal analógica vibran por esta señal, pero le suman su propia vibración: La señal analógica ya no es exactamente igual, sino que incorpora este ruido.

Amplificación del ruido

El ruido se combina con la señal analógica y forma parte de ella.

Ya no los podemos separar.

Por tanto, al amplificarla, también se amplifica este ruido.

La pregunta entonces es...

¿Existe una forma mejor de transportar y almacenar las señales que nos garantice que no se van degradando?.

Sí, el audio digital.

Niveles

Antes de abordar el Audio digital, vamos a hacer un viaje por los diferentes niveles de la tecnología actual: Del átomo al software.

En ciencia y en ingeniería dividimos el conocimiento por niveles.

El modelo es como el que ya conocéis de las capas de red.

En cada capa se introduce una abstracción, y permite abordar nuevos problemas sin tener que conocer los detalles de los niveles inferiores.

Nivel 1: Átomo de silicio

Empezaremos nuestra torre desde el nivel del átomo.

Habría más niveles por debajo: partículas subatómicas, mecánica cuántica..., pero fijaremos el del átomo como punto de partida.

La física y la química son las rama de la ciencia que se estudian este nivel.

En el caso de la electrónica, el átomo que más nos interesa es el de Silicio (Si) que es la base de todo.

El Átomo de silicio está representado en esta figura:

¡OJO! ¡Es una representación para entender sus propiedades, pero Físicamente el átomo no es exactamente así!

Las diferencias son:

  1. El núcleo es muchísimo más pequeño en comparación con los orbitales.
  2. Los orbitales no están tan bien definidos. En realidad los electrones están "por todos lados", pero con mayor probabilidad se encuentran en las zonas verdes. En la realidad todo es mucho más difuso

El núcleo tiene 14 protones y 14 neutrones (lo que le da un peso atómico de 28).

En el nivel exterior tiene 4 orbitales P, cada uno con 1 electrón, lo que le permite formar enlaces covalentes con otros átomos.

Los orbitales forman un tetraedro, en el que el núcleo está en el centro y cada orbital apunta hacia uno de los 4 vértices de este tetraedro.

  • Aplicación práctica: Esta representación del átomo de Silicio está modelada con el programa FreeCAD.

Descarga su modelo 3D y ábrelo con FreeCAD para entender mejor su estructura.

Nivel 2: Materiales

Uniendo átomos de silicio se obtienen materiales apropiados para la electrónica.

Las principales propiedades que lo hacen tan adecuado son las siguientes:

Propiedades semiconductores

El silicio es un semiconductor intrínseco, lo que significa que su comportamiento eléctrico puede modificarse fácilmente mediante dopaje para crear regiones tipo N (exceso de electrones) y tipo P (exceso de huecos).

Esta propiedad es esencial para la fabricación de dispositivos electrónicos como transistores, diodos y circuitos integrados.

Estabilidad térmica y mecánica

Los cristales de silicio tienen una alta estabilidad térmica y mecánica, lo que los hace ideales para su uso en una amplia gama de condiciones ambientales.

Esto es importante para garantizar la fiabilidad y durabilidad de los dispositivos electrónicos, especialmente aquellos que operan en entornos extremos.

Cristalografía bien definida

El silicio forma una estructura cristalina cúbica centrada en el diamante, lo que significa que los átomos de silicio se organizan en una red tridimensional regular.

Esta estructura cristalina proporciona una plataforma estable para la fabricación de dispositivos electrónicos con propiedades eléctricas y mecánicas consistentes y predecibles.

Y algunos de los materiales que suelen producir para la fabricación de aparatos electrónicos son los siguientes:

Silicio monocristalino

Es el material base para la mayoría de los dispositivos semiconductores, como los transistores y los circuitos integrados.

Se obtiene a partir de lingotes de silicio fundido que se solidifican en forma de cristal único.

Este material se utiliza para fabricar chips de silicio en los que se encuentran millones de transistores interconectados.

Silicio policristalino

Es una forma de silicio en la que los cristales individuales tienen diferentes orientaciones.

Aunque no es tan puro como el silicio monocristalino, es menos costoso de producir y se utiliza en aplicaciones donde se requiere menos precisión, como paneles solares fotovoltaicos y algunos componentes electrónicos de potencia.

Óxido de silicio (SiO2)

Es un material dieléctrico utilizado en la fabricación de aislantes y aisladores en dispositivos electrónicos.

En los chips de silicio, el SiO2 se utiliza como aislante entre las capas de metal y como dieléctrico en los transistores de óxido de metal-óxido semiconductor (MOSFETs).

Nivel 3: Semiconductores

Materiales artificiales creados por el hombre (no existen en la naturaleza).

Un semiconductor basado en el silicio es un material semiconductor cuya estructura y propiedades se basan en el uso del silicio como componente principal.

Comportamiento semiconductor

Los semiconductores de silicio tienen una banda prohibida de energía estrecha, lo que significa que su conductividad eléctrica está entre la de los conductores (materiales que conducen bien la electricidad) y los aislantes (materiales que no conducen bien la electricidad).

Esto permite controlar la corriente eléctrica que fluye a través del material, lo que es esencial para la fabricación de dispositivos electrónicos.

Dopaje

El silicio puede ser dopado, es decir, se le pueden agregar pequeñas cantidades de impurezas para modificar sus propiedades eléctricas.

Los dopantes más comunes son el fósforo (dopaje tipo N, que agrega electrones) y el boro (dopaje tipo P, que agrega huecos).

Recuerda: Si N, e- de más. Si P, e- de menos.

Esta capacidad de dopaje permite la creación de regiones con diferentes tipos de conductividad dentro del material, lo que es esencial para la fabricación de dispositivos como transistores y diodos.

Unión PN --> Diodos

Un diodo de silicio es un dispositivo semiconductor que se basa en el uso de silicio como material principal y que tiene la capacidad de permitir o bloquear el flujo de corriente eléctrica en una sola dirección.

Consiste en una unión PN, que es la unión entre dos regiones dopadas de manera diferente dentro de un cristal de silicio.

Unión NPN --> Transistor

Un transistor es un dispositivo semiconductor que cumple varias funciones en circuitos electrónicos, incluyendo amplificación, conmutación, y regulación de corriente y voltaje.

Se compone de materiales semiconductores, generalmente silicio o germanio, y posee tres regiones de material semiconductor: la base, el emisor y el colector.

Nivel 4: Transistor

Imagina que un transistor es como un interruptor que puede estar "abierto" o "cerrado".

En el caso de un transistor de silicio NPN, está compuesto por tres partes:

Emisor

Esta es la parte que "emite" electrones cuando el transistor está activado.

Base

Actúa como el "controlador" del transistor.

Cuando le aplicas una pequeña corriente aquí, actúa como el "interruptor" que puede activar o desactivar el transistor.

Colector

Esta es la parte que "recoge" los electrones cuando el transistor está activado.

En un transistor NPN, la "base" está hecha de un material tipo P, lo que significa que tiene "huecos" que pueden ser llenados con electrones.

El "emisor" está hecho de un material tipo N, donde los electrones son libres para moverse.

El "colector" también está hecho de un material tipo P.

Cuando aplicas una pequeña corriente en la base (la parte P), esta corriente controla el flujo de electrones del emisor (la parte N) al colector (otra parte P).

En otras palabras, la corriente que fluye de la base al emisor controla la corriente que fluye del emisor al colector.

Esto permite que el transistor actúe como un interruptor controlado electrónicamente.

La principal diferencia entre un transistor NPN y un transistor PNP radica en la polaridad de las cargas en la base y en la dirección de la corriente principal entre el emisor y el colector.

En un transistor NPN, la base es P y la corriente principal es causada por electrones (cargas negativas), mientras que en un transistor PNP, la base es N y la corriente principal es causada por huecos (cargas positivas).

Nivel 5: Puertas lógicas

Las puertas lógicas son bloques fundamentales en la lógica digital que realizan operaciones lógicas básicas, como AND, OR y NOT, en señales binarias (0 y 1).

Estas puertas lógicas pueden construirse utilizando transistores.

Así es como se construyen algunas puertas lógicas básicas utilizando transistores:

Puerta AND

Una puerta AND produce un resultado de "1" (alto) solo cuando todas sus entradas son "1".

Para construir una puerta AND usando transistores, puedes conectar dos transistores en serie (uno después del otro) entre la fuente de voltaje y el suelo (GND).

La salida se toma del nodo común entre los dos transistores.

Cuando se aplican voltajes a ambas entradas, ambos transistores deben estar "encendidos" para que la salida sea "1".

Si cualquiera de los transistores está apagado, la salida será "0".

Puerta OR

Una puerta OR produce un resultado de "1" si al menos una de sus entradas es "1".

Para construir una puerta OR utilizando transistores, puedes conectar dos transistores en paralelo entre la fuente de voltaje y el suelo (GND).

La salida se toma del nodo común entre los dos transistores.

Si cualquiera de las entradas se aplica con un voltaje "1", al menos uno de los transistores estará "encendido", lo que hará que la salida sea "1".

Puerta NOT

Una puerta NOT (también conocida como inversor) produce una salida inversa de su entrada.

Es decir, si la entrada es "1", la salida será "0", y si la entrada es "0", la salida será "1".

Para construir una puerta NOT utilizando transistores, puedes conectar un transistor de manera que la entrada esté conectada a la base y la salida se tome del colector.

La salida será el inverso de la entrada.

Cuando la entrada es "1", el transistor está "encendido" y la salida es "0".

Cuando la entrada es "0", el transistor está "apagado" y la salida es "1".

Estos son solo ejemplos básicos de cómo se pueden construir puertas lógicas utilizando transistores.

En la práctica, se utilizan configuraciones más complejas y se combinan varias puertas lógicas para formar circuitos digitales más sofisticados.

Nivel 6: Microprocesador

Construir un microprocesador utilizando puertas lógicas sería una tarea enormemente compleja debido a la cantidad masiva de puertas lógicas y la interconexión necesaria.

Sin embargo, es útil entender cómo se pueden utilizar puertas lógicas para construir los componentes básicos que forman un microprocesador.

A grandes rasgos, esos componentes básicos, incluyen la unidad de control, la unidad aritmético lógica (ALU), los registros y la memoria.

Nivel 7: Software

Los microprocesadores son capaces de ejecutar una amplia variedad de software, que puede dividirse en varias categorías principales:

Sistemas operativos

Los sistemas operativos son el software principal que controla y coordina el funcionamiento de un microprocesador y sus recursos.

Ejemplos de sistemas operativos incluyen Microsoft Windows, macOS, Linux, Android, iOS, entre otros.

Estos sistemas operativos proporcionan una interfaz entre el hardware del microprocesador y el software de aplicación, permitiendo a los usuarios interactuar con sus computadoras y dispositivos.

Software de aplicación

Este es el software que los usuarios ejecutan para realizar tareas específicas en sus dispositivos.

Incluye una amplia gama de programas y aplicaciones, como procesadores de texto, hojas de cálculo, navegadores web, reproductores multimedia, juegos, aplicaciones de productividad, herramientas de desarrollo de software, aplicaciones de redes sociales, entre otros.

Firmware y controladores

El firmware es un tipo de software que está integrado en el hardware del microprocesador y proporciona instrucciones de bajo nivel para controlar dispositivos y componentes específicos.

Los controladores son programas de software que permiten que el sistema operativo y el hardware del microprocesador se comuniquen entre sí y funcionen correctamente.

Esto incluye controladores para dispositivos de entrada/salida como teclados, ratones, impresoras, tarjetas de red, tarjetas gráficas, entre otros.

Software embebido

Este es el software diseñado específicamente para ser ejecutado en sistemas embebidos, que son sistemas informáticos especializados integrados en dispositivos y equipos electrónicos.

El software embebido puede incluir sistemas operativos en tiempo real (RTOS), controladores de dispositivo, firmware de control de dispositivos, y aplicaciones específicas para el dispositivo en cuestión.

Software de desarrollo

Este tipo de software se utiliza para crear y desarrollar otros programas y aplicaciones.

Incluye herramientas de compilación, entornos de desarrollo integrados (IDE), depuradores, editores de código, y otras utilidades que facilitan el proceso de escritura, compilación, depuración y mantenimiento de software.

Una breve Introducción al Audio digital

  • Problema de los sistemas analógicos. Información asociada a la forma de la onda. Se degrada
  • Conversión a números
  • Garantizado por las matemáticas: Teorema de Nyquist

  • Señal digital: Números. Estamos en el reino de los números. ¡Matemáticas!
  • No hay degradación por copia
  • Información en números
  • Números fáciles de manipular
  • El audio digital son... números!
  • ¡Bienvenidos al mundo digital!

Electrónica digital

  • Circuitos electrónicos especializados en el tratamiento de números. Manipulación, almacenamiento y transporte de números.
  • Diseñador: Lograr que los números hagan lo que nosotros queremos
  • Actualmente: Números en binario
  • Tecnología actual: Bit 0: 0v, Bit 1: 5v, 3.3v, 1.8v
  • Circuito digital: Manipula bits

Bits: Niveles

  • Transistor (niveles anteriores). Primer nivel lógico
  • Puertas lógicas: Digital
    • Combinando transitores obtenemos puertas lógicas
    • Base de nuestra sociedad digital
  • Microprocesador
    • puertas lógics --> Mux, Reg, Alus.. --> Micros
    • ¡Máquina universal!
  • Software. ¡Mundo del software!

Mundo digital

  • Vivimos en una sociedad digital. ¿Qué significa? ¡Que todo son números!
  • ¡Todo lo que nos llega son números!
  • Internet: Red digital. Especializada en el transporte de números. ¡Cualquier señal se puede convertir a número!

WooClap Time!

Descargas

Curioso

Nuevo componente para controlar circuitos digitales: un switch

Este panel no necesita conexión hardware, es para probar

Autor

Jesús Parrado Alameda (jesusgpa)

Creditos

Licencia

Enlaces