L. Semana 13 - HazelMartinez/Portafolio- GitHub Wiki

15/10/19

RAID10

Minimo 4 discos Excelente redundancia

File systems

Pero si solo tenemos las operaciones escribir y leer. Donde encontramos la informacion, como sabemos los bloques disponibles.

Por el sistema operativo nos permite una abtracción de procesos, esto nos permite interactuar con el hardware. Los archivos son unidades logicas de informacion creadas por procesos. Un disco puede contener millones de archivos y cada uno es independiente. Yo necesito que sea persistente, que no se vea afectada por otro documento. La informacion se mantenga ahi. La parte que treta con los archivos es el file system. Existen varios tipos de sistemas de archivos.
->Linux eXT2, Ext3 ->Windows NTFS ->FAT, FAT32 (DOS, WINDOWS) -> CDFS (CD Rom)

Interactuamos con un API para interacturar el sistema de archivos. Requerimientos a considerar: ->Persistencia: Asegurarnos que los datos esten ahi ->Velocidad: Velocidad de lectura y escritura para mis archivos ->Almacenamiento: Gestion ->Sharing: Compartir información de mis archivos con algunos otros usuarios. ->Protección:Quienes tienen permiso de usarlos ->Usarlo facilmente ->Acceso Random, acceder a cualquier parte del disco duro, permite almacenamiento permanente.

Sector FS block es siempre del mismo tamaño del bloque del disco.

Particion: Agarrar un disco y partirlo en dos o más.

Volumen: nombre que se le da a la collecion de bloques

Super bloque: Donde el file sistem almacena información critica (tamaño, nombre).

Archivos es un mecanismo de abstracción que probee la forma de almacenar información en el disco de manera que pueda leerla cuando sea necesario. La abstraccion me permite ocultar detalles de como y donde esta la información almacenada.

Permite ocultar al cliente los detalles de la implementación.

Estructurar un archivo

Fin de secuencia. Bit de secuencia. Records de tamaño fijo. Arbol de record.

Bit de secuencia

Cualquier significado tiene que estar establecido a nivel de usuario. A el no le importa lo que esta en el archivo.El solo ve bits. El sistema operativo no interfiere para hacer el trabajo. Este tipo de archivos son archivos planos.

Ejemplo:unix

Records de tamaño fijo

Se representan por un conjunto de bloques y cada uno tiene una estructura interna. Usa mainframes/midrange sistemas de operación.

Arbol de records

No tienen necesariamente el mismo tamaño. Contienen una llave en especifica.

Tipos de archivos

Archivos regulares

Contienen informacion de archivos

Directorios: Mantienen la estructura del file sistem

Archivos de caracteres especiales. Archivos que se usan para input/ output.

Archivos binarios: Archivos de programas ejecutables.

Existen dos formas de acceder a la informacion de los archivos: Acceso secuencial. No se podian leer en orden. Esta asociado a la secuencia de bits. Se debia utilizar acceso secuencial.

Acceso secuencial

Acceso Random

File Metadata

Tienen atributos que nos permiten ver los manejos del archivo.

Directorios

Archivos especiales mantenidos en track files La idea es tener una estructura que me permita encontrar de forma facil la informacion de mi archivo. Un sistema directorio jerarquico nos permite tener tantos directorios como necesitemos.

Layout

Sistemas de archivos almacenados en el disco. Sector 0 del disko es el llamado el Master Boot Record (MBR) almacenar la parte del booteo de la maquina- Al final del MBR se encuentra la tabla de particiones. Nos dice cuales partes tienen particiones.

El MBR tiene informacion de cada partición. Cada particion tiene un bloque de booteo. Si la particion no tiene informacion de bloqueo el dice que no tiene. Tiene parametros del file system, como cuantos bloques tiene. El I-nodo alamcena la metadata de cada archivo. ¿Como hago para saber cuales bloques le pertenecen al archivo? Asignación continua. Los archivos estan uno a la par del otro. Todo se maneja como un arreglo.

Contiguos Allocation: Todos los bloques del archivo están físicamente uno a la par del otro.

El principal problema es la desfragmentacion para generar bloques mas grandes para almacenar el archivo. Esto aplica que tengo que des-fragmentar el disco.

Asignación mediante listas enlazadas. Cada archivo como un archivo de listas enlazadas de la lista de discos.

Tengo que recorrer la lista para poder llegar al bloque deseado

I nodes (nodos indexados)

Asociado a cada archivo con una estructura de datos que contiene un conjunto de listas con atributos, y los direcciones de los discos.

En los I nodos tenemos 15 punteros 12 punteros a los bloques de datos. Esto hace una estrategia eficiente para pequeños archivos. 13 a bloques indirectos. Disminuye el numero de bloques que podemos usar, pierdo un bloque en referenciar a unos cuantos, bloques asociados al bloque principal, tengo la informacion dividida. 14 indirecto a data bloques
15 triple indirectos a data blocks

En el esquema el I nodo debe estar cuando el archivo esta abierto.

Word tiene el archivo cargado, y de ahi tiene algunas paginas precargadas. Entonces va cargando conrespecto se baje

I nodes conocido como fomato extendido, tiene un tamanio fijo y contiene la metadata del archivo. Funciona como el pegamento que une los bloques de datos en el orden correcto. Es como tener una estructura indexada. voy teninedo partes del archivo

Algoritmo de compresion

Introduccion

Tasas de compresion de bits Reduciomos la cantidad de bits. Reduce la cantidad de bits identificando y eliminando datos redundantes pero no se pierde compresion. Puedo descomprimir la informacion y obtener la info original. El proceso mediante el cual reducimos el tamaño del archivo se llama compresion por que nos ayuda a disminuir la cantidad de recursos. Cuando hablamos de recurso hablamos de capacidad de compresion.

Compresion con perdida

Es una compresion donde la informacion original se pierde. esto significa que no pueden ser regenerados. Permirten aproximaciones no exactas del contenido original. No se logra la informacion al 100%. Normalmente reducia el nivel de degradaciòn del producto final. Se utilizaba para audio, video e imagenes. Especialmente en streaming media. Aunque es perceptible, es estable.

Compresion sin perdida

Permite obtener la informacion mediante lo comprimido

Huffman Code

Se usa el principio en GZIP, JPEG. La idea es asignar algortimos binarios a aquellos simbolos que se presneten lo mas frecuentemente en la data. Codigos o simbolos que aparecen poco se les va a asignar simbolos pero de mayor cantidad de digitos. Construye un arbol binario que es usado para asignar los simbolos. La idea es obtener estadisticas de estos simbolos. Estos simbolos se organizan en una lista de acuerdo a la probabilidad que aparezcan en el documento, esta lista de simbolos es nuestro elemento inicial para construir el arbol de Huffman Code.

Si la lista contiene un nodo se termina Si no 2.Seleccione los primeros nodos con la menor probabilidad de que aparezca. 3.De juntar los primeros nodos, creo un nodo F. Sumo la cantidad de apariciones de los dos caracteres. Y suma la cantidad.
Inserto la cantidad que le conresponbde de acuerdo a ellos dos. Asumamos que yo tenia un texto.

Se toman los menores de la lista y los sumo.