Usuario:Ju&Jote/Taller
Formatos digitales para documentos
La información que contiene un documento se encuentra dentro de un determinado formato. Según el ICA-CIA se entiende por documento toda información registrada producida o recibida durante la iniciación, desarrollo o terminación de una actividad personal o institucional y que incluye contenido, contexto y estructura suficientes para servir como testimonio de esa actividad.
Otra definición, procedente de la norma UNE-ISO 15489-1 (AENOR, 2006) de documento nos indica que se trata de información creada o recibida, conservada como información o prueba, por una organización o un individuo en el desarrollo de sus actividades o en virtud de sus obligaciones legales. En ambas definiciones leemos que se trata de información registradas, conservada, lo cual obliga a disponer de un formato para que dicha información sea accesible.
Cuando nos fijamos en las características exteriores de los documentos, observamos que el soporte hace referencia al material físico en el que se fija el contenido del documento. El papel ha sido, por tradición, donde se ha fijado principalmente la información. Hoy en día tenemos que añadir los documentos electrónicos ya que la información se almacena en discos magnéticos. Otra característica es la clase, donde se identifica el tipo de documento de que se trata, esto es, textual, iconográfico, sonoro, audiovisual o multimedia. Una vez que tenemos el soporte y la clase, llegamos al formato. Por lo general los formatos son normalizados y estandarizados. En el caso del papel, el formato es el DIN(A4, A3…). Los documentos electrónicos relacionan el formato con la aplicación informática con la cual ha sido creado. Por ejemplo, documento textual consiste en un fichero informático formato DOC (documento de Microsof Word), PDF (portable document format). Y si se trata de un documento iconográfico TIFF (tagged image file format). Según el documento así será el formato.
Formatos para textos
HTML (hyper text markup language): es el formato más utilizado para publicar en la red (Word Wild Web) ya que se emplea para dar formato a los textos, asigna enlaces a imágenes y establece los hipervínculos; cuando un navegador pide una página, recibe el código HTML que ejecuta en local para visualizarla.
PDF (portable document format): como formato abierto es un estándar para el intercambio de información electrónica y reconocida por empresas y organismos gubernamentales. Se puede imprimir en cualquier plataforma, Macintosh, Microsoft Windows, Unix. En el año 2007, Adobe, propietaria del formato PDF, presentó a la Association for Information and Image Management la especificación completa del formato PDF, de está manera se podrá liberar como un estándar de ISO.
PDF/A (portable document format-archive): fue aprobado en 2005 como estándar ISO 19005-1:2005. Document Management. Electronic document file format for long-term preservation. Part 1: Use of PDF 1.4. Es el primer formato diseñado para la conservación a largo plazo de documentos electrónicos. Es un formato 100% autocontenido, no admite ningún tipo de vínculo externo; no permite incrustar audio, vídeo ni otros ejecutables; no permite utilizar firmas electrónicas ni ningún tipo de sistema que implique el uso de cifrado; todas las fuentes de letra deben estar incrustadas; incorpora uso de metadatos estandarizados basados en el estándar XMP (extensible metadata platform). Este estándar se basa en las especificaciones RDF (resource descrption framework) y el XML (extended markup language).
ODF (open document file): es un estándar de aplicaciones ofimáticas creado por Open Office. Es la alternativa abierta a los formatos propietarios de Microsoft. XML (extended markup language): es propiedad de la World Wide Web Consortium y se utiliza para etiquetar datos y sirve para estructurar, almacenar e intercambiar información.
Formatos para imágenes fijas
DjVu: formato de tecnología wavelet, estándar abierto. Acceso al texto con el código ASCII. La resolución del archivo estás prefijada.
GIF (graphics interchange format): Es un formato muy utilizado en páginas web para mostrar gráficos. Se caracteriza por ser formato de 8 bits que da animación mediante frames y como compresión utiliza LZW.
JPEG (joint photographic expert group): se usa mucho en internet y comprime imágenes con pérdida, aunque puede ser ajustada. Ocurre que un nivel de compresión alto nos ofrece una calidad de imagen baja. Y si la compresión es pequeña, la calidad de imagen es muy buena, lo que supone mayor peso y necesidad de espacio para guardarla.
JPEG2000 (joint photographic expert group): se presentó en el año 2000 y es capaz de crear compresiones de fotografías muy altas, basadas en la tecnología wavelet o de segmentación. Trabaja con niveles de compresión mayores que el JPEG. Como desventaja está que tiende a emborronar más la imagen que el JPEG incluso para el mismo tamaño de archivo y que elimina detalles pequeños y texturas. Este formato ha sido publicado como norma ISO/IEC 15444-1:2000.
MrSID (multiresolution seamless image databse). Basado en algoritmos wavelet de codificación y potentes capacidades de descompresión. Diseñado para portabilidad de imágenes masivas, gigantes. Permite la visualización y manipulación instantánea de imágenes, tanto en local como en red. Dispone de multiresolución, descodificación selectiva, mosaico y navegación en Internet. Este formato se presenta como el ideal para los fondos de cartotecas, de hecho es el empleado por el Instituto Cartográfico de Catalunya, que también utiliza el JPEG2000.
RAW: este formato corresponde a las cámaras fotográficas digitales con sus diferentes extensiones. Se trata de los datos que nos ofrece la propia cámara. Las imágenes que nos ofrece el sensor de la cámara serán más naturales, sin aplicación de filtros de mejora. Este formato da mucha información y permite ajustar todos los parámetros sin perder información inicial.
TIFF (tagged image file format): Se caracteriza por guardar imágenes de alta calidad y con etiquetas informativas. Considerado el formato ideal para guardar originales digitales. Se utiliza para intercambiar archivos entre aplicaciones y plataformas de ordenadores.
Formatos para sonido
CDDA (compact disc digital audio): formato original de los CD de audio, con muy buena calidad pero requiere mucho espacio.
MIDI (musical instrument digital interface): se emplea para la distribución en la red de audio en baja calidad y con poco consumo de espacio.
MP3 (MPEG-1 audio layer-III): utilizado sobretodo para el intercambio en la red. Gran capacidad de compresión.
RA (real audio): ofrece buena compresión y descompresión. Se emplea en la difusión en Internet.
WAV (wave form): permite realizar compresiones, lo cual afecta a la calidad.
Formatos para imágenes móviles
QuickTime (.mov): creado por Apple es un formato multiplataforma. Compatible con otros tipos de formato de audio, video e imagen. Sirve para la reproducción como para la difusión.
AVI (audio video interleaved) (.avi): es un formato multiplataforma que intercala audio y video.
MEPG: estándar cuya compresión crea una pérdida de calidad. MEPG-1 es para CD, MEPG-2 es para DVD, TV digital y MEPG-4 sirve para transmisión de video y multimedia en la red.
Windows Media Player: reproductor de Microsoft, que reproduce diversos formatos, copia, busca y distribuye en Internet.
Bibliografía
Consejo Internacional de Archivos (CIA) (1997). Guide for Management Electronic Record san Archival Perspective (Guía para la gestión archivística de documentos electrónicos), Paris.
DÍEZ CARRERA, Carmen (2012). La biblioteca digital, Gijón, Trea.
SERRA SERRA, Jordi (2008). Los documentos electrónicos. ¿Qué son y cómo se tratan?, Gijón, Trea.
Referencias
TORRES FREIXENET, Luis (2008). http://www.aragon.es/estaticos/GobiernoAragon/Departamentos/EducacionCulturaDeporte/Documentos/docs/Areas/Actas_II_Jornadas_Aragonesas/22%20Preservaci%C3%B3n%20Digital.pdf [consultado: 2015-04-06]