Archivo de texto

tipo de dato

Un archivo de texto simple, texto sencillo o texto sin formato (también llamado texto plano o texto simple; en inglés «plain text»), es un archivo informático que contiene únicamente texto formado solo por caracteres que son legibles por humanos y carece de cualquier tipo de formato tipográfico.[1]

Archivo de texto
Información general
Extensión de archivo .txt, .text
Tipo de MIME text/plain
Formato abierto Sí 

Estos archivos están compuestos de bytes que representan caracteres ordinarios como letras, números y signos de puntuación (incluyendo espacios en blanco), también incluye algunos pocos caracteres de control como tabulaciones, saltos de línea y retornos de carro. Estos caracteres se pueden codificar de distintos modos. El sistema de codificación ASCII viene a ser la base primordial y no necesita de un identificador explícito en la comunicación digital. Para poder representar diferentes sistemas de codificación de caracteres como UTF-1, UTF-7, UTF-8, UTF-16, UTF-32, UTF-EBCDIC, SCSU, BOCU-1 y GB 18030 es necesario que haya al principio de cada fichero de texto una marca de orden de bytes.

Los archivos de texto plano carecen de información destinada a generar formatos (negritas, subrayado, cursivas, tamaño, etc.)[2]​ y tipos de letra (por ejemplo, Arial, Times, Courier, etc.).[2]​ Esta simplicidad permite que una gran variedad de programas pueda leer y editar ese contenido. Las aplicaciones destinadas a la escritura y modificación de archivos de texto se llaman editores de texto. Cada texto tiene un peso diferente porque tiene una codificación distinta.

Uso en software

editar

Los documentos de texto plano son legibles por humanos -a diferencia de los archivos binarios- , son usados en ocasiones por ciertos programas como una forma de almacenamiento de los datos. La ventaja que este tipo de ficheros ofrece, además de la interoperabilidad (ya que es un formato universal), es que un usuario puede acceder a los datos y modificar las variables para personalizar el programa.

Adicionalmente, cuando ocurre algún tipo de corrupción de datos, es más fácil para una persona arreglar problemas en un archivo de texto que en uno binario. Algunos formatos de texto (como XML) tienen mecanismos incluidos para especificar la codificación del documento, pero la gran mayoría de formatos no lo tiene. Como contrapartida, cualquier usuario podría leer y modificar el valor de las variables a su antojo, o aleatoriamente o por equivocación, siendo impredecibles los efectos sobre el programa.

Un inconveniente de los archivos de texto es que no hay forma segura de saber a priori qué codificación se utilizó para guardarlo. Un programa editor de texto puede grabar un archivo en UTF-8, pero un compilador puede esperar un formato ISO-8859; al tratar de compilar el archivo generará errores en el programa. El problema es aún más complejo en el caso de ficheros transmitidos a través de redes informáticas, en las que una identificación errónea de la codificación de los archivos de texto puede dar lugar a multitud de errores.

Convenciones de nombres

editar

En sistemas Windows

editar

La costumbre ha hecho que los archivos de texto se nombren con la extensión .txt, aunque pueden tener cualquier otra a capricho del usuario (son válidas y habituales: .inf, .80, .dat, etc.)[cita requerida]

Es recomendable no usar para un archivo de texto plano extensiones que, estando muy difundidas y siendo muy conocidas, pueden confundir tanto al usuario como al propio sistema operativo, como por ejemplo .xls, .doc, .ppt, .wav, .gif o .jpg, aunque no hay ningún impedimento real si se quieren utilizar.

En sistemas Unix y GNU/Linux

editar

En sistemas Unix y GNU/Linux las convenciones de nombres de archivos son más relajadas. La extensión .txt se ha hecho popular en los últimos tiempos, pero habitualmente el contenido del archivo se determina con programas que examinan los primeros bytes, como por ejemplo el comando "file".

Véase también

editar

Referencias

editar
  1. The Linux Information Project (15 de febrero de 2005). «What is plain text? -- introduction by The Linux Information Project (LINFO)». www.linfo.org (en inglés). Consultado el 23 de julio de 2016. 
  2. a b «The Unicode® Standard Version 11.0 – Core Specification» (pdf). Unicode Consortium (en inglés). 30 de junio de 2018. Archivado desde el original el 19 de septiembre de 2018. Consultado el 1 de enero de 2019. «Plain text is a pure sequence of character codes; plain Unicode-encoded text is therefore a sequence of Unicode character codes. In contrast, styled text, also known as rich text, is any text representation consisting of plain text plus added information such as a language identifier, font size, color, hypertext links, and so on.» 

Enlaces externos

editar