"Fossies" - the Fresh Open Source Software Archive

Member "share/man/es/man1/mac2unix.1" (6 Oct 2014, 27403 Bytes) of archive /windows/misc/dos2unix-7.1-win64.zip:


dos2unix

Section: 2014-10-06 (1)
Updated: 2014-10-06
Index
 

NOMBRE

dos2unix - Convertidor de ficheros de texto de formato DOS/Mac a Unix y viceversa  

SINOPSIS

    dos2unix [parámetros] [FICHERO ...] [-n FICHERO_DE_ENTRADA FICHERO_DE_SALIDA ...]
    unix2dos [parámetros] [FICHERO ...] [-n FICHERO_DE_ENTRADA FICHERO_DE_SALIDA ...]

 

DESCRIPCIÓN

El paquete Dos2unix incluye las utilerías "dos2unix" y "unix2dos" para convertir ficheros de texto plano en formato DOS o Mac a formato Unix y viceversa.

En ficheros de texto DOS/Windows, un salto de línea, también conocido como nueva línea, es una combinación de dos caracteres: un retorno de carro (CR) seguido por un salto de línea (LF). En ficheros de texto Unix, un salto de línea es solamente un carácter: el salto de línea (LF). En ficheros de texto Mac, antes de Mac OS X, un salto de línea era sólo un carácter retorno de carro (CR). Actualmente, Mac OS usa el estilo Unix de saltos de línea (LF).

Además de saltos de línea, Dos2unix puede también convertir la codificación de ficheros. Unas cuantas páginas de códigos DOS pueden ser convertidas a Unix Latin-1. Y ficheros Unicode de Windows (UTF-16) pueden ser convertidos a ficheros Unicode de Unix (UTF-8).

Los ficheros binarios son ignorados automáticamente, a menos que se fuerce su conversión.

Los ficheros no regulares, tales como directorios y FIFO, son ignorados automáticamente.

Los enlaces simbólicos y sus destinos no son modificados por defecto. Los enlaces simbólicos pueden opcionalmente ser reemplazados, o la salida puede ser escrita al destino simbólico del enlace. En Windows no está soportada la escritura a enlaces simbólicos.

Dos2unix fue modelado después de dos2unix bajo SunOS/Solaris. Hay una importante diferencia respecto a la versión original SunOS/Solaris. Esta versión hace, por defecto, la conversión en el mismo fichero (modo de fichero antiguo), mientras que la versión original de SunOS/Solaris sólo es compatible con la conversión en fichero emparejado (modo de fichero nuevo). Véanse las opciones "-o" y "-n".  

PARÁMETROS

--
Todos los parámetros siguientes son tratados como nombres de fichero. Use este parámetro si desea convertir ficheros cuyos nombres inician con un guión. Por ejemplo para convertir un fichero llamado ``-foo'', use este comando:

    dos2unix -- -foo

O en modo de fichero nuevo:

    dos2unix -n -- -foo out.txt

-ascii
Sólo convierte los salto de línea. Éste es el modo de conversión por defecto.
-iso
Conversión entre el conjunto de caracteres DOS e ISO-8859-1. Véase también la sección MODOS DE CONVERSIÓN.
-1252
Usa la página de códigos Windows 1252 (Europa Occidental).
-437
Usa la página de códigos DOS 437 (EE. UU.). Está es la página de códigos usada por defecto para conversión ISO.
-850
Usa la página de códigos DOS 850 (Europa Occidental).
-860
Usa la página de códigos DOS 860 (Portugués).
-863
Usa la página de códigos DOS 863 (Francocanadiense).
-865
Usa la página de códigos DOS 865 (Nórdico).
-7
Convierte caracteres de 8 bits al espacio de 7 bits.
-b, --keep-bom
Mantiene la Marca de Orden de Byte (BOM). Cuando el fichero de entrada tiene BOM, escribe BOM en el fichero de salida. Este es el comportamiento por defecto en la conversión a saltos de línea DOS. Vea también la opción "-r".
-c, --convmode CONVMODE
Establece el modo de conversión, Donde CONVMODE puede ser: ascii, 7bit, iso, mac siendo ascii el valor por defecto.
-f, --force
Fuerza la conversión de ficheros binarios.
-h, --help
Despiega la ayuda y termina el programa.
-i[FLAGS], --info[=FLAGS] FILE ...
Display file information. No conversion is done.

The following information is printed, in this order: number of DOS line breaks, number of Unix line breaks, number of Mac line breaks, byte order mark, text or binary, file name.

Example output:

     6       0       0  no_bom    text    dos.txt
     0       6       0  no_bom    text    unix.txt
     0       0       6  no_bom    text    mac.txt
     6       6       6  no_bom    text    mixed.txt
    50       0       0  UTF-16LE  text    utf16le.txt
     0      50       0  no_bom    text    utf8unix.txt
    50       0       0  UTF-8     text    utf8dos.txt
     2     418     219  no_bom    binary  dos2unix.exe

Optionally extra flags can be set to change the output. One or more flags can be added.

d
Print number of DOS line breaks.
u
Print number of Unix line breaks.
m
Print number of Mac line breaks.
b
Print the byte order mark.
t
Print if file is text or binary.
c
Print only the files that would be converted.

With the "c" flag dos2unix will print only the files that contain DOS line breaks, unix2dos will print only file names that have Unix line breaks.

Examples:

Show information for all *.txt files:

    dos2unix -i *.txt

Show only the number of DOS line breaks and Unix line breaks:

    dos2unix -idu *.txt

Show only the byte order mark:

    dos2unix --info=b *.txt

List the files that have DOS line breaks.

    dos2unix -ic *.txt

List the files that have Unix line breaks.

    unix2dos -ic *.txt

-k, --keepdate
Mantiene la fecha del fichero de salida igual a la del fichero de entrada.
-L, --license
Muestra la licencia del programa.
-l, --newline
Añade salto de línea adicional.

dos2unix: Sólo los saltos de línea DOS son cambiados por dos saltos de línea Unix. En modo Mac sólo los saltos de línea Mac son cambiados por dos saltos de línea Unix.

unix2dos: Sólo los saltos de línea Unix son cambiados por dos saltos de línea DOS. En modo Mac los saltos de línea Unix son cambiados por dos saltos de línea Mac.

-m, --add-bom
Write a Byte Order Mark (BOM) in the output file. By default an UTF-8 BOM is written.

When the input file is UTF-16, and the option "-u" is used, an UTF-16 BOM will be written.

Never use this option when the output encoding is other than UTF-8 or UTF-16. See also section UNICODE.

-n, --newfile FICHERO_DE_ENTRADA FICHERO_DE_SALIDA ...
Modo de fichero nuevo. Convierte el fichero FICHERO_DE_ENTRADA y escribe la salida al fichero FICHERO_DE_SALIDA. Los nombres de fichero deben ser dados en pares y los comodines no deben ser usados o perderá sus ficheros.

La persona que inicia la conversión en el modo de fichero nuevo (pareado) será el propietario del fichero convertido. Los permisos de lectura/escritura del fichero nuevo serán los permisos del fichero original menos la umask(1) de la persona que ejecute la conversión.

-o, --oldfile FICHERO ...
Modo de fichero viejo. Convierte el fichero FICHERO y lo sobrescribe con la salida. El programa por defecto se ejecuta en este modo. Sí se pueden emplear comodines.

En modo de fichero antiguo (in situ), el fichero convertido obtiene el mismo propietario, grupo, y permisos de lectura/escritura que el fichero original. Lo mismo aplica cuando el fichero es convertido por otro usuario quien tiene permiso de lectura en el fichero (p.e. usuario root). La conversión será abortada cuando no sea posible preservar los valores originales. Cambiar el propietario implicaría que el propietario original ya no podrá leer el fichero. Cambiar el grupo podría ser un riesgo de seguridad, ya que el fichero podría ser accesible a personas inadecuadas. La preservación del propietario, grupo, y permisos de lectura/escritura sólo está soportada bajo Unix.

-q, --quiet
Modo silencioso. Suprime todas las advertencias y mensajes. El valor retornado es cero. Excepto cuando se emplean parámetros incorrectos.
-r, --remove-bom
Elimina la Marca de Orden de Byte (BOM). No escribe el BOM en el fichero de salida. Este es el comportamiento por defecto al convertir a saltos de línea Unix. Vea también la opción "-b".
-s, --safe
Ignora los ficheros binarios (por defecto).
-u, --keep-utf16
Keep the original UTF-16 encoding of the input file. The output file will be written in the same UTF-16 encoding, little or big endian, as the input file. This prevents transformation to UTF-8. An UTF-16 BOM will be written accordingly. This option can be disabled with the "-ascii" option.
-ul, --assume-utf16le
Supone que el formato de fichero de entrada es UTF-16LE.

Cuando existe una marca de orden de bytes (BOM) en el fichero de entrada, la BOM tiene prioridad sobre esta opción.

Cuando se hace un supuesto incorrecto (el fichero de entrada no estaba en formato UTF-16LE) y la conversión tiene éxito, obtendrá un fichero UTF-8 de salida con el texto erróneo. La conversión errónea puede ser deshecha con iconv(1) mediante convertir el fichero UTF-8 de salida de vuelta a UTF-16LE. Esto restaurará el fichero original.

El supuesto de UTF-16LE funciona como un modo de conversión. Al cambiar al modo por defecto ascii el supuesto UTF-16LE es deshabilitado.

-ub, --assume-utf16be
Supone que el formato del fichero de entrada es UTF-16BE.

Esta opción funciona igual que la opción "-ul".

-v, --verbose
Display verbose messages. Extra information is displayed about Byte Order Marks and the amount of converted line breaks.
-F, --follow-symlink
Sigue los enlaces simbólicos y convierte los destinos.
-R, --replace-symlink
Reemplaza los enlaces simbólicos con los ficheros convertidos (los ficheros destino originales no se alteran).
-S, --skip-symlink
No altera los enlaces simbólicos ni sus destinos (por defecto).
-V, --version
Despiega la información de la versión y termina el programa.
 

MODO MAC

En modo normal los saltos de línea son convertidos de DOS a Unix y viceversa. Los saltos de línea Mac no son convertidos.

En modo Mac los saltos de línea son convertidos de Mac a Unix y viceversa. Los saltos de línea DOS no son modificados.

Para ejecutar en modo Mac use el modificador "-c mac" o use los comandos "mac2unix" o "unix2mac".  

MODOS DE CONVERSIÓN

ascii
En modo "ascii" sólo los saltos de línea son convertidos. Éste es el modo de conversión por defecto.

Aunque el nombre de este modo es ASCII, el cual es un estándar de 7 bits, éste emplea 8 bits. Siempre use este modo cuando convierta ficheros en Unicode UTF-8.

7bit
En este modo todos los caracteres no ASCII de 8 bits (con valores de 128 a 255) son convertidos al espacio de 7 bits.
iso
Los caracteres son convertidos entre un conjunto de caracteres DOS (página de códigos) y el conjunto de caracteres ISO-8859-1 (Latín-1) de Unix. Los caracteres DOS sin equivalente ISO-8859-1, para los cuales la conversión es imposible, son convertidos en un punto. Lo mismo se aplica para caracteres ISO-8859-1 sin contraparte DOS.

Cuando sólo se emplea el parámetro "-iso", dos2unix intentará determinar la página de códigos activa. Cuando esto no sea posible, dos2unix utilizará la página de códigos 437 por defecto, la cual es empleada principalmente en EE. UU. Para forzar una página de códigos específica emplee los parámetros "-437" (EE. UU.), "-850" (Europa Occidental), "-860" (Portugués), "-863" (Francocanadiense), o "-865" (Nórdico). La página de códigos Windows 1252 (Europa Occidental) también está soportada con el parámetro "-1252". Para acceder a otras páginas de códigos use dos2unix en combinación con iconv(1). Iconv puede convertir entre una larga lista de codificaciones de caracteres.

No use nunca la conversión ISO en ficheros de texto Unicode. Esto corrompería los ficheros codificados como UTF-8.

Algunos ejemplos:

Convierte de la página de códigos por defecto de DOS a Latín-1 de Unix.

    dos2unix -iso -n in.txt out.txt

Convierte de DOS 850 a Unix Latín-1.

    dos2unix -850 -n in.txt out.txt

Convierte de Windows 1252 a Unix Latín-1.

    dos2unix -1252 -n in.txt out.txt

Convierte de Windows 1252 a Unix UTF-8 (Unicode).

    iconv -f CP1252 -t UTF-8 in.txt | dos2unix > out.txt

Convierte de Latín-1 en Unix a la página de códigos por defecto de DOS.

    unix2dos -iso -n in.txt out.txt

Convierte de Unix Latín-1 a DOS 850.

    unix2dos -850 -n in.txt out.txt

Convierte de Unix Latín-1 a Windows 1252.

    unix2dos -1252 -n in.txt out.txt

Convierte de Unix UTF-8 (Unicode) a Windows 1252.

    unix2dos < in.txt | iconv -f UTF-8 -t CP1252 > out.txt

Véase también <http://czyborra.com/charsets/codepages.html> y <http://czyborra.com/charsets/iso8859.html>.

 

UNICODE

 

Codificaciones

Existen diferentes codificaciones Unicode. En Unix y Linux los ficheros Unicode son codificados comúnmente como UTF-8. En Windows los ficheros de texto Unicode pueden estar codificados en UTF-8, UTF-16, o UTF-16 big endian, pero con más frecuencia son codificados en formato UTF-16.  

Conversion

Los ficheros de texto Unicode pueden tener saltos de línea DOS, Unix o Mac, como cualquier fichero de texto.

Todas las versiones de dos2unix y unix2dos pueden convertir ficheros codificados como UTF-8, debido a que UTF-8 fue diseñado para retro-compatibilidad con ASCII.

Dos2unix y unix2dos con soporte Unicode UTF-16, pueden leer ficheros de texto codificados como UTF-16 little y big endian. Para ver si dos2unix fue compilado con soporte UTF-16 escriba "dos2unix -V".

UTF-16 encoded files are by default converted to UTF-8. On Unix/Linux it is required that the locale character encoding is set to UTF-8. Use the locale(1) command to find out what the locale character encoding is. UTF-8 formatted text files are well supported on both Windows and Unix/Linux.

UTF-16 and UTF-8 encoding are fully compatible, there will no text be lost in the conversion. When an UTF-16 to UTF-8 conversion error occurs, for instance when the UTF-16 input file contains an error, the file will be skipped.

When option "-u" is used, the output file will be written in the same UTF-16 encoding as the input file. Option "-u" prevents conversion to UTF-8.

Dos2unix and unix2dos have no option to convert UTF-8 files to UTF-16.

La conversión en modos ISO y 7-bit no funciona en ficheros UTF-16.  

Marca de orden de bytes

En Windows los ficheros de texto Unicode típicamente tienen una marca de orden de bytes (BOM), debido a que muchos programas de Windows (incluyendo el Bloc de notas) añaden una BOM por defecto. Véase también <http://es.wikipedia.org/wiki/Marca_de_orden_de_bytes_%28BOM%29>.

En Unix los ficheros Unicode típicamente no tienen una BOM. Se supone que los ficheros de texto son codificados en la codificación de caracteres local.

Dos2unix sólo puede detectar si un fichero está en formato UTF-16 si el fichero tiene una BOM. Cuando un fichero UTF-16 no tiene una BOM, dos2unix tratará el fichero como un fichero binario.

Emplee la opción "-ul" o "-ub" para convertir un fichero UTF-16 sin BOM.

Dos2Unix, por defecto, no escribe BOM en el fichero de salida. Con la opción "-b" Dos2unix escribe el BOM cuando el fichero de entrada tiene el BOM.

Unix2dos escribe BOM en el fichero de salida cuando el fichero de entrada tiene BOM. Use la opción "-r" para eliminar el BOM.

Dos2unix y unix2dos escriben siempre BOM cuando se usa la opción "-m".  

Ejemplos Unicode

Convertir de Windows UTF-16 (con una BOM) a Unix UTF-8

    dos2unix -n in.txt out.txt

Convertir de Windows UTF-16LE (sin una BOM) a Unix UTF-8

    dos2unix -ul -n in.txt out.txt

Convertir de Unix UTF-8 a Windows UTF-8 sin una BOM

    unix2dos -m -n in.txt out.txt

Convertir de Unix UTF-8 a Windows UTF-16

    unix2dos < in.txt | iconv -f UTF-8 -t UTF-16 > out.txt

 

EJEMPLOS

Lee la entrada desde 'stdin' y escribe la salida a 'stdout'.

    dos2unix
    dos2unix -l -c mac

Convierte y reemplaza a.txt. Convierte y reemplaza b.txt.

    dos2unix a.txt b.txt
    dos2unix -o a.txt b.txt

Convierte y reemplaza a.txt empleando modo de conversión ascii.

    dos2unix a.txt

Convierte y reemplaza a.txt empleando modo de conversión ascii. Convierte y reemplaza b.txt empleando modo de conversión de 7bits.

    dos2unix a.txt -c 7bit b.txt
    dos2unix -c ascii a.txt -c 7bit b.txt
    dos2unix -ascii a.txt -7 b.txt

Convierte a.txt del formato de Mac a Unix.

    dos2unix -c mac a.txt
    mac2unix a.txt

Convierte a.txt del formato de Unix a Mac.

    unix2dos -c mac a.txt
    unix2mac a.txt

Convierte y reemplaza a.txt manteniendo la fecha del fichero original.

    dos2unix -k a.txt
    dos2unix -k -o a.txt

Convierte a.txt y escribe la salida a e.txt.

    dos2unix -n a.txt e.txt

Convierte a.txt y escribe la salida a e.txt, manteniendo la fecha de e.txt igual a la de a.txt.

    dos2unix -k -n a.txt e.txt

Convierte y reemplaza a.txt. Convierte b.txt y escribe a e.txt.

    dos2unix a.txt -n b.txt e.txt
    dos2unix -o a.txt -n b.txt e.txt

Convierte c.txt y escribe a e.txt. Convierte y reemplaza a.txt. Convierte y reemplaza b.txt. Convierte d.txt y escribe a f.txt.

    dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt

 

CONVERSIÓN RECURSIVA

Emplee dos2unix en combinación con los comandos find(1) y xargs(1) para convertir recursivamente ficheros de texto contenidos en un árbol de directorios. Por ejemplo para convertir todos los ficheros .txt en el árbol de directorios debajo del directorio actual escriba:

    find . -name *.txt |xargs dos2unix

 

INTERNACIONALIZACIÓN

LANG
El idioma principal se selecciona con la variable de entorno LANG. La variable LANG consiste de varias partes. La primer parte es el código del idioma en minúsculas. La segunda es opcional y es el código del país en mayúsculas, precedido por un guión bajo. Existe también una tercera parte opcional: la codificación de caracteres, precedida por un punto. Unos cuantos ejemplos para intérpretes de comandos tipo POSIX estándar:

    export LANG=nl               Neerlandés
    export LANG=nl_NL            Neerlandés, Países Bajos
    export LANG=nl_BE            Neerlandés, Bélgica
    export LANG=es_ES            Español, España
    export LANG=es_MX            Español, México
    export LANG=en_US.iso88591   Ingles, EE. UU., codificación Latín-1
    export LANG=en_GB.UTF-8      Ingles, Reino Unido, codificación UTF-8

Para una lista completa de códigos de idioma y país véase el manual de gettext: <http://www.gnu.org/software/gettext/manual/gettext.html#Language-Codes>

En sistemas Unix puede emplear el comando locale(1) para obtener información específica del locale.

LANGUAGE
Con la variable de entorno LANGUAGE puede especificar una lista de prioridad de los idiomas, separados por dos puntos. Dos2unix da preferencia a LANGUAGE por encima de LANG. Por ejemplo, primero neerlandés y entonces alemán: "LANGUAGE=nl:de". Antes de que pueda usar una lista de prioridad de idiomas a través de la variable LANGUAGE, primero tiene que habilitar la internacionalización, mediante asignar un valor distinto de ``C'' a LANG (o LC_ALL). Véase también el manual de gettext: <http://www.gnu.org/software/gettext/manual/gettext.html#The-LANGUAGE-variable>

Si selecciona un idioma que no está disponible el programa funcionará en ingles.

DOS2UNIX_LOCALEDIR
Con la variable de entorno DOS2UNIX_LOCALEDIR el LOCALEDIR asignado durante la compilación puede ser modificado. LOCALEDIR es usado para encontrar los ficheros de idioma. El valor por defecto de GNU es "/usr/local/share/locale". El parámetro --version desplegará el LOCALEDIR en uso.

Ejemplo (intérprete de comandos POSIX):

    export DOS2UNIX_LOCALEDIR=$HOME/share/locale

 

VALOR DE RETORNO

Se regresa cero cuando el programa termina exitosamente. Cuando ocurre un error del sistema se regresará el último número de error del sistema. Para otros errores se regresa 1.

El valor de retorno es siempre cero en modo silencioso, excepto cuando se emplean parámetros incorrectos.  

ESTÁNDARES

<http://es.wikipedia.org/wiki/Documento_de_texto>

<http://es.wikipedia.org/wiki/Retorno_de_carro>

<http://es.wikipedia.org/wiki/Nueva_l%C3%ADnea>

<http://es.wikipedia.org/wiki/Unicode>  

AUTORES

Benjamin Lin - <blin@socs.uts.edu.au> Bernd Johannes Wuebben (mac2unix mode) - <wuebben@kde.org>, Christian Wurll (add extra newline) - <wurll@ira.uka.de>, Erwin Waterlander - <waterlan@xs4all.nl> (Maintainer)

Página del proyecto: <http://waterlan.home.xs4all.nl/dos2unix.html>

Página de SourceForge: <http://sourceforge.net/projects/dos2unix/>  

VÉASE TAMBIÉN

file(1) find(1) iconv(1) locale(1) xargs(1)


 

Index

NOMBRE
SINOPSIS
DESCRIPCIÓN
PARÁMETROS
MODO MAC
MODOS DE CONVERSIÓN
UNICODE
Codificaciones
Conversion
Marca de orden de bytes
Ejemplos Unicode
EJEMPLOS
CONVERSIÓN RECURSIVA
INTERNACIONALIZACIÓN
VALOR DE RETORNO
ESTÁNDARES
AUTORES
VÉASE TAMBIÉN