"Fossies" - the Fresh Open Source Software archive

Member "share/man/es/man1/unix2mac.1" of archive dos2unix-6.0.4-win64.zip:


dos2unix

Section: 2013-12-30 (1)
Updated: 2013-07-27
Index
 

NOMBRE

dos2unix - Convertidor de archivos de texto de formato DOS/Mac a Unix y viceversa  

SINOPSIS

    dos2unix [par['a]metros] [ARCHIVO ...] [-n ARCH_DE_ENTRADA ARCH_DE_SALIDA ...]
    unix2dos [par['a]metros] [ARCHIVO ...] [-n ARCH_DE_ENTRADA ARCH_DE_SALIDA ...]

 

DESCRIPCI['O]N

El paquete Dos2unix incluye las utiler['i]as "dos2unix" y "unix2dos" para convertir archivos de texto plano en formato DOS o Mac a formato Unix y viceversa.

En archivos de texto DOS/Windows, un salto de l['i]nea, tambi['e]n conocido como nueva l['i]nea, es una combinaci['o]n de dos caracteres: un retorno de carro (CR) seguido por un salto de l['i]nea (LF). En archivos de texto Unix, un salto de l['i]nea es solamente un car['a]cter: el salto de l['i]nea (LF). En archivos de texto Mac, antes de Mac OS X, un salto de l['i]nea era s['o]lo un car['a]cter retorno de carro (CR). Actualmente, Mac OS usa el estilo Unix de saltos de l['i]nea (LF).

Adem['a]s de saltos de l['i]nea, Dos2unix puede tambi['e]n convertir la codificaci['o]n de archivos. Unas cuantas p['a]ginas de c['o]digos DOS pueden ser convertidas a Unix Latin-1. Y archivos Unicode de Windows (UTF-16) pueden ser convertidos a archivos Unicode de Unix (UTF-8).

Los archivos binarios son ignorados autom['a]ticamente, a menos que se fuerce su conversi['o]n.

Los archivos no regulares, tales como directorios y FIFO, son ignorados autom['a]ticamente.

Los enlaces simb['o]licos y sus destinos no son modificados por defecto. Los enlaces simb['o]licos pueden opcionalmente ser reemplazados, o la salida puede ser escrita al archivo destino del enlace. Los enlaces simb['o]licos en Windows no est['a]n soportados. Estos son siempre reemplazados, sin que se alteren sus destinos.

Dos2unix fue moldeado a partir del dos2unix que existe en SunOS/Solaris y tiene modos de conversi['o]n similares.  

PAR['A]METROS

--
Todos los par['a]metros siguientes son tratados como nombres de archivo. Use este par['a]metro si desea convertir archivos cuyos nombres inician con un gui['o]n. Por ejemplo para convertir un archivo llamado ``-foo'', use este comando:

    dos2unix -- -foo

O en modo de archivo nuevo:

    dos2unix -n -- -foo out.txt

-ascii
S['o]lo convierte los salto de l['i]nea. ['E]ste es el modo de conversi['o]n por defecto.
-iso
Conversi['o]n entre el conjunto de caracteres DOS e ISO-8859-1. V['e]ase tambi['e]n la secci['o]n MODOS DE CONVERSI['O]N.
-1252
Usa la p['a]gina de c['o]digos Windows 1252 (Europa Occidental).
-437
Usa la p['a]gina de c['o]digos DOS 437 (EE. UU.). Est['a] es la p['a]gina de c['o]digos usada por defecto para conversi['o]n ISO.
-850
Usa la p['a]gina de c['o]digos DOS 850 (Europa Occidental).
-860
Usa la p['a]gina de c['o]digos DOS 860 (Portugu['e]s).
-863
Usa la p['a]gina de c['o]digos DOS 863 (Francocanadiense).
-865
Usa la p['a]gina de c['o]digos DOS 865 (N['o]rdico).
-7
Convierte caracteres de 8 bits al espacio de 7 bits.
-c, --convmode CONVMODE
Establece el modo de conversi['o]n, Donde CONVMODE puede ser: ascii, 7bit, iso, mac siendo ascii el valor por defecto.
-f, --force
Fuerza la conversi['o]n de archivos binarios.
-h, --help
Despiega la ayuda y termina el programa.
-k, --keepdate
Mantiene la fecha del archivo de salida igual a la del archivo de entrada.
-L, --license
Muestra la licencia del programa.
-l, --newline
A[~n]ade salto de l['i]nea adicional.

dos2unix: S['o]lo los saltos de l['i]nea DOS son cambiados por dos saltos de l['i]nea Unix. En modo Mac s['o]lo los saltos de l['i]nea Mac son cambiados por dos saltos de l['i]nea Unix.

unix2dos: S['o]lo los saltos de l['i]nea Unix son cambiados por dos saltos de l['i]nea DOS. En modo Mac los saltos de l['i]nea Unix son cambiados por dos saltos de l['i]nea Mac.

-m, --add-bom
Escribe una marca de orden de bytes para UTF-8 en el archivo de salida. Nunca use esta opci['o]n cuando la codificaci['o]n de salida sea distinta de UTF-8. V['e]ase tambi['e]n la secci['o]n UNICODE.
-n, --newfile ARCH_DE_ENTRADA ARCH_DE_SALIDA ...
Modo de archivo nuevo. Convierte el archivo ARCH_DE_ENTRADA y escribe la salida al archivo ARCH_DE_SALIDA. Los nombres de archivo deben ser dados en pares y los comodines no deben ser usados o perder['a] sus archivos.

La persona que inicia la conversi['o]n en el modo de archivo nuevo (pareado) ser['a] el propietario del archivo convertido. Los permisos de lectura/escritura del archivo nuevo ser['a]n los permisos del archivo original menos la umask(1) de la persona que ejecute la conversi['o]n.

-o, --oldfile ARCHIVO ...
Modo de archivo viejo. Convierte el archivo ARCHIVO y lo sobrescribe con la salida. El programa por defecto se ejecuta en este modo. S['i] se pueden emplear comodines.

En modo de archivo antiguo (in situ), el archivo convertido obtiene el mismo propietario, grupo, y permisos de lectura/escritura que el archivo original. Lo mismo aplica cuando el archivo es convertido por otro usuario quien tiene permiso de lectura en el archivo (p.e. usuario root). La conversi['o]n ser['a] abortada cuando no sea posible preservar los valores originales. Cambiar el propietario implicar['i]a que el propietario original ya no podr['a] leer el archivo. Cambiar el grupo podr['i]a ser un riesgo de seguridad, ya que el archivo podr['i]a ser accesible a personas inadecuadas. La preservaci['o]n del propietario, grupo, y permisos de lectura/escritura s['o]lo est['a] soportada bajo Unix.

-q, --quiet
Modo silencioso. Suprime todas las advertencias y mensajes. El valor retornado es cero. Excepto cuando se emplean par['a]metros incorrectos.
-s, --safe
Ignora los archivos binarios (por defecto).
-ul, --assume-utf16le
Supone que el formato de archivo de entrada es UTF-16LE.

Cuando existe una marca de orden de bytes (BOM) en el archivo de entrada, la BOM tiene prioridad sobre esta opci['o]n.

Cuando se hace un supuesto incorrecto (el archivo de entrada no estaba en formato UTF-16LE) y la conversi['o]n tiene ['e]xito, obtendr['a] un archivo UTF-8 de salida con el texto err['o]neo.

La conversi['o]n err['o]nea puede ser deshecha con iconv(1) mediante convertir el archivo UTF-8 de salida de vuelta a UTF-16LE. Esto restaurar['a] el archivo original.

El supuesto de UTF-16LE funciona como un modo de conversi['o]n. Al cambiar al modo por defecto ascii el supuesto UTF-16LE es deshabilitado.

-ub, --assume-utf16be
Supone que el formato del archivo de entrada es UTF-16BE.

Esta opci['o]n funciona igual que la opci['o]n "-ul".

-F, --follow-symlink
Sigue los enlaces simb['o]licos y convierte los destinos.
-R, --replace-symlink
Reemplaza los enlaces simb['o]licos con los archivos convertidos (los archivos destino originales no se alteran).
-S, --skip-symlink
No altera los enlaces simb['o]licos ni sus destinos (por defecto).
-V, --version
Despiega la informaci['o]n de la versi['o]n y termina el programa.
 

MODO MAC

En modo normal los saltos de l['i]nea son convertidos de DOS a Unix y viceversa. Los saltos de l['i]nea Mac no son convertidos.

En modo Mac los saltos de l['i]nea son convertidos de Mac a Unix y viceversa. Los saltos de l['i]nea DOS no son modificados.

Para ejecutar en modo Mac use el modificador "-c mac" o use los comandos "mac2unix" o "unix2mac".  

MODOS DE CONVERSI['O]N

Los modos de conversi['o]n ascii, 7bit, e iso son similares a los de los comandos dos2unix/unix2dos de SunOS/Solaris.
ascii
En modo "ascii" s['o]lo los saltos de l['i]nea son convertidos. ['E]ste es el modo de conversi['o]n por defecto.

Aunque el nombre de este modo es ASCII, el cual es un est['a]ndar de 7 bits, ['e]ste emplea 8 bits. Siempre use este modo cuando convierta archivos en Unicode UTF-8.

7bit
En este modo todos los caracteres no ASCII de 8 bits (con valores de 128 a 255) son convertidos al espacio de 7 bits.
iso
Los caracteres son convertidos entre un conjunto de caracteres DOS (p['a]gina de c['o]digos) y el conjunto de caracteres ISO-8859-1 (Lat['i]n-1) de Unix. Los caracteres DOS sin equivalente ISO-8859-1, para los cuales la conversi['o]n es imposible, son convertidos en un punto. Lo mismo se aplica para caracteres ISO-8859-1 sin contraparte DOS.

Cuando s['o]lo se emplea el par['a]metro "-iso", dos2unix intentar['a] determinar la p['a]gina de c['o]digos activa. Cuando esto no sea posible, dos2unix utilizar['a] la p['a]gina de c['o]digos 437 por defecto, la cual es empleada principalmente en EE. UU. Para forzar una p['a]gina de c['o]digos espec['i]fica emplee los par['a]metros "-437" (EE. UU.), "-850" (Europa Occidental), "-860" (Portugu['e]s), "-863" (Francocanadiense), o "-865" (N['o]rdico). La p['a]gina de c['o]digos Windows 1252 (Europa Occidental) tambi['e]n est['a] soportada con el par['a]metro "-1252". Para acceder a otras p['a]ginas de c['o]digos use dos2unix en combinaci['o]n con iconv(1). Iconv puede convertir entre una larga lista de codificaciones de caracteres.

Nunca emplee la conversi['o]n ISO en archivos de texto Unicode. Esto corromper['a] los archivos codificados como UTF-8.

Algunos ejemplos:

Convierte de la p['a]gina de c['o]digos por defecto de DOS a Lat['i]n-1 de Unix.

    dos2unix -iso -n in.txt out.txt

Convierte de DOS 850 a Unix Lat['i]n-1.

    dos2unix -850 -n in.txt out.txt

Convierte de Windows 1252 a Unix Lat['i]n-1.

    dos2unix -1252 -n in.txt out.txt

Convierte de Windows 1252 a Unix UTF-8 (Unicode).

    iconv -f CP1252 -t UTF-8 in.txt | dos2unix > out.txt

Convierte de Unix Lat['i]n-1 a la p['a]gina de c['o]digos por defecto de DOS.

    unix2dos -iso -n in.txt out.txt

Convierte de Unix Lat['i]n-1 a DOS 850.

    unix2dos -850 -n in.txt out.txt

Convierte de Unix Lat['i]n-1 a Windows 1252.

    unix2dos -1252 -n in.txt out.txt

Convierte de Unix UTF-8 (Unicode) a Windows 1252.

    unix2dos < in.txt | iconv -f UTF-8 -t CP1252 > out.txt

V['e]ase tambi['e]n <http://czyborra.com/charsets/codepages.html> y <http://czyborra.com/charsets/iso8859.html>.

 

UNICODE

 

Codificaciones

Existen diferentes codificaciones Unicode. En Unix y Linux los archivos Unicode son codificados com['u]nmente como UTF-8. En Windows los archivos de texto Unicode pueden estar codificados en UTF-8, UTF-16, o UTF-16 big endian, pero con m['a]s frecuencia son codificados en formato UTF-16.  

Conversion

Los archivos de texto Unicode pueden tener saltos de l['i]nea DOS, Unix o Mac, como cualquier archivo de texto.

Todas las versiones de dos2unix y unix2dos pueden convertir archivos codificados como UTF-8, debido a que UTF-8 fue dise[~n]ado para retro-compatibilidad con ASCII.

Dos2unix y unix2dos con soporte Unicode UTF-16, pueden leer archivos de texto codificados como UTF-16 little y big endian. Para ver si dos2unix fue compilado con soporte UTF-16 escriba "dos2unix -V".

Las versiones Windows de dos2unix y unix2dos siempre convierten archivos Codificados como UTF-16 a UTF-8. Las versiones Unix de dos2unix/unix2dos convierten archivos UTF-16 a la codificaci['o]n de caracteres local cuando es configurado a UTF-8. Emplee el comando locale(1) para determinar cual es la codificaci['o]n de caracteres local.

Dado que los archivos de texto formateados UTF-8 son bien soportados tanto en Windows como en Unix, dos2unix y unix2dos no tienen opci['o]n para escribir archivos UTF-16. Todos los caracteres UTF-16 pueden ser codificados en UTF-8. La conversi['o]n de UTF-16 a UTF-8 ocurre sin p['e]rdida. Los archivos UTF-16 ser['a]n ignorados en Unix cuando la codificaci['o]n de caracteres local no sea UTF-8, para evitar la p['e]rdida accidental de texto. Cuando ocurre un error de conversi['o]n de UTF-16 a UTF-8, por ejemplo cuando el archivo de entrada UTF-16 contiene un error, el archivo ser['a] ignorado.

La conversi['o]n en modos ISO y 7-bit no funciona en archivos UTF-16.  

Marca de orden de bytes

En Windows los archivos de texto Unicode t['i]picamente tienen una marca de orden de bytes (BOM), debido a que muchos programas de Windows (incluyendo el Bloc de notas) a[~n]aden una BOM por defecto. V['e]ase tambi['e]n <http://es.wikipedia.org/wiki/Marca_de_orden_de_bytes_%28BOM%29>.

En Unix los archivos Unicode t['i]picamente no tienen una BOM. Se supone que los archivos de texto son codificados en la codificaci['o]n de caracteres local.

Dos2unix s['o]lo puede detectar si un archivo est['a] en formato UTF-16 si el archivo tiene una BOM. Cuando un archivo UTF-16 no tiene una BOM, dos2unix tratar['a] el archivo como un archivo binario.

Emplee la opci['o]n "-ul" o "-ub" para convertir un archivo UTF-16 sin BOM.

Dos2unix nunca escribe una BOM en el archivo de salida, a menos que emplee la opci['o]n "-m".

Unix2dos escribe una BOM en el archivo de salida cuando el archivo de entrada tiene una BOM, o cuando se emplea la opci['o]n "-m".  

Ejemplos Unicode

Convertir de Windows UTF-16 (con una BOM) a Unix UTF-8

    dos2unix -n in.txt out.txt

Convertir de Windows UTF-16LE (sin una BOM) a Unix UTF-8

    dos2unix -ul -n in.txt out.txt

Convertir de Unix UTF-8 a Windows UTF-8 sin una BOM

    unix2dos -m -n in.txt out.txt

Convertir de Unix UTF-8 a Windows UTF-16

    unix2dos < in.txt | iconv -f UTF-8 -t UTF-16 > out.txt

 

EJEMPLOS

Lee la entrada desde 'stdin' y escribe la salida a 'stdout'.

    dos2unix
    dos2unix -l -c mac

Convierte y reemplaza a.txt. Convierte y reemplaza b.txt.

    dos2unix a.txt b.txt
    dos2unix -o a.txt b.txt

Convierte y reemplaza a.txt empleando modo de conversi['o]n ascii.

    dos2unix a.txt

Convierte y reemplaza a.txt empleando modo de conversi['o]n ascii. Convierte y reemplaza b.txt empleando modo de conversi['o]n de 7bits.

    dos2unix a.txt -c 7bit b.txt
    dos2unix -c ascii a.txt -c 7bit b.txt
    dos2unix -ascii a.txt -7 b.txt

Convierte a.txt del formato de Mac a Unix.

    dos2unix -c mac a.txt
    mac2unix a.txt

Convierte a.txt del formato de Unix a Mac.

    unix2dos -c mac a.txt
    unix2mac a.txt

Convierte y reemplaza a.txt manteniendo la fecha del archivo original.

    dos2unix -k a.txt
    dos2unix -k -o a.txt

Convierte a.txt y escribe la salida a e.txt.

    dos2unix -n a.txt e.txt

Convierte a.txt y escribe la salida a e.txt, manteniendo la fecha de e.txt igual a la de a.txt.

    dos2unix -k -n a.txt e.txt

Convierte y reemplaza a.txt. Convierte b.txt y escribe a e.txt.

    dos2unix a.txt -n b.txt e.txt
    dos2unix -o a.txt -n b.txt e.txt

Convierte c.txt y escribe a e.txt. Convierte y reemplaza a.txt. Convierte y reemplaza b.txt. Convierte d.txt y escribe a f.txt.

    dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt

 

CONVERSI['O]N RECURSIVA

Emplee dos2unix en combinaci['o]n con los comandos find(1) y xargs(1) para convertir recursivamente archivos de texto contenidos en un ['a]rbol de directorios. Por ejemplo para convertir todos los archivos .txt en el ['a]rbol de directorios debajo del directorio actual escriba:

    find . -name *.txt |xargs dos2unix

 

INTERNACIONALIZACI['O]N

LANG
El idioma principal se selecciona con la variable de entorno LANG. La variable LANG consiste de varias partes. La primer parte es el c['o]digo del idioma en min['u]sculas. La segunda es opcional y es el c['o]digo del pa['i]s en may['u]sculas, precedido por un gui['o]n bajo. Existe tambi['e]n una tercera parte opcional: la codificaci['o]n de caracteres, precedida por un punto. Unos cuantos ejemplos para int['e]rpretes de comandos tipo POSIX est['a]ndar:

    export LANG=nl               Neerland['e]s
    export LANG=nl_NL            Neerland['e]s, Pa['i]ses Bajos
    export LANG=nl_BE            Neerland['e]s, B['e]lgica
    export LANG=es_ES            Espa[~n]ol, Espa[~n]a
    export LANG=es_MX            Espa[~n]ol, M['e]xico
    export LANG=en_US.iso88591   Ingles, EE. UU., codificaci['o]n Lat['i]n-1
    export LANG=en_GB.UTF-8      Ingles, Reino Unido, codificaci['o]n UTF-8

Para una lista completa de c['o]digos de idioma y pa['i]s v['e]ase el manual de gettext: http://www.gnu.org/software/gettext/manual/gettext.html#Language-Codes <http://www.gnu.org/software/gettext/manual/gettext.html#Language-Codes>

En sistemas Unix puede emplear el comando locale(1) para obtener informaci['o]n espec['i]fica del locale.

LANGUAGE
Con la variable de entorno LANGUAGE puede especificar una lista de prioridad de los idiomas, separados por dos puntos. Dos2unix da preferencia a LANGUAGE por encima de LANG. Por ejemplo, primero neerland['e]s y entonces alem['a]n: "LANGUAGE=nl:de". Antes de que pueda usar una lista de prioridad de idiomas a trav['e]s de la variable LANGUAGE, primero tiene que habilitar la internacionalizaci['o]n, mediante asignar un valor distinto de ``C'' a LANG (o LC_ALL). V['e]ase tambi['e]n el manual de gettext: http://www.gnu.org/software/gettext/manual/gettext.html#The-LANGUAGE-variable <http://www.gnu.org/software/gettext/manual/gettext.html#The-LANGUAGE-variable>

Si selecciona un idioma que no est['a] disponible el programa funcionar['a] en ingles.

DOS2UNIX_LOCALEDIR
Con la variable de entorno DOS2UNIX_LOCALEDIR el LOCALEDIR asignado durante la compilaci['o]n puede ser modificado. LOCALEDIR es usado para encontrar los archivos de idioma. El valor por defecto de GNU es "/usr/local/share/locale". El par['a]metro --version desplegar['a] el LOCALEDIR en uso.

Ejemplo (int['e]rprete de comandos POSIX):

    export DOS2UNIX_LOCALEDIR=$HOME/share/locale

 

VALOR DE RETORNO

Se regresa cero cuando el programa termina exitosamente. Cuando ocurre un error del sistema se regresar['a] el ['u]ltimo n['u]mero de error del sistema. Para otros errores se regresa 1.

El valor de retorno es siempre cero en modo silencioso, excepto cuando se emplean par['a]metros incorrectos.  

EST['A]NDARES

<http://es.wikipedia.org/wiki/Documento_de_texto>

<http://es.wikipedia.org/wiki/Retorno_de_carro>

<http://es.wikipedia.org/wiki/Nueva_l%C3%ADnea>

<http://es.wikipedia.org/wiki/Unicode>  

AUTORES

Benjamin Lin - <blin@socs.uts.edu.au> Bernd Johannes Wuebben (modo mac2unix) - <wuebben@kde.org>, Christian Wurll (a[~n]adi['o] el salto de l['i]nea extra) - <wurll@ira.uka.de>, Erwin Waterlander - <waterlan@xs4all.nl> (Mantenimiento)

P['a]gina del proyecto: <http://waterlan.home.xs4all.nl/dos2unix.html>

P['a]gina de SourceForge: <http://sourceforge.net/projects/dos2unix/>

Freecode: <http://freecode.com/projects/dos2unix>  

V['E]ASE TAMBI['E]N

file(1) find(1) iconv(1) locale(1) xargs(1)  

POD ERRORS

Hey! The above document had some coding errors, which are explained below:
Around line 59:
Non-ASCII character seen before =encoding in '[par['a]metros]'. Assuming ISO8859-1


 

Index

NOMBRE
SINOPSIS
DESCRIPCI['O]N
PAR['A]METROS
MODO MAC
MODOS DE CONVERSI['O]N
UNICODE
Codificaciones
Conversion
Marca de orden de bytes
Ejemplos Unicode
EJEMPLOS
CONVERSI['O]N RECURSIVA
INTERNACIONALIZACI['O]N
VALOR DE RETORNO
EST['A]NDARES
AUTORES
V['E]ASE TAMBI['E]N
POD ERRORS