Valores separados por comas

Valores separados por comas
	Un archivo CSV simple que enumera tres personas y las empresas para las que trabajan
Extensión de nombre de archivo	.csv
Tipo de medio de Internet	text/csv
Identificador de tipo uniforme (UTI)	texto público con valores separados por comas
Conformación de UTI	texto público con valores delimitados
Tipo de formato	Flujos de datos seriales y multiplataforma
Contenedor para	Información de la base de datos organizada como listas separadas por campos
Estándar	RFC 4180

Formato de archivo utilizado para almacenar datos

Los valores separados por comas ( CSV ) son un formato de archivo de texto que utiliza comas para separar valores y saltos de línea para separar registros. Un archivo CSV almacena datos tabulares (números y texto) en texto sin formato , donde cada línea del archivo generalmente representa un registro de datos . Cada registro consta de la misma cantidad de campos , y estos están separados por comas en el archivo CSV. Si el delimitador de campo en sí puede aparecer dentro de un campo, los campos pueden estar rodeados por comillas. ^[3]

El formato de archivo CSV es un tipo de formato de archivo separado por delimitadores . ^[4] Los delimitadores que se utilizan con frecuencia incluyen la coma, el tabulador , el espacio y el punto y coma. Los archivos separados por delimitadores suelen tener la extensión ".csv" incluso cuando el separador de campos no es una coma. Muchas aplicaciones o bibliotecas que consumen o producen archivos CSV tienen opciones para especificar un delimitador alternativo. ^[5]

La falta de cumplimiento del estándar CSV RFC 4180 hace necesario el soporte de una variedad de formatos CSV en el software de entrada de datos. A pesar de este inconveniente, CSV sigue estando muy extendido en las aplicaciones de datos y es ampliamente compatible con una variedad de software, incluidas las aplicaciones de hojas de cálculo comunes como Microsoft Excel . ^[6] Los beneficios citados a favor de CSV incluyen la legibilidad humana y la simplicidad del formato. ^{[ cita requerida ]}

Aplicaciones

CSV es un formato común de intercambio de datos que es ampliamente compatible con aplicaciones de consumo, empresariales y científicas. Entre sus usos más comunes se encuentra el traslado de datos tabulares ^[7]^[8] entre programas que operan de forma nativa en formatos incompatibles (a menudo propietarios o no documentados). ^[1] Por ejemplo, un usuario puede necesitar transferir información desde un programa de base de datos que almacena datos en un formato propietario a una hoja de cálculo que utiliza un formato completamente diferente. La mayoría de los programas de bases de datos pueden exportar datos como CSV. La mayoría de los programas de hojas de cálculo pueden leer datos CSV, lo que permite utilizar CSV como formato intermedio al transferir datos de una base de datos a una hoja de cálculo.

CSV también se utiliza para almacenar datos. Las herramientas de ciencia de datos comunes como Pandas incluyen la opción de exportar datos a CSV para almacenamiento a largo plazo. ^[9] Los beneficios de CSV para el almacenamiento de datos incluyen la simplicidad de CSV hace que el análisis y la creación de archivos CSV sean fáciles de implementar y rápidos en comparación con otros formatos de datos, la legibilidad humana hace que la edición o corrección de datos sea más simple, ^[10] y la alta compresibilidad que conduce a archivos de datos más pequeños. ^[11] Alternativamente, CSV no admite relaciones de datos más complejas y no hace distinción entre valores nulos y vacíos, y en aplicaciones donde se necesitan estas características se prefieren otros formatos.

Especificación

RFC 4180 propone una especificación para el formato CSV; sin embargo, la práctica real a menudo no sigue la RFC y el término "CSV" podría referirse a cualquier archivo que: ^[1]^[12]

es texto simple que utiliza una codificación de caracteres como ASCII , varias codificaciones de caracteres Unicode (por ejemplo, UTF-8 ), EBCDIC o Shift JIS .
consta de registros (normalmente un registro por línea),
con los registros divididos en campos separados por delimitadores (normalmente un único carácter reservado como coma, punto y coma o tabulación; a veces el delimitador puede incluir espacios opcionales),
donde cada registro tiene la misma secuencia de campos.

Dentro de estas limitaciones generales, se utilizan muchas variaciones. Por lo tanto, sin información adicional (como si se respeta el RFC 4180), un archivo que se afirma simplemente que está en formato "CSV" no está completamente especificado. Como resultado, algunas aplicaciones que admiten archivos CSV tienen asistentes de importación de texto que permiten a los usuarios obtener una vista previa de las primeras líneas del archivo y luego especificar los caracteres delimitadores, las reglas de comillas y el recorte de campos.

Historia

Los valores separados por comas son un formato de datos que es anterior a las computadoras personales por más de una década: el compilador IBM Fortran (nivel H extendido) bajo OS/360 admitió CSV en 1972. ^[13] La entrada/salida dirigida por listas ("formato libre") se definió en FORTRAN 77 , aprobado en 1978. La entrada dirigida por listas usaba comas o espacios como delimitadores, por lo que las cadenas de caracteres sin comillas no podían contener comas o espacios. ^[14]

El término "valor separado por comas" y la abreviatura "CSV" se utilizaban en 1983. ^[15] El manual de la computadora Osborne Executive, que incluía la hoja de cálculo SuperCalc , documenta la convención de comillas CSV que permite que las cadenas contengan comas incrustadas, pero el manual no especifica una convención para incrustar comillas dentro de cadenas entre comillas. ^[16]

Las listas de valores separados por comas son más fáciles de escribir (por ejemplo, en tarjetas perforadas ) que los datos alineados con columnas fijas, y eran menos propensas a producir resultados incorrectos si un valor se perforaba una columna fuera de su ubicación prevista.

Los archivos separados por comas se utilizan para el intercambio de información de bases de datos entre máquinas de dos arquitecturas diferentes. El carácter de texto simple de los archivos CSV evita en gran medida incompatibilidades como el orden de bytes y el tamaño de las palabras . Los archivos son en gran medida legibles para humanos, por lo que es más fácil trabajar con ellos en ausencia de una documentación o comunicación perfectas. ^[17]

La principal iniciativa de estandarización (transformar la " definición difusa de facto " en una más precisa y de iure ) se produjo en 2005, con la RFC 4180, que definió CSV como un tipo de contenido MIME . ^[18] Más tarde, en 2013, algunas de las deficiencias de la RFC 4180 fueron abordadas mediante una recomendación del W3C. ^[19]

En 2014, la IETF publicó la RFC 7111, que describe la aplicación de fragmentos de URI a documentos CSV. La RFC 7111 especifica cómo se pueden seleccionar rangos de filas, columnas y celdas de un documento CSV utilizando índices de posición. ^[20]

En 2015, el W3C , en un intento de mejorar CSV con semántica formal , publicó los primeros borradores de recomendaciones para los estándares de metadatos CSV, que comenzaron como recomendaciones en diciembre del mismo año. ^[21]

Funcionalidad general

Los formatos CSV se utilizan mejor para representar conjuntos o secuencias de registros en los que cada registro tiene una lista idéntica de campos. Esto corresponde a una única relación en una base de datos relacional o a datos (aunque no cálculos) en una hoja de cálculo típica.

El formato se remonta a los primeros tiempos de la informática empresarial y se utiliza ampliamente para pasar datos entre computadoras con diferentes tamaños de palabras internas, necesidades de formato de datos, etc. Por este motivo, los archivos CSV son comunes en todas las plataformas informáticas.

CSV es un archivo de texto delimitado que utiliza una coma para separar valores (muchas implementaciones de herramientas de importación/exportación CSV permiten utilizar otros separadores; por ejemplo, el uso de una fila "Sep=^" como la primera fila en el archivo *.csv hará que Excel abra el archivo esperando que el signo de intercalación "^" sea el separador en lugar de la coma ","). Las implementaciones CSV simples pueden prohibir los valores de campo que contienen una coma u otros caracteres especiales como nuevas líneas. Las implementaciones CSV más sofisticadas los permiten, a menudo al requerir caracteres " ( comillas dobles ) alrededor de los valores que contienen caracteres reservados (como comas, comillas dobles o, con menos frecuencia, nuevas líneas). Los caracteres de comillas dobles incrustados pueden representarse mediante un par de comillas dobles consecutivas, ^[22] o anteponiendo una comilla doble con un carácter de escape como una barra invertida (por ejemplo, en Sybase Central).

Los formatos CSV no están limitados a un conjunto de caracteres en particular . ^[1] Funcionan igual de bien con conjuntos de caracteres Unicode (como UTF-8 o UTF-16 ) que con ASCII (aunque los programas particulares que admiten CSV pueden tener sus propias limitaciones). Los archivos CSV normalmente sobrevivirán incluso a una traducción simple de un conjunto de caracteres a otro (a diferencia de casi todos los formatos de datos propietarios). Sin embargo, CSV no proporciona ninguna forma de indicar qué conjunto de caracteres está en uso, por lo que debe comunicarse por separado o determinarse en el extremo receptor (si es posible).

Las bases de datos que incluyen múltiples relaciones no se pueden exportar como un único archivo CSV ^{[ cita requerida ]} . De manera similar, CSV no puede representar de manera natural datos jerárquicos u orientados a objetos . Esto se debe a que se espera que cada registro CSV tenga la misma estructura. Por lo tanto, CSV rara vez es apropiado para documentos creados con HTML , XML u otras tecnologías de marcado o procesamiento de textos.

Las bases de datos estadísticas de diversos campos suelen tener una estructura generalmente similar a una relación, pero con algunos grupos de campos repetibles. Por ejemplo, las bases de datos de salud, como la Encuesta demográfica y de salud, suelen repetir algunas preguntas para cada hijo de un padre determinado (quizás hasta un número máximo fijo de hijos). Los sistemas de análisis estadístico suelen incluir utilidades que pueden "rotar" dichos datos; por ejemplo, un registro de "padre" que incluye información sobre cinco hijos se puede dividir en cinco registros separados, cada uno de los cuales contiene (a) la información sobre un hijo y (b) una copia de toda la información no específica del hijo. CSV puede representar la forma "vertical" u "horizontal" de dichos datos.

En una base de datos relacional, problemas similares se pueden solucionar fácilmente creando una relación independiente para cada uno de esos grupos y conectando los registros "secundarios" con los registros "principales" relacionados mediante una clave externa (como un número de identificación o el nombre del principal). En lenguajes de marcado como XML, dichos grupos suelen estar incluidos dentro de un elemento principal y se repiten según sea necesario (por ejemplo, varios <child>nodos dentro de un único <parent>nodo). Con CSV no existe una solución de archivo único ampliamente aceptada.

Normalización

El nombre "CSV" indica el uso de la coma para separar los campos de datos. Sin embargo, el término "CSV" se utiliza ampliamente para referirse a una gran familia de formatos que difieren en muchos aspectos. Algunas implementaciones permiten o requieren comillas simples o dobles alrededor de algunos o todos los campos; y algunas reservan el primer registro como encabezado que contiene una lista de nombres de campo. El conjunto de caracteres que se utiliza no está definido: algunas aplicaciones requieren una marca de orden de bytes (BOM) Unicode para aplicar la interpretación Unicode (a veces incluso una BOM UTF-8). ^[1] Los archivos que utilizan el carácter de tabulación en lugar de la coma se pueden denominar con más precisión "TSV" para valores separados por tabulaciones.

Otras diferencias de implementación incluyen el manejo de separadores de campo más comunes (como el espacio o el punto y coma) y caracteres de nueva línea dentro de los campos de texto. Otra sutileza es la interpretación de una línea en blanco: puede ser igualmente el resultado de escribir un registro de cero campos o un registro de un campo de longitud cero; por lo tanto, su decodificación es ambigua.

RFC 4180 y estándares MIME

El estándar técnico RFC 4180 de 2005 formaliza el formato de archivo CSV y define el tipo MIME "text/csv" para el manejo de campos basados en texto. Sin embargo, la interpretación del texto de cada campo sigue siendo específica de la aplicación. Los archivos que siguen el estándar RFC 4180 pueden simplificar el intercambio de CSV y deberían ser ampliamente portables. Entre sus requisitos:

Líneas de estilo MS-DOS que terminan con caracteres (CR/LF) (opcional para la última línea).
Un registro de encabezado opcional (no hay una forma segura de detectar si está presente, por lo que se requiere cuidado al importar).
Cada registro debe contener el mismo número de campos separados por comas.
Cualquier campo puede ser citado (con comillas dobles).
Los campos que contienen un salto de línea, comillas dobles o comas deben ir entre comillas. (Si no es así, es probable que no sea posible procesar el archivo correctamente).
Si se utilizan comillas dobles para encerrar campos, entonces una comilla doble en un campo debe estar representada por dos caracteres de comillas dobles.

La mayoría de los programas que afirman leer archivos CSV pueden procesar este formato. Las excepciones son (a) los programas pueden no admitir saltos de línea dentro de campos entrecomillados, (b) los programas pueden confundir el encabezado opcional con datos o interpretar la primera línea de datos como un encabezado opcional y (c) las comillas dobles en un campo pueden no analizarse correctamente de manera automática.

Paquete de datos tabulares sin fricción de OKF

En 2011, la Open Knowledge Foundation (OKF) y varios socios crearon un grupo de trabajo sobre protocolos de datos, que más tarde evolucionó hasta convertirse en la iniciativa Frictionless Data. Uno de los principales formatos que lanzaron fue el paquete de datos tabulares, que se basaba en gran medida en CSV, utilizándolo como el principal formato de transporte de datos y añadiendo metadatos básicos de tipo y esquema (CSV carece de cualquier información de tipo para distinguir la cadena "1" del número 1). ^[23]

La Iniciativa de Datos sin Fricción también ha proporcionado un Formato de Descripción de Dialecto CSV estándar para describir diferentes dialectos de CSV, por ejemplo, especificando el separador de campo o las reglas de citación. ^[24]

Estándar de datos tabulares del W3C

En 2013, el grupo de trabajo "CSV en la Web" del W3C comenzó a especificar tecnologías que proporcionaran una mayor interoperabilidad para las aplicaciones web que utilizan CSV o formatos similares. ^[25] El grupo de trabajo completó su trabajo en febrero de 2016 y se cerró oficialmente en marzo de 2016 con la publicación de un conjunto de documentos y recomendaciones del W3C ^[26] para modelar "Datos Tabulares", ^[27] y mejorar CSV con metadatos y semántica .

Reglas básicas

Existen muchos documentos informales que describen los formatos "CSV". El IETF RFC 4180 (resumido anteriormente) define el formato para el tipo MIME "text/csv" registrado ante la IANA .

Las reglas típicas de estas y otras especificaciones e implementaciones "CSV" son las siguientes:

CSV es un formato de datos delimitado que tiene campos/columnas separados por el carácter de coma y registros/filas terminados por nuevas líneas.
Un archivo CSV no requiere una codificación de caracteres específica , un orden de bytes o un formato de terminador de línea (algunos programas no admiten todas las variaciones de final de línea).
Un registro termina en un terminador de línea. Sin embargo, los terminadores de línea se pueden incorporar como datos dentro de los campos, por lo que el software debe reconocer los separadores de línea entre comillas (ver a continuación) para ensamblar correctamente un registro completo a partir de, quizás, varias líneas.
Todos los registros deben tener el mismo número de campos, en el mismo orden.
Los datos dentro de los campos se interpretan como una secuencia de caracteres , no como una secuencia de bits o bytes (consulte RFC 2046, sección 4.1). Por ejemplo, la cantidad numérica 65535 se puede representar como los 5 caracteres ASCII "65535" (o quizás otras formas como "0xFFFF", "000065535.000E+00", etc.); pero no como una secuencia de 2 bytes destinada a ser tratada como un solo entero binario en lugar de como dos caracteres (por ejemplo, los números 11264–11519 tienen una coma como su byte de orden superior: ). Si no se sigue esta convención de "texto simple", entonces el archivo CSV ya no contiene suficiente información para interpretarlo correctamente, es probable que el archivo CSV no sobreviva a la transmisión a través de diferentes arquitecturas de computadora y no se ajustará al tipo MIME text/csv .ord(',')*256..ord(',')*256+255
Los campos adyacentes deben estar separados por una sola coma. Sin embargo, los formatos "CSV" varían mucho en cuanto a la elección de este carácter separador. En particular, en las configuraciones regionales donde se utiliza la coma como separador decimal, se utiliza en su lugar un punto y coma, una tabulación u otro carácter.
```
1997, Ford, E350
```
Cualquier campo puede estar entre comillas (es decir, encerrado entre comillas dobles), mientras que algunos campos deben estar entre comillas, como se especifica en las siguientes reglas y ejemplos:
```
"1997", "Ford", "E350"
```
Los campos con comas incrustadas o caracteres de comillas dobles deben estar entre comillas.
```
1997, Ford, E350, "Camioneta súper lujosa"
```
Cada uno de los caracteres de comillas dobles incrustados debe estar representado por un par de caracteres de comillas dobles.
```
1997, Ford, E350, camioneta "súper" y "lujosa"
```
Los campos con saltos de línea incrustados deben estar entre comillas (sin embargo, muchas implementaciones de CSV no admiten saltos de línea incrustados).
```
1997, Ford, E350, "Consigue uno ahora""van rápido"
```
En algunas implementaciones de CSV ^{[ ¿cuáles? ]} , los espacios iniciales y finales y las tabulaciones se eliminan (se ignoran). Este tipo de eliminación está prohibido por la RFC 4180, que establece que "los espacios se consideran parte de un campo y no deben ignorarse".
```
1997, Ford, E350no es lo mismo que1997, Ford, E350
```
Según RFC 4180, no se permiten espacios fuera de las comillas en un campo ^{[ verificación fallida ]} ; sin embargo, el RFC también dice que "Los espacios se consideran parte de un campo y no deben ignorarse" y "Los implementadores deben 'ser conservadores en lo que hacen, ser liberales en lo que aceptan de otros' (RFC 793, sección 2.10) al procesar archivos CSV".
```
1997, "Ford", E350
```
En las implementaciones de CSV que eliminan los espacios iniciales o finales, los campos con dichos espacios como datos significativos deben estar entre comillas.
```
1997, Ford, E350, "Camioneta de súper lujo"
```
El procesamiento de comillas dobles solo se debe aplicar si el campo comienza con comillas dobles. Sin embargo, tenga en cuenta que las comillas dobles no están permitidas en campos sin comillas según RFC 4180.
```
Los Ángeles,34°03′N,118°15′ONueva York, 40°42′46″N, 74°00′21″OParís, 48°51′24″N,2°21′03″E
```
El primer registro puede ser un "encabezado", que contiene los nombres de las columnas en cada uno de los campos (no existe una forma confiable de saber si un archivo hace esto o no; sin embargo, es poco común utilizar caracteres distintos de letras, dígitos y guiones bajos en dichos nombres de columnas).
```
Año, Marca, Modelo1997, Ford, E3502000,Mercurio,Puma
```

Ejemplo

Año	Hacer	Modelo	Descripción	Precio
1997	Vado	E350	ac, abdominales, luna	3000.00
1999	Caza	Venture "Edición extendida"		4900.00
1999	Caza	Venture "Edición extendida, muy grande"		5000.00
1996	Jeep	Gran Cherokee	¡DEBO VENDER! Aire acondicionado, techo corredizo, cargado.	4799.00

La tabla de datos anterior se puede representar en formato CSV de la siguiente manera:

Año, Marca, Modelo, Descripción, Precio1997, Ford, E350, "aire acondicionado, abs, luna", 3000,001999, Chevrolet, Venture, edición extendida, 4900,001999, Chevrolet, "Venture "Edición extendida, muy grande"", "", 5000,001996, Jeep, Grand Cherokee, "¡¡DEBO VENDERLO!!".Aire acondicionado, techo corredizo, cargado", 4799,00

Ejemplo de un archivo CSV de EE. UU./Reino Unido (donde el separador decimal es un punto y el separador de valores es una coma):

Año, Marca, Modelo, Longitud1997, Ford, E350, 2,352000,Mercurio,Puma,2,38

Ejemplo de un archivo CSV/ DSV europeo análogo (donde el separador decimal es una coma y el separador de valores es un punto y coma):

Año;Marca;Modelo;Longitud1997;Vado;E350;2,352000;Mercurio;Puma;2,38

El último formato no cumple con el RFC 4180. ^[28] El cumplimiento se puede lograr mediante el uso de una coma en lugar de un punto y coma como separador y entrecomillando todos los números que tienen un signo decimal.

Soporte de aplicaciones

Algunas aplicaciones utilizan CSV como formato de intercambio de datos para mejorar su interoperabilidad , exportando e importando CSV. Otras utilizan CSV como formato interno .

Como formato de intercambio de datos: el formato de archivo CSV es compatible con casi todos los sistemas de gestión de bases de datos y hojas de cálculo.

Hojas de cálculo que incluyen Apple Numbers , LibreOffice Calc y Apache OpenOffice Calc. Microsoft Excel también admite un dialecto de CSV con restricciones en comparación con otro software de hojas de cálculo (por ejemplo, a partir de 2019, ^[actualizar]Excel todavía no puede exportar archivos CSV en la codificación de caracteres UTF-8 de uso común y no se exige que el separador sea la coma). El importador CSV de LibreOffice Calc es en realidad un importador de texto delimitado más genérico, que admite varios separadores al mismo tiempo, así como el recorte de campos.
Varias bases de datos relacionales permiten guardar los resultados de las consultas en un archivo CSV. PostgreSQL ofrece el COPYcomando , que permite guardar y cargar datos en y desde un archivo. guarda el contenido de una tabla en un archivo llamado . ^[29]COPY (SELECT * FROM articles) TO '/home/wikipedia/file.csv' (FORMAT csv)articles/home/wikipedia/file.csv
Muchos programas de utilidad en sistemas de estilo Unix (como cut , paste , join , sort , uniq , awk ) pueden dividir archivos con un delimitador de coma y, por lo tanto, pueden procesar archivos CSV simples. Sin embargo, este método no maneja correctamente las comas o las nuevas líneas dentro de cadenas entre comillas.

Como representación interna (principal u opcional). Puede ser nativa o externa , pero difiere del formato de intercambio ("solo exportación/importación") porque no es necesario crear una copia en otro formato:

Algunas hojas de cálculo , incluida LibreOffice Calc, ofrecen esta opción sin obligar al usuario a adoptar otro formato.
Algunas bases de datos relacionales, cuando utilizan SQL estándar, ofrecen un contenedor de datos externos (FDW). Por ejemplo, PostgreSQL ofrece los comandos ^[30] y ^[31] para configurar cualquier variante de CSV.CREATE FOREIGN TABLECREATE EXTENSION file_fdw
Las bases de datos como Apache Hive ofrecen la opción de expresar CSV o .csv.gz como formato de tabla interno.
El editor emacs puede operar en archivos CSV utilizando el modo csv-nav. ^[32]

El formato CSV es compatible con las bibliotecas disponibles para muchos lenguajes de programación . La mayoría proporciona alguna forma de especificar el delimitador de campo, el separador decimal , la codificación de caracteres, las convenciones de comillas, el formato de fecha, etc.

Límites de software y filas

Los programas que funcionan con CSV pueden tener límites en la cantidad máxima de filas que pueden tener los archivos CSV. A continuación, se incluye una lista de software común y sus limitaciones: ^[33]

Microsoft Excel: límite de 1.048.576 filas;
Microsoft PowerShell, sin límite de filas o celdas. (Memoria limitada)
Números de Apple: límite de 1.000.000 de filas;
Hojas de cálculo de Google: límite de 5.000.000 de celdas (el producto de columnas y filas);
OpenOffice y LibreOffice: límite de 1.048.576 filas;
Editores de texto (como WordPad , TextEdit , Vim , etc.): sin límite de filas o celdas;
Bases de datos (comando COPY y FDW): sin límite de filas o celdas.

Véase también

Referencias

^ abcde Shafranovich, Y. (octubre de 2005). Formato común y tipo MIME para archivos CSV. IETF . p. 1. doi : 10.17487/RFC4180 . RFC 4180.
^ ab "commaSeparatedText". Documentación para desarrolladores de Apple: Identificadores de tipo uniformes . Apple Inc .
^ "Formato de archivo de valores separados por comas CSV: instrucciones - Creativyst - Explorado, diseñado y entregado (sm)". Software Creativyst . Archivado desde el original el 1 de abril de 2021. Consultado el 22 de agosto de 2023 .
^ Guía de administración de IBM DB2. IBM.
^ "¿Cuáles son los formatos disponibles?". Eurostat . Archivado desde el original el 26 de julio de 2023 . Consultado el 22 de agosto de 2023 .
^ "Importar o exportar archivos de texto (.txt o .csv)". Soporte técnico de Microsoft . Consultado el 16 de agosto de 2023 .
^ "CSV - Valores separados por comas" . Consultado el 2 de diciembre de 2017 .
^ "Archivos CSV" . Consultado el 4 de junio de 2014 .
^ "pandas.DataFrame.to_csv — documentación de pandas 2.0.3". pandas.pydata.org . Consultado el 16 de agosto de 2023 .
^ "Formato CSV: historia, ventajas y por qué sigue siendo popular". ByteScout . 2021-09-15 . Consultado el 2023-08-16 .
^ "Comparación de diferentes formatos de archivos en Big Data". www.adaltas.com . 2020-07-23 . Consultado el 2023-08-16 .
^ "Formato de archivo estándar de valores separados por comas (CSV)". Edoceo, Inc. Recuperado el 4 de junio de 2014 .
^ IBM FORTRAN Program Products for OS and the CMS Component of VM/370 General Information (PDF) (primera edición), julio de 1972, pág. 17, GC28-6884-0 , consultado el 5 de febrero de 2016. Para los usuarios familiarizados con los procesadores FORTRAN IV G y H predecesores, estas son las principales nuevas capacidades del lenguaje .
^ "E/S dirigida por listas", Referencia del lenguaje Fortran 77 , Oracle
^ "SuperCalc², paquete de hojas de cálculo para IBM, CP/M" . Consultado el 11 de diciembre de 2017 .
^ "Estructura de archivo con formato de valores separados por comas". 1983 . Consultado el 11 de diciembre de 2017 .
^ "CSV, Valores separados por comas (RFC 4180)" . Consultado el 4 de junio de 2014 .
^ RFC 4180: Formato común y tipo MIME para archivos de valores separados por comas (CSV). doi : 10.17487/RFC4180 . RFC 4180 . Consultado el 22 de diciembre de 2020 .
^ Consulte sparql11-results-csv-tsv, la primera recomendación del W3C con alcance CSV y que llena algunas de las deficiencias del RFC 4180.
^ RFC 7111: Identificadores de fragmentos de URI para el tipo de medio text/csv. doi : 10.17487/RFC7111 . RFC 7111 . Consultado el 22 de diciembre de 2020 .
^ "Modelo para datos tabulares y metadatos en la Web – Recomendación del W3C del 17 de diciembre de 2015" . Consultado el 23 de marzo de 2016 .
^ * Creativyst (2010), Cómo usar el formato de archivo de valores separados por comas (CSV), creativyst.com , consultado el 24 de mayo de 2010
^ "Paquete de datos tabulares". Especificaciones de datos sin fricción .
^ "Dialecto CSV". Especificaciones de datos sin fricción .
^ "Grupo de trabajo CSV en la Web". W3C CSV WG. 2013. Consultado el 22 de abril de 2015 .
^ CSV en el repositorio web (en GitHub)
^ Modelo para datos tabulares y metadatos en la Web (recomendación del W3C)
^ Shafranovich (2005) afirma: "Dentro del encabezado y de cada registro, puede haber uno o más campos, separados por comas".
^ "Documentación: 14: COPIA". PostgreSQL . Consultado el 12 de mayo de 2024 .
^ "Documentación: 14: F.35. postgres_fdw". PostgreSQL. 2022-02-10 . Consultado el 2022-03-04 .
^ "Documentación: 14: F.14. file_fdw". PostgreSQL. 2022-02-10 . Consultado el 2022-03-04 .
^ "EmacsWiki: Navegación Csv". www.emacswiki.org .
^ "Comprensión de CSV y límites de filas" . Consultado el 28 de febrero de 2021 .

Lectura adicional

"Guía de administración de IBM DB2: formatos de archivos LOAD, IMPORT y EXPORT". IBM . Archivado desde el original el 13 de diciembre de 2016 . Consultado el 12 de diciembre de 2016 .(Tiene descripciones de archivos ASCII delimitados (.DEL) (incluidos los separados por comas y puntos y comas) y archivos ASCII no delimitados (.ASC) para transferencia de datos).

[rfc4180-1] Shafranovich, Y. (octubre de 2005). Formato común y tipo MIME para archivos CSV. IETF . p. 1. doi : 10.17487/RFC4180 . RFC 4180.

[appleuti-2] "commaSeparatedText". Documentación para desarrolladores de Apple: Identificadores de tipo uniformes . Apple Inc .

[3] "Formato de archivo de valores separados por comas CSV: instrucciones - Creativyst - Explorado, diseñado y entregado (sm)". Software Creativyst . Archivado desde el original el 1 de abril de 2021. Consultado el 22 de agosto de 2023 .

[4] Guía de administración de IBM DB2. IBM.

[5] "¿Cuáles son los formatos disponibles?". Eurostat . Archivado desde el original el 26 de julio de 2023 . Consultado el 22 de agosto de 2023 .

[6] "Importar o exportar archivos de texto (.txt o .csv)". Soporte técnico de Microsoft . Consultado el 16 de agosto de 2023 .

[7] "CSV - Valores separados por comas" . Consultado el 2 de diciembre de 2017 .

[8] "Archivos CSV" . Consultado el 4 de junio de 2014 .

[9] "pandas.DataFrame.to_csv — documentación de pandas 2.0.3". pandas.pydata.org . Consultado el 16 de agosto de 2023 .

[10] "Formato CSV: historia, ventajas y por qué sigue siendo popular". ByteScout . 2021-09-15 . Consultado el 2023-08-16 .

[11] "Comparación de diferentes formatos de archivos en Big Data". www.adaltas.com . 2020-07-23 . Consultado el 2023-08-16 .

[12] "Formato de archivo estándar de valores separados por comas (CSV)". Edoceo, Inc. Recuperado el 4 de junio de 2014 .

[13] IBM FORTRAN Program Products for OS and the CMS Component of VM/370 General Information (PDF) (primera edición), julio de 1972, pág. 17, GC28-6884-0 , consultado el 5 de febrero de 2016. Para los usuarios familiarizados con los procesadores FORTRAN IV G y H predecesores, estas son las principales nuevas capacidades del lenguaje .

[14] "E/S dirigida por listas", Referencia del lenguaje Fortran 77 , Oracle

[15] "SuperCalc², paquete de hojas de cálculo para IBM, CP/M" . Consultado el 11 de diciembre de 2017 .

[16] "Estructura de archivo con formato de valores separados por comas". 1983 . Consultado el 11 de diciembre de 2017 .

[17] "CSV, Valores separados por comas (RFC 4180)" . Consultado el 4 de junio de 2014 .

[18] RFC 4180: Formato común y tipo MIME para archivos de valores separados por comas (CSV). doi : 10.17487/RFC4180 . RFC 4180 . Consultado el 22 de diciembre de 2020 .

[19] Consulte sparql11-results-csv-tsv, la primera recomendación del W3C con alcance CSV y que llena algunas de las deficiencias del RFC 4180.

[20] RFC 7111: Identificadores de fragmentos de URI para el tipo de medio text/csv. doi : 10.17487/RFC7111 . RFC 7111 . Consultado el 22 de diciembre de 2020 .

[21] "Modelo para datos tabulares y metadatos en la Web – Recomendación del W3C del 17 de diciembre de 2015" . Consultado el 23 de marzo de 2016 .

[22] * Creativyst (2010), Cómo usar el formato de archivo de valores separados por comas (CSV), creativyst.com , consultado el 24 de mayo de 2010

[23] "Paquete de datos tabulares". Especificaciones de datos sin fricción .

[24] "Dialecto CSV". Especificaciones de datos sin fricción .

[25] "Grupo de trabajo CSV en la Web". W3C CSV WG. 2013. Consultado el 22 de abril de 2015 .

[26] CSV en el repositorio web (en GitHub)

[27] Modelo para datos tabulares y metadatos en la Web (recomendación del W3C)

[28] Shafranovich (2005) afirma: "Dentro del encabezado y de cada registro, puede haber uno o más campos, separados por comas".

[29] "Documentación: 14: COPIA". PostgreSQL . Consultado el 12 de mayo de 2024 .

[30] "Documentación: 14: F.35. postgres_fdw". PostgreSQL. 2022-02-10 . Consultado el 2022-03-04 .

[31] "Documentación: 14: F.14. file_fdw". PostgreSQL. 2022-02-10 . Consultado el 2022-03-04 .

[32] "EmacsWiki: Navegación Csv". www.emacswiki.org .

[33] "Comprensión de CSV y límites de filas" . Consultado el 28 de febrero de 2021 .


Un archivo CSV simple que enumera tres personas y las empresas para las que trabajan
Extensión de nombre de archivo	`.csv`
Tipo de medio de Internet	`text/csv`^[1]
Identificador de tipo uniforme (UTI)	texto público con valores separados por comas ^[2]
Conformación de UTI	texto público con valores delimitados ^[2]
Tipo de formato	Flujos de datos seriales y multiplataforma
Contenedor para	Información de la base de datos organizada como listas separadas por campos
Estándar	RFC 4180