El estándar de citometría de flujo ( FCS ) es un estándar de archivos de datos para la lectura y escritura de datos de experimentos de citometría de flujo . La especificación FCS ha sido tradicionalmente desarrollada y mantenida por la Sociedad Internacional para el Avance de la Citometría (ISAC). [1] FCS solía ser el único formato de archivo ampliamente adoptado en citometría de flujo. Recientemente, ISAC ha desarrollado formatos de archivo estándar adicionales.
El formato de archivo FCS describe un archivo que es una combinación de datos textuales seguidos de datos binarios. El orden de disposición del archivo es el siguiente:
El segmento HEADER es una cadena de texto ASCII que comienza identificando la versión del estándar FCS utilizada, seguida de tres pares de desplazamientos de bytes que designan las posiciones de los segmentos TEXT, DATA y ANALYSIS. A continuación se muestra un segmento de encabezado de ejemplo.
FCS3.0 58 4380 4381 5586 0 0
Debido a que el ancho del campo de las posiciones de bytes del segmento de encabezado está limitado a 8 caracteres, la posición máxima que puede almacenar es 99 999 999. Todo lo que supere ese valor se codifica como 0 tanto para la posición inicial como para la final, y en su lugar se utiliza la palabra clave del segmento TEXT correspondiente.
El segmento de texto es una cadena de texto ASCII que se divide en una serie de pares clave-valor que están delimitados por un carácter elegido, por ejemplo, '|'. El primer carácter que sigue inmediatamente al segmento de encabezado es el delimitador. A continuación se muestra un ejemplo de un encabezado y un segmento de texto.
FCS3.0 58 4380 4381 5586 0 0|$BEGINANALYSIS|0|$BEGINDATA|4381|$BEGINSTEXT|0|$BTIM|08:24:37.64|$BYTEORD|1,2,3,4|$CELLS|RBC|...|
Para que un archivo FCS sea válido, el segmento de texto debe contener todas las palabras clave requeridas, que describen el formato y la codificación del segmento DATA. Para la versión 3.1 de FCS, las palabras clave requeridas para el segmento TEXT principal de FCS son las siguientes:
Palabra clave | Descripción |
---|---|
$INICIAR ANÁLISIS | Desplazamiento de bytes al comienzo del segmento ANÁLISIS. |
$BEGINDATA | Desplazamiento de bytes al comienzo del segmento DATOS. |
$BEGINSTEXT | Desplazamiento de bytes al comienzo de un segmento de TEXTO suplementario. |
$ORDEN DE BYTES | Orden de bytes para adquisición de datos por computadora. |
$TIPO DE DATOS | Tipo de datos en el segmento DATOS (ASCII, entero, punto flotante). |
$FINAL DEL ANÁLISIS | Desplazamiento de byte al último byte del segmento ANÁLISIS. |
$DATAFINAL | Desplazamiento de byte al último byte del segmento DATOS. |
$TEXTEXTO FINAL | Desplazamiento de byte al último byte de un segmento de TEXTO suplementario. |
$MODO | Modo de datos (modo de lista: preferido, histograma: obsoleto). |
$ SIGUIENTE DATO | Desplazamiento de bytes al siguiente conjunto de datos en el archivo. |
$PAR | Número de parámetros en un evento. |
$PnB | Número de bits reservados para el parámetro número n. |
$PnE | Tipo de amplificación para el parámetro n. |
$PNN | Nombre corto para el parámetro n. |
$PnR | Rango para el parámetro número n. |
$TOTAL | Número total de eventos en el conjunto de datos. |
El segmento DATOS del archivo FCS sigue al segmento TEXTO y se distribuye por evento (fila por fila) según el orden descrito en los parámetros (también conocidos como canales) $P1N $P2N$...PnN. Un evento es una célula biológica real o alguna otra masa que fue lo suficientemente grande como para activar el dispositivo de captura de adquisición de datos del instrumento citómetro de flujo. Los segmentos de datos tienen el siguiente diseño:
Segmento de datos[Evento1][Evento2][Evento3]...[Evento$TOT]
Cada evento se distribuye de acuerdo con la cantidad de bytes que describe $PnB para cada parámetro. Estos bytes se deben interpretar de acuerdo con la combinación especificada por $BYTEORD y $DATATYPE.
Evento[$P1B][$P2B][$P3B]...[$PnB]
Los datos de citometría de flujo se guardan normalmente para su análisis en forma de matriz , con los canales de fluorescencia y dispersión representados en columnas, y los "eventos" individuales (la mayoría de los cuales son células) formando las filas. La cantidad de eventos adquiridos de cada muestra suele oscilar entre unos pocos miles y unos pocos millones.
La primera versión de un estándar de citometría de flujo (FCS) se desarrolló en 1984. [2] Desde entonces, FCS se convirtió en el formato de archivo estándar compatible con todos los proveedores de software y hardware de citometría de flujo. FCS es un formato de archivo binario con tres segmentos principales: un segmento de texto que contiene metadatos en estructuras de pares de palabras clave/valor, un segmento de datos que generalmente contiene una matriz de valores de expresión detectados (el llamado formato de modo de lista) y un segmento de análisis raramente utilizado.
A lo largo de los años, se incorporaron actualizaciones para adaptarse a los avances tecnológicos tanto en citometría de flujo como en tecnologías informáticas.
En 1990, se introdujo FCS 2.0. [3] [4] Las características introducidas en FCS 2.0 incluían la opción de múltiples conjuntos de datos dentro de un archivo de datos, el uso de diferentes órdenes de bytes que se adaptaban a las variaciones de hardware en diferentes plataformas informáticas e información básica de compensación y escalado. A FCS 2.0 le siguió FCS 3.0 en 1997, que introdujo la posibilidad de almacenar conjuntos de datos de más de 100 MB. [5]
La última versión, FCS 3.1, se introdujo en 2010. [6] [7] Conserva la estructura básica de archivos FCS y la mayoría de las características de las versiones anteriores del estándar. Los cambios incluidos en FCS 3.1 abordan posibles ambigüedades en las versiones anteriores y proporcionan un estándar más sólido. Incluyen compatibilidad simplificada con caracteres internacionales y compatibilidad mejorada para almacenar la compensación. Las principales incorporaciones son compatibilidad con la escala de visualización preferida, una forma estandarizada de capturar el volumen de la muestra , información sobre los orígenes del archivo de datos y compatibilidad con la identificación de placas y pocillos en experimentos de alto rendimiento basados en placas.