La estructura poblacional y diversidad genética de 104 cerdos negros lampiños de Yucatán (NLY) y ocho de raza Duroc fueron caracterizados usando un chip SNP50K. Se obtuvo la estructura poblacional, se calculó un análisis de componentes principales (ACP), menor alelo frecuencia (MAF), Heterocigosidad observada (Ho), Consanguinidad (F), Índice de Fijación de individuos en subpoblaciones (Fis), índice de alogamia (t) y análisis de asociación para identificar SNP diferentes entre poblaciones. Según el análisis Admixture la población NLY se estructura en tres subpoblaciones. El componente genético de Duroc en subpoblaciones NLY es bajo de 0.0036 a 0.0353, apreciándose una subpoblación con mayor diversidad genética, con valores más bajos de F, Fis y mayor Ho y t. Se identificaron SNP (p<1.21E-50 a p< 6.4E-20), asociados con genes y procesos biológicos. Genes
Desde la llegada de los cerdos a América en el siglo XVI y su distribución a lo largo del nuevo mundo, ya sea la selección natural o artificial, ha modelado la diversidad de las poblaciones actuales.
El Sistema de Información sobre la Diversidad Animal de la FAO (
Este biotipo lampiño procede de cerdos ibéricos (
Con el objetivo de obtener un programa de reproducción ordenado, se evaluó una amplia población de NLY, utilizando chip SNP50K comercial para estimar la diversidad y estructura poblacional real; así como sus relaciones genéticas para la futura selección de pie de cría distante de raza comercial.
De una población total de 560 cerdos negros lampiños de Yucatán (NLY) de 49 granjas, ubicadas desde Mérida hasta Tizimín del estado de Yucatán-México; se eligieron 104 adultos reproductores de 2 a 3 años de edad (17 sementales y 87 cerdas), considerando fenotípicamente rasgos de ausencia de pelo (lampiños), piel negra, sin manchas, pezuña negra y hocico recto. Adicionalmente, se utilizó información sobre el origen de las cerdas o sementales, para reducir cualquier parentesco entre las muestras. Además, ocho cerdas Duroc fueron muestreadas como población de referencia y utilizadas para evaluar la introgresión en los cerdos de Yucatán.
Este estudio tiene registro SIP18-076 de la Universidad Autónoma de Nayarit y convenio con el Parque Científico y tecnológico de Yucatán. Para la toma de muestras de sangre, se siguieron las recomendaciones de las Normas Oficiales
El control de calidad de datos de los SNP se realizó utilizando PLINK v1.9 (
En primer lugar, se realizó un análisis de la estructura de la población para identificar las subpoblaciones en cerdos NLY con el software Admixture 1.3 (
Para cada subpoblación del cerdo NLY y Duroc se calculó la frecuencia de alelo menor (MAF), la Heterocigosidad observada (Ho), la consanguinidad (F) y el índice de fijación de individuos dentro de las subpoblaciones (Fis) con el programa PLINK v1.9 (
Con PLINK v1.9 (
La primera estructura de la población se realizó a una validación cruzada de 10 veces, para elegir el mejor valor de K; el valor de K=4 mostró el error de validación cruzada más bajo (0.584). Según el análisis Admixture, la población de NLY se estructura en tres subpoblaciones (
YUC1, YUC2 y YUC3 subpoblaciones de cerdo negro lampiño de Yucatán. DUR población de raza Duroc. Los valores por columna de cada raza indican la proporción de otras razas.
DUR
YUC1
YUC2
YUC3
DUR
0.99997
0.03532
0.00363
0.02726
YUC1
0.00001
0.69764
0.18677
0.18429
YUC2
0.00001
0.08993
0.64234
0.07703
YUC3
0.00001
0.17711
0.16726
0.71142
Con el ACP se observa que la subpoblación YUC2 es la más alejada de la raza Duroc, siendo más cercanas YUC1 y YUC3 al compartir más componente genético de Duroc (
Valores positivos de Fis indican consanguinidad, es mayor si se aproxima a 1; corresponde a la reducción global de heterocigosidad observada respecto a lo esperado en su población; en la subpoblación YUC3 es menor el valor Fis, F y mayor la Ho, indicando mayor diversidad genética (
MAF, frecuencia de alelo menor. Ho, Heterocigosidad observada. Fis, índice de fijación subpoblacional. eem, error estándar medio. Diferentes letras en las filas indican diferencias estadísticas entre las poblaciones (ANOVA, p<0.05).
YUC1
YUC2
YUC3
Duroc
eem
Muestras
70
14
20
8
Media MAF
0.260a
0.216c
0.247b
0.202d
0.025
Consanguinidad (F)
0.039ª
0.067ª
-0.006b
0.079ª
0.011
Ho
0.328b
0.305b
0.359ª
0.301b
0.011
Fis
0.079ª
0.142ª
-0.007b
0.158ª
0.021
Índice de alogamia (t)
0.870b
0.782b
1.0278a
0.729b
0.027
Una población se aproxima a apareamiento aleatorio si el valor de t se acerca a 1, cuando es mayor a 1 hay exceso de heterocigotos y cuando el valor es cero todos los individuos son homocigotos; en la subpoblación YUC3 se aproxima a 1, siendo menor en las demás subpoblaciones YUC1, YUC2 y Duroc.
En el análisis de asociación entre toda la población de NLY vs Duroc para identificar diferencias, se identificaron 226 SNP con valores de p<1.21E-50 a p< 6.4E-20, de los cuales solo 93 SNP se identificaron asociados a genes y procesos biológicos (
Proceso biologico
Cromosoma
Variantes
Genes identificados
Diferenciación de células epiteliales, la morfogénesis y el desarrollo del epitelio
2
rs81223208
EHF
7
rs80830437, rs331746636, rs81222725, rs81398056, rs325625775
DST, PDEA8A, FOXA1
14
rs80785304, rs345768654
VCL
Metabolismo de nutrientes
2
rs713429023
PDHX
3
rs81317284
ST6GAL2
6
rs81390019, rs81390069, rs81390070, rs81390137, rs81285728, rs81317489, rs81226716, rs81318326, rs81475823
PABPC4, HPCAL4, MFSD2A, MC2R,
MPPE1, IMPA2, PTPN2
7
rs80793059, rs342597254, rs80868794, rs80837023, rs80951652, rs80986501, rs80845345, rs80850402
GCLC, ADAMTSL3, HOMER2,
UNC45A
13
rs81448371
PDIA5
14
rs339061874, rs328957349, rs345309524, rs80889570, rs80895748, rs80897302
CFAP70, CHCHD1, ADK, DUSP13
15
rs81241812
ACSL1
X
rs327444342, rs322147119, rs81474003
FAM58A, BRCC3
Transportes de nutrientes
1
rs328115005
6
rs81389915, rs329679425, rs81389921, rs81251860, rs81389936, rs81389948, rs81389955 , rs81389959, rs81262099, rs81211910, rs81390112
12
rs81261131
14
rs81451083, rs81451108
15
rs343808632
18
rs81471732
x
rs326399484, rs337683495, rs81473903,
Inmunidad
6
rs341367004, rs81306790
7
rs81398013, rs80837723, rs80805016, rs80976160, s80849899
15
X
rs328334089, rs327024720, rs336767148
Desarrollo muscular, esquelético y embrionario.
4
rs326729657
6
rs81389986, rs339432830
7
rs80816179, rs81398046
8
rs81476832
9
rs81305287
14
rs327184000
15
rs80949190
x
rs81474001
Sinapsis y receptores
3
rs81370102
6
rs81337627
18
rs322407819
x
rs330548482, rs322056532, rs325753884, rs80918182
Considerando el número de SNP diferentes entre NLY vs Duroc, en los cromosomas 6, 7, X y 14 es en donde mayor número se identificaron (
Cromosoma
1
2
3
4
6
7
8
9
12
13
14
15
18
X
nSNP
1
2
3
1
27
20
1
1
1
1
11
5
2
17
La muestra de 104 NLY elegida para el estudio, fueron sin pelo, de piel negra, sin manchas, pezuña negra y hocicos rectos para evitar variación fenotípica. El análisis ADMIXTURE los subdivide en tres subpoblaciones. La introgresión de la raza Duroc es muy baja en las tres subpoblación de NLY identificadas (YUC1, YUC2 y YUC3) de 0.00363 a 0.03532, similar a la del cerdo Pampa Rocha de Uruguay (
La separación de tres subpoblaciones en NYL y la baja introgresión de Duroc, coincide con lo observado por
Existe diferencia en la diversidad genética entre las subpoblaciones de NLY; en YUC3 es mayor, acercándose a apareamiento aleatorio. Es probable que individuos de YUC1, YUC2 y Duroc presenten apareamientos de individuos con mayor cercanía genética en cada subpoblación, lo que ocasionó el aumento de F y Fis. Con la información generada, es posible realizar una programación de los apareamientos en las subpoblaciones, para generar más diversidad genética y evitar la pedida de variabilidad como sucede en poblaciones Ibéricas (
Al identificar 93 SNP que son diferentes entre poblaciones de NLY vs Duroc, de acuerdo a sus frecuencias alélicas extremas, mayor frecuencia en Duroc y menor en NLY, podemos emplearlos como marcadores. Según
Considerando que los cerdos americanos son en parte de origen ibérico (
En este estudio no se coincide con
Para el desarrollo muscular y esquelético, el SNP
El alto número de SNP identificados como diferentes entre NLY y Duroc, puede atribuirse a la ausencia de selección y de cruzamiento con raza Duroc. Si bien se necesitan más estudios para validar el papel de los genes que se identificaron, estos hallazgos confirman que la domesticación y la evolución es diferente entre cerdos Duroc y NLY.
En este primer estudio con SNP50K en cerdos NLY se identifica la diferencia genética de este cerdo, en comparación con el cerdo Duroc, proporcionando información genética útil para la conservación de este recurso genético local. NLY está distante de Duroc, con diferente estructura poblacional, diversidad genética y diferentes genes que implican procesos biológicos importantes, que pueden ser útiles en la selección racial y programa de diferenciación.
Tabla A. Lista de los 93 SNPs de genes asociados con procesos biológicos.
La presente investigación ha sido financiada por la Secretaría de Investigación, Innovación y Educación Superior. Mérida, Yucatán, México.
In the present study, the Population structure and genetic diversity of 104 Yucatan black hairless pigs (YBH) and 8 Duroc breeds were by using an SNP50K chip characterized. The population structure was obtained, as well as the calculation of Principal Component Analysis (PCA), Minor Allele Frequency (MAF), observed heterozygosity (oH), consanguinity (F), Fixation index of individuals within subpopulations (Fis), the t (outcrossing rate or alogamia index) was made, also the association analysis to identify SNP with population differences. The genetic component of Duroc in YBH subpopulations is low, from 0.00363 to 0.03532, THUS, IT WAS OBSERVED (appreciating) a subpopulation with greater genetic diversity and lower values of F and Fis, as well as higher oH and t. SNPs were identified (p<1.213E-50 to p< 6.4E-20), associated with genes and biological processes. Genes
Since the arrival of pigs in America in the 16th century and their distribution throughout the new world, whether in natural or artificial selection, it has shaped the diversity of today’s populations.
The FAO Animal Diversity Information System (
This hairless biotype comes from Iberian pigs (
To obtain a breeding program in order, a large population of YBH was using a commercial SNP50K chip evaluated, to estimate the diversity and the actual population structure, as well as their genetic relationships for the future selection of feet of distant commercial breeds.
From a total population of 560 hairless black pigs from Yucatan (YBH) from 49 farms, located from Mérida to Tizimín in Yucatan state, Mexico; 104 breeding adults from 2 to 3 years old (17 boars and 87 sows) were selected, considering phenotypically characteristics of hairlessness (hairless), black skin, without spots, black hoof and straight snout. In addition, information about the origin of the sows or boars was used to reduce any relationship between the samples. In addition, eight Duroc sows were sampled as a reference population and they were used to assess introgression in Yucatan pigs.
This study has registration SIP18-076 from the Autonomous University of Nayarit and an agreement with the Yucatan Science and Technology Park. For the collection of blood samples, the recommendations of Official Standards
SNP data quality control was performed using PLINK v1.9 (
First, an analysis of the population structure was to identify the subpopulations in YBH pigs performed with the Admixture 1.3 software (
For each subpopulation of pig YBH and Duroc, the minor allelic frequency (MAF), the observed heterozygosity (oH), consanguinity (F) and the index of fixation of individuals in the subpopulations (Fis) were calculated using the PLINK v1.9 program (
With PLINK v1.9 (
The first population structure was performed with a 10-fold cross-validation, to choose the best K value; the K=4 value presented the smallest cross-validation error (0.584). According to the mixture analysis, the YBH population is in three subpopulations structured (
YUC1, YUC2 and YUC3 sub-populations of the hairless black pig of Yucatan. DUR Duroc breed population. The values per column of each breed indicate the proportions of other breeds.
DUR
YUC1
YUC2
YUC3
DUR
0.99997
0.03532
0.00363
0.02726
YUC1
0.00001
0.69764
0.18677
0.18429
YUC2
0.00001
0.08993
0.64234
0.07703
YUC3
0.00001
0.17711
0.16726
0.71142
With the ACP, YUC2 subpopulation is the most distant from the Duroc breed, with YUC1 and YUC3 closer because they share more Duroc genetic component (
Positive values of Fis indicate consanguinity; is greater if it approaches 1; corresponds to the general reduction in heterozygosity observed in relation to that expected in its population; in the YUC3 subpopulation, the Fis value is lower, F and oH are higher, indicating greater genetic diversity (
MAF, minor allele’s frequency. oH, observed heterozygosity. Fis, sub-population fixation index. eem, mean standard error. Different letters in the rows indicate statistical different between populations (ANOVA, p<0.05).
YUC1
YUC2
YUC3
Duroc
eem
Samples
70
14
20
8
MAF Mean
0.260ª
0.216c
0.247b
0.202d
0.025
Consanguinity (F)
0.039ª
0.067a
-0.006 b
0.079a
0.011
oH
0.328b
0.305b
0.359 a
0.301b
0.011
Fis
0.079ª
0.142 a
-0.007 b
0.158a
0.021
Allogamy index (t)
0.870b
0.782 b
1.0278 a
0.729b
0.027
A population approaches random mating if the value of t approaches 1, when it is greater than 1, there is an excess of heterozygotes and when the value is zero, all individuals are homozygous; in the YUC3 subpopulation, it approaches 1, being lower in the other YUC1, YUC2 and Duroc subpopulations.
In the analysis of association between the entire population of YBN vs Duroc to identify differences, 226 SNPs were identified with values of p <1.21E-50 ap <6.4E-20, of which only 93 SNPs were associated with genes and biological processes (
Biological process
Chromosome
Variants
Identified genes
Epithelial cell differentiation, morphogenesis and epithelial development
2
rs81223208
EHF
7
rs80830437, rs331746636, rs81222725, rs81398056, rs325625775
DST, PDEA8A, FOXA1
14
rs80785304, rs345768654
VCL
Nutrient metabolism
2
rs713429023
PDHX
3
rs81317284
ST6GAL2
6
rs81390019, rs81390069, rs81390070, rs81390137, rs81285728, rs81317489, rs81226716, rs81318326, rs81475823
PABPC4, HPCAL4, MFSD2A, MC2R,
MPPE1, IMPA2, PTPN2
7
rs80793059, rs342597254, rs80868794, rs80837023, rs80951652, rs80986501, rs80845345, rs80850402
GCLC, ADAMTSL3, HOMER2,
UNC45A
13
rs81448371
PDIA5
14
rs339061874, rs328957349, rs345309524, rs80889570, rs80895748, rs80897302
CFAP70, CHCHD1, ADK, DUSP13
15
rs81241812
ACSL1
X
rs327444342, rs322147119, rs81474003
FAM58A, BRCC3
Nutrient transport
1
rs328115005
6
rs81389915, rs329679425, rs81389921, rs81251860, rs81389936, rs81389948, rs81389955 , rs81389959, rs81262099, rs81211910, rs81390112
12
rs81261131
14
rs81451083, rs81451108
15
rs343808632
18
rs81471732
x
rs326399484, rs337683495, rs81473903,
Immunity
6
rs341367004, rs81306790
7
rs81398013, rs80837723, rs80805016, rs80976160, s80849899
15
X
rs328334089, rs327024720, rs336767148
Muscle, skeletal and embryonic development.
4
rs326729657
6
rs81389986, rs339432830
7
rs80816179, rs81398046
8
rs81476832
9
rs81305287
14
rs327184000
15
rs80949190
x
rs81474001
Synapses and receptors
3
rs81370102
6
rs81337627
18
rs322407819
x
rs330548482, rs322056532, rs325753884, rs80918182
Considering the number of different SNPs between YBH and Duroc, on chromosomes 6, 7, X and 14, this is where the highest number was identified (
Chromosome
1
2
3
4
6
7
89
12
13
14
15
18
X
SNPn
1
2
3
1
27
20
11
1
1
11
5
2
17
The 104 YBH samples chosen for the study were hairless muzzles, flawless black skin, black hull and straight foci to avoid phenotypic variations. The ADMIXTURE analysis subdivides them into three subpopulations. The introgression of the Duroc breed is very low in the three identified YBH subpopulations (YUC1, YUC2 and YUC3) from 0.00363 to 0.03532. It is similar to that of the Pampa Rocha pig from Uruguay (
The separation of three subpopulations in the YBH and the low introgression of Duroc coincide with that observed by
There is a difference in genetic diversity between YBH subpopulations; in YUC3 it is taller, approaching random mating. It is likely that individuals from YUC1, YUC2 and Duroc show matings from individuals with greater genetic proximity in each subpopulation, which caused an increase in F and Fis. With the information generated, it is possible to program the mating in the subpopulations, generate more genetic diversity and avoid the request for variability, as occurs in Iberian populations (
By identifying 93 SNPs that are different between populations of YBH vs Duroc, according to their extreme allele frequencies, higher frequency in Duroc and lower in YBN, we can use them as markers. According to
Considering that the American pigs are part of Iberian origin (
This study does not coincide with
For muscle and skeletal development, the SNP
The high number of SNPs identified as different between YBH and Duroc can be attributed to the lack of selection and crossing with the Duroc breed. Although further studies are needed to validate the role of the identified genes, these findings confirm that domestication and evolution are different between Duroc and YBH pigs.
In this first study with SNP50K in YBH pigs, the genetic difference of this pig is in comparison to the Duroc pig identified, providing useful genetic information for the conservation of this local genetic resource. YBH is far from Duroc, with a different population structure, genetic diversity and different genes involving important biological processes, which can be useful in the racial selection and differentiation program.
Suplementary information
Tabla A. List of 93 SNPs and genes associated with biological processes.
This research was funded by the Secretariat for Research, Innovation and Higher Education, Mérida, Yucatán, Mexico.