2011年6月6日 星期一

潮汕人與廣府、客家人母系遺傳背景差異的分析

潮汕人與廣府、客家人母系遺傳背景差異的分析
分類:醫藥學論文 > 臨床醫學論文(定做論文) 作者: 時間:2011-1-5 10:04: 瀏覽:27991 次 英文版


作者:李曉昀1,蘇敏,黃海花,李輝,田東萍,高玉霞

【摘要】 目的廣東漢族3大民系即潮汕、廣府和客家人都是內陸中原漢族移民的後裔,本研究利用反映母系遺傳的線粒體DNA(mtDNA)證據分析3大民系的遺傳背景差異。方法收集89份潮汕人血樣和48份內陸中原河南太行山食管癌高發區人群血樣,構建每個個體的mtDNA單倍群;廣府和客家人的單倍群數據來自文獻。將這3大民系人群的單倍群分布情況與河南太行山人群和南方原住民族人群進行比較分析。  結果河南太行山人主要由北方漢族主要單倍群構成,廣府和客家人則以南方原住民族主要單倍群為主,潮汕人表現為北方漢族主要單倍群稍高於南方原住民族主要單倍群(http://big.hi138.com/)。基於單倍群頻率的主成分分析顯示,河南太行山和潮汕人聚在一起,客家和廣府人則與南方原住民族群體聚在一起。結論3大民系中,只有潮汕人的中原漢族血統更純正,與河南太行山人群的關系最近,這可能也是其為南方沿海食管癌高危人群的原因之一;而客家和廣府人則與南方原住民族在母系血統上有更多的交融。

【關鍵詞】 潮汕;廣府;客家;mtDNA;遺傳背景

 ABSTRACT: ObjectiveThree ethnic populations of Han inhabitants in Guangdong Province, namely, Chaoshan population, Cantonese and Hakka, descended from north-central China Han immigrants. Here we analyzed their genetic background differences based on mitochondrial DNA (mtDNA) evidences reflecting matrilineal genetics.MethodsBased on mtDNA variations, we inferred mtDNA haplogroups of 48 and 89 subjects from the Taihang and Chaoshan areas, respectively. mtDNA data of Cantonese and Hakka populations were quoted from published literature. We compared haplogroup distribution in the 3 ethnic populations with that in the Taihang Mountain population and the southern natives.ResultsThe northern Han-dominating haplogroups were predominant in the Taihang Mountain population, while Cantonese and Hakka populations had southern natives-dominating haplogroups as their major haplogroups, and Chaoshan population possessed slightly higher frequency of northern haplogroups than southern haplogroups. The principal component analysis based on frequencies of mtDNA haplogroups showed that the Taihang Mountain population and Chaoshan population clustered together, and that Cantonese, Hakka and the southern natives clustered together.ConclusionOf the 3 ethnic populations, Chaoshan population alone possesses the purest lineage of north-central China Hans, and shows the closest genetic affinity to the Taihang Mountain population, which might be one of the reasons why Chaoshan population alone has become esophageal cancer high-risk population in the coast of southern China. Both Cantonese and Hakka populations show more gene flow from the southern natives in the maternal lineage.

  KEY WORDS: Chaoshan; Cantonese; Hakka; mtDNA; genetic background

  廣東漢族3大民系,分別是操潮汕、白話和客家方言的潮汕、廣府和客家人。潮汕人居住地潮汕地區地處華南沿海閩粵兩省交界處,廣府人以廣州為中心分布於珠三角及周邊地區,客家人主要集中於廣東和福建、江西的交界處。據歷史記載,中國南方古老的原住民主要是百越、荊蠻族群[1-2],而3大民系都是中原漢族在不同時期遷到廣東不同地區後形成的。3大民系中,只有潮汕人是食管癌高發人群,發病風險最高的潮汕南澳島人群1995~2004年間的食管癌世界人口標化年發病率為109.28/10萬[3],始終徘徊於世界食管癌高發區行列。而且潮汕食管癌發病率、家族聚集現象與病理類型和眾所周知的食管癌高發區——內陸中原太行山區(山西、河南、河北交界處)基本類似[4-7](免費論文下載中心 http://big.hi138.com/)。這是否提示3大民系雖然都是中原移民後裔,但遺傳背景上存在差異,潮汕人和中原食管癌高發區人群間可能存在更近的遺傳關系?本研究選用已被廣泛應用於人群進化和遺傳關系研究的反映母系遺傳背景的線粒體DNA(mtDNA)多態性標記,將3大民系與中原太行山和南方原住民族人群的母系遺傳背景比較,分析他們的遺傳背景差異。

  1材料與方法

  1.1材料在知情同意原則下,分別於2002~2004年間在潮汕地區和河南太行山區共采集137個相互間無親緣關系的成年漢族男性個體的靜脈血。具體采樣包括:潮汕人群血樣89份,來自潮汕地區操潮汕方言的的南澳、澄海、潮陽、潮州;河南太行山人群血樣48份,來自河南的食管癌高發區林縣和新鄉;廣府和客家人的數據由復旦大學生命科學院人類學研究室提供,分別來自廣州(68個個體)和福建長汀客家人(54個個體)。

  1.2線粒體多態性分析常規苯-酚抽提基因組DNA。線粒體高變1區(HVS-1)用引物L15974(序列為TCCACCATTAGCACCCAAAG)和H16488(序列為AGGAACCAGATGTCGGATACAG)進行PCR擴增,擴增產物經蝦堿酶(shrimp alkaline phosphatase, SAP)和核酸外切酶Ⅰ(Exonclease Ⅰ)純化後,通過Big-Dye末端熒光標記試劑盒(美國PE公司)進行測序反應(医药学/临床医学論文 http://big.hi138.com/)。測序反應產物經乙醇沈澱後用ABI PRISM 3100測序儀(美國PE公司)進行核苷酸序列測定。另外參照東亞人群線粒體單倍群系統樹[8],選取線粒體編碼區6個多態性位點(COII-tRNALys9bp缺失、9824HinfI、4831HhaI、5176AluI、10310NlaⅢ、10397AluI),它們包含了大多數中國人群mtDNA基因型。9bp缺失位點PCR產物直接用35g/L的瓊脂糖凝膠電泳檢測;其余位點PCR產物使用相應限制性內切酶酶切,用PCR-限制性片段長度多態性(PCR-RFLP)的方法進行基因分型。引物在上海生物工程公司合成,限制性內切酶、蝦堿酶和外切酶均購自紐英倫生物技術公司(New England Biolabs, USA)。

  1.3數據分析

  1.3.1mtDNA單倍群推斷參照校對後的mtDNA劍橋標準序列(rCRS)[9],用DNAStart和BioEdit7.0軟件對線粒體HVS-I區序列進行分析比對。根據東亞人群線粒體單倍群系統樹[8],結合HVS-I區序列的某些特征性多態位點和編碼區檢測的6個多態位點,推斷所檢測的潮汕和河南太行山區每個個體所屬的mtDNA單倍群。所謂mtDNA單倍群是用來命名在mtDNA系統關系樹中處於一個單系群位置上的一組mtDNA,它們共享一些特定突變,是由一個最近的共同祖先及其所有後代組成的一組mtDNA[10]。

  1.3.2統計學分析分別統計所研究人群中mtDNA單倍群的頻率分布情況,並進一步總結北方漢族人群主要單倍群(A、C、D、G、M8a、Y和Z)和南方原住民族主要單倍群(B、F、R9a、R9b和N9a)在所研究人群中的分布。據文獻報道[11-14],東亞北部的主要mtDNA單倍群A、C、D、G、M8a、Y和Z在中國北方漢族中的頻率明顯高於南方漢族,是北方漢族人群的主要單倍群,而南方原住民族的主要單倍群B、F、R9a、R9b和N9a在南方漢族的頻率則比北方漢族明顯高。

  基於各人群單倍群頻率分布情況,用SPSS11.5軟件進行主成分分析(principal component analysis, PC),研究人群間母系親緣關系的遠近。在主成分分析中加入了4個百越族群(傣族98個個體、壯族26個個體、水族30個個體、仫佬族39個個體)和4個荊蠻族群(苗族39個個體、土瑤41個個體、八排瑤35個個體、盤瑤32個個體)共8個南方主要原住民族人群單倍群數據(由復旦大學生命科學院人類學研究室提供)。考慮到同一單倍群下的各亞群間有比較近的親緣關系,若各亞群作為獨立的變量可能會導致分析結果的誤差,故主成分分析時將B、D、F、M7單倍群下的亞群各自合並一起分析。所謂主成分分析,就是根據各觀察變量間的相互關系,用較少的綜合指標即主成分來反應存在於各變量中的各類信息,觀察變量的總方差在各主成分上重新分配,第一主成分(PC1)有最大方差,其所包含的信息占總信息的比值最大,後續主成分可解釋的方差逐個減少。此外,主成分值與單倍群頻率間的相關分析也在SPSS11.5軟件上進行。
免費論文下載中心 http://www.hi138.com

  2結果

  2.1mtDNA單倍群頻率潮汕人、代表廣府人的廣州人、代表客家人的福建長汀客家人和位於內陸中原的河南太行山人的mtDNA單倍群頻率分布見表1。為了更好地分析北方漢族人群主要單倍群(A、C、D、G、M8a、Y和Z)和南方原住民族主要單倍群(B、F、R9a、R9b和N9a)在所研究人群中的分布,我們根據表1的數據將此兩大類單倍群分布總結在表2,其中A包括MG*、N*及R11;加*的單倍群表示屬於該單倍群的個體不能排除屬於下一級某個亞群的可能性,但目前尚不能進一步明確。B、D、F頻率為各自所包含的亞群合並後的頻率。從表2可見河南太行山人的北方漢族人群主要單倍群合計頻率(56.25%)明顯高於其南方原住民族主要單倍群合計頻率(35.42%),潮汕人的北方漢族主要單倍群合計頻率(47.19%)稍高於南方原住民族主要單倍群合計頻率(44.95%),而廣州和長汀客家人均表現為南方原住民族主要單倍群合計頻率(分別為69.12%和55.56%)明顯高於北方漢族主要單倍群合計頻率(分別為19.12%和31.48%)。表1mtDNA單倍群在3大民系與河南太行山人群的頻率分布表2北方漢族人群主要單倍群和南方原住民族主要單倍群在人群中的頻率分布

  2.2mtDNA單倍群頻率的主成分分析為了進一步研究3大民系人群與河南太行山及南方原住民族間的關系,我們進行了單倍群頻率的主成分分析。圖1為前3個主成分構建的三維主成分坐標圖,該圖解釋了89.02%的總體方差。圖1可見長汀客家人、廣州人及除外苗族的南方原住民族群體聚集在主成分圖的下方組成南方人群,在第2主成分(PC2)上和位於主成份圖最上方的河南太行山人分開。潮汕人和苗族的位置介於南方人群和河南太行山人之間,但更靠近河南太行山人,在第2主成分(PC2)上與河南太行山人聚在一起。我們進一步做了前3個主成分值間以及主成分值和各單倍群間的相關分析(表3),顯示PC2與單倍群D、G*、M9a、M10、和R11頻率呈顯著正相關,而與F和M7呈顯著負相關。圖1mtDNA單倍群頻率的主成分坐標圖表3主成分值間以及主成分值和各單倍群間的相關分析(表內數據代表相關系數)

  3討論

  據歷史記載,漢族源於北方古老的華夏部落,在爭奪黃河流域的中原地區的戰爭中,打敗蚩尤驅逐三苗,占據了中原[15]。秦統一中原後,公元前216年開始向南方擴張,擊敗當地土著,秦軍及其隨軍家屬逐漸進入嶺南,開創了中原漢民大規模移民的先河。春秋戰國時期,潮汕原住民主要是百越中的閩越人,現在的潮汕漢人主要由福佬和河佬兩大群體構成,意指由閩(福建)陟潮的中原漢族後裔,主要來自河南、山西一帶[16]。廣府人主要由早期中原漢族移民與本地古越族雜處同化而成,既有古南越遺傳,更受中原漢文化哺育。客家先民,來自進入嶺南的中原移民,在南遷過程與本地原住民族融合而形成客家民系。文波等的研究[11]從分子遺傳學水平證實漢族向南擴張主要源於北方漢族人群自北向南的遷徙,在這一過程中,漢族與南方原住民族間存在基因交流而混合有一定程度的南方原住民族血統。為了判斷潮汕、廣府、客家3大民系的中原漢族母系血統保留程度以及與南方原住民族母系血統交融程度,我們將3大民系母系遺傳背景與內陸河南太行山和南方原住民族人群比較,分析3大民系的遺傳背景差異。

  mtDNA單倍群頻率分析顯示,與河南太行山人主要由北方漢族主要單倍群構成不同,潮汕人表現為南北單倍群所占比例相近,廣州和長汀客家人則以南方原住民族主要單倍群為主。提示相對於河南太行山人,3大民系的母性基因庫與南方原住民族血統有更多的交融,尤以廣州和長汀客家人為甚,二者均表現為南方原住民族血統占優勢,但潮汕人仍然能保持其北方漢族血統稍高於南方原住民族血統。

  主成分分析是常用的一種因子分析方法,用來考察不同人群單倍群分布的相似程度,兩個群體在主成分圖上位置越接近說明他們之間的親緣關系越近。主成分分析結果顯示,雖然3大民系地理位置相近,但潮汕人並未像長汀客家人和廣州人一樣與南方原住民族聚在一起,而是和河南太行山人聚在一起,提示潮汕人在母系遺傳上與南方原住民族的基因交流程度要低於長汀客家人和廣州人,從而保持了更多的中原漢族母系血統,在母系遺傳背景上與河南太行山人的親緣關系更近,而長汀客家人和廣州人則與南方原住民族關系密切。河南太行山人和潮汕人在第2主成分(PC2)上與長汀客家、廣州人及南方原住民族分開,相關分析(表3)顯示PC2與單倍群D、G*、M9a、M10、和R11頻率呈顯著正相關。D和G*是北方漢族主要單倍群,它們在河南太行山和潮汕人中的頻率均高於長汀客家和廣州人(表2),尤其D是河南太行山和潮汕人群共享的最高頻率的單倍群,而高頻率的D單倍群是北方漢族人群的特征。因此,相關分析結果提示潮汕人群中較高頻率的北方漢族主要單倍群是將其與河南太行山人群聚在一起而與長汀客家和廣州人分開的主要原因。主成分分析顯示苗族與河南太行山人聚在一起,這可能與黃帝擊敗三苗占據中原後與遺留在中原的三苗有部分融合有關。

  與我們研究結果相似,李輝等[17]的研究表明,長汀客家人母系遺傳背景與北方漢族差異頗大,可能是在荊蠻族核心上不斷加入漢族移民形成的。黃淑娉等[18]對3大民系的體質人類學研究提示,潮汕人的基因庫裏含有比較多的中原漢族遺傳成份,而廣府和客家人相似性比較大,與南方原住民族融合程度比較高。結合本研究結果,我們認為廣府、潮汕、客家人群中,只有潮汕人的中原血統更純正,與河南太行山人群的關系最近,這可能是為什麽中國南方沿海地區生活環境和飲食習慣與北方截然不同,但3大民系中僅潮汕人為南方沿海食管癌高危人群的原因之一。而廣府和客家人則與南方原住民族在母系血統上有更多交融。

  潮汕地區東北與閩南接壤,東隔海峽與臺灣相望,西北橫亙的蓮花山脈既是潮汕與興梅客家地區的天然屏障,也是潮汕與珠江流域的分水嶺,形成一個背山面海、內陸比較封閉、有很長海岸線的地理區域。相對隔離的地理環境再加上以往交通落後,潮汕人群較少與其他人群婚配,成為相對隔離人群,語言、文化、習俗角度考察認為該人群是目前中國古漢族文化繼承保存最好的人群[16,19]。

【參考文獻】
 \[1\]費孝通. 中華民族多元一體格局 \[M\]. 北京:中央民族大學出版社, 1999.

  \[2\]葛劍雄,吳松弟,曹樹基. 中國移民史 \[M\]. 福州:福建人民出版社, 1997.

  \[3\]SU M, LIU M, TIAN DP, et al. Temporal trends of esophageal cancer during 1995-2004 in Nanao Island, an extremely high-risk area in China \[J\]. Eur J Epidemiol, 2007, 22(1):43-48.

  \[4\]陳偉三,楊合麟. 廣東省南澳縣1987~1992年食管癌流行病學特點 \[J\]. 癌癥, 1996, 15(4):274-276.

  \[5\]SU M, TIAN DP, LI XY, et al. Family aggregation of carcinoma of esophagus and cardia in Chaoshan littoral region of China \[J\]. Cancer Detect Preve, 2004, S-108 (abstract).

  \[6\]SU M, LI XY, TIAN DP, et al. Clinicopathologic analysis of esophageal and cardiac cancers and survey of molecular expression on tissue microarrays in Chaoshan littoral of China \[J\]. World J Gastroenterol, 2004, 10(15):2163-2167.

  \[7\]付承林,蘇敏,田東萍,等. 廣東潮汕地區16954例食管癌與食管胃交界惡性腫瘤臨床分析 \[J\]. 中國腫瘤, 2008, 17(5):421-425.

  \[8\]KIVISILD T, TOLK HV, PARIK JR, et al. The emerging limbs and twigs of the East Asian mtDNA tree \[J\]. Mol Biol Evol, 2002, 19(10):1737-1751.

  \[9\]ANDREWS RM, KUBACKA I, CHINNERY PF, et al. Reanalysis and revision of the Cambridge reference sequence for human mitochondrial DNA by Andrews \[J\]. Nat Genet, 1999, 23(2):147.

  \[10\]TORRONI A, RICIIARDS M, MACAULAY V, et al. mtDNA haplogroups and frequency patterns in Europe \[J\]. Am J Hum Genet, 2000, 66(3):1173-1177.

  \[11\]WEN B, LI H, LU D, et al. Genetic evidence supports demic diffusion of Han culture \[J\]. Nature, 2004, 431:302-305.

  \[12\]YAO YG, KONG QP, BANDELT HJ, et al. Phylogeographic differentiation of mitochondrial DNA in Han Chinese \[J\]. Am J Hum Genet, 2002, 70(3):635-651.

  \[13\]WEN B, LI H, GAO S, et al. Genetic structure of Hmong-Mien speaking populations in East Asia as revealed by mtDNA lineages \[J\]. Mol Biol Evol, 2005, 22(3):725-734.

  \[14\]LI H, CAI XY, ELIZABETH R, et al. Mitochondrial DNA diversity and population differentiation in Southern East Asia \[J\]. Am J Physical Anthropol, 2007, 134:481-488.

  \[15\]李輝. 東亞人的遺傳系統初識 \[J\]. 國立國父紀念館館刊(臺北), 2002, 10:123-136.

  \[16\]黃贊發. 潮汕先民與先賢 \[M\]. 汕頭:汕頭大學出版社, 2000:1-30.

  \[17\]李輝,潘悟雲,文波,等. 客家人起源的遺傳學分析 \[J\]. 遺傳學報, 2003, 30(9):873-880.

  \[18\]黃淑娉. 廣東漢族三大民系的文化特征 \[J\]. 廣西大學學報:哲學社會科學版, 1998, 20(6):68-69.

  \[19\]黃挺. 潮汕文化源流 \[M\]. 廣東高等教育出版社, 1999:1-71.

沒有留言:

張貼留言