본문 바로가기
Coffee Genetics

예멘 커피의 독특한 유전적 다양성

by mjcafe 2024. 4. 14.

  • 거의 모든 재배 커피(Coffea arabica L.) 품종은 일부 커피 종자가 인근 에티오피아에서 예멘으로 유입된 후 예멘에서 유래한 것으로 확인되었지만, 예멘의 실제 커피 유전적 다양성과 그것이 커피 세계에 미치는 중요성은 결코 탐구된 적이 없다.
  • 우리는 5개의 유전자 클러스터를 관찰했다.
  • 우리가 EO (Ethiopian-Only) cluster라고 명명한 첫 번째 클러스터는 에티오피아 액세션들만으로 구성되었다.
    이 클러스터는 예멘 및 재배 품종 클러스터들과 명확하게 분리되어, 야생 에티오피아 품종과 전 세계 커피 재배 품종 사이의 유전적 거리를 확인해준다. 
  • 우리가 SL-17 cluster라고 명명한 두 번째 클러스터는, 전 세계적으로 재배되는 품종들의 작은 클러스터였으며 예멘 샘플들은 포함되지 않았다.
  • 다른 두 클러스터는 전세계 품종과 예멘 샘플로 구성되었다. 우리는 이를  Yemen Typica-Bourbon cluster와 Yemen SL-34 cluster라고 명명했다.
  • 마지막으로, 우리는 예멘 특유적이면서(unique to Yemen), 어떠한 알려진 재배되는 품종들과 관련이 없으며, 그리고 심지어 알려진 에티오피아 액세션들과도 관련이 없는 한 클러스터를 관찰했다. 우리는 이 클러스터를 New-Yemen cluster라고 명명했다.
  • 우리는 이러한 발견의 결과와 C. arabica의 재배화(domestication) 과정을 통해 형성된 주요 resilience/adaptation 및 컵 품질 유전자를 식별하기 위한 더욱 포괄적인 유전적 개선 프로젝트의 길을 닦을 수 있는 잠재력에 대해 논의한다.

 

전 세계 1,250만 가구가 커피 재배로 소득을 올린다 (Browning 2018). 커피는 주로 두 가지 종으로 생산된다: 아라비카 커피를 생산하는 Coffea arabica L. 그리고 브라질에서 코닐론(Conilon)으로 알려진 커피, 세계 다른 곳에서는 로부스타 (Robusta)를 생산하는 Coffea canephora Pierre ex A. Froehner.

 

아라비카 커피 생산은 기후 변화(Bunn et al. 2015), Hemileia vastatrix로 인한 커피 잎 녹병 (coffee leaf rust) (Avelino et al. 2015), 그리고 Colletotrichum kahawae로 인한 커피베리병(Coffee Berry Disease)(Van der Vossen et al. 2015)과 같은 심각한 질병들과 같은 여러 문제에 직면해 있다. 


이러한 복잡한 문제에 대한 단일 해결책은 없지만, 유전학 연구와 개량 품종 육종은 잠재적인 해결책을 찾는 중요한 탐구 영역이다. 유전적으로 우수한 품질의 커피 품종을 찾는 것이 스페셜티 시장의 핵심 이슈가 되었다 (Montagnon et al. 2019).
불행하게도 C. arabica의 유전적 다양성(genetic diversity)은 다배체화(polyploidization)라는 최근의 싱글 이벤트로 인해 재배 작물들 중에서 가장 낮은 수준에 속한다 (Scalabrin et al. 2020). 더욱이 이러한 낮은 유전적 다양성의 주요 부분은 주로 Ethiopia에서 발견되며 그 정도는 덜하지만 South Sudan에서도 발견된다 (Chevalier 1929; Harlan 1969; Sylvain 1958; Thomas 1942). 

Ethiopia와 South Sudan이 C. arabica의 원산지 중심인 반면, Yemen은 아라비카 커피 재배화(domestication)의 중심지였다. 역사적 기록 (de la Roque 1716; Ukers 1922; Chevalier 1929; Cramer 1957; Haarer 1958; Meyer 1965; Koehler 2017)과 과거 표현형(phenotypic) 연구(Montagnon and Bouharmont 1996) 또는 유전학 연구들(Lashermes et al. 1996; Anthony et al. 2002; Silvestrini et al. 2007; Pruvot-Woehl et al. 2020; Scalabrin et al. 2020)은 에티오피아 외부에서 재배된 모든 아라비카 품종들이 예멘 재배화 중심지를 통과했음을 나타낸다. 그럼에도 불구하고 모든 선행 유전학 연구들은 에티오피아와 아라비카 커피 품종들의 세계 확산 사이의 예멘 중간 기착(Yemeni stop-over)을 확인하기 위해 예멘 커피 샘플들을 사용했지만, 예멘 커피들의 유전적 다양성을 밝혀낸 연구는 없었다. 

예멘 커피에 초점을 맞춘 소수의 유전적 연구(Al-Murish et al. 2013; Hussein et al. 2017)에서는 예멘 농부들에 의해 식별된 품종들의 유전적 이질성(genetic heterogeneity)이 나타났다. 그 연구들에서는 에티오피아의 액세션들이나 전 세계적으로 재배되는 품종들이 포함되지는 않았다.

 

유전 연구 및 게놈 분석을 위해 유전학자 및 육종가들은 다양한 분자 마커들, 즉 Single Nucleotide Polymorphism (SNPs)와 Single Sequence Repeats (SSRs)를 사용할 수 있다 (Adhikari et al. 2017 검토). 게놈의 조밀한 범위 커버를 위해 수천 개의 SNP를 제공하는 GBS(Genotyping by Sequencing) 기술은 의심할 바 없이 유전자형(genotype)과 표현형(phenotype) 간의 관계, 즉 배수체들(polyploids)에서의 관계를 연구하는 이상적인 방법이다 (Clevenger et al. 2015). SNP는 C. canephora의 게놈 전체 선택(genome wide selection)을 위해 커피에 자주 사용된다 (Alkimim et al. 2020).


Scalabrinet al. (2020)은 4배체 종인 C. arabica의 두 하위 게놈(sub-genomes)의 SNPs를 사용하여 C. arabica 게놈의 서열을 분석하여 최근 독특한 다체화 이벤트(the recent unique polyploidization event)를 보여주었다. 그러나 목표가 fingerprinting 또는 유전적 다양성 연구인 경우에는, SSRs에서의 높은 수준의 다형성(polymorphism)으로 인해 SSRs가 신뢰할 수 있고 실용적이며 비용 효과적인 선택이 된다 (Hodel et al. 2016). 포도의 경우, 10개의 SSRs을 사용하여 Vitis 생식질 컬렉션들을 특성 분석하는 첫 번째 접근 방식이 포도나무 품종들에 대한 높은 판별 능력을 입증했다 (Emmanuelli et al. 2013). 동일한 연구에서 SSRs이 포도나무의 유전적 다양성을 정립하는 데 SNPs만큼 효율적인 것으로 입증되었다. 


Singhet al. (2013)은 오로지 유전적 다양성에 대한 연구가 목적일 때에는, SSR markers가 SNP markers보다 더 효율적이라는 사실을 발견했다. Anthonyet al. (2002)은 6개의 SSR markers가 에티오피아에서 조기 도입된 후 예멘에서 전파된 재배되는 C. arabica 품종들의 기원을 확인하는 데 효율적이라는 것을 발견했다. 최근에 da Silva et al. (2019)은 C. arabica 품종과 3개의 이배체(diploid) Coffea 종들을 효율적으로 판별하기 위해 30개의 마커를 사용했다. Bentiet al. (2020)은 에티오피아의 40가지 재배되는 C. arabica 품종들을 효율적으로 판별하기 위해 14개의 SSR markers을 사용했다. 마지막으로 Pruvot-Woehl et al. (2020)은, 가장 큰 알려진 C. arabica의 유전적 다양성을 나타내는 2,533개 유전자형 샘플들에 사용된 8개 SSR markers 세트 (본 연구에서 사용된 것)가 품종 간 판별에 효율적이었고, 품종 인증(varietal authentication)에, 따라서 유전적 다양성 연구에 사용될 수 있었음을 보여주었다.

 

지난 반년 동안 예멘에서 활동하는 커피 회사인 Qima Coffee(http://www.qimacoffee.com)는 예멘 커피의 유전적 지형을 더 잘 이해하기 위한 연구 활동을 전개해 왔다. 예멘에서 관찰된 다양한 커피 형태형들(morphotypes)를 대표하는 45개 개체로 이루어진 육종 개체군이 수집되었다. 우리는 이 육종 개체군과 에티오피아 액세션들과 재배품종들, 전 세계적으로 재배되는 품종들을 활용하여, 예멘에서의 C. arabica 커피 유전적 다양성을 기술하는 것을 목표로 하는 최초의 글로벌 연구를 제시한다.

연구에서 다룬 주요 질문은 다음과 같다; 
예멘의 유전적 다양성의 규모와 구조는 어떠한가?
예멘의 유전적 다양성은 에티오피아의 알려진 커피의 유전적 다양성 및 전 세계적으로 재배되는 아라비카 품종들의 유전적 다양성과 어떻게 비교되는가?
그리고 마지막으로, 예멘의 유전적 다양성이 C. arabica의 유전적 개량 기회를 제공하는가?

 

 

▣ Plant material
137개의 C. arabica 샘플들이 연구되었다. 이들은 다음과 같은 3가지 범주들에 속한다 (Table 1).

Ethiopian accessions (EA)
72개의 액세션들이 FAO와 Orstom 서베이에 의해 각각 1966년과 1968년에 수집된 에티오피아 액세션들을 대표한다 (FAO 1968; Charrier 1978). 이 72개의 액세션들은, 2014년에 World Coffee Research 그리고 the Centro Agronómico Tropical de Investigación y Enseñanza (CATIE)에 의해서 정의된 코어 컬렉션의 일부이므로 선택되었다 (Solano, personal communication).

Worldwide cultivars (WWC)
20개의 샘플들이 에티오피아 이외의 전세계적으로 자라는 주요한 재배되는 품종들을 대표한다.  이는 Bourbon과 Typica를 포함할 뿐만 아니라, 모든 현재 커피 생산국가들에 도입되기 전에 Ethiopia로부터 Yemen을 거쳐 이전된 것으로  보이는 동아프리카 품종들 및 인도 품종들도 포함된다 (reviewed in Pruvot-Woehl et al. 2020).

Yemen Qima breeding population (YQ)
주요 커피생산지역들을 대표하는 예멘 생식질로부터 뽑힌 45그루 나무들로 구성된 Qima 육종 개체군의 45개 샘플들.  

 

DNA extraction and SSR marker analysis

  • DNA 추출 및 SSR 마커 분석의 모든 작업은 프랑스 남부에 위치한 Qualtech사의 ADNiD 연구소(http://www.qualtech-groupe.com/en/)에서 수행되었다.
  • SDS 완충액(buffer)을 사용하여 직접 만든 프로토콜에 따라 약 20mg의 건조된 조직에서 게놈 DNA를 추출했다.
  • 그런 다음 DNA를
    magnetic bead (Agencourt AMPure XP, Beckman Coulter, Brea, California, USA)로 정제한 후,
  • Tris Edta(TE) buffer에서 용출(elution)했다.
  • DNA concentration
    bisbenzimide DNA intercalator (Hoechst 33,258)가 있는
    Enspire spectrofluorimeter  (분광형광측정기) (Perkin Elmer)를 사용하고,
    알려진 DNA 스탠다드들과 비교하여 추정했다. 
  • Combes et al. (2000) 이후 선택되고 그리고 Pruvot-Woehl et al. (2020)에 의해 광범위한 판별력이 확인된 된
    8개의 SSR primer pairs (Table 2)가 사용되었다. 

 

본 연구에서 사용된 미소부수체 목록

 

  • PCR
    30ng genomic DNA7.5μL의 29 PCR buffer (Type-it Microsatellite PCR Kit, Qiagen),
    각각 1.0μM의 정방향 및 역방향 프라이머 (10μM)를 포함하는, 15μL 최종 볼륨에서 수행했다.
  • 증폭
    초기 변성(initial denaturation)을 위해 94℃에서 5분 동안,
    사용된 primer에 따라 annealing 온도에서 30초 동안, 
    72℃에서 1분 동안, 진행되었고,
    이를 35회 사이클을 수행하며,  
    72℃에서 5분 동안 최종 확장단계(final step of extension)로
    프로그래밍된 thermal cycler (Eppendorf)에서 수행되었다.
    Final holding temperature는 4℃였다.
  • PCR 샘플
    내부 표준인 GeneScan 500 LIZ size standard (Applied Biosystems)을 사용하여
    모세관 전기영동 (capillary electrophoresis) ABI 3130XL에서 실행되었다.
  • 대립유전자들의 스코어링GeneMapper v.4.1 소프트웨어 (Applied Biosystems)를 사용했다.

 

Data analysis

  • Pruvot-Woehl et al. (2020)에 의해 설명된 방법이 사용되었다. 
  • C. arabica는 4배체(tetraploid)이기 때문에,
    각 대립유전자(allele)에 대해 존재/부재(1/0)가 코드화되었다.
  • 엄밀히 말하면, 우리는 유전자형(genotype)보다는 SRR 대립유전자 표현형(SRR allelic phenotype)을 다루고 있다. 
    실제로, 표현형(phenotype) AB는 다음 유전자형 중 하나일 수 있다: AABB, ABAB, AAAB, ABBB.
  • DARwin6 소프트웨어 (Perrier 및 Jacquemoud-Collet 2006)가 단일 데이터 파일과 함께 사용되었다.
  • 비유사성 행렬(Dissimilarity matrix)이 Dice Index를 사용하여 계산되었으며,
  • Weighted Neighbor-Joining 방법(Saitou and Nei 1987)을 사용하여
    유전적 다양성 트리(genetic diversity tree)를 구축하고
    Principal Coordinates Analysis (PCoA)을 실행하는 기초가 되었다.
  • Perrier and Jacquemoun-Collet (2006)이 지적한 바와 같이,
    PCoA는 다양성을 전반적으로 표현하는 반면, 트리 방법은 개별 유전 관계를 충실하게 표현하는 경향이 있다.
    따라서 데이터를 보는 이 두 가지 서로 다른 방식은 상호보완적이다. 
  • 클러스터들의 견고성(robustness)을 확인하기 위해,
    판별 분석(Discriminant Analysis, DA) (Tomassone et al. 1988)이
    PCoA의 첫 번째 5개 축 좌표에 대해 실행되었다.
    Wilks Lambda test를 통해 유전자 클러스터 간의 통계적 차이를 체크했다.
  • 이 표본을 제외한 전체 표본을 대상으로 한 모형 구축을 기반으로 각 표본을 분류할 때,
    교차검증(cross validation)을 통해 분류가 잘 된 비율을 체크하였다.
  • DA 및 관련 테스트들은 Xlstat 소프트웨어 (Addinsoft 2020)를 사용하여 수행되었다.

 

 

 

모든 샘플을 기반으로 한 neighbor-Joining tree (Fig. 1)는 잘 표시된 5개의 서로 다른 클러스터들을 보여준다.
샘플 카테고리들은 각 클러스터에 고르게 분포되어 있지 않다 (Table 1).

 


하나의 메인 클러스터는 거의 전적으로 Ethiopian accessions로 구성되었다.

우리는 이를 EO (Ethiopian Only 클러스터)라고 명명했다.

전 세계적으로 재배되는 다섯 가지 품종들이 그 클러스터에 속했다: 
(i) Geisha (CATIE 코드 T.02722)는 원래 Panama에서 다시 알려진 그 유명한 게이샤이다 (Pruvot-Woehl et al. 2020).
(ii) Java는 원래 Cameroon (Bouharmont 1994)에서, 에티오피아 개체군에서 선발된 품종이다.
(iii) Chiroso는 Colombia에서 재배되는 품종에 부여된 이름으로,
      컵 품질이 우수하다고 알려져 있다 (Montagnon Pers. Obs.).
(iv) SL-06은 20세기 초 Kenya에서 Kent 나무 (Jones 1956)에서 선발된 것으로 추정된다.
(v) Mibirizi는 the Great Lake 지역에서 재배된 최초의 품종 중 하나이다;
      그 기원은 알려져 있지 않다 (Leplae 1936).
      이 클러스터에 있는 Mibirizi 액세션의 CATIE 코드는 T.02702이다.

 

 

두 번째 클러스터는 Ethiopian accessions와 worldwide cultivated varieties로 구성되었다.
재배 품종들은 20세기 초 동아프리카에서 선발된 품종으로 SL-14, SL-17, K-7이다. 
SL-14와 SL-17은 케냐의 “Drought Resistant 가뭄 저항성” 개체군 중에서 선발되었다.

이 '가뭄 저항성' 개체군의 기원은 알려져 있지 않다 (Jones 1956).
K-7과 K-758은 모두 동일한 유전적 지문을 갖고 있으며 Kent selections의 후손으로 추정된다 (Fernie 1970).
CATIE 코드 T.03622를 사용하는 Mibirizi도 이 클러스터에 있었다.
이 클러스터에서는 예멘 샘플이 발견되지 않았다.
우리는 이 클러스터를 'SL-17' 클러스터라고 명명했다.

세 번째와 네 번째 클러스터는 worldwide coffee cultivars와 Yemeni samples로만 구성되었다.
한 클러스터에는 Yemeni accessions와 20세기 초 동아프리카에서 선발된 두 가지 재배 품종인 SL-09SL-34가 포함되었다. SL-09는 기원이 알려지지 않은 반면, SL-34는 French Fathers of the Holy Ghost (성신회, ‘Spiritans’이라고도 함) 선교사들이 예멘(아덴)에서 직접 가져온 씨앗으로 만들어진 이질적인(heterogeneous) "French Mission" 개체군의 후손이다. 우리는 이 클러스터를 'Yemen SL-34' 클러스터라고 명명했다.

다른 클러스터에는 Yemeni accessions, 그리고 Bourbon, Typica, SL28 (Coorg와 동일한 DNA 지문이 있음), Kent, KP-263KP-532, Bronze 009Moka를 비롯한 다양한 worldwide cultivated varieties가 포함되었다. 우리는 이 클러스터를 'Yemen Typica-Bourbon' 클러스터라고 명명했다.

TypicaBourbon은 18세기 이후 세계로 퍼진 유일한 두 품종이다. Typica는 인도를 거쳐 아시아로, Bourbon은 현재 La Reunion Island인 Bourbon 섬을 통해 전파되었다. KentCoorg는 Baba Budan이 인도에 커피를 처음 도입하여 형성된 개체군인 Old Chicks에서 파생된 인도 품종이다 (Haarer 1958; Kushalappa and Eskes 1989).동아프리카에서는, 예멘의  Mocha 항에서 나오는 모든 커피 콩이나 씨앗에 “Moka”'라는 명칭이 부여되었다 (Jones 1956). Cramer(1957) 및  Carvalho et al. (1984)은 Moka 품종이 다른 유전적 배경에서 발생할 수 있는 돌연변이로 인해 작고 둥근 열매를 가지고 있다고 설명한 바 있다.

 

마지막으로, 우리는 Yemeni samples로만 이뤄지고 worldwide cultivars는 없는 클러스터 하나를 발견했다.
우리는 이것을 “New-Yemen” 클러스터라고 명명했다. 

 


Fig. 2는 PCoA의 처음 두 축을 기반으로 한 그래프를 보여주고 있으며, 이는 전체 분산(variation)의 40.2%를 설명한다. 
“Ethiopian only” 유전자 클러스터는 그래프의 오른쪽 부분에 있고,
“SL-17”, “Yemen Bourbon/Typica” 그리고 “Yemen SL-34”는 좌상 분면에 있다.
오직 New-Yemen만이 그래프의 좌하단 부분에 있어 유전적 특이성(genetic singularity)을 확인해준다.

마커 당 평균 대립유전자 수(average allele number per marker)는 전체 개체군에 있어서 7.4였다.

그러나 “Ethiopian only” 클러스터는 마커당 7.0개의 대립유전자를 가진 반면, 다른 모든 클러스터들은 마커당 2.63개의 대립유전자만 있었다. “SL-17”, “Yemen Bourbon/Typica”, “Yemen SL-34”, 그리고 “New-Yemen” 클러스터들은 마커당 각각 3.5, 2.4, 1.8, 그리고 1.9개의  대립유전자를 가졌다.

첫 번째 5개 축의 좌표들을 기반으로 한 DA(판별분석)는 Wilks lambda test가 매우 유의하기 때문에 (P<0.0001), 클러스터 간의 통계적 차이를 확인해주었다. 유전자 클러스터들에 대한 샘플의 교차 검증(cross-validation)을 통한 전반적인 양호한 분류(overall good classification)는 평균 91%였으며, “New-Yemen” 클러스터의 경우에는 100%였다.

샘플 카테고리 및 배속된 유전자 클러스터가 포함된 상세한 샘플 리스트는 보충 데이터에 제공된다 (Table S1).

 

 

우리가 아는 한, 우리의 연구는 예멘에서 C. arabica의 유전적 다양성을 확대해서 본(zoom in) 최초의 연구이다. 이러한 유전적 다양성을 밝히면 전 세계적으로 재배되는 커피 품종들의 유전적 다양성을 더 잘 이해할 수 있다.

본 연구에 사용된 SSR 마커 세트의 목적적합성(relevance)은, Pruvot-Woehl et al. (2020)가 정립한 바와 같이, C. arabica의 유전적 다양성 탐구에 대해 확인되었다. 이는 또한 유전학 연구들에서 SSRs의 유용성(usefulness)에 동의하는 것이었다 (Hodel et al. 2016). 8개의 SRR markers 세트는 우리 연구에서 마커당 7.4개의 대립유전자로 매우 다형성이 높다(highly polymorphic). Pruvot-Woehlet al. (2020)은 동일한 8개 마커들에 대해 마커당 11.9개의 대립유전자를 보고했다. 그러나, 유전자 이입된 품종들(introgressed varieties) (C. canephora 또는 C. liberica와의 종간 교배에서 유래)이 연구 대상 개체군에 포함되었다. 

Da Silvaet al. (2019)은 또한 연구에 유전자 이입된 품종과 다른 Coffea 종을 포함했으며 마커당 6.9개의 대립유전자(30 SSR)를 가지고 있어 현재 연구보다 적다. 
Bentiet al. (2020)은 40개 에티오피아 아라비카 품종 개체군에 대해 마커당 7.5개의 대립유전자(14개 SSR)를 발견했으며, 그 중 2개는 유전자 도입 품종이었다.

DA(판별분석)는 유전자 클러스터, 즉 “New-Yemen” 클러스터의 견고성(robustness)을 입증했다.

 

▣ Yemen holds most of the C. arabica genetic diversity known outside of Ethiopia

우리의 연구는, 에티오피아 외부에서 재배되는 대다수의 커피 품종들이 예멘을 통과해서 이전되었다는 역사에 기초한 이전 지식 (de la Roque 1716; Ukers 1922; Chevalier 1929; Cramer 1957; Haarer 1958; Meyer  1965; Koehler 2017)과 선행 유전학 연구들 (Lashermes et al. 1996; Anthony et al. 2002; Silvestrini et al. 2007; Pruvot-Woehl et al. 2020; Scalabrin et al. 2020)을 확인했다

그러나 예멘에서 재배되는 커피나무들의 상세한 유전적 구조와, 이러한 상세한 유전적 다양성과 전 세계적으로 재배되는 품종들과의 연관성은 알려지지 않았다. 
우리는 이 연구에서 예멘에 적어도 3개의 서로 다른 C. arabica 유전자 클러스터가 있음을 보여주었다. 
이 클러스터들은 잘 분리되어 있으며 세 가지 주요 가설로 이어진다: 
(i) 서로 다른 좁은 유전적 기반으로부터의 몇 가지 개체군들의 도입과, 시간 경과에 따른, 가장 적응된 개체군들의 선택,
(ii) 오늘날 관찰되는 서로 다른 유전자 클러스터들의 개체군들 내에서의,
      더 큰 유전적 기반을 가진 하나 또는 여러 개체군들의 도입과 예멘에서의 선택, 또는
(iii) 예멘에서의 전 세계적으로 선택된 품종들의 재도입.


우리의 데이터는 처음 두 가설 중 하나를 뒷받침할 수도 있고 두 가설의 조합을 뒷받침할 수도 있을 것이다.
세 번째 가설은 묵살될 수는 없지만, 모든 주요 커피 품종들의 예멘 재도입의 역사적 기록은 없기 때문에 가능성이 낮다.

 

Yemen Typica-Bourbon 클러스터는 전 세계적으로 재배되는 재부분의 주요 품종들을 포괄한다. 이처럼 오늘날 예멘은 300년 전 세계에 전달했던 유전적 다양성의 대부분을 여전히 보유하고 있다. 
더욱이 예멘에는 독특한 유전적 다양성도 존재한다. 실제로, 우리 연구에서 전 세계적으로 재배되는 품종은 New-Yemen 클러스터에 속하지 않는다. 즉, 18세기에 예멘 밖으로 퍼졌으나 도중에 분실되거나 역선택(counter-selected)되었거나 단순히 예멘을 떠나지 않았다는 것을 의미한다.

유전자 클러스터들과 예멘 커피 농민들이 붙인 커피 재배품종들의 이름 사이에는 상관관계가 없었다. 이는 Hussein et al. (2017)의 연구 결과와 일치한다. 사실, 주어진 이름의 대부분은 정확한 유전적 배경에 의존하지 않는 몇 가지 명백한 시각적 특징과 관련되어 있다. 예를 들어, 키가 큰 커피들은 Udaini, Jufaini 및 Jadi라고 하며, 보다 작은 나무들은 Dawairi 및 Tufahi라고 한다 (Sheibani, 자체 관찰). 붙여진 이름들과 실제 유전자 지문 사이의 불일치는 Pruvot-Woehl et al. (2020)에 의해 세계 여러 지역들에서 정확하게 나타났다.

 

Origin and history of the C. arabica coffee varieties cultivated worldwide

우리 연구에서 Ethiopian accessions는 Yemeni accessions와 군집화되지 않았다. 그러나 Ethiopian accessions 샘플들은 에티오피아에 존재하는 모든 가능한 유전적 다양성을 대표하지는 않는다 (FAO 1968; Charrier 1978; Scalabrin et al. 2020). 게다가, 본 연구에 사용된 유일한 구득가능한 에티오피아 생식질은 South Sudan지역과 동부 에티오피아 Hararghe 커피 지대를 커버하지 않는 약 50년 전에 실시된 두 건의 서베이들에서 나온 것이다. 

Scalabrinet al. (2020)은 에티오피아 남서부/남수단으로부터 에티오피아의 Great Rift 동부를 향해, 그 다음 Hararghe 에티오피아 커피 지대들, 그 다음에 예멘, 그리고 그 다음에 전 세계로 향한 C. arabica의 전반적인 서-동 이동이 있었다고 제시하고 있다. 
Montagnon and Bouharmont (1996)는 Great Rift Valley 서쪽과 동쪽의 Ethiopian accessions 간의 유전적 차이를 최초로 강조했다. Great Rift의 동쪽이 야생 C. arabica의 고향이었는지, 아니면 서부 포레스트들로부터 유입된 야생 C.  arabica가 처음으로 재배화된  최초의 장소였는지 여부는 아직 의문으로 남아 있다.  더 동쪽인 Hararghe 지대들에는 Great Rift Valley의 서부 및/또는 동부 지역에서 들어오는 커피나무들이 심어졌다. Hararghe 커피는 두 지역들 사이에 집약적인 교역 관계가 있었기 때문에, 예멘에 심은 커피와 관련이 있을 수 있다 (Haarer 1958). 

Scalabrinet al. (2020)은 에티오피아 액세션들에 초점을 맞춰 세 가지 주요 유전 그룹을 확인했다: 'Jimma-Bonga’ 그룹'Sheka’ 그룹은 에티오피아 커피 에리어들의 서부 지역에서 나온 에티오피아 액세션들로 구성되었으며, “Harar-Yemen” 그룹이라고 하는 세번째 그룹은 그들 연구의 worldwide cultivars 및 Yemeni samples 부분과 더 밀접하게 관계되었다. 

우리의 연구는, 예멘 커피의 유전적 다양성에 초점을 맞추었지만, 예멘 액세션들이 유전적으로 구별되는 클러스터들로 구성되어 있으며, 이들의 에티오피아 내에서의 가능한 기원지가 한 곳이 아닐 수도 있음을 보여주었다. 이런 맥락에서, 예멘 커피 유전적 지형의 기원을 더 잘 이해하기 위해서는 Great Rift Valley 동부 그리고 Hararghe에서 오는 더 많은 에티오피아 샘플들을 연구하는 것이 우선순위이다.

 

우리 연구의 Ethiopian-Only 클러스터에서 발견된  worldwide cultivars는 예멘 루트를 통과하지 않은 커피 종자를 나타낸다. Geisha (CATIE 코드 T.02722)가 그런 것의 유명한 예이다. Geisha는  20세기 초에 에티오피아 남서부에서 케냐로 직접 옮겨졌다 (Koehler 2017). 


Java 품종이 또 다른 예이다. 이 품종은 “Abyssinian”, 즉 에티오피아 개체군으로부터 선택되었으며, 먼저 Indonesia로 이동한 다음,  Cameroon으로 이동하여 최종적으로 Java 품종이 선택되었다 (Bouharmont 1994). 


SL-06도 Ethiopian-Only 클러스터에서 발견되었지만, Kent로부터의 단일 나무 선택(single tree selection)으로 Jones (1956)에 의해 처음 보고되었다.  에티오피아 재래 원시품종들(landraces)과 명확하게 군집을 이루며 예멘 군집들과는 유전적으로 구별되므로, SL-06이 인도로 이동하여 Kent가 원산지인 종자의 일부였을 가능성은 거의 없다. 케냐 연구 기지들과 CATIE 생식질 콜렉션들 사이에 라벨링이 잘못 되거나 혼합되었을 가능성을 배제할 수 없으므로, 이 “SL-06”은 그 오리지널 SL-06 Kenyan Selection과 관련이 없을 수 있다. 


Chiroso는 컵 품질로 유명한 콜롬비아에서 소규모로 재배되는 품종이다. 우리는 연구에서 Chiroso가 에티오피아를 “탈출한(escaped)” 에티오피아 재래종의 일부임을 보여준다. 
뛰어난 컵 품질을 갖춘 소규모로 재배되는 품종들에서 더 많은 DNA fingerprints가 수집될 가능성이 매우 높으며  (Montagnon et al. 2019; Pruvot-Woehl et al. 2020), 예멘 루트를 우회한 에티오피아 토착재래종의 사례가 더 많이 발견될 가능성이 높다. 


Mibirizi CATIE 코드 T.02702는 이 “Ethiopian-Only 클러스터”의 일부이며, CATIE 컬렉션의 에티오피아 액세션  T.04620과 유전적으로 매우 가깝다. CATIE 코드 T.03622를 사용하는 또 다른 Mibirizi 액세션은 SL-17 클러스터의 일부이며, CATIE 코드 T.02702를 사용하는 Mibirizi와 유전적으로 매우 다르다. 이는 동아프리카와 CATIE 컬렉션 사이 어딘 가에 있는 Mibirizi 품종에 대한 잘못된 라벨링 때문일 수 있다. Mibirizi에 대한 제한된 정보 (Leplae 1936)를 감안할 때, Mibirizi가 에티오피아 토착재래종일 가능성은 거의 없으며, 두 Mibirizi 코드 중 하나라도 정확하다면 T.03622 코드가 될 것이다. 그러나 무역이나 문화적 접촉을 통해 중앙 아프리카에서의 여러 차례 독립적인 도입이 이루어지면서 Mibirizi라고 불리는 매터리얼의 두 가지 유전적 배경들이 탄생했다는 가설은 무시될 수 없다.

 

우리 연구에서 SL-17 클러스터에는 4개의 에티오피아 액세션들이 포함되어 있고 예멘 액세션들은 없다.
따라서 한 가지 가설은 이 클러스터의 대표들이 아직 존재하지만 조사되지 않았거나 예멘에서 사라졌기 때문에, 예멘을 통과했지만 Yemen Qima 개체군에서 포착되지 않았다는 것이다. 
또 다른 가설은 예멘을 통과한 적이 없으며 에티오피아에서 동아프리카로 직접 유입되었다는 것이다.

예멘 SL-34 클러스터는 SL-17 클러스터와 달리 예멘에서 명확하게 표시된다. 
이 클러스터의 두 가지 worldwide cultivated varieties 부분은 SL-09와 SL-34이다. 
Jones (1956)에 따르면, SL-09는 기원이 알려지지 않은 반면, SL-34지리적 기원이 중앙 아프리카, Bourbon Island 또는 예멘인 “French Mission”에서 유래한 것이다. 

Yemen Typica-Bourbon은 전 세계적으로 재배되는 C. arabica 품종들 대다수가 따른 주요 초기 경로를 나타낸다.
Montagnon et al. (2019) 및 Pruvot-Woehl et al. (2020)에 의해 리뷰된 바와 같이, 18세기 초 예멘에서 나오는 두 가지 주요 커피 루트는 Bourbon Island (오늘날의 La Reunion)과 India였다. 

Bourbon Island를 거쳐 전이된 종자들은 Bourbon 품종만 탄생시켰기 때문에, Yemen Typica-Bourbon 클러스터의 작은 부분을 대표했을 가능성이 높다. India를 거쳐 이전된 종자들은 인도네시아 루트를 거쳐 그 다음 신세계로 진출한 Typica 품종이 탄생시켰기 때문에, 필연적으로 Yemen Typica-Bourbon의 더 넓은 다양성이 포함되었다. 이들 동일한 개체군은 또한 India에서 처음 재배된 후 East Africa에 도입된 이 클러스터에서 여러 품종들을 탄생시켰다. 

 

마지막으로, New-Yemen 클러스터는 예멘을 떠나지 않았거나 도중에 분실되었다. 어떤 시나리오가 사실인지에 관계없이, 사실 이는 cultivated varieties worldwide에서는 발견되지 않는 독특한 유전자 클러스터를 구성한다는 것이다. 에티오피아에서 이 클러스터의 기원은 알려져 있지 않다. 에티오피아에서의 그 조상은 삼림 벌채나 유전적 멸종으로 인해 사라졌을 수도 있다. 마찬가지로 유전적 다양성이 아직 연구되거나 발표되지 않은 에티오피아의 일부 개체군에 그 조상이 존재할 수도 있다.

우리의 연구는 우리가 그 점들을 연결하고, C. arabica의 전세계 이동과 확산을 더 잘 이해할 수 있게 해준다. 오늘날까지 전체적으로 세 가지 주요 루트들이 고려되었다:
(i) the Yemen-India route,
(ii) the Yemen-Bourbon Island route,
(iii) 예멘을 거치지 않고 세계로 퍼진 일부 에티오피아 액세션들의 우리가 “Escapee” route라고 부르는 것.

우리의 결과는 처음 두 경로에 대한 Yemen Typica-Bourbon 클러스터의 중요성과 함께 이 세 경로들을 확인해준다. 
그러나 이는 또한 이전에 간과되었던 또 다른 경로, SL-17과 예멘 SL-34 클러스터가 뒤따랐을 가능성이 높은, 즉 19세기 말/ 20세기 초의 예멘-동아프리카 직접 경로를 강조한다. 이 결과는 또한 예멘 클러스터들과 그들의 에티오피아 조상들 사이의 어떠한 커넥션을 탐구하기 우선적으로 Hararghe region의 유전적 다양성을 추가로 조사해야 할 필요성을 확인시켜준다.

따라서 우리는 C. arabica 커피의 본고장인 에티오피아와, 재배 커피 품종들의 세계 간의 게이트웨이 나라인 예멘의 C. arabica 유전 구조에 대한 더 깊은 지식과 더 완전한 그림을 여기서 처음으로 제시한다. 


예멘의 품종들은 놀라울 정도로 탄력적이다 (resilient): BourbonTypica는 300년 동안 재배되었다. 예멘의 Typica-Bourbon 품종들에서 선발된 Mundo Novo, Caturra 또는 Catuai는 현재 브라질에서 50년 넘게 성공을 거두었다  (Guerreiro Filho et al. 2018). 역시 예멘 Typica-Bourbon 클러스터의 SL-28은 거의 1세기 동안 케냐 농부들에게 높이 평가되었다. 


Robusta와의 종간 교배들로부터 유래한 유전자 이입 품종들만이 소출 및 커피 잎 녹병에 대한 저항성(현재는 종종 손상됨) 때문에 오리지널 예멘 하향 품종들을 부분적으로 물려 받았다 (Zambolim 2016; Montagnon et al. 2019). 가장 최근에는, 잡종 강세 (hybrid vigor)를  활용하는 F1 하이브리드들이 전통적인 예멘 하강 품종들에 비해 상당한 우월성을 보여주었다 (Georget et al. 2019; Marie et al. 2020).

 

Breseghello and Coelho (2013)는 작물 재배화(crop domestication)부터 현대의 작물 육종까지의 이벤트들에 관한 포괄적인 리뷰를  제안한 바 있다. 재배화 “the origin of crop” 바로 다음에, 직관적인 농부 선택이 오고 그것이 “origin of  landraces”가 되며, 이어서 순수 계통선택과 대량선택 (pure line selection and mass selection)이 이어져 “origin of cultivars”가 된다. 
나중에는, 통제된 매핑 (controlled mapping)에 기초한 식물 육종과 가능하게는 marker assisted  selection이 이루어질 것이다. 


우리의 결과예멘이 최소한 세계의 토착재래 원시품종들(landraces)과 재배품종들(cultivars)의 주요 기원지였으며, 에티오피아 액세션들과는  별개인 클러스터를 형성했음을 나타낸다. 이러한 일반적인 관찰이 선행 연구들에서 이루어졌었 다 (Montagnon and Bouharmont 1996; Lashermes et al. 1996; Anthony et al. 2002; Silvestrini et al. 2007; Pruvot-Woehl et al. 2020; Scalabrin et al. 2020). 


그러나 본 연구는 예멘의 C. arabica의 유전적 다양성에 관한 설명과, 후속의 전 세계적 재배품종 선택에 대한 중요성에 대한 설명에 깊이를 더한다. 재배화(domestication)와 초기 선택(early selection)의 결과로 야생 개체군과 재배 개체군 사이의 유전적 거리 패턴은 한해살이 작물들 (Gepts 2004; Glaszmann et al. 2010) 뿐만 아니라 다년생 작물들 (perennial crops), 즉 차 tea — Camellia sinensis (L.) Kuntze (Meegahakumbura et al. 2018), 복숭아 peach — Prunus persica (L.) Batsch (Agaki et al. 2016) 또는 포도나무 grapevine – Vitis vinifera L. (Riaz et al. 2018)에서도 관찰된 바 있다.

Gepts (2004)는 작물 재배화(crop domestication)가 유전적 결과를 가져오고 종종 유전적 다양성과 유전자 발현 다양성(gene expression diversity)을 감소시키는 장기적인 선택 실험임을 상기시킨다 (Flint-Garcia 2013; Liu et al. 2019; Turner-Hissong et al. 2020) . 


이는 결국 최근 코코아 –  Theobroma cacao L.(Hämälä)에서 나타난 다유전적 적응(polygenic adaptation)을 포함하여 (Hämälä et al. 2020),  육종가들이 적응을 위한 유전자들(genes for adaptation)을 이해하고 식별하며 표적화할 수 있는 독특한 기회를 제공한다 (Ross-Ibarra et al. 2007; Glaszmann et al. 2010). 

우리의 결과를 통해 이제 예멘의 유전적 다양성을 재검토하고 완전히 탐구하는 것이 가능해졌다.
예멘의 커피 재배지는 거친 기후를 가지고 있다: 전 세계 커피 재배 에리어들 중에서 고온과 저온을 극한적인 범위에서 모두 보여주며, 아울러 가장 낮은 강우량 수준들의 지역 중 하나이다. 이러한 환경이 1,400년대 (커피가 예멘에 처음 소개됨)부터 1,700년대 (오늘날 전 세계 주요 커피 품종이 예멘에서 빠져나간 시기) 사이 뿐만 아니라, 지난 300년간의 커피 경작과 전파 기간 동안에도 탄력 있는 품종들(resilient varieties)을 선호했다는 것은 의심의 여지가 없다. 

우리는 또한 지금까지 세계 어디에서도 관측되지 않았던 New-Yemen 클러스터를 발표한다. 새로 발견된 이 유전자 클러스터는 전 세계 커피 부문의 지속 가능성에 대한 큰 기회를 나타낸다. 실제로 커피의 기후 변화 영향을 해결하는 방법 (Bunn et al. 2015; Davis et al. 2019)은 극한 기온에 적응한 새로운 품종에 부분적으로 의존할 것이다. 예멘은 극한의 커피 기후에서 선별된 유전자들의 수백 년에 달하는 커피의 가치를 세계를 제공할 수 있다. 이번 연구 결과는 글로벌 커피 커뮤니티에게, 입증된 성공적인 품종들의 기원지에서의 유전적 다양성에 대한 더 깊은 탐구와 이해를 제공할 뿐만 아니라 완전히 새로운 유전적 저장소인 the New-Yemen cluster를 제공할 수 있었다. 

 

기후 변화 문제에 더해, 우리의 결과는 스페셜티 커피 시장에 컵 품질에 대한 새로운 미개척 유전적 다양성을 제공한다; 이는 커피 부문의 다양성과 지속가능성을 크게 높일 수 있을 것이다 (Montagnon et al. 2019).

 

마지막으로 예멘은 가장 오래된 커피 재배 국가 중 하나이지만, 이 나라의 커피 유전적 풍경(genetic landscape)에 대해서는 알려진 바가 거의 없다. 우리의 결과는 예멘 커피 재배자들을 위한 최고의 재배 재료 선택을 안내하는 데 매우 중요할 것이다.

 

우리가 아는 한, 우리의 연구는 전 세계 재배 품종 개발의 핵심 중심지인 예멘에서 C. arabica의 유전적 다양성을 최초로 공개하고 설명했다. 우리는 예멘에서의 세 개 유전자 클러스터들을 관찰했다. 이런 이유로, 예멘의 세 클러스터를 포괄하는 유전적 다양성을 갖춘 단일 이벤트로 커피가 예멘에 도입되었거나, 또는 예멘에서의 몇 차례 독립적인 커피의 도입들이 있었다. 


더욱이, 우리는 커피 재배품종들의 유전적 다양성의 주요 부분이 커피가 예멘에서 전파되어 전 세계로 재배된 지 300년이 지난 오늘날에도 여전히 존재한다는 것을 보여주었다.  그러나 한 가지 유전자 클러스터인 New-Yemen 클러스터예멘을 떠나지 않았기 때문에 또는 도중에 분실되었기 때문에, 세계의 다른 곳에서는 관찰되지 않았기에 우리 연구 이전에는 알려지지 않았다. New-Yemen 클러스터는 유전적 관점에서 지금까지 관찰된 에티오피아의 어떤 개체군들과도 관련이 없다. 따라서 에티오피아에서 유전적 원천(genetic source)이 사라졌거나, 또는 유전적 다양성 분석에 아직 포함되지 않은 개체군과 관련이 있는 것이다. 


본 연구는 새로운 연구 기회, 즉 예멘 커피 유전자 풀에서 적응 유전자(adaptation genes)를 찾는 길을 열어준다.

 

 

댓글