본문 바로가기
Coffee Genetics

Authentication of Coffea arabica Varieties through DNA Fingerprinting and its Significance for the Coffee Sector

by mjcafe 2024. 4. 29.

 

 

 

배경: 커피 재배에 가장 적합한 품종을 찾는 것이 지속 가능한 생산과 마케팅을 위한 핵심조건으로 점점 더 간주되고 있다. 커피 녹병 및 기타 질병에 대한 취약성(susceptibility), 기후 변화에 대한 적응, 스페셜티 시장의 높은 컵 품질에 따라 품종 성과가 달라진다. 그러나 빈약한  조직과 프로페셔날한 커피 종자 섹터의 부족으로 인해, 대부분의 기존 커피 농장들 (심지어 종자 재배지 및 묘목장도)은 어떤 품종을 사용하고 있는지 모른다. 커피 플랜팅 재료의 DNA fingerprinting은 커피 종자 섹터의 분야의 전문화에 기여할 것이다.

목적: 본 논문의 목적은 
i) 8개의 SRR (Single Sequence Repeats marker)을 기반으로 하는 기존 커피 DNA 핑거 프린팅 방법의
    견고성(robustness)을 대규모로 확인하는 것이다.
ii) 더 전문적인 종자 부문으로 방향을 전환(moving the needle)하는데
    어떻게 도움이 될 수 있는지 설명하는 것이다.

방법: 아라비카 품종들의 가능한 모든 유전적 배경을 대표하는 2,533개의 샘플에 8개의 SRR makers 를 사용하여 DNA 핑거 프린팅을 수행했다. 유전적 다양성(genetic diversity)을 분석하고, 품종 준거들에 대한 유전자 합치성 (genetic conformity to varietal references)을 평가했다.


결과: DNA fingerprinting 방법은 C. arabica 품종들의 인증(authenticating) 그리고 육종 및 이동 역사의 추적에 있어 강력한(robust) 것으로 입증되었다. 두 가지 중요한 커피 품종인 마르세유사(Marseillesa)와 게이샤(Gesha) 각각의 유전자 합치성 (genetic conformity)은 91%와 39%인 것으로 나타났다.

결론: DNA fingerprinting은 커피 부문의 다양한 관계자에게 강력하고 새로운 도구를 제공한다. 농부는 자신의 재배 품종들의 신원(정체, identity)을 확인할 수 있고, 커피 로스터는 품종들과 관련된 마케팅 주장이 정확하다는 것을 확신할 수 있으 며, 무엇보다도, 더욱 전문적이고 신뢰가능한 커피 종자 섹터의 정립을 추구하는 사람들이 종자 재고와 종묘 나무들의 유전적 순도(genetic purity)를 확립하고 체크하기 위한 신뢰가능한 새로운 모니터링 도구를 가질 수 있게 해준다. 

하이라이트: C. arabica는 주로 자가수분(self-pollinating)을 하지만, 고정된 라인 품종들이라도 통제되지 않은 교차수분(uncontrolled cross pollination)으로 인해, 원래의 유전적 준거에서 멀어지고 있는(drifting away) 것으로 보인다. 가능한 가장 큰 유전적으로 다양한 샘플 세트에 적용된 8개의 SSR 마커 세트가 광범위한 다양한 품종들을 판별(discriminate)하는 것으로 입증되었다. 수치는 커피 품종들의 유전자 불합치성 (genetic non conformity)이 체크된 샘플의 최대 61%를 차지할 수 있음을 확인한다. 

 

 

 

커피 생산은 전 세계적으로 약 1,250만 가구의 연간 소득에 기여한다 (1). 커피 산업 전체는 약 740억 달러를 창출하는 것으로 추산된다. 그러나 오랫동안 재배된 커피 품종에 대한 관심은 거의 주어지지 않았다. 상품으로 간주되어 커피 종만 명확하게 식별되었다: 아라비카 커피를 생산하는 Coffea arabica와, 브라질에서 생산될 경우 Conillon으로 알려졌고 세계 다른 지역에서는 Robusta라고 하는 커피를 생산하는 C. canephora. 그러나 지난 10년 동안 커피 품종에 대한 포커스가 관심을 끌었다. Montagnon et al. (2)에 따르면, 커피 품종에 대한 이러한 새로운 관심을 설명하는 세 가지 주요 이유는 다음과 같다.
i) 2012년 초, 라틴 아메리카의 녹병(Hemileia vastatrix) 위기 (3),
    이는 녹병에 걸리기 쉽고, 저-소출인 품종들을 키우는 농민들의 취약성 (vulnerability)과,
    일반적인 커피 공급의 취약성 (vulnerability) 모두를 밝혔다.
ii) 기후 변화가 커피 재배의 미래에 미치는 영향에 대한 증거 증가 (4) 그리고
     현행 품종들이 극심한 가뭄 또는 열과 같은 높은 비생물학적 스트레스에 대한 대처 불능성 (2), 그리고
iii) 종종 특정 품종들과 관련된 최고 향기로운 품질의 틈새 시장을 찾는 스페셜티 커피 시장의 성장이다.
      스페셜티-시장용 특정 품종의 가치-창출 가능성을 보여주는 가장 상징적인 예는 Gesha 품종이다.
      Gesha 품종은, 2018년 커피 상품 가격이 1.11 USD/lb일 때, 803 USD/lb라는 세계 신기록 경매 가격을 기록했다 (5).


최근까지 커피 산업에서 품종의 중요성이 높지 않았지만, 커피 육종가들은 항상 로부스타 (6, 7)와 아라비카 (2, 8)를 위한 개량 품종을 만드는 데 적극적이어 왔다. 그럼에도 불구하고 많은 국가에서, 대규모 개량 및 재식 계획이 이루어진 콜롬비아 및 온두라스(아라비카), 그리고 베트남(로부스타)을 제외하고는, 광범위한 경작에서 개량 품종들의 비율이 낮다. 브라질이나 코스타리카와 같은 주요 또는 잘 알려진 생산 국가에서도 대부분의 커피 재배지는 여전히 Caturra, Catuai 또는 Mundo Novo와 같이 1950년대에 선택된 품종을 사용하여 재배되고 있다 (9). 그러나 차세대 F1 hybrids (10)과 같은 주류의 높은 생산량을 위한 개량된 아라비카 품종이나 높은 가격을 받을 수 있는 특정 아로마틱 품질 (2)에 대한 수요가 증가하고 있다.

과거에는 개량 품종에 대한 욕구가 제한되었기 때문에, 커피 세계 대부분의 지역에서 커피 종자 부문은 제대로 조직되지 않은 상태로 남아 있다. 커피 생산자가 유전적 개선의 혜택을 받고 특정 품종에 대한 증가하는 수요를 충족하려면 커피 종자 부문을 전문화해야 할 필요성이 크다 (2). 커피 종자 분야에 초점을 맞춘 소수의 학술 연구들이 동아프리카를 다루었으며, 종자의 비공식적 교환이 재배 재료에 접근하는 주요 방법이라고 결론지었다 (11-13). 최근 연구를 통해 품종, 즉 새로운 아라비카 F1 hybrid 품종의 효율적인 대량 증식을 위한 기술이 개선되었지만(10), 종자 부문의 효율성이 풀리지는 않았다.

 

World Coffee Research (WCR)는 이러한 커피 부문 격차가 커피 생산의 장기적인 지속가능성에 대한 주요 제약 요인임을 확인했다. 따라서 WCR은 해당 부문을 전문화하기 위한 조치를 취하고 도구를 제안하기로 결정했다. 관찰된 주요 제약 중 하나는 식재 재료의 유전자 합치성(genetic conformity)에 대한 불확실성이다. 수십 년 동안 때로는 국경을 넘어 비공식적으로 종자를 교환한 후, 재배 품종의 실제 유형을 확인하는 것은 매우 어렵다. C. canephora (14, 15)와 C. arabica (16)의 유전적 다양성을 설명하기 위해 분자 마커가 오랫동안 사용되어 왔다. 그러나 재배 품종의 유전적 적합성을 확인하는 구체적인 방법은 없다. 브라질(17~20), 니카라과(21) 또는 푸에르토리코(22) 등 일부 국가의 커피 재배품종들에 대한 유전적 다양성 분석(genetic diversity analysis)에 대한 몇 가지 논문이 보고된 바 있었다.

본 고에서는 아라비카 커피에 대한 세계 최초의 유전자 인증 방법(genetic authentication method)을 제시한다.
주요 목표는 다음과 같다: 

i) 그 방법의 견고성(robustness)을 확인하고

ii) 보다 전문적인 종자 부문으로 나아가는 데 어떻게 도움이 될 수 있는지 설명한다.

 

 

 

▣ Coffee Samples

WCR은 2014년부터 수집된 2,533개의 아라비카 샘플로 구성된 DNA fingerprinting database를 유지하고 있다.

샘플들은 그들의 출처, 유전적 범주 또는 지리적 기원에 따라 그룹화될 수 있다.

샘플의 세 가지 주요 소스는 다음과 같다:

 

(1) WCR research populations (22%) -- 유전적 다양성 및 변종 실험 과정에서 분석되었다.
     여기에는 아라비카 생식질의 핵심 컬렉션(Tropical Agricultural Research and Higher Education Center (CATIE)
     생식질 컬렉션의 하위 집합)을 나타내는 100개 액세션들,

     2012년 남수단의 Schilling 및 Krishnan이 수집한 24개 액세션들 (T.Schilling, WCR, personal communication),

     그리고 다양한 실험에 포함된 품종들이 포함된다.

(2) Nursery verification (10%): WCR VerifiedSM은, 건강하고 유전적으로 순수한 식물 생산을 보장하기 위해

     묘목장과 종묘장 구역들에서의 생산 실무들을 검증하는 체계(scheme)이다.

     묘목장 검증의 한 단계는 신청자 종자 로트와 묘목장들로부터 나온 품종들의

        유전적 합치성(genetic conformity)을 확인하는 것이다.

         테스트를 거친 현재 품종들에는 Marsellesa, CR95, 그리고 Centroamericano가 포함된다.

(3) 자신의 매터리얼을 체크하고자 하는 개인들로부터 받은 익명화된 샘플들(68%).

이 샘플들의 지리적 원산지는

⊙ Central and North America (47%),

Africa (30%),

South America (13%), 그리고

Asia (10%)이다.

 

다양한 유전적 범주들이 C. arabica 이동 및 육종의 역사를 기반으로 선택되었다 [예를 들어 (23, 24) 참조].
C. arabica의 기원지는 South Western forests of Ethiopia와 Boma Plateau of South Sudan이다.

 

15세기에 에티오피아으로부터 가져온 일부 씨앗으로 예멘에서 커피가 생산되었다.

17세기 말과 18세기 초에 종자는 예멘에서

    i) Bourbon Island (현재의 프랑스령 레위니옹 섬)으로 옮겨져 Bourbon variety가 탄생했고,

   ii) 인도로, 그리고 인도에서 인도네시아 옮겨져 Typica variety가 탄생했다.
Bourbon과 Typica는 아메리카 대륙과 아시아에서 재배된 커피를 재배하는 데 사용되었다.

19세기 후반과 20세기 초반에 커피 재배는 Bourbon Island로부터 도입된 품종들 뿐만 아니라 아메리카 대륙으로부터 다시 도입된 품종들로 (Bourbon and Typica)로 동아프리카와 중앙아프리카에서 시작되었다.
흥미롭게도 인도 생식질(200년 전 예멘으로부터 채취된)도 도입되었다.
마지막으로, 동아프리카에서는, 비공식 경로를 통해 이들 국가들을 빠져나온 소수의 에티오피아 또는 수단 재래원시품종들(landraces)도 도입 되었다. 그러한 재래원시품종들 중 가장 유명한 두 랜드레이스가 Gesha (에티오피아)와  Rume Sudan (수단)이었다. 이러한 도입을 통해, 케냐 (Scott Agricultural Laboratory)탄자니아 (Lyamungu Research Station)에서 일부 육종 작업이 시작되었다.
오늘날 콩고민주공화국(Democratic Republic of Congo)의 물룽구(Mulungu)는 나중에 키부(Kivu) 지역(Rwanda와 Burundi)을 지원하는 육종 중심지였다.


1960년대 커피 생산이 일반 질병에 취약하다는 두려움으로 인해, 주로 에티오피아에서 FAO (및 ORSTOM)가 주도하는 생식질 수집 임무가 시작되었고, 수집된 물질이 수많은 유전자 은행에 배포되었다. 
동일한 우려에 자극 받아 라틴 아메리카의 육종 프로그램에서는 주로 Timor Hybrid (1920년대에 발견된 C. arabicaC. canephora의 자연 교배종)를 사용하여, 커피 녹병과 커피베리병에 저항하는 품종을 만들기 위한 노력을 배가했다. 이는 일반적으로 Catimor 및 Sarchimor라고 불리는 수많은 유전자 이입 품종들(introgressed varieties)을 탄생시켰다 (24). 
마지막으로 F1 hybrids가 2000년대에 아라비카 커피 품종들의 최신 세대로 탄생했다 (25).

요약하면, 에티오피아와 수단으로부터의 C. arabica의 경로는 단 3개 뿐이었다 (three pathways).

   ⊙ 오리지날 예멘 경로 (Yemen pathway),

   ⊙ 1960년대 공식 FAO(26) 및 ORSTOM(27) 서베이들, 그리고

   ⊙ 개별적 주도들을 통한 소수의 “escapes” (Gesha, Rume Sudan. . .).

 

이런 역사에 기반하여, 다음과 같은 C. arabica 매터리얼의 카테고리들이 고려되었다 (Table 1): 

 

  • Out of Ethiopia Yemen pathway
    • Typica/Bourbon (458 samples): Bourbon 또는 Typica 레퍼런스들에 매칭하거나
       이 둘 중 하나에 매우 밀접하게 관계되는 모든 품종들
    • East African varieties (132 samples): 1940년대부터 현재까지
      East Africa에서 선발된 모든 품종들 : SL series, K series. . .
    • Kivu region varieties (129 samples): 1940년대부터 현재까지
       Kivu regions에서 선발된 모든 품종들 : BM series, Mibirizi, Mulungu. . .
  • Ethiopian landraces (406 samples): FAO (26)와 ORSTOM (27) 미션들에 의해 1960년대에 조사된 에디오피타
    액세션들과, 역사적인 Yemen pathway를 따르지 않았던 에티오피아 이외에서 재배되는 소수의 랜드레이스들.
  • Sudanese landraces (24 samples): 2012년의
    Schilling & Krishnan에 의한 잎들에 대한 현장 조사
     (T. Schilling, World Coffee Research, personal  communication), 그리고 Rume Sudan 품종.
  • Introgressed varieties (1150 samples): 육종 프로그램으로부터 유래한 것과 Timor 하이브리드들로부터 파생된
    (주로 Sarchimors and Catimors) 유전자이입 품종들.
  • F1 hybrids (234 samples): 2000년대에 선정된 것들.

 

 

두 가지 품종(Marsellesa 및 Gesha)의 경우에는, 준거와 일치하는 개체들의 퍼센트를 평가했다. 
이 두 가지 품종이 선택된 이유는 다음과 같다.
 i) WCR 데이터베이스에는 상당한 수의 샘플이 있다 (Marsellesa와 Gesha의 경우 각각 299개와 88개).
ii) Marsellesa는 최근 Ecom에 의해 International Union for the Protection of New Varieties of Plants (식물신품종보호 국제연맹)에 등록된 품종이며, Ecom에 의해 레퍼런스가 제공되었다; Gesha의 스토리는 잘 참조되어 있으며 [예를 들어 (28) 참조], 그 레퍼런스는 CATIE가 Turrialba (코스타리카)에서 보유하고 있는 T.02722 액세션이다.

 

▣ DNA Extraction and SSR Marker Analysis

  • DNA 추출 및 SSR 마커 분석의 모든 작업은 프랑스 남부에 있는 Qualtech 社의 ADNiD 연구소(http://www.qualtech-groupe.com/en/)에 의해서 수행되었다.
  • 1mL의 SDS buffer를 사용하여 수 밀리그램의 잎 조직으로부터 세포 용해(Cell lysis)를 수행했다.
  • 칼륨 아세테이트(potassium acetate)를 사용하여 단백질 제거(Deproteination)를 수행한 후,
    DNA를 마그네틱 비드(magnetic beads)로 정제한 후, TA buffer에서 용출했다.
  • Combes et al. (29) 이후에, 선정된 동일한 8개의 SSR primer pairs (Table 2)가
    WCR 레퍼런스 데이터베이스 구축 초기부터 사용되어왔다.
  • PCR
    30ng genomic DNA와
    7.5μL의 2 PCR buffer (Type it, Qiagen), 그리고
    각각 1.0μM의 정방향 및 역방향 프라이머 (10mM)를 포함하는,
    최종 부피 15μL에서 수행되었다.
  • 증폭(Amplifications)
    프로그래밍된 thermal cycler (Eppendorf)에서 수행되었는데,
    초기 변성(initial denaturation)을 위해 94℃에서 5분 동안,
    이어서 94℃에서 30초 동안,
    사용된 프라이머에 따라 annealing(결합) temperature에서 30초 동안, 그리고
    72℃에서 1분 동안 수행되었으며,
    이 사이클들이 35회 수행되었고 (⇒ 반복),
    72C에서 5분 동안 최종 확장(extension) 단계가 이어졌다 ( 안정화, 채워지지 않은 염기서열 보완).

    최종 유지 온도(final holding temperature)는 4℃였다.

  • PCR 샘플은 모세관 겔 전기영동 (capillary gel electrophoresis)에서 돌려졌다.
    [내부 스탠다드(홈메이드)가 포함된 Applied BiosystemsTM 3130XL]
  • SSR 프로필은 먼저 GeneMapperTM Software 6을 통해 설정된 다음 육안으로 검사되었다.
  • 그 방법의 robustness는
    100% 반복성(repeatability)이 관찰된 세 가지 다른 클론들(F1 hybrids)의
    10회 생물학적 반복(biological repetitions)으로 체크되었다 (데이터는 제시되지 않음).

SSR (Simple Sequence Repeat) 분석법은 PCR을 이용하는 분석기법으로, 식물 집단 내의 유전자좌(gene locus)마다 많은 대립인자들(alleles)을 가지고 있으며, 실험에 대한 재현성이 매우 뛰어나며, 대립유전자의 특성을 명확하게 구분할 수 있어, 옥수수, 벼, 밀, 보리 등과 같은 작물의 유전적 다양성, 집단구조, 계통유연관계를 분석하고 있으며, 핑거 프린팅 (fingerprinting)과 분자 매핑(molecular mapping) 등에 이용되고 있으며, 많은 작물에서 품종 식별에 유용한 분자 마커로 알려져 있다.

 

 

▣ Data Analysis

C. arabica는 4배체(tetraploid)이기 때문에, 각 대립유전자(allele)에 대해 존재/부재(1/0)가 코드화되었다.
엄밀히 말하면 이는 유전자형(genotype)이라기보다는 SSR 대립유전자 표현형(allelic phenotype)이다.
실제로, 표현형(phenotype) AB는 다음 유전자형(genotypes) 중 하나일 수 있다: AABB, ABAB, AAAB, ABBB. 
한 가지 실질적인 결과는 동일한 대립유전자 표현형을 갖는 두 샘플이 반드시 동일한 유전자형을 가질 필요는 없다는 것이다. 이는 대립유전자 표현형을 기준으로 Marsellesa 및 Gesha에 대한 레퍼런스와 일치하는 샘플의 비율이 엄격한 유전자형 일치의 상한선임을 의미한다.


DARwin6 software (30)는 단일 데이터 파일과 함께 사용되었다.  (⇒ https://darwin.cirad.fr/ 에서 다운로드 가능)
Dice Index를 사용하여 비유사성 행렬(dissimilarity matrix)을 계산했다.
유전적 다양성 트리(genetic diversity tree)는 Neighbor-Joining 방법을 사용하여 구축되었다 (31).

 

 

 

8개의 마커들에 걸쳐 총 95개의 서로 다른 대립유전자(alleles)가 식별되었다.
마커당 대립유전자의 수는 3개에서 20개까지 다양했다.
95개 대립유전자 중 35개(40%)는 0.05~0.95 범위의 빈도(frequency)를 가졌다.

따라서 대립유전자의 60%는 희귀(rare)하거나 단일형(monomorphic)에 가깝다.

데이터베이스의 총 2,533개 샘플 중, 752개가 8개 마커에 대한 고유한 대립유전자 표현형(allelic phenotype)에 일치했다(corresponded) (Table 1). 이는 대부분의 Typica/Bourbon이 Typica 레퍼런스 또는 Bourbon 레퍼런스에 매우 가깝다는 사실을 나타낸 것이다. 다른 카테고리의 경우, 이는 주로 유전자 이입 품종들(introgressed varieties)의 경우 Marsellesa, 에티오피아 랜드레이스의 경우 Gesha, F1 하이브리드들의 경우 Centroamericano와 같이, 조사 중인 일부 특정 품종들의 대표성이 상대적으로 높기 때문이다.

전체 Neighbor-Joining 트리는 Figure 1에 나와 있다.
C. arabica 종의 유전적 다양성 나무가 아니라, 재배 품종들의 유전적 다양성 나무이다.

이후에는 다양한 인증 관점에서 다양한 유전적 카테고리들을 더 자세히 살펴본다.

 

Figure 1. Neighbor-Joining tree from the single allelic data (0/1) 
               of 2,533 C. arabica samples from the WCR DNA ...

J AOAC Int, Volume 103, Issue 2, March-April 2020, Pages 325~334, https://doi.org/10.1093/jaocint/qsz003

 

 

▣ Introgressed Varieties

모든 CatimorsSarchimorsBourbon 부모(Caturra 또는 Villa Sarchi)와 Timor Hybrid를 공통적으로 가지고 있다. 각각의 싱글 품종이 자가생식(selfing)을 통한 계보선택 과정(process of genealogical selection) 후에 선발되었다. 자가 세대의 수(number of selfing generations)가 항상 잘 문서화되어 있는 것은 아니다. 이는 종종 6~9세대 사이이다.

모든 Catimors Sarchimors는 트리 하단, 주황색 점선 아래에 있다. 따라서 Catimors/Sarchimors 품종을 나머지 카테고리와 구별하는 것은 쉽다. 품종의 정확한 인증고착정도(degree of fixation)(자가생식 세대 selfing generation)에 따라 결정된다. 예를 들어, Marsellesa, CR95 또는 Lempira는 인증하기 쉬운 고정되고 동질적인 라인들이다. 레퍼런스와의 작은 편차(deviations)는 잘 고착된 품종들에서도 항상 발생하는 잔류 분리(residual segregation)로 명확하게 식별될 수  있다.

동아프리카의 Cat129와 같은 다른 품종들은 제어된 그리고 및 확산증식 시스템 (controlled and diffusion multiplication system)을 따르지 않고 동아프리카에서 유명해지고 널리 사용되었다. 결과적으로 Cat129 fingerprints는 싱글 레퍼런스라기보다는 트리의 단일 브랜치에 가깝다. 그럼에도 불구하고 이 브랜치는 다른 품종들에 비해 개별화(individualized)되어 있다.

TH 832/1과 관련된 CIFC HW26 cross에서 파생된 T.8667 개체군으로부터 파생된 중앙 아메리카 Catimors는 모두 트리의 큰 가지에서 그룹화되어 있다. CR95 (코스타리카)와 같은 개별 품종들은 명확하게 식별될 수 있지만, 일부 샘플은 동일한 계통의 여러 품종들 간의 교차 수분(cross pollinations)에서 유래한 것으로 보인다.

이에 비해 초기 HW26 교배에서 유래한 T.5175 개체군은 좁은 가지이다.

 

Obata (브라질), Parainema (온두라스), 그리고 Marsellesa (중앙 아메리카)는

동일한 T.5296 개체군에서 파생된 Sarchimors이며, 그  자체는 Villa SarchiTH 832/2 간의 초기 교배에서 파생되었다. 잘 고정된 품종들이다. 

Batian (케냐)과 RABC15 (르완다)는 싱글 Bourbon 품종(Caturra 또는 Villa Sarchi)에서 파생된 것이 아니라, 많은 전통적인 동아프리카 계통들, 인도 계통들 그리고 심지어 에티오피아 또는 수단의 랜드레이스들 (예: Rume Sudan)이 포함되는 다중적 교배들로부터 파생된 것이다.  Batian은 다양한 고정 계통들으로 만들어진 복합 품종인 반면, RABC15는 인도 Sln6 개체군에서 파생된 단일 고정 라인이다. 결과적으로 두 품종 모두 유전적 배경의 대부분을 구성하는 오래된 Scott Labs 품종들 (예: SL34, SL14)과 Rume Sudan 지역에 위치한다. 멀티-라인 품종인 Batian은 가지를 형성하는 반면, RABC15는 예상된 좁은 유전 핑거 프린트를 가지고 있다.

잘 식별된 유전자 이입 품종들 외에도, 일부 샘플들은 다양한 다른 유전자 이입 품종들 간의 통제되지 않은 교배에서 유래한 것으로 보인다. 이러한 경우, 그 샘플들의 원래 유전적 조성을 역추적하는 것이 어려운 경우가 많다.

 

F1 Hybrids

출시된 모든 F1 하이브리드 품종들은 클론이지만 (10), 최근의 Starmaya 품종은 웅성 불임 부모(male sterile parent)의 종자로 배포된다 (32). 
따라서 F1 품종은 단일한 명확한 레퍼런스가 있기 때문에 인증하는 것이 가장 쉬운 상황이다.
중앙 아메리카에서 가장 최근에 출시된 F1 하이브리드들 (CentroamericanoMilenioCasiopea, 그리고 Mundo Maya)은 분명히 독특한 대립유전자 표현형을 가지고 있다.
흥미롭게도 Centroamericano와 Milenio는 완전 Sibs (형제)이며, 두 클론들 모두 동일한 교배 (T.5296 × Rume Sudan)에서 선택되었으며, 여전히 8개의 SSR 마커로 판별되었다.

 

Typica and Bourbon

Typica와 Bourbon은 두 개의 가깝고 매우 좁은 가지들을 형성한다.
각각의 레퍼런스 대립유전자 표현형은 잘 식별된다. 
키가 큰 Bourbon 품종과 Caturra 또는 Villa Sarchi와 같은 그것의 파생 왜소 단일 유전자 돌연변이 품종(dwarf single gene mutation varieties)은 우리의 마커 세트와 정확히 동일한 대립 유전자 표현형을 가지고 있다.
따라서 DNA 핑거 프린팅만으로는 이러한 품종들을 구별할 수 없다.
나무를 추가적으로 시각적으로 관찰하면 키가 큰 나무와 왜소한 나무의 차이를 확인할 수 있다.
수많은 샘플들이 Bourbon과 Typica (Typica/Bourbon mix) 사이의 교배에서 유래한 나무들에 해당하며, 

Bourbon과 Typica를 나란히 재배하는 오랜 역사에서 언젠가 발생한 통제되지 않은 교배들일 가능성이 높다.

East African and Kivu Region Varieties

동아프리카와 Kivu 지역의 재배되는 품종들 대부분이 Typica와 Bourbon에 관계된 유전적 클러스트를 형성하고 있다.
비록 SL28SL34와 같은 일부 오래된 품종들의 대립유전자 표현형들이 명확하게 식별되고 있지만, 재배되는 매터리얼은 다른 오래된 품종들로부터 주로 유래된 것으로 발견된다. 
르완다로부터의 Jackson과 BM139은 “population”품종들인 것으로 발견된다. 
이 품종들이 형성하는 트리들은 유전적으로 다양하며, 싱글 레퍼런스라기 보다는 유전적 클러스터에 해당한다. 

 

Ethiopian and Sudanese Landraces

당연히 에티오피아 랜드레이스들은 "Catimors/Sarchimors" 영역을 제외하고 그 데이터베이스의 전체 유전적 다양성(genetic variability)을 포괄한다.
Gesha 품종은 에티오피아 랜드레이스인 것으로 확인되었다.
Gesha 레퍼런스는 코스타리카 CATIE 생식질 컬렉션의 T.02722 액세션이며, Gesha로 식별된 대부분의 재배되는 품종들은 개별 유전자 클러스터를 형성하고 있다 (Figure 1 and 3).

남수단 랜드레이스들은 오래된 Rume Sudan 랜드레이스를 포함하여 균일한 유전 그룹을 구성한다.
Rume Sudan은 Batin의 계보(genealogy)에 중요한 공헌자이기 때문에 남수단 랜드레이스는 Batian과 밀접하게 밀집해 있다.

 

Figure 2. Representation and genetic conformity evaluation of the 299 Marsellesa samples
               in the Neighbor-Joining tree ...

J AOAC Int, Volume 103, Issue 2, March-April 2020, Pages 325~334, https://doi.org/10.1093/jaocint/qsz003

 


Focus on Genetic Conformity of Two Varieties: Marsellesa and Gesha

WCR 데이터베이스의 일부 품종들은 대규모 묘목장 검증 프로그램의 일부이거나 (예: Marsellesa) 또는 DNA 핑거프린팅의 중요한 후보 (Gesha와 같은)에 대한 관심으로 인해 높은 수준으로 대표된다. 
WCR 데이터베이스에 있는 299개의 Marsellesa 추정 샘플들 중 91%가 Marsellesa로 확인되었다 (Figure 2) : 82%는 Marsellesa 레퍼런스와 정확히 일치했으며, 9%는 Marsellesa와 밀접하게 관련되어 있었다 (즉, 허용 가능한 수준의 Marsellesa의 분리가 있다). 그러나 샘플의 8%는 관련이 없는 다양한 Catimors였으며 1%는 Typica 또는 Bourbon이었다.
WCR 데이터베이스에 있는 Gesha 추정 샘플 88개 (Figure 3) 중 39%는 Gesha 레퍼런스 (CATIE의 T.2722 액세션)와 정확히 일치했으며, 24%는 Gesha와 밀접하게 관련되어 Gesha "클러스터"를 형성했다. 그러나 샘플의 37%는 관련 없는 유전적 배경을 가지고 있었다. 일부는 SL34와 같은 오래된 동아프리카 품종이었고 일부는 Typica/Bourbon mix이었다. 

 

Figure 3. Representation and genetic conformity evaluation of the 88 Gesha samples 
               in the Neighbor-Joining tree from ...

J AOAC Int, Volume 103, Issue 2, March-April 2020, Pages 325~334, https://doi.org/10.1093/jaocint/qsz003

 

 

식물 품종들에 대한 DNA 핑거 프린트 식물 유전형 분석(genotyping)은 새로운 것이 아니다 (33).
그러나 우리가 아는 한, 우리의 연구는 C. arabica 커피 품종에 DNA 지문을 대규모로 적용하려는 최초의 시도를 나타낸다.
Vieira et al. (17)에서는, C. arabica의 DNA 핑거프린팅은 브라질에 국한되었으며, 샘플들은 생식질 컬렉션에서 채취되었다.
식물 품종들의 DNA 핑거프린팅은 코코아 (34, 35) 또는 고무나무 (36)와 같은 열대 나무 작물들을 포함하여 다양한 작물들에서 수행된 바 있다. 그러나 이러한 모든 연구는 생식질 컬렉션에서 중복을 식별하거나 생식질 컬렉션들에 있는 품종들의 유전적 핑거 프린팅을 기술하기 위한 것이었다.
종자 분야의 관점에서 열대 나무 작물들의 DNA 핑거 프린팅을 조사하고, 필드에서의 추정되는 품종들이나 배포할 식재 매터리얼의 품종이나 배포할 재배 재료의 유전자 합치성 (genetic conformity)을 평가하는 발표된 연구를 우리는 알지 못한다

본 연구는 생식질 컬렉션들 뿐만 아니라 전세계의 커피 나무들로부터의 품종들에 대한 C. arabica DNA 핑거 프린팅에 관한 지식을 가져오는 종류들 중 최초의 것이다. 

그 첫 결과는, 사용되어 온 총 95개의 대립 유전자들을 나타내는 8개 SSR 마커들의 세트가 C. arabica 품종들을 판별하는데 강력하다는 것이다
어떤 경우들에서는, 잘 정의된 여러 다른 품종들의 대립유전자 표현형들을 구별하기가 불가능했다
이는  BourbonCaturra, 그리고 Villa Sarchi의 경우였다. 
CaturraVilla Sarchi키가 큰 Bourbon 품종의 왜소 돌연변이들(dwarf mutants)이다. 이는 8개의 SSR 마커를 통해 발견될 가능성이 매우 낮은 단일 유전자 돌연변이이다. 따라서 Bourbon 대립유전자 표현형이 확인되면 Bourbon, Caturra 또는 Villa Sarchi 사이에 어떤 품종이 있는지 결론을 내릴 수 없다. 나무(키가 크거나 왜소한 나무)를 육안으로 검사하는 것만이 결정에 도움이 된다.
현재 마커들이 판별하지 못하는 또 다른 예는 CR95 (코스타리카)와 Lempira (온두라스)이다. 이 두 개의 서로 다른 품종들은 동일한 대립유전자 표현형을 가지고 있다; 그들은 동일한 육종 개체군(T.8667)의 후손이다. 잘 기술된 품종들을 판별할 수 없는 유일한 경우였다.
최근에는 이러한 드문 상황에서 판별을 미세 조정하기 위해 새로운 마커가 테스트되고 있다.

 

우리의 연구에 따르면 현장에서 재배되는 아라비카 커피 나무의 상당 부분이 기존 품종 간의 한 세대 또는 여러 세대의 통제되지 않은 수분 (uncontrolled pollinations)에서 파생된 혼합물이라는 사실이 밝혀졌다. 이것은 중앙아메리카의 CatimorsSarchimors의 경우이다. (이러한 상황에서는 1990년대 초기 셀렉션들이 각종 연구센터 컬렉션들에 소장되어 있기 때문에 품종 레퍼런스를 찾는 것이 가능하다.)

동아프리카와 키부(Kivu) 지역에서는 상황이 다르다. 케냐의 Batian 또는 Ruiru 11과 같은 국가 육종 프로그램에서 공식적으로 발표한 최근 품종들은 종종 합치적이다 (conforming). 질병 저항성으로 명성을 얻고 남동부 아프리카에 널리 심어졌지만, 연구 기관에서 공식적으로 출시되거나 배포된 적이 없는 Cat129와 같은 품종의 경우에는 이야기가 다르다. 일반적으로 이러한 출시에 수반되는 통제가 있다. 결과적으로 Cat129의 대립형질 표현형 (allelic phenotype)은 잘 정의되어 있다; 그러나 많은 outliers가 발견될 수 있다.

오래된 동아프리카와 Kivu 지역 품종들은 흥미로운 사례를 제시한다. “True” SL28과 SL34는 널리 퍼져 있지만, SLs와 K7과 같은 품종들로부터 진화한 개체군들도 마찬가지이다SLs와 K7은 처음에는 잘 정의되었지만 표류하여 현재는 초기 대립유전자의 혼합을 가지고  있다. 반드시 위험한 상황은 아니다. 현재 재배되는 나무는 여러 세대에 걸쳐 선택되었으며 이들의 대립유전자 풍부함은 회복력에 대한 부가 가치가 될 수 있다고 주장할 수도 있다.


BM71, BM139 또는 Kivu의 Jackson과 같은 오래된 품종들은 오늘날 집단 품종들(population varieties)로 기술될 수 있으며, 이는 또한 대립유전자의 혼합(mix of alleles)을 나타낸다. 이러한 각 품종들은 싱글 레퍼런스가 아닌 클러스터인 유전적 핑거 프린트를 커버한다.  클러스터 간에 겹치는 경우가 있다. 그런 상황들에서, 한 샘플의 DNA 핑거 프린트를 통해 알 수 있는 가장 좋은 점은 예를 들어 BM139 또는 Jackson과 “compatible”하다는 것이다. 에티오피아와 수단의 랜드레이스들은 쉽게 핑거 프린트될 수 있으며, 그 핑거 프린트들은 많고 다르다.  Gesha 또는 Rume Sudan 레퍼런스에는 독특한 대립유전자 표현형이 있다. 

WCR 유전자 데이터베이스에 대한 경험은 상대적으로 조직화된 연구 및 묘목장 네트워크가 있는 지역에서 최근에 선택된 품종이 만족스러운 유전자 합치성 (genetic conformity)을 보여준다는 결론을 제시한다. 이에 대한 가장 좋은 예는 현재 유전자 합치성(genetic conformity)이 91%인 Marsellesa 품종이다. 

그러나 품종이 오래되었거나 연구 및 묘목 네트워크가 제대로 조직되지 않은 경우에는 유전자 합치성 비율이 급격히 감소할 수 있다. Gesha의 유전자 합치도가 39%라는 수치는 다양한 방식으로 해석될 수 있다. 낮은 것으로 간주될 수도 있지만, 어떠한 공식적인 Gesha 종자 배포 경로가 없으면 높은 것으로 간주할 수도 있다. 게다가 Gesha로 추정되는 것 (supposed Gesha)의 24%는 여전히 Gesha 레퍼런스에 가깝고 Gesha 클러스터를 형성한다. 그럼에도 불구하고 Gesha의 명성과 확산은 매우 최근의 것이다 (지난 10~15년 동안). 공식적인 종자 섹터가 없다면 Gesha의 유전자 힙치성 비율은 증가하기보다는 줄어들 가능성이 매우 높다.

 

C. arabica가 자가수분 종이고 대부분의 재배 품종들이 고정 계통(fixed lines)인데, 왜 그렇게 높은 유전자 불합치성  (genetic nonconformity)이 있는지 궁금해할 수 있다. Turnbull et al. (34)이 코코아에 대해 제시한 가능한 이유들과 마찬가지로, 오류의 주요 원천은 인간일 가능성이 높다: 잘못된 라벨링, 품종 이름에 대한 잘못된 (선의) 믿음, 일부 통제되지 않은 (때로는 밀수품) 종자 이동의 불확실한 추적 가능성. 그러나 C. arabica가 자가수분을 할 수 있다는 사실이 항상 자가수분을 한다는 의미는 아니다. 다양한 연구에서 C. arabica의 교차수분(cross-pollination) 비율이 10~15%에 달할 수 있다는 사실이 입증되었다 (37~39). 더욱이, 에티오피아 포레스트들에 관한 최근 연구들에서는 이 비율이 50% 이상까지 올라갈 수 있음을 보여주었다 (40). 몇몇 연구에서는 커피 꽃가루가 바람이나 곤충에 의해 최대 2km 거리까지 이동할 수 있음을 확증한다 (41-43).

우리가 아는 한, Charrier (44)는 인 (32P)과 황 (35S)으로 방사성 활성화된(radio-activated) 꽃가루를 사용하여, 구역 내 꽃가루의 이동 거리가 설정된 유일한 연구를 발표했다. 커피나무 높이가 3~4m이고 밀도가 헥타르당 1,111그루인 커피나무 부지에서 전형적인 양호한 개화기 동안에, 꽃가루는 최대 42m까지 이동할 수 있다.

따라서, 원래 순수한 품종의 유전적 표류(genetic drift)는 구획을 격리하거나 구획의 내부 나무에서만 종자를 수확하기 위한 특별한 조치를 취하지 않는 경우 교차 수분을 통해 발생할 가능성이 매우 높다. 유전적 표류는 현재 C. arabica (25)와 C. canephora (45)에서 잘 확립된 하이브리드 활력(hybrid vigor) 현상에 의해 크게 향상될 수 있다. 예를 들어 Bourbon과 같은 고정 품종(fixed-line variety)이 있고 바로 근처에 Gesha 품종이 있으며, 그 Gesha 구역에서의 Bourbon 꽃가루의 오염도가 낮더라도, Gesha 구역의 씨앗을 수확하여 새로운 구역에 식재하는 경우라면, Bourbon 꽃가루가 관련된 교배로 인한 소수의 씨앗이 Bourbon과 Gesha 사이에 F1 잡종 나무를 만들 것이다. 새로운 구획에서 F1 나무는 더 왕성하고 수확량이 많으므로 농부가 가장 활발한 나무에서 씨앗을 수확하기 때문에 새로운 세대의 구역을 식재하기 위해 농부가 선택할 가능성이  더 높다. 그런 다음 꽃가루 오염이 10% 미만일 수 있었던 것부터 시작하여, 실제로는 우연한 Bourbon × Gesha F1 cross의 F2 분리 개체군이며 원래의 진정한 Gesha는 소실된 Gesha 구역에서 2세대 후에 끝날 수도 있을 것이다. 

 

전 세계 농장들, 종묘장들, 종자 로트들로부터 수집한 커피 품종 샘플들의 대규모 데이터 세트 분석을 통해, 우리는 커피 매터리얼의 유전자 합치성 (genetic conformity)이 빈번하게 의심스럽다는 것을 보여주었다. 우리는 이것이 주로 커피 종자 섹터의 질서와 우량한 실무의 결여  때문이라고 믿는다. 이는 개량된 품종들이 지속가능한 커피 산업, 즉 질병 저항성, 기후 변화 적응 및 고품질 커피에 대한 시장 수요에 필수적인 것으로 점차 인식될 때 우려되는 사항이다. 품종 합치성(및 인증)을 확보하는 능력은 커피 육종에 대한 투자 증가를 촉진하고 농부들에게 유전적 개량이 이루어질 수 있도록 보장하는 데 필수적인 전제 조건이 될 가능성이 매우 높다. 

The International Union for the Protection of New Varieties of Plants (UPOV) 국제식물 신품종보호연맹은 신품종들을 등록하고 육종자의 권리를 보호하는 세계적으로 인정받는 기관이다. UPOV에 등록된 커피 품종 수의 변화 (Fig. 4)는 2012년 이후 크게 증가했음을 보여준다. 따라서 등록된 품종의 총 수가 여전히 적더라도 (예를 들어 수박의 경우 700 품종이 넘는 데 비해 커피는 60 품종) 품종 혁신이 더 많아지는 추세는 분명하다. 유전적 적합성을 갖기 위한 첫 번째 조건은, 잘 기술된 레퍼런스 품종을 확보하는 것이며, 이는 그 품종이 UPOV 하에서 보호되는 경우에 의무사항이므로, 이는 흥미로운 추세이다. 

 

 

 

처음으로 우리는 SSR 마커 세트를 통해 아라비카 커피 품종의 품종 인증의 견고성을 대규모로 입증했다. 개체의 대립유전자 표현형의 100% 반복성(repeatability) 외에도, 품종이 Full Sibs(Centroamericano 및 Milenio 클론들)로 알려진 유일한 상황을 포함하여,대부분의 품종을 식별할 수 있었다. 단일 돌연변이로 인해 두 품종이 다른 경우에만(예를 들어 키가 큰 Bourbon의 dwarf Caturra) 8개의 마커로 두 품종을 구별하는 것이 불가능했다. 그러나 이 경우 동일한 “Bourbon” 유전적 배경을 가진 나무를 시각적으로 관찰하면 Bourbon인지 Caturra 인지 판단하기에 충분하다. 이 DNA 핑거프린팅 방법은 묘목장, 농부 및 전체 커피 산업에 심은 나무나 거래되는 종자의 유전적 식별에 대한 지식을 늘릴 수 있는 독특한 기회를 제공한다. 우리의 결과는 대부분의 품종이 대립유전자 표현형을 통해 쉽게 식별될 수 있음을 보여준다. 필드나 종묘장에서 최근에 육종 되어 출시된 품종 Marsellesa는 수용 가능한 유전적 적합성을 보여준다 (Marsellesa의 경우 91%). 그러나 우리는 또한 씨앗이 공식적인 경로를 통해 이동하지 않은 인기가 높은 품종의 유전적 적합성이 훨씬 낮다는 것을 보여준다 (Gesha의 경우 39%). 다른 품종의 꽃가루 오염과 관련이 있을 가능성이 가장 높은 유전적 부동은 상당하다.

커피 품종 인증(authentication)은 질병 압력과 기후변화 영향, 그리고 고품질 커피에 대한 수요 증가라는 맥락에서, 커피 부문 지속가능성의 핵심 부분으로 인정받고 있다. 일반적으로 커피 종자 섹터는 농장에서 컵까지 커피 이해관계자가 마땅히 받아야 할, 그리고 점점 더 요구되는 유전적 적합성을 보장하기 위해 더욱 조직적이고 전문적이어야 한다. 지난 5년 동안 WCR은 아라비카 커피 품종 카탈로그 (46), WCR VerifiedSM, 종자 로트 및 종묘장 검증 프로그램 (47), 그리고 여기서 제시된 DNA 핑거프린팅 도구 분석 등 커피 종자 부문의 전문화에 기여하기 위한 여러 도구를 제작했다. 커피 부문이 점차 전문화됨에 따라 재배 재료의 유전적 합치성이 증가할 것이며, 이는 여기에 설명된 DNA 핑거 프린팅 도구를 사용하여 모니터링할 수 있다. 한편, 커피 부문의 많은 행위자들은 이제 자신이 다루고 있는 품종을 식별할 수 있게 되었다.

 

 

 

 

댓글