인간 유전자 5 개 중 1 개는 '실제'가 아닙니다.

새로운 연구는 생물 의학의 얼굴을 바꿀 수 있습니다. 인간 게놈은 이전에 믿었던 것보다 훨씬 적은 수의 "실제"또는 단백질 코딩 유전자를 포함하는 것으로 밝혀졌습니다.

우리의 DNA에는 처음에 생각했던 것보다 훨씬 적은 수의 '실제'유전자가있을 수 있습니다.

1990 년대 초, 과학자들은 인간 게놈의 전체 DNA 서열을 매핑하기 시작했습니다.

소위 인간 게놈 프로젝트는 질병과의 유전 적 연관성을 찾고, 어떤 유전자가 단백질을 암호화하는지, 어떤 요인이 유전자 발현을 조절하는지 등 게놈의 다양한 요소의 기능과 구조를 이해하는 것을 목표로했습니다.

인간 게놈 프로젝트의 초기 결과는 신체 조직과 장기의 좋은 기능에 필수적인 단백질 인 큰 분자를 암호화 할 수있는 유전자가 4 만 개 있다고 예측했습니다.

그러나이 프로젝트가 2003 년에 마감되면서 그 수는 약 20,000-25,000 개의 단백질 코딩 유전자로 떨어졌습니다.

그 이후로 과학자들은 최종 단백질체, 즉 유전자에 의해 발현 될 수있는 총 단백질 수를 찾기 위해 노력해 왔으며 이러한 단백질의 유전 적 발현이 여러 질병에서 어떻게 변이되는지 이해하는 데 초점을 맞추고 있습니다.

이를 위해 스페인 마드리드에있는 스페인 국립 암 연구 센터 생물 정보학 유닛의 마이클 트레스 (Michael Tress)가 이끄는 국제 연구팀은 현재 사용 가능한 주요 프로테옴 데이터베이스에서 단백질 코딩으로 간주되는 유전자를 조사했습니다.

Tress와 동료들은 저널에 연구 결과를 발표했습니다. 핵산 연구. 영국 Hinxton에있는 Wellcome Trust Sanger Institute의 Federico Abascal이이 논문의 첫 번째 저자입니다.

최소 2,000 개의 유전자가 '유전자'입니다.

연구진은 GENCODE / Ensembl, RefSeq 및 UniProtKB의 세 가지 단백질 서열 및 유전 적 주석 모음의 단백질체를 비교했습니다.

Tress와 팀은 단백질 인코딩으로 나열된 총 22,210 개의 유전자 중 3 개 컬렉션 모두에 포함 된 19,446 개의 유전자 만 발견했습니다.

그런 다음 2,764 개의 유전자 차이를 확대하여 실험적 증거와 주석에서 사용할 수있는 정보를 조사했습니다.

증거에 따르면 이러한 유전자의 대부분은 "비 암호화 유전자 또는 유사 유전자"였습니다.

또한 과학자들은 세 가지 컬렉션에서 단백질 코딩으로 나열된 추가 1,470 개의 유전자가 단백질 코딩 유전자의 기능적 특성이나 일반적인 진화를 가지고 있지 않음을 발견했습니다.

따라서 연구진은“현재 3 개의 참조 데이터베이스가 인간 코딩 유전자의 수를 최소 2,000 개 이상 과대 평가하여 대규모 생물 의학 실험을 복잡하게 만들고 소음을 추가한다고 믿습니다.”

"인간 참조 프로테옴은 대부분의 기본 연구의 기본 기둥이며 거의 모든 대규모 생물 의학 프로젝트를 지원하기 때문에 어떤 잠재적 비 코딩 유전자가 단백질을 코딩하지 않는지 결정하는 것은 어렵지만 매우 중요한 작업입니다."

Tress는 연구자들이 연구 결과를 어떻게 발전시키고 있는지 공유합니다. “우리는 이러한 유전자 중 많은 것을 자세히 분석 할 수 있었고 이미 300 개 이상의 유전자가 비 코딩으로 재 분류되었습니다.”라고 그는 설명합니다.

연구 공동 저자 인 데이비드 후안 (David Juan)은“놀랍게도 이러한 특이한 유전자 중 일부는 잘 연구되었으며 유전자가 단백질을 생산한다는 가정에 근거한 100 개 이상의 과학 출판물을 보유하고 있습니다.”라고 말했습니다.

따라서 결과는 우리가 알고있는 생물 의학 분야를 바꿀 수 있습니다. 그러나 더 많은 연구가 필요합니다.

아바스칼은“우리의 증거는 인간이 19,000 개의 코딩 유전자를 가질 수 있지만 여전히 19,000 개의 유전자가 무엇인지는 알 수 없습니다.”라고 덧붙입니다.

none: 섬유근통 전염병-박테리아-바이러스 귀코와 목구멍