CXorf66 - CXorf66

CXorf66
Идентификаторы
Псевдонимы CXorf66 , SGPX, открытая рамка считывания хромосомы X 66
Внешние идентификаторы MGI: 3779666 HomoloGene : 82551 Генные карты : CXorf66
Расположение гена (человек)
Х-хромосома (человек)
Chr. Х-хромосома (человек)
Х-хромосома (человек)
Геномное расположение CXorf66
Геномное расположение CXorf66
Группа Xq27.1 Начало 139 955 728 п.н.
Конец 139 965 521 п.н.
Ортологи
Виды Человек Мышь
Entrez
Ансамбль
UniProt
RefSeq (мРНК)

NM_001013403

NM_001039240
NM_001382307

RefSeq (белок)

NP_001013421

н / д

Расположение (UCSC) Chr X: 139.96 - 139.97 Мб н / д
PubMed поиск
Викиданные
Просмотр / редактирование человека Просмотр / редактирование мыши

CXorf66 также известный как Хромосома Х открытая рамка считывания 66 , является 361aa белка в организме человека , который кодируется CXorf66 гена . Предполагается, что кодируемый белок является трансмембранным белком типа 1 ; однако его точная функция в настоящее время неизвестна. У CXorf66 один псевдоним: RP11-35F15.2.

Существует патент на CXorf66 под файлом US 8586006, выданный Институтом системной биологии и интегрированной диагностики, Inc.

Белок CXorf66 является потенциальным новым биомаркером рака .

Ген

CXorf66 расположен на хромосоме X в Xq27.1 и находится на цепи комплемента. Ген CXorf66 расположен между АТФ11С-АТФазой , MIR505 и HNRNPA3P3 . В дополнение к этому, согласно OMIM, CXorf66 находится между SOX3 , SPANXB1 и CDR1 .

Генный локус гена CXorf66 человека на хромосоме X

мРНК

Варианты сращивания

CXorf66 состоит только из одного известного варианта сплайсинга с тремя экзонами (1-117, 118-271 и 272-1288 п.н.) и двумя интронами . Расположение соединений находится на 30aa [G] и 81aa [M].

Сплайсинг гена CXorf66

Было обнаружено, что CXorf66 имеет только один сайт полиаденилирования .

Протеин

Сочинение

Имея 57 серинов и 42 лизина, белок CXorf66 богат серином и лизином . CXorf66 имеет молекулярную массу 39,9 кдаль и изоэлектрическую точку 9,89.

Домены

Белок CXorf66 имеет предсказанный сигнальный пептид из 1-19аа, топологический домен из 20-47аа, трансмембранный домен из 48-68аа и второй топологический домен из 69-361аа. Предполагается, что сайт расщепления сигнального пептида находится между 17-18 аминокислотами. После анализа состава белка (богатый серином и лизином) и посттрансляционных модификаций (высокий уровень фосфорилирования) было предсказано, что первый топологический домен [20-47aa] является внеклеточным , а топологический домен [69-361aa] является цитоплазматическим. . Визуальное изображение можно увидеть на Рисунке II .

Рисунок I. Кандидаты в сайты фосфорилирования в белке CXorf66 человека.
Рисунок II. SOSUI Прогнозирование трансмембранной топологии белка CXorf66

В белке CXorf66 человека были обнаружены три повторяющихся мотива DKPV [31-34 и 204-207aa], SEAK [97-100 и 287-290aa] и PKRS [161-164 и 245-248aa]. Эти повторы сохраняются у других приматов, таких как Gorilla gorilla gorilla и Macaca mulatta , но отсутствуют у других млекопитающих.

SNP

Существует один естественный вариант популяции (частота 0,436) на 233aa от пролина до лейцина в белке CXorf66, причем пролин является предковой кодируемой аминокислотой. Никаких эффектов с этой миссенс-мутацией не наблюдалось .

Взаимодействующие белки

Основываясь на предсказанном STRING взаимодействии белков, CXorf66 имеет средний балл за связь с белками, перечисленными на рисунке III . Важно отметить, что все перечисленные белки не определены экспериментально.

Регулирование

Транскрипция

Промоутер

Существует только один известный промотор, предсказанный Genomatix для белка CXorf66 на отрицательной цепи из 139047554-139048298, который имеет длину 745 пар оснований. Когда для созданного промотора CXorf66 использовали поисковое выравнивание BLAT, были получены многочисленные совпадения с высокой идентичностью для различных генов на разных хромосомах. Ниже приведены несколько сгенерированных результатов поиска с наивысшими оценками, которые имеют высокий процент идентичности:

имя Идентификатор гена Гол Диапазон (пп) из 745 Идентичность Хромосома Strand Начало Конец
ZBTB8A 653121 282 656 88,2% 1 - 32994892 32995547
ТЕСК2 10420 263 624 90,3% 1 - 45843093 45843716
TBCK 93627 244 639 91,5% 4 + 107146630 107147268
USP48 84196 241 631 89,0% 1 + 22014725 22015355
ПТПН22 26191 227 281 90,0% 1 - 114365307 114365587
PSPH 5723 220 605 90,6% 7 - 56098319 56098923

Уникально, что TESK2 - это специфическая для семенников протеинкиназа, которая коррелирует с предсказанной тканевой экспрессией CXorf66.

Факторы транскрипции

С помощью Genomatix была создана таблица из 20 основных факторов транскрипции и их сайтов связывания в промоторе CXorf66 (см. Рисунок IV ).

Рисунок IV: Сгенерированный список сайтов связывания факторов транскрипции в промоторе CXorf66

Перевод

CXorf66 имеет две miRNA , hsa-mir-1290 и hsa-miR-4446-5p, которые, как предполагается, связываются с 3 'UTR-областью мРНК.

Посттрансляционные модификации

Сайт N-гликозилирование был предсказан в Expasy NetNGlyc на NGSS [24aa] с вторичным сайтом также возможен при NGTN [21aa]. Используя NetPhos , было предсказано в общей сложности 48 сайтов фосфорилирования (41 серин , 2 треонина и 5 тирозинов ), все из которых расположены после предсказанного трансмембранного домена, что предполагает цитоплазматическую топологию. Используя YinOYang , было предсказано множество сайтов O-GlcNAc . Все, что включает в себя высокий потенциал, происходит после трансмембранной области 48–68 аминокислот. SUMOplot анализ проводил человек разумного белка CXorf66, обнаружил высокую вероятность sumolyation мотива в позиции K241, наряду с низкими мотивами вероятностных на K316 и K186. Поскольку сумоилирование играет роль в различных клеточных процессах, таких как ядерно-цитозольный транспорт и регуляция транскрипции, ожидается, что CXorf66 модифицируется пост-трансляцией белка SUMO .

Субклеточная локализация

Рисунок V. Сигналы ядерной локализации CXorf66 в гомологах

При использовании PSORT II имеется сигнал ядерной локализации PYKKKHL на 268aa. Можно видеть, что этот сигнал сохраняется у других видов приматов; однако не присутствует у других млекопитающих. В дополнение к этому, согласно SAPS kNN-Prediction, разработанной SDSC Biology Workbench, белок CXorf66 для человека и гомолог мыши с вероятностью 47,8% окажутся в ядерной области клетки. Однако для более отдаленных гомологов, таких как Bos taurus, которые не имеют сигналов ядерной локализации, CXorf66 с вероятностью 34,8% попадет во внеклеточную, включая область клеточной стенки, или области плазматической мембраны. Для того, чтобы просмотреть несколько гомологи и их сигналы ядерной локализации, см Рисунок V .

Гомология

CXorf66 не имеет известных паралогов у людей; однако CXorf66 имеет консервативные гомологи во всем царстве млекопитающих . Высоко консервативен у приматов, заметная быстрая эволюция была отмечена для CXorf66, см. Рис. VI , что объясняет большее количество ортологов у млекопитающих, чем у беспозвоночных, птиц и рептилий.

Рисунок VI. Расхождение гомологов белков CXorf66
CXorf66 белок Виды Дата расхождения (MYA) инвентарный номер NCBI обложка запроса Значение E Идентичность
Гомолог CXorf66 Шимпанзе (Pan troglodytes) 6.3 XP_001139133.1 100% 0 98%
Гомолог CXorf66 Горилла (Gorilla gorilla gorilla) 8,8 XP_004065002.1 100% 0 98%
LOC631784 изоформа X1 Мышь (Mus musculus) 92,3 XP_006528296.1 98% 2E-41 34%
CXorf66-подобная изоформа X1 Крыса (Rattus norvegicus) 92,3 XP_001068529.2 84% 6E-32 32%
Гомолог CXorf66 Корова (Bos taurus) 94,2 XP_005200949.1 96% 2.00E-46 35%
Гомолог CXorf66 Белый носорог (Ceratotherium simum simum) 94,2 XP_004441715.1 100% 8.00E-86 48%
Гомолог CXorf66 Лошадь (Equus caallus) 94,2 XP_005614614.1 96% 8.00E-58 44%
Средний полипептид нейрофиламента Зебровый зяблик (Taeniopygia guttata) 296 XP_002197538.1 44% 2.00E-08 30%
Триадиноподобный, частичный Аллигатор (Alligator mississippiensis) 296 XP_006271227.1 53% 2.00E-12 23%
LOC590028 Морской еж (Strongylocentrotus purpuratus) 742,9 XP_794743.3 45% 2.00E-05 35,40%
Альфа-L-фукозидаза Стрептококковый митит 2535,8 WP_001083113.1 47% 7.00E-38 22%

Выражение

Согласно данным Unigene's EST cDNA Tissue Abundance display и Protein Atlas, CXorf66 имеет умеренно высокие уровни экспрессии в семенниках, в дополнение к более высоким уровням экспрессии в тканях плода по сравнению с другими стадиями развития. CXorf66 белок также имеет заметное присутствие низкой в обеих контрольной эндометрий тотальной РНК и эндометриоза тотальной РНК. Считается, что CXorf66 имеет заметное присутствие в плазме и тромбоцитах . Основываясь на данных PaxDb, CXorf66 оказался в первых 5% одного исследования плазмы человека и в 25% других исследований, проведенных с тромбоцитами человека. В дополнение к этому, было обнаружено заметное присутствие 60–100% белка CXorf66 как в ткани перегородки при нормальной кардиомиопатии, так и в ткани перегородки при дилатационной кардиомиопатии . Кроме того, CXorf66 содержит ~ 75% белка в мононуклеарных клетках периферической крови .

Данные по тканевой экспрессии Unigene EST для белка CXorf66 человека
Генные карты предсказали тканевую экспрессию человеческого белка CXorf66

Рекомендации

внешние ссылки