5 июня 2008 г.

На стыке генетики и информатики

Кишечная палочка Escherichia coli — излюбленный объект генных инженеров, давно используемый в качестве универсальной биохимической фабрики. Геном различных «пород» (штаммов) E. coli содержит 4,6 миллионов пар нуклеотидов и 4377 генов. В переводе на байты это составит около 1,11 Мб. И заметьте, что палочка не просто хранит 1 Мб информации. А хранит/читает/копирует/изменяет/выполняет заложенную в её геноме информацию. (http://users.rcn.com/jkimball.ma.ultranet/BiologyPages/G/GenomeSizes.html)



Теперь посмотрим, что происходи у человека. Согласно http://en.wikipedia.org/wiki/Chromosome (07.07.2007), у человека приходится 984 гена на хромосому, 128,3 миллиона оснований на хромосому, 132,4 тысяч оснований на ген. Прочитан геном на 92,70%.



Так как оснований в ДНК всего 4 (А, Г, Т, Ц). То одно основание несет 2 бита информации (2^2=4). А весь геном порядка 769957500 байт (3079830000x2/8). Что приблизительно равно 734,3 Мб информации. И это в каждой клетке организма в двух копиях (2n). Генеративные клетки (например, сперматозоид) несут только по одной копии генома (1n). И все равно 734,3 Мб информации на сперматозоид – тоже много.



Здесь не учтен объем генетической информации митохондрий, теломер, центромер, гетерохроматиновых участков хромосом. Так что общий объём информации в каждой клетке человека порядка 2 Гб.


Неизвестно, как ещё сюда добавить негеномную ненаследуемую информацию человека – его память.



Если принять средний вес клетки за 5x10^-12 кг, то информации на 1 кг веса человека придется не менее: 370 ЭБ (400000000000 ГБ). Подсчет очень не точен, потому что числа астрономические, отсюда и астрономическая погрешность. Но все равно компьютерным носителям ещё очень далеко до таких масштабов миниатюризации. Куда там жестким дискам весом 800 г и объемом в 500 ГБ (1:640 000 000 к человеческой ткани) или microSD флэш-карточкам весом 0,3 г и объемом в 4 ГБ (1:30 000 000).



Google дает пользователям по 6 ГБ места. Если каждый землянин (6,6x10^9) воспользуется этим местом, то всего получится не более 37 ЭБ (1:10 кг человеческой ткани, 1:700 человека).



Думаю теперь ясен вывод, к которому я веду. Нынешние компьютерные, космические технологии лишь бледная тень живой природы.



P.S. Правда, забыл упомянуть, что смысловых (транскрибируемых) участков в ДНК человека всего около 2%. Так что образ генотипа человека занимает не 1 Гб, а порядка 50 Мб. :)

P.P.S. Геном человека и шимпанзе (наиболее человекоподобной обезьяны) совпадает на 98,8%. Глядя на такой высокий уровень подобия можно только отметить, что мы произошли не от обезьян в общем или шимпанзе в частности, а от общего предка.

Комментариев нет: