
Учёные уже полностью дизассемблировали H1N1 и занесли его в
вирусную базу NCBI Influenza Virus Resource. Там всё задокументировано в подробностях. Например, образец A/Italy/49/2009(H1N1) был обнаружен в носу 26-летней женщины, вернувшейся из Италии в США. Вот первые 120 бит его
генетического кода.
atgaaggcaa tactagtagt tctgctatat acatttgcaa ccgcaaatgc agacacatta
Сколько бит убьёт человека?
По приблизительным подсчётам, общий размер исходников H1N1 составляет 26 022 бит, а если исключить служебные стоп-сигналы (указывают на окончание каждой белковой последовательности), то исполняемый код состоит примерно из 25 054 бит. Это число является приблизительным ещё и потому, что в вирусе присутствует механизм генерации избыточного мусора для маскировки от антивирусов.
Итак, получается около 25 килобит или 3,2 килобайта. Таков объём кода для программы, имеющей ненулевые шансы убить человека. H1N1 написан гораздо эффективнее, чем компьютерный вирус MyDoom размером около 22 КБ.
Очень унизительно, что меня могут убить всего 3,2 КБ генетических данных. Впрочем, в 850 МБ человеческого генома по любому должны быть дыры для парочки эксплойтов.
Для не знакомых с молекулярной биологией короткий ликбез. Символы из вышеприведённого кода называются нуклеотидами. Они бывают четырёх типов (A [T/U] G C), то есть каждый символ содержит два бита.
Исходный код живого организма (последовательность нуклеотидов ДНК) загружается в оперативную память (транслируется последовательность нуклеотидов РНК один к одному, разве что T заменяется на U), компилируется в виде кодирующих тринуклеотидов (кодонов) и запускается на исполнение (по кодонам происходит синтез аминокислот конкретного организма).
Когда программу РНК запускают на исполнение, начинается синтез аминокислот. Они создаются по одной аминокислоте на каждые три нуклеотида. Вышеприведённый генетический код можно представить в виде такой последовательности базовых аминокислот.
MKAILVVLLYTFATANADTL
Каждый символ в этой записи (кодон) эквивалентен шести битам информации (три двухбитных нуклеотида). M — это метионин, K — лизин, A — аланин и т.д. (см.
таблицу аминокислот).
Интересно, что генетический код любого живого организма начинается со стартового кодона М. В природе это обязательный маркер валидного кода.
Поскольку ДНК и РНК — это практически одно и тоже, то в биологии принято любой генетический код записывать в виде последовательности нуклеотидов ДНК, даже если в природе этот код распространяется непосредственно готовый к запуску, то есть в виде РНК, как вирус гриппа. Это очень важная деталь, о которой мы поговорим ниже.
Однако, вернёмся к основной теме топика. Приведённый код — это начало гена HA, который программирует производство белка
гемагглютинина. В нашем образце присутствует гемагглютинин подтипа H1, что и отражено в названии вируса H1N1.
Гемагглютинин — это интерфейс для присоединения к клетке-хозяину. Если представить живые существа в виде компьютеров, то каждая функциональная группа клеток в организме выходит на связь с внешним миров через определённый порт. Например, порт 21 предназначен конкретно для протокола FTP. В вирусе гриппа порт H1 указывает на конкретную область человеческого тела (горло), к которой можно присоединиться. Любопытно, что тот же самый H1 подходит для присоединения к кишечному тракту птиц. Поэтому один и тот же вирус H1N1 способен атаковать и респираторную систему людей, и пищеварительную систему птиц.
Для сравнения, другой порт H5 (часть вируса H5N1, известного как «птичий грипп»), нацелен на атаку лёгочной ткани, что приводит к пневмонии, поэтому H5N1 намного опаснее и вызывает гораздо больше смертей. Поражение через порт H1 совсем не так страшно: человек просто начинает много сморкаться, но лёгкие не страдают.
Учёные до сих пор продолжают изучать порт H5. Уже известно, что у некоторых людей-мутантов лёгкие не способны соединяться с вирусом по этому порту. У кого есть такая мутация в генах, имеют большие шансы безболезненно пережить эпидемию H5N1, если она вдруг начнётся.
Взлом свиного гриппа
В журнале Nature опубликована
фантастическая статья, где собрана вся информация о текущей структуре вируса H1N1, его сравнение с другими штаммами гриппа. Автор подробно рассказывает, чем у них отличается патогенная компонента, то есть именно та часть, которая убивает человека.
Обладая этой информацией, я теперь точно знаю, как нужно модифицировать исходники H1N1, чтобы сделать его более смертоносным.
В статье написано, что ген PB2 с глутаминовой кислотой в 627-ой позиции обладает слабой патогенностью (не очень смертелен). Однако, вариант с лизином на той же позиции более смертелен. Хорошо, найдём это место в исходниках H1N1. Информация из базы данных:
601 QQMRDVLGTFDTVQIIKLLP
621 FAAAPPEQSRMQFSSLTVNV
641 RGSGLRILVRGNSPVFNYNK
Как видим, на 627-й позиции кода вируса стоит символ “E”, это и есть кодон для глутаминовой кислоты. Слава богу, что здесь именно он, поэтому от H1N1 умирает не так много народу, как могло бы.
Если раскодировать кодоны в исходный код ДНК, то мы получим:
621 F A A A P P E Q S R
1861 tttgctgctg ctccaccaga acagagtagg
Как видно, глутаминовой кислоте соответствует последовательность нуклеатидов “GAA”. Чтобы модифицировать геном и сделать вирус более смертельным, нам нужно всего лишь заменить “GAA” одним из двух вариантов лизина (”K”), то есть “AAA” или “AAG”. Таким образом, более смертоносный вариант H1N1 будет иметь такой вид:
621 F A A A P P K Q S R
1861 tttgctgctg ctccaccaaa acagagtagg
Вот так. Поменять всего два бита — и практически безвредный H1N1 превращается в более смертоносный вариант.
Теоретически, я могу использовать вполне доступные технологии для синтеза нового вируса. Для начала я могу обратиться в одну из коммерческих компаний, которая занимается синтезом ДНК (например,
Mr. Gene) и заказать конкретную последовательность ДНК дешевле чем за $1000. Правда, нужно учесть, что фирма Mr. Gene применяет процедуру скрининга для выявления потенциально опасного биологического кода. Сложно сказать, среагируют ли их фильтры на этот модифицированный вариант гена. Если так, то можно заняться производством нового вируса и без их помощи. Для этого нам нужно достать образцы обычного H1N1 и применить опять же хорошо известные и стандартные техники для контролируемой мутации генома, чтобы заменить нужный нуклеотид.
Кстати, в журнале Nature есть даже ссылка на
научную статью, в которой подробно рассказывается, как самостоятельно сделать вирус гриппа А [Neumann, G. et al Generation of influenza A viruses entirely from cloned cDNA. Proc. Natl Acad. Sci. USA 96, 9345-9350 (1999)]. Тоже интересное чтиво.
Находчивый грипп
Перед тем как модифицировать вирус H1N1, давайте подумаем. Матушка-природа сделала гениальную работу, упаковав смертельный код всего в 3,2 КБ, да так, что мы не можем с ним справиться. Видимо, она не так глупа. Наш маленький хак не станет для неё откровением. Может быть, грипп способен поменять пару бит в своём коде самостоятельно?
Краткий ответ — да.
Вирус гриппа действительно способен на такие мутации. Дело в том, что после копирования молекулы ДНК запускается белок для проверки «контрольной суммы». Он проверяет, что копия идентична оригиналу. Но проблема в том, что вирус гриппа основан на РНК с проприетарным механизмом копирования. Он вообще не запускает проверку «контрольной суммы». В результате уровень ошибок копирования чрезвычайно высок: примерно одна на 10 000 базовых пар. И это при том, что весь геном гриппа состоит из 13 000 базовых пар. То есть, грубо округляя, в каждой новой копии гриппа присутствует одна случайная мутация.
Некоторые из этих мутаций не имеют никакого значения, другие делают вирус безвредным, но некоторые очень редкие мутации могут сделать вирус более опасным. Поскольку вирусы размножаются и распространяются с астрономической скоростью, очень высоки шансы на то, что наш маленький хак произойдёт естественным образом.
Это одна из причин, я думаю, почему медицинские организации настолько озабочены распространением H1N1: у нас нет защиты от него, и хотя он пока не очень опасен, но через пару мутаций могут начаться действительно серьёзные проблемы.
В настоящее время патогенность H1N1 примерно такая же, как у обычного гриппа. В июне на 21 449 подтверждённых случаев заболевания было всего 87 смертей, то есть смертность составляет 0,4%. Для сравнения, у «нормального» гриппа смертность <0,1%, у испанской разновидности в 1918 году смертность была 2,5%, а у разновидности H5N1 («птичий» грипп) смертность превышает 50% (!), но он, к счастью, практически не передаётся от человека к человеку.
Заразившись H1N1 сегодня, вы можете получите ценный бонус практически безопасной выработки иммунитета, так что когда вирус мутирует и вернётся снова, вы уже будете под защитой.
Ещё одна проблема с системой копирования вируса гриппа заключается в том, что он хранит свой генетический код в восьми участках РНК, а не в одной неделимой цепочке. Из-за этого механизм репликации становится ещё более непредсказуемым. Если вам «повезло» заразиться двумя разными вирусами гриппа, то в вашем организме может появиться принципиально новый штамм гриппа, потому что в поражённых клетках вирусы гриппа обмениваются кодом в хаотическом порядке.
Вот почему дополнительная опасность H1N1 заключается в его уникальном свойстве, которое называют «тройной реассортацией». Он содержит фрагменты и человеческого, и свиного, и птичьего гриппа, и может свободно обмениваться кодом со своими «родственниками» из любого вида животных.
комментарии (177)
Хотя лучше наоборот, посмотрим, как в генах информация хранится, какими оптимизациями кода пользуется пририода, ну и узнаем, правда ли, что все на Лиспе с Перлом написано xkcd.com/224/ :)
Спасибо за статью!
Это одно из направлений разработок альтернатив кремниевым процессорам.
Причем с куда большей вероятностью.
Или полбита урана.
Забавная статья, но вообще, для нашего мира проще рассуждать о том, что в состоянии не убить человека.
Поэтому, в рамках предложенной автором темы (игра на сходстве генетического и программного кода) или просто так, было бы интересно почитать про замкнутые искусственные экосферы. Господа биологи, может кто осилит предложенную тематику?
Т.е. интересно, сколько и каких «тварей по паре» нужно загрузить на ковчег, чтобы энный период времени там могла существовать устойчивая популяция особей нашего биологического вида? Если будет предложено несколько вариантов, их уже можно будет померить на предмет длин генетических цепочек :)
Интересно также, применяются ли уже сейчас суперкомпьютеры для расчёта таких экосфер. С одной стороны — почему бы нет, наверняка есть попытки. А с другой — хотелось бы конкретики.
Псевдонаучно, иногда наивно но вот примерно про «замкнутые искусственные экосферы»
Правда с уклоном в социологию, а не в биологию
Но сам набор фактов интересен, может стоило продолжить хотя бы ради этого. Спасибо за наводку, попробую вернуться к чтению Вербера, стараясь не заморачиваться его толкованиями и обращая внимание лишь на факты, за альтернативным взглядом на которые можно и другие источники покопать.
и под ie6 верстать…
Некоторые фразы просто монументальны. Например: «РНК с проприетарным механизмом копирования» или «Обладая этой информацией, я теперь точно знаю, как нужно модифицировать исходники H1N1, чтобы сделать его более смертоносным»
Забавно было почитать :)
без работы не останемся :))
Спасибо автору за отличную аналогию с программированием, очень доступно и интересно во всяком случаи для IT-шников.
приятно узнавать о том, что уже должно быть изучено)
MZ…
E
Выходит Баллмер знал наверняка!
FTP — 21.
создать вирус(Autorun?!...) и зазомбировать людей =) вот это ботнет будет!!!
«Заразившись H1N1 сегодня, вы получите гарантированное здоровье завтра» :)
И как вообще можно вычислить «потенциально опасные последовательности» в ДНК? (эвристические алгоритмы?) КАК ЭтО работаЕт? O_o
Вот где-то так, если очень упрощённо.
Насчёт потенциальных опасностей — в основном на основании уже известных примеров кода и его функций. Благо их в окружающем мире полно.
Чтобы фабрика стала опасной, она должна выпускать что-то другое, например:
— мины — белки-токсины: попадая на другую фабрику рушат на ней производственный процесс.
— роботы-рейдеры — вирусы: захватывают фабрику, собирают себе подобных и, как правило, взрывают фабрику вырываясь на свободу.
Этот выпуск может быть налажен за счет подмены подпрограмм РНК, либо добавление в полную программу соответствующего кода.
Бактериальная инфекция — это суть фабрики по собственному воспроизводству и производству мин. С ними возиться гораздо проще, чем с вирусней.
И ещё очень интересно, почему в каком-то конкретном месте создаётся нужная клетка — в почках клетки почек, например, клетки эпидермиса на поверхности организма и т.п.?
Хотя если есть клетка почек, то из неё только они и будут получаться скорее всего. Тогда вопросы — когда (почему?) орган останавливает свой рост, и откуда берутся начальные клетки для роста органов?
Кстати, оба ответа верны. Когда клетка делится — в новой сразу есть все необходимые для чтения и «выполнения» ДНК элементы. Но при этом вся эта информация зашифрована и в ДНК.
Что касается начальных клеток — есть такое понятие, как «стволовая клетка», которая может превратиться в любую ткань, тем самым дав начало новому органу/части тела. Такие клетки есть в зародышах любого живого существа, с них начинается формирование организма. Потом они большей частью исчезают, поэтому отрастить новую руку или почку мы уже не можем. Это похоже на инсталляцию ОС, установочные файлы после развертывания обычно удаляются.
Останавливается развитие органа по команде того же кода ДНК. По сути, в нём находится описание всего организма, процессов его развития и функционирования, начиная с первого деления яйцеклетки и до смерти. Иногда происходит повреждение генного материала, выливающееся в бесконтрольный и бессмысленный рост клеточной массы, это мы называем раком. В случае программы это будет утечка памяти, бесконечный цикл или memory cannot be read — в результате «падение» отдельно взятого процесса или всей системы.
Про остановку логично, но сам процесс непонятный. При формировании организма/органов есть центры управления, которые выделяют некоторую квоту на деление клеток, а потом «сворачивают проект»? И деление происходит прямо в этих клетках, раздувая орган? Ведь у клеток нет физической связи, и понять, где находится клетка, она не может.
Или деление идёт повсюду, а управляется всё нервной системой? И тогда у клеток должен быть интерфейс управления. «Горшочек, не вари!» ;)
Очень интересует всё развитие организма, управление процессами, когда это не пара клеток, а уже целый Вавилон.
Нет, централизованного интерфейса на этом уровне не существует. Но клетки могут «общаться» друг с другом, ферменты, электролитический баланс и так далее. Способы узнать, что находится в окружающем пространстве, у клетки есть.
А вот когда организм переходит в более-менее структурированную фазу — управление работает уже по-другому. В основном на базе гормонов, пептидов и нервных импульсов. Тут уже за управление отвечают нервные узлы, мозг головной и спинной.
Кто вы по образованию? (-:
Возможно, опечатка? 25 порт — это обычно SMTP.
задумался… было бы интересно написать статью или даже просто сводную таблицу, сравнивающую компьютерные термы програмирования и аналоги в молекулярной биологии
чтобы потом не удивлялись
Разве это так? Я слышал что иммунитет не распространяется на новые штаммы. Поэтому ВОЗ категорически не рекомендует специально заражаться «легким» вирусом, чтобы потом пережить новую мутацию.
А ВОЗ возникает потому, что больше заразившихся = больше мутаций. А, как сказано выше, вирус и так непозволительно приблизился к высоко патогенной форме.
Особенно интересно, как он себя поведет в Юго-восточной Азии. Там куры, люди и свиньи издавна живут под одной крышей.
Через год-два эпидемия будет до 1% летальных исходов.
Любопытно, как бы вылгядел генетический троян :)))
это как антивирусные базы.
а ВИЧ действует так, что заражает как раз эти хранилища. поэтому пока и не могут победить. т.е. представьте, что у касперского будут заражённые антивирусные базы, которые сами могут исполняться.
по схожему пути действует герпес — он заражает ганглии — т.е. нервную систему, куда иммунная система попасть не может. т.е. как антивирус не может лечить, например, биос компьютера.
Почувствовал себя блондинкой.
А если серьезно — вспомнил ассемблер. Точнее дизассемблирование — когда копаться приходится на уровне бит и байт.
Очень интересная статья. Можете продолжить?
Патчат обычно исходный код, потом компилируют и запускают — "как Бэтмэн" могут стать ваши клоны или дети (особенно, если ваш сосед — Бэтмэн :)
Но что-то подсказывает, что оно изначально так и писалось, в машинных кодах.
а вирус гриппа полиморфен, ла
*GenomClass.php
*
* @author архангел Гавриил < gavriil@heaven.god>
* @version 1.0
* @package human
**/
</boyan_mode>
ага, уже были случаи, когда начитавших таких статей подростки собирались группами и пытались заразиться вирусом свиного грипа, чтобы, выздоровев и приобретя имуннитет, не заболеть позже, когда начнётся самая жесть
— сканеры — антитела: прилепляются к соответствующему по сигнатуре обекту. После прилепления на них загорается лампочка и к ним подходят ближайшие антивирусные фабрики (лимфоциты различных типов).
— антивирусные фабрики — лимфоциты всякие: производят сканеры; жрут то, за что зацепились сканеры; окружают территорию (вызывая воспаление), и т.п.
Если сканеры начинают цепляться за дружеские клетки (вызывая тем самым реакцию антивирусной системы) — то возникает аутоиммунное (красная волчанка, из Хауса, например). Строгость этой системы в частности препятствует трансплантации органов и тканей.
Хорошо сказали :)
О базовых парах обычно говорят в контексте двойной спирали ДНК, когда каждый нуклеотид имеет парный себе. Не думаю, что это применимо к рнковым вирусам и не уверен, что стоило здесь делить на два :-)
В организме, понятно дело, никто ни во что не втыкает — оно происходит само. Также как и собираются кораблики в бутылке: насыпается мусор, заливается клей, трясется. Единственно что вилка-розетка притягиваются друг к другу за счет разных электрических зарядов.
А вот «трояны» — исключительно случайность, что, кстати, в статье чётко разжёвано.
По поводу последнего — какова вероятность того, что все процессы в мире сложились бы так, что вы написали это сообщение? Да единица — вы же его написали.
Имхо, либо придерживаться антропного принципа, либо считать, что существуют параллельные вселенные, в которых всё возможно, и тогда не так уж важно, что вероятность возникновения такой вселенной ничтожно мала, может все соседние и пусты.
Прежде чем тупо переносить оценки для равновесной системы на неравновесную и делать из этого «глубокомысленные» выводы, настоятельно рекомендую хотя бы ознакомиться с диссипативными структурами…
См. вики: ru.wikipedia.org/wiki/Вероятность:
Вероятность (вероятностная мера) — мера достоверности случайного события. Оценкой вероятности события может служить частота его наступления в длительной серии независимых повторений случайного эксперимента
_________*______>
* — тут образовалась жизнь.
Перед этим мог пройти любой промежуток времени, поэтому, на образование жизни случайно (а может быть и в разные периоды в нескольких местах независимо друг от друга) было много ресурсов и куча возможностей.
А насчет несуществования — ну так расскажите, сколько конкретно времени прошло до появления жизни? Через сколько все закончится.
Да и так, если заморачиваться, то и времени, вообще-то не существует. Это тоже абстракция)
Поправлю вашу фразу — «Перед этим мог пройти любой конечный промежуток времени» — и все встает на свои места.
Сколько конкретно времени прошло до появления жизни — не столь важно. То, что мы не можем назвать точную цифру — не значит, что до появления жизни прошло бесконечно много времени, не так ли?
Речь о том, что на «разработку» жизни было бесконечное количество времени. И в какой-то точке этого бесконечного времени она появилась.
Bootstrap отсутствует, нужна другая клетка ( материнская ) с предустановленными пакетами.
— получение из общего репозитория (ДНК) кода соответствующего сборке продукта (РНК) — механизм транскрипции — найти в инете схему сборки шамблера и распечатать ее
— код сборки на рибосоме становится предварительным продуктом — трансляция — вырезать распечатку из бумаги
— обработка продукта напильником (различными белками), а также сборка — согнуть, сложить, склеить, покрасить.
Реально — последний этап самый сложный. Поменять нуклеотид или даже аминокислоту — достаточно легко, но гарантировать конечную корректную сборку — практически невозможно. Поэтому в инфо-биологии очень перспективно направление 3д-моделинга белков.
Не хочу никого обидеть, но уровень образования упал просто катастрофически :-/
В том смысле, что популяции штаммов вирусов не эволюционируют таким путём, чтобы информация о выгоде «не убивай людей, а то негде будет жить» распространялась через поколения. Если бы распространялась, то давно бы уже все биологические виды превратились в симбиотов, а не травили бы друг друга :)
Подобное высказывание слышал про клещей, от которых прививки делают. Мол, ошибка эволюции, такой маленький, и такой токсичный, убивает носителя и в результате погибает сам. Легко объявить ошибкой то, что неразумно на наш взгляд. Но не всё на свете подчиняется разуму, особенно нашему :)
вирус об этом не знает, но получается, что больший ход дается тому вирусу, с которым люди пошли (и успели дойти) на работу и заразили кого-то.
нуклеотид в РНК или пару в составе ДНК правильнее назвать символом.
А кодон будет словом.
О размерах: вирусы бывают «упакованными», когда ген стартует со смещением относительно другого. То есть одна цепочка РНК может кодировать 2 разных гена = белка.
PS. Мне понравилась строчка в описании гена вируса
/host=«human»
Все уже придумано до нас! :)
Блог очень интересный, надеюсь частота появления новых топиков увеличится.
А по теме, сейчас как раз нобелевскую премию дали за исследования в области деления клетки, старения. Там как раз про этот механизм.
www.bunniestudios.com/blog/?p=353
Жаль не указали ссылку на оригинал.
А ещё мне на ум пришла аналогия с геномом и машиной Тьюринга. Как вам «проблема разрешимости организмов»?
>применяет процедуру скрининга для выявления потенциально опасного >биологического кода.
Вот они антивирусы в прямом смысле этого слова. Интересно они там за сигнатурами ловят или еще какая-та эвристика.
Без них — ну вообще никак.
Дезоксирибонуклеи́новая кислота́ (ДНК) — один из двух типов нуклеиновых кислот, обеспечивающих хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования живых организмов
Кто знает может в этом направлении и пойдет наука…
Это феерическая статья.
Если соберетесь делать какое-то исследование по теме, могу предоставить ресурсы и вычислительные мощности.
Многое, конечно, зависит от способа применения и от природы задач, который фреймворк будет решать.
>atgaaggcaa tactagtagt tctgctatat acatttgcaa ccgcaaatgc agacacatta
Самое начало статьи и такая грубая ошибка. Бит как известно может иметь только два значение 0 и 1, или допусти а и б. А тут целых 4 (a,t,g,c). Может имело смысл не проводить аналогии, а просто написать «первые 120 знаков».
комментарий:
/* А еti gеnу nаdо bу ubrаt nаfig. Аrсhаngеl Gаvriil */
правильнее написать начитается синтез белка или полипептида
Исполняемый код любого exe-шника начинается со стартового кодона MZ
Возможно, я буду еще жив, когда появится биопрограммирование.
P.S. Жаль, что уже нельзя поставить за статью плюс :(
Не факт. Смертность увеличивается, а мертвые плохо распространяют грипп.
Так что можно смертность еще уменьшить, чтобы увеличить распространяемость, тогда общее количество умерших будет больше.