Пользователь
0,0
рейтинг
17 августа 2012 в 14:17

Разное → Розалинд — платформа для изучения биоинформатики

DNA

Широко известны сайты для решения олимпиадных задач по программированию, такие, как, например, TopCoder и Codeforces, а также сборники математических задач-головоломок, например, Project Euler. За последний год произошёл бум онлайн образования: возникли стартапы Coursera и Udacity, предоставляющие онлайн курсы от топовых университетов США… но для тех, кто хочет изучить биоинформатику, пока ничего нет.

Розалинд — проект, разрабатываемый в Санкт-Петербуге и University of California, San Diego с мая 2012 года, как раз заполняет эту нишу. Это платформа для обучения биоинформатике с помощью решения задач, бесплатная и открытая.

Всё обучение строится вокруг задач, которые и составляют основное содержание сайта:

image

Каждая задача содержит биологическое обоснование и строгую формулировку, достаточную для формального решения. Например, в двенадцатой задаче необходимо из небольших фрагментов ДНК собрать геном. Также там рассказывается, что такое секвенирование и зачем это нужно:

image

Пользователь может решать задачи на любом языке программирования и даже на бумажке, но после скачивания с сайта тестового датасета у него будет лишь пять минут для его обработки. Если ответ неверный, ничего страшного, можно пробовать неограниченное количество раз, но при этом датасет каждый раз генерируется заново.

Не все задачи можно решать сразу, вернее, сразу можно решить только первую. Задачи выстраиваются в граф зависимостей, чтобы процесс обучения был осмысленнее и материал осваивался по порядку. Но если вас больше интересует, например, только сборка геномов (genome assembly), либо выравнивание (sequence alignment), либо вычислительная протеомика (computational proteomics), то можно углубиться в определённом направлении по графу зависимостей и не решать другие задачи. Таким образом, полученные знания будут глубже в выбранной теме.

image

И, конечно, на сайте есть профили, а также зачатки игровой механики: уровни и бейджи.

image

image

Надеюсь, Розалинд будет полезен всем, кто хочет окунуться в этот интереснейший мир биоинформатики или просто изучить что-то новое.

Проект активно развивается, поэтому мы с радостью выслушаем любую критику. В частности, 26 августа в Петербурге пройдёт международная конференция RECOMB Bioinformatics Education, одной из главных тем которой станет Розалинд.

Система уже поддерживает переиспользование задач в своих курсах, так называемые «профессорские аккаунты», благодаря чему мы внедрим Розалинд в образовательный процесс UCSD и Harvey Mudd весной 2013. Для России это не так востребовано, потому что программ по биоинформатике особо-то нигде и нет. Но с Розалинд это становится проще, — может быть, появятся?

Мы постоянно добавляем новые задачи: сейчас их 42 и примерно столько же находятся в черновиках. Недавно появилась возможность принимать и курировать пользовательские идеи для задач, чтобы биоинформатическое сообщество смогло участвовать в процессе создания контента. image

В планах видеозапись лекций по биоинформатике в UCSD и создание нескольких онлайн курсов на основе этого материала.

P.S. Проект назван в честь Розалинд Франклин, чьи исследования привели Уотсона и Крика к открытию спиралевидной структуры ДНК. Розалинд умерла от рака за четыре года до присуждения Нобелевской премии за это открытие, в 37 лет, так как имела наследственную предросположенность и много работала с радиацией.
Николай Вяххи @vyahhi
карма
70,5
рейтинг 0,0
Реклама помогает поддерживать и развивать наши сервисы

Подробнее
Реклама

Самое читаемое Разное

Комментарии (35)

  • +6
    Хорошее вы дело делаете! =)
  • НЛО прилетело и опубликовало эту надпись здесь
    • +2
      В том-то и соль, что не надо быть специалистом! Условие содержит всю необходимую для решения задачи информацию (во всяком случае, очень старается :)).
      • НЛО прилетело и опубликовало эту надпись здесь
        • +1
          Там была огромная работа проведена, но если всё же какие-то определения так себе, то мы тут же получим по ушам через обратную связь.
  • +4
    Граф зависимостей — потрясающая идея! Жаль, что пока не очень популярная :(
    • +5
      Рад, что вам понравилось, мы сами очень довольны этой концепцией!

      // Надо поставить себе напоминалку — на 1-е апреля сделать этот граф циклическим!
  • +1
    Интересно.

    Жду появления чего-то вроде kaggle.com. Это может сильно подхлестнуть интерес к биоинформатике.
  • НЛО прилетело и опубликовало эту надпись здесь
    • +1
      Подняли!
      • НЛО прилетело и опубликовало эту надпись здесь
        • 0
          Ну получилось не очень оперативно, но, надеюсь, больше не будет падать… Оказывается, в пятницу вечером на хабре много активных пользователей :)
  • НЛО прилетело и опубликовало эту надпись здесь
    • +1
      Нет, просто 11 (Failure Array) и 28 (Suffix Array) ещё в процессе доработки, т.к. плохо связаны по смыслу с другими. Мы их вначале опубликовали, а потом решили доработать и временно закрыли.

      Новые задачи постоянно будут добавляться, до конца лета ещё около 10 опубликуем.
  • +4
    Замечательный проект. Имею огромный интерес к биоинформатике и генетике, но всегда боялся начать глубоко изучать эти области из-за полного отсутствия каких либо знаний по химии (и категоричной неспособности оную науку вообще понять). Надеюсь, что ваш проект поможет мне в этом хоть немного.
    И кстати, я думаю, что вашим проектом заинтересуется больше пользователей в России, если вы сделаете русскоязычный вариант сайта. Я конечно понимаю, что сегодня образованному человеку стыдно не знать английский, но раз одной из целей, которую вы себе ставите — популяризация биоинформатики в нашей стране, то перевести этот ресурс на русский не создаст больших трудностей… И еще раз спасибо
  • 0
    Идея хороша, но содержание местами смущает. Например, наугад ткнув в задачу, вижу странные вещи:

    Во-первых, ложное утверждение (в Extra Information):
    A standard mathematical exercise is to verify that every tree must contain at least two leaves.

    Во-вторых, сама задача математически тривиальна и содержит в условии слишком много ненужных данных.
  • +1
    Хоть сейчас бери в качестве задач на собеседования! Как раз в порядке увеличения сложности.
    • НЛО прилетело и опубликовало эту надпись здесь
      • +1
        Тематика задач не причём. Задачи, строго говоря, вообще не про генетику, а про алгоритмы.
    • НЛО прилетело и опубликовало эту надпись здесь
  • +2
    Интересно, а можно ли на базе проекта создавать что-то типа конкурсов/олимпиад для школьников? Первые задачи вполне по силам одолеть старшеклассникам, и, если бы можно было бы делать выборки, ограничивающие набор задач, то, мне кажется, можно было бы сделать хорошую площадку для взращивания биоинформатиков «с младых ногтей»
    • 0
      Можно, это одна из целей проекта. Выборки, ограничивающие набор задач уже можно создавать при наличии профессорского аккаунта (который можно запросить нажав кнопку у себя в профиле).
  • 0
    А на русском языке делать не будете?
    • 0
      В ближайшее время не планировали, но когда-нибудь будем.
      • 0
        Блин, ну как так — рекламируетесь на русскоязычном ресурсе и не имеете русскоязычной версии…
        • 0
          Если не знаете английского языка, то учить биоинформатику будет очень сложно, даже с полностью русифицированным Розалиндом. Все доступные справочные материалы по этой теме, в основном, на английском.

          Лучший способ изучения биоинформатики в таком случае — начать с изучения английского языка.
          • 0
            Ничего, продираться сквозь трудности изучения биоинформатики я готов. Тем более, что Вы заявляете, что на сайте все нужные материалы есть. А вот учить английский — не готов, у меня и без него список «изучить на досуге» очень длинный.

            Так что жаль, что нет русского:(
  • НЛО прилетело и опубликовало эту надпись здесь
    • +1
      Хороший вопорос! Виды надо располжить в лексикографическом порядке, но это как-то прошло мимо условия :) Исправляем, спасибо за feedback!
      • НЛО прилетело и опубликовало эту надпись здесь
      • НЛО прилетело и опубликовало эту надпись здесь
        • +1
          Спасибо за замечание! Поправили генератор датасетов, стояли детские ограничения :)
          Теперь можете проверить алгоритм на данных посложнее.
  • +2
    Шикарно!

    P.S. Узнаю Twitter Bootstrap. :)
  • 0
    Интересно и здорово!
  • 0
    Вы сделали работу за которую не стыдно. Очень впечатляет это действительно круто.
    Но сайт надо обязательно перевести на русский язык.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.