Большой расчет: зачем генетике информатика
Корреспонденты журнала «Нау. Путеводитель по науке в Москве» побывали в лаборатории системной биологии и вычислительной техники ИОГен РАН и познакомились с ее руководителем — Всеволодом Макеевым — и аспирантом лаборатории — Ильей Воронцовым. Мы поговорили о том, чем занимается биоинформатика, для чего генетике нужны большие данные и что нужно изучать, чтобы работать в этой области.
Всеволод Юрьевич Макеев
специалист в области системной биологии, вычислительной генетики и биоинформатики, руководитель лаборатории системной биологии и вычислительной техники ИОГен РАН, член-корреспондент РАН
Илья Воронцов
аспирант лаборатории системной биологии и вычислительной техники ИОГен РАН, научные интересы — регуляция генов
Большие данные живой природы

Что такое живая природа? Простыми словами это все, что отличается способностью расти, дышать, питаться, развиваться. Но стоит только задуматься, попросить себя перечислить примеры, как в сознании сразу возникают десятки образов. Можно точно сказать, что в живой природе самое важное — разнообразие: миллионы видов, разные процессы, которые происходят в живых организмах. Именно поэтому человек, ученый издавна пытался классифицировать, разобрать по полочкам всю существующую, новую, появляющуюся информацию в живой природе, найти закономерность ее видов, процессов,


он хотел свести все к минимуму, систематизировать, найти логику этого многообразия. Так и появились законы классической биологии. Однако существующие законы, теории, правила постепенно расширяются, появляются новые, растет число видов, классов, что объясняется продолжающимся ростом новых объектов живой природы, о которых говорится в теории прогрессивной эволюции. Она гласит, что с течением времени количество разных биологических объектов растет – они становятся сложнее, разнообразнее, интереснее.
Для чего генетике нужна информатика

Биоинформатика дает нам возможность собрать много информации и дать компьютеру ее проанализировать. Компьютеры очень хорошо работают с большим количеством однородных данных. Например, на молекулярном уровне: как устроена наследственная информация? В разных организмах разное количество клеток: в червяке их, например, 1000, в человеке — под несколько триллионов.
Но в каждой клетке есть одинаковая молекула, которая несет наследственную информацию.


При этом все клетки делают разные вещи: одни переносят кислород в крови, другие собирают из кальция кристаллы и делают кости, третьи передают электрические импульсы и формируют нейроны, которые дают нам возможность думать. У них разные свойства, разнообразные способности, и наша задача — понять, что у клеток сходное, а что разное. И именно компьютер может собрать и проанализировать данные, чтобы дать ответ. Потому что он умеет хорошо анализировать очень большие данные, а человек — нет.
Почему компьютер, а не человек

Человек устроен таким образом, что он строит предположения и использует небольшое количество данных. Например, человек считает: «Если температура тела высокая — значит, я заболел, если нормальная, то здоров». Кто-то может считать иначе: «Температура не важна, важно, чтобы глаза блестели». У человека, как правило, есть очень небольшое количество идей, которые, как ему кажется, могут управлять ситуацией, в которой он находится. Он не может одновременно учитывать все признаки: температуру, пульс, скорость дыхания, влажность кожи.


Используя очень большие данные, можно понять причинно-следственные связи: например, у человека возникает диабет. Статистика показывает, что обычно это происходит после вирусных инфекций. Используя большие данные, мы видим, что, чтобы диабет начал развиваться, нужна встряска. Но эта связь не была очевидна, пока медицина не получила статистические данные.
Откуда у людей голубые глаза?

В генетике важно все. В каждой клетке нашего тела содержится инструкция о том, как, что и когда делать. Любое изменение будет иметь последствия. Большая часть наследственной информации сосредоточена в хромосомах — именно они хранят ее, передают и отвечают за выполнение действий. Например, если на 15-й хромосоме есть буква G, то с вероятностью 99 % у вас будут голубые глаза. А если в этом месте будет другая буква, то глаза могут быть всех остальных цветов, скорее всего, карие.


Казалось бы, изменилась одна буква, а последствия вышли довольно ощутимые.
Голубые глаза — это результат мутации гена. Из-за нее у носителей гена в радужной оболочке глаза снижена выработка меланина — пигмента, который отвечает за цвет глаз. Эта мутация возникла всего 6–10 тыс. лет назад, по меркам истории человечества — совсем недавно, в эпоху неолита. Это значит, что голубые глаза появились у людей, которые не просто освоили земледелие и скотоводство, но уже научились делать посуду и орудия труда

Образование и карьера

Чтобы учиться и работать в области биоинформатики, нужно понимать, что все школьные предметы взаимосвязаны.
В первую очередь нужно обратить внимание на биологию, математику. Чтобы разбираться в биологии, полезно знать химию. В качестве естественно-научного предмета, в котором есть логика, связанная с естественно-научными явлениями, не помешает знать физику. Кафедра биоинформатики в МФТИ на факультете биологической и медицинской физики была создана в 2013-м. Первые группы были маленькие — шесть или семь человек. Сейчас уже больше: в 2020 году взяли 16 студентов.
В Высшей школе экономики есть магистратура по этому направлению. Специалисты по биоинформатике могут работать в различных областях: кто-то остается в науке, некоторые специалисты уходят в инженерные области. Многие наши выпускники (МФТИ. —Прим. ред.) работают в «Яндексе» и Сбербанке, в компьютерных фирмах. Специалистов ждут на работу фармацевтические компании. Знания пригодятся там, где нужно обрабатывать статистику и работать с большими данными.