Основы биоинформатики

Современная биология имеет дело с колоссальными объемами данных.  Часто обработать их вручную просто невозможно, поэтому многие биологические задачи решаются вычислительными методами. Не будем далеко ходить: молекула ДНК настолько мала, что разглядеть ее под световым микроскопом нельзя. А если и можно (под электронным), всё равно визуальное изучение не поможет решить всех задач.

ДНК человека состоит из трех миллиардов нуклеотидов – чтобы вручную проанализировать их все и найти нужный участок, не хватит и целой жизни. Ну, может и хватит – одной жизни на анализ одной молекулы – но это слишком долго, дорого и малопродуктивно, так что геном анализируют при помощи компьютеров и вычислений.

Биоинформатикаэто и есть весь набор компьютерных методов для анализа биологических данных: прочитанных структур ДНК и белков, микрофотографий, сигналов, баз данных с результатами экспериментов и т. д.

Биоинформа́тикамеждисциплинарная область, объединяющая общую биологию, молекулярную биологию, кибернетику, генетику, химию, компьютерные науки, математику и статистику.

Биоинформатику считают областью внутри вычислительной биологии, которая главным образом сфокусирована на статистической обработке биологических данных. Различия в подходе с разных сторон: биоинформатики — это биологи, специализирующиеся на использовании вычислительных систем и инструментов для решения биологических задач, а вычислительные биологи — это специалисты по компьютерным наукам, математики, статистики и инженеры, разрабатывающие инструменты для таких расчётов.

В биоинформатике используются методы прикладной математики, статистики и информатики.

Биоинформатика используется в биохимии, биофизике, экологии и в других областях.

Наиболее часто используемыми инструментами и технологиями в этой области являются языки программирования Python, R, Java, C#, C++; язык разметки — XML; язык структурированных запросов к базам данных — SQL; программно-аппаратная архитектура параллельных вычислений — CUDA; пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете — MATLAB, и электронные таблицы.

Что происходит в сфере биоинформатики сегодня в России?

Российский рынок геномики и биоинформатики сейчас только формируется, и его объемы пока невелики. Однако по темпам роста этот рынок практически не отстает от американского. Помимо падения цен на геномное секвенирование (это одна из ключевых технологий, применяемых для работы с геномом), значительную роль здесь играет и популяризация направления — у лабораторий, проводящих генетические исследования, клиентов становится больше с каждым днем.

На сегодняшний день основное направление развития российского биотеха — работа с будущими родителями. Сюда можно отнести генетические консультации при планировании беременности, исследование эмбрионов до проведения ЭКО, диагностику плода и обследование новорожденных на наличие наследственных заболеваний по новейшим методикам.

Второе активно развивающееся направление — генетическая диагностика раковых опухолей.

Проанализировав ДНК клеток опухоли, врачи могут подобрать лечение, которое с наибольшей вероятностью позволит победить болезнь.

Компаний, работающих в этих областях, становится в России всё больше. В основном они базируются в Москве, Санкт-Петербурге и Новосибирске.