Санкт‒Петребургский Политехнический
Высшая школа прикладной математики и вычислительной физики
Прикладная математика и биоинформатика
Вычислительная биология или биоинформатика основывается на применении методов прикладной математики, машинного обучения и математического моделирования к пониманию биологических систем исключительной сложности и процессов в них протекающих.
Цель этой магистерской программы – дать ключевые знания в области биологии и компьютерных наук, навыки программирования, необходимые для работы с огромным количеством современных биологических данных, а также научить строить математические модели применительно к биологическим задачам.
По окончании этой программы вы сможете продолжить обучение в аспирантуре, стать специалистом‒биоинформатиком или аналитиком больших биомедицинских данных в
компаниях или научно‒исследовательских учреждениях.
10 бюджетных мест
Обучение ведется на русском и частично на английском языке
Государственная аккредитация
О программе
Программа магистратуры 01.04.02_01 Прикладная математика и биоинформатика охватывает обширную область подготовки специалистов в области вычислительной биологии, математической системной биологии, синтетической биологии и биоинформатики.
Важным компонентом программы является самостоятельная работа, в том числе над реальным научным проектом или прикладной разработкой. Мы стремимся научить студентов не только выполнять поставленные задачи, но и учиться их формулировать. Мы предоставляем магистрантам широкий выбор тем для научно‒исследовательской работы, от разработки методов, алгоритмов и программ, анализа больших массивов биологических данных до моделирования биологических процессов и систем. Проектами руководят специалисты, работающие в разных областях науки и бизнеса, как из Политеха, так и из других организаций. Студент в праве сам найти себе тему и руководителя, чья область научных интересов соответствует тематике программы.
- Направление подготовки
- Срок, форма обучения
- Язык реализации
- Квалификация выпускника
- Применение электронного обучения, дистанционных образовательных технологий
- 01.04.02 Прикладная математика и информатика.
- Очная форма обучения, XX зачетных единиц, 2 года
- Обучение ведется на русском и частично на английском языке
- Магистр
- С применением
Биоинформатика и омиксные технологии
- Секвенирование ДНК
- Поиск однонуклеотидных полиморфизмов
- Анализ транскриптома
- Метаболомика и методы анализа метаболомных данных
- Протеомика и методты анализа протеомных данных
- Предсказание пространственных структур белков и докинг
- Hi-C
- Анализ эпигенетический меток
- Анализ полиморфизмов и структурных вариантов
- Поиск мобильных элементов в геноме
- Сборка геномов
- Анализ данных ChipSeq
- Интеграция, визуализация и интерпретация омиксных данных
Системная биология
- Кинетическая корректура в биохимических реакциях.
- Механизмы поиска транскрипционными факторами сайтов специфического связывания с ДНК. Облегчённая диффузия и модели расчёта времён первого достижения. Парадокс специфичности и скорости достижения сайтов и его разрешение. Стохастическое моделирование молекулярных конфигураций комплексов ДНК-белок.
- Транскрипционная пульсация и её влияние на вариабельность экспрессии гена.
Расчёт динамики состояния промотора по современным данным на примере гена even-skipped в морфогенезе дрозофилы. - Эффекты кооперативности в биологии с точки зрения статистической механики.
- Графовый формализм в моделировании генных и других биологических сетей.
- Информационный подход в сигнальных и генных сетях. Методы оценки физических ограничений на биологические процессы. Понятие оптимальности функционирования биологического процесса.
- Моделирование времени цветения растений. Примеры моделей для арабидопсиса и бобовых.
- Эпидемиологические модели. Детерминистский подход (классические модели типа SEIR) и стохастический подход (агентное моделирование). Пример COVID-19 и уроки моделирования.
Био‒/Статистика
- Углубленный регрессионный анализ
- Обобщенные/смешанные линейные модели
- Байесовский анализ
- Gibbs sampling/MCMC
- Анализ данных типа времени жизни
- Поиск генетических ассоциаций
Машинное обучение
- Наивный байесовский классификатор и метод ближайших соседей,
- деревья решений,
- нейронные сети,
- методы обучения без учителя,
- композиционные методы машинного обучения,
- автокодеры,
- передача обучения и адаптация данных,
- обучение с подкреплением,
- глубокие порождающие модели,
- глубокое обучение,
- сеть Хопфилда,
- более подробно см. https://levutkin.github.io/teaching/machine-learning
Машины опорных векторов
- SVM-подход к решению задачи классификации
- SVM-подход к решению задачи восстановления регрессии
- Модификация стандартного SVM-подхода
- Качество обучения
- Основные этапы построения машин опорных векторов
- Практическая реализация SVM-алгоритмов
Методы оптимизации
- Постановка задачи глобальной оптимизации в биоинформатике и системной биологии.
- Обработка ограничений на параметры.
- Наборы тестовых функций
- Метод численного отжига
- Методы туннелирования
- Генетические алгоритмы
- Эволюционные стратегии
- Разнообразие эволюционных алгоритмов
- Разностная эволюция
- Методы на основе поведения природных популяций: колонии муравьев, метод роя частиц, и др.
- Модификации для невещественных параметров
- Комбинированные методы
Параллельные вычисления
- Архитектура многопроцессорных вычислительных систем
- Основы технологии MPI: спецификация, реализации, основные понятия, компиляция и запуск, структура
- MPI-программ
- Коллективные коммуникационные операции
- Средства организации двухточечных обменов сообщениями в MPI
- Неблокирующие коммуникационные операции типа «точка-точка» в MPI
- Производные типы данных в MPI
- Группы процессов и коммуникаторы. Виртуальные топологии
- Новые возможности в стандартах 2.х и 3.х
- Технология программирования OpenMP
- Функции OpenMP
- Использование технологии OpenMP для решения СЛАУ
Интернет технологии
- Современные технологии разработки приложений в Интернете (обзор возможностей)
- Реализация средств управления данными
- Реализация сервисной архитектуры
- Реализация внутреннего языка предметной области
- Реализация графического интерфейса пользователя
- Методика подготовки и проведения приёмо-сдаточных испытаний
- Зачет по продукту
Генетика человека
- Геном человека.
- Гаметогенез и оплодотворение.
- Эмбриогенез человека.
- Формирование осей тела развивающегося зародыша.
- Генетический контроль нейрогенеза.
- Генетический контроль развития производных мезодермы.
- Генетический контроль развития производных энтодермы.
- Программированная клеточная гибель.
- Некодирующие РНК в развитии.
- Транскрипционные факторы и регуляция генной экспрессии.
- Редактирование РНК.
- Тератогенез.
- Меланогенез у человека.
- Генетические основы музыкальности.
- Генетические основы особенностей поведения человека.
Медицинская генетика
- Генетический груз, хромосомные и генные мутации, методы диагностики.
- Роль мобильных элементов в геноме.
- Наследственные неврологические заболевания.
- Неинфекционные амилоиды и инфекционные амилоиды – прионы.
- Клетки HeLa.
- Сигнальная трансдукция.
- Прото-онкогены. Рецепторы, ассоциированные с G-белками.
- МикроРНК и рак.
- p53.
- Терапия рака.
- Метаболизм лекарств.
- Гены «предрасположенности».
- Мультифакториальные заболевания. Алкоголизм.
- Основные теории старения человека.
- Эпигенетика.
Генетика популяций
- Понятие популяции, модели роста численности
- Типы генетической вариабельности
- Принцип Харди‒Вайнберга, условия выполнимости
- Неравновесное сцепление
- Инбридинг и структура популяции, Индекс фиксации
- Мутации, конверсия гена и миграция
- Эффективный размер популяции
- Коалесценция
- Модели миграции
- Понятие нейтральной эволюции
- Филогения и молекулярная эволюция
- Методы построения филогенетических деревьев
- Типы нуклеотидных замен, оценка синонимичных/несинонимичных замен. Тест МакДоналда‒Крейтмана
- Естественный отбор в больших популяциях
- Типы отбора
- Статистики для обнаружения следов отбора
- Случайный дрейф генов в небольших популяциях
- Баланс между отбором, мутациями и миграцией
- Обнаружение примесей в популяциях, анализ родства
Биологической практикум
- Методы выделения ДНК и контроля качества нуклеиновых кислот. Особенности выделения ДНК из растительного материала.
- Выделение ДНК и оценка качества полученного генетического материала.
- Теоретические основы полимеразной цепной реакции (ПЦР).
- Подбор праймеров для маркерного анализа с помощью ПЦР.
- Постановка ПЦР; оценка результатов с помощью гель-электрофореза.
- Анализ и обсуждение полученных результатов.
- Использование Байесовского подхода к моделированию структурными уравнениями эффектов генетических полиморфизмов на количественные признаки
- Использование Transfer Learning для выявления вредных мутаций в белках млекопитающих
- Моделирование динамики распространения транспозонов в геноме человека в норме и патологии
- Стохастическое моделирование молекулярных конфигураций регуляторных районов ДНК в эукариотических клетках
- Математическая модель динамики экспрессии генов gap в эмбрионе плодовой мушки, учитывающая сайты связывания транскрипционных факторов
- Разработка и анализ методов ускорения парного выравнивания рестрикционных карт
- Разработка программного обеспечения для автоматической предобработки, фильтрации и анализа качества данных scRNA-seq
- Университет Южной Калифорнии, США
- Компания “Соевый комплекс”, Краснодар
- Университет Вермонта, США
- Национальный университет Тайваня
- Университет Калифорнии Дэвис, США
- Институт генетических ресурсов растений им. Н.И.Вавилова
Абитуриентам
Прием на обучение по программам магистратуры проводится по результатам междисциплинарного экзамена в объеме требований, предъявляемых государственными образовательными стандартами высшего образования к уровню подготовки бакалавра по направлению, соответствующему направлению магистратуры.
При приеме на обучение по программам магистратуры не используются результаты итогового государственного экзамена в бакалавриате и иных испытаний, не являющихся вступительными испытаниями, проводимыми в соответствии с Правилами.
Междисциплинарный экзамен проводится в форме тестирования.
- Максимальное количество баллов за междисциплинарный экзамен составляет 100 баллов
- Минимальное количество баллов за междисциплинарный экзамен составляет 50 баллов
- Междисциплинарный экзамен проводится в очно в письменной форме и (или) с использованием дистанционных технологий (при условии идентификации поступающих при сдаче ими вступительных испытаний)
Вопросы для подготовки к вступительному экзамену
Актуальная информация о правилах поступления
Чем занимается биоинформатика?
Биоинформатика решает задачи, возникающие в ходе биологических исследований, путем анализа и интрепретации данных. Биоинформатики разрабатывают алгоритмы, программные решения и аналитические модели для хранения, обработки и визуализации больших биологических данных, включающих в себя геномные, биохимические, фармакологические, агробиологические и другие модальности. Биоинформатика, таким образом, закладывает основы для исследований в области вычислительной биологии.
Вычислительная биология занимается поиском обобщенных решений задач, разработкой и внедрением алгоритмов или инструментов для поиска ответа на биологические вопросы, возникшие в ходе биоинформатического анализа. В то время, как вычислительная биология делает упор на разработке теоретическим методов, компьютерных симуляций и математических моделей, биоинформатика преимущественно использует методы статистики, машинного обучения и информационные технологии.
Современные тенденции развития биоинформатики и вычислительной биологии
Несмотря на то, что российский рынок геномики и биоинформатики сейчас только формируется, и его объемы пока невелики, отрасль биотехнологических продуктов переживает стадию бурного роста и не отстает по темпам роста от рынков США и Европы. Проекты в области биоинформатики могут быть самыми разными: от стартапов до международных проектов и государственных инициатив, привлекающих многомиллионные инвестиции.
Карьерные перспективы
- Карьера в науке
- Компании: от биотехнологии и агробиологии до страховой медицины;
- Работа в смежных областях: карьера в сфере высшего образования, популяризация науки, научная журналистика, бизнес‒аналитика и консалтинг.
Кому подойдет программа?
- физикам, математикам и программистам, которые хотят попробовать свои силы для решения задач в области биоинформатики и вычислительной биологии
- биологам и биофизикам, которые хотят освоить на высоком уровне компьютерные науки, программирование и информационные технологии
Что делать, если я не знаю биологию?
Предполагается, что поступающий не утратил тягу к познанию, мотивирован и стремится получить новые навыки и умения. Чтобы поступить и успешно учиться не требуются специальные знания в области биологии; ‒ необходима хорошая базовая математическая подготовка и биологические знания в объеме школьной программы. Все остальные дисциплины, необходимые для понимания молекулярной биологии и современных биотехнологий включены в курс обучения.
Лаборатория «Математическая биология и биоинформатика»
Адрес: 29АФ, помещения А.3.28 ‒ А.3.31, Политехническая улица, Санкт-Петербург, 195251 Россия
Телефон:
E-mail:
compbio@pm.me