Ошибки выжившего: видим только успешные примеры.
Важно не относиться к химии как к магии.
Нет журнала неудач в химии.
Артем Митрофанов, выпускник факультета наук о материалах МГУ.
Кандидат химических наук, старший сотрудник химического факультета МГУ.
Возглавляет межкафедральную лабораторию интеллектуального химического дизайна.
Область, которая быстро развивается и предлагает удобные инструменты.
Основная прикладная задача химии: создание веществ с заданными свойствами.
Понимание фундаментальных взаимодействий и закономерностей.
Вопросы синтеза и масштабирования новых веществ.
Традиционно решаются методом проб и ошибок.
Часто возникают проблемы с токсичностью и радиационной стойкостью.
Поиск новых соединений в освещенных областях.
Использование уже известных соединений для экономии времени и ресурсов.
Ограничение поиска в неизведанных областях.
Использование численных методов для оценки свойств новых соединений.
Создание предъективных моделей для оценки свойств гипотетических соединений.
Генеративные модели для автоматизации процесса создания молекул.
Оптимизационные модели для существующих технологий.
Применение на ранних стадиях дизайна.
Завод производит продукт, соблюдая ГОСТы и минимизируя затраты.
Можно изменять температуру синтеза, компоненты сплава и другие параметры.
Планомерный перебор вариантов может быть дорогостоящим, поэтому нужны алгоритмы для сокращения шагов.
Спектральные данные требуют автоматизации и минимизации ошибок.
Алгоритмы должны возвращать результаты с определенной точностью.
Искусственный интеллект помогает ускорить и улучшить методы анализа.
Квантовая химия использует численные методы для решения уравнений Шредингера.
Расчеты требуют много времени и ресурсов, что делает их менее эффективными.
Ускорение расчетов с помощью ИИ может быть целесообразным.
ИИ включает алгоритмы, выполняющие задачи, ранее считавшиеся человеческими.
Примеры: чат-боты, системы компьютерного зрения, алгоритмы для химических данных.
ИИ остается областью математики и алгоритмов с большим количеством коэффициентов.
Сбор данных для химических задач сложнее, чем для текстовых или изображений.
Недостаток данных может быть основной проблемой.
Научные журналы публикуют данные в бумажном формате, что затрудняет сбор информации.
Наука о данных объединяет математику, статистику, алгоритмы и целевые области.
Подготовка данных занимает больше времени, чем их обработка.
Современные компьютеры и серверы могут обрабатывать химические данные, что делает ИИ более доступным.
Хорошие модели и алгоритмы важны, но без качественных данных они бесполезны.
Плохие данные приводят к неверным предсказаниям.
Начинать нужно с планомерного сбора данных.
Часто приходится обращаться к специалистам для анализа данных.
Автоматические алгоритмы пока работают плохо.
Формирование таблиц из статей вручную остается актуальной задачей.
Химические данные часто сопровождаются шумом и погрешностями.
Важно собирать данные самостоятельно для сложных задач.
Базы данных помогают предсказывать свойства, но для сложных задач нужны новые данные.
Большинство алгоритмов машинного обучения созданы для текстовых или графических данных.
Химические данные часто представлены в виде структур и спектров.
Необходимы специальные алгоритмы для работы с такими данными.
Задача построения предсказательных моделей для материалов.
Важно найти численное соотношение между структурой и свойствами.
Методы машинного обучения и кодирование данных развиваются.
Параметрические модели имеют ограниченную область применимости.
Важно учитывать, где модель может быть использована.
Модели часто используются как часть генеративных моделей для генерации структур с заданными свойствами.
Генеративные модели в материаловедении пока не могут полностью восстанавливать структуры.
В области генерации молекул ситуация лучше, но ошибки все еще встречаются.
В прошлом году на олимпиаде школьники успешно генерировали молекулы с заданными свойствами.
Оптимизационное моделирование помогает минимизировать расходы и находить новые соединения.
В химии молекулы имеют трехмерные структуры, которые можно оптимизировать для нахождения минимальной энергии.
Использование байесовского формализма и нейронных сетей ускоряет процесс оптимизации.
Нейронные сети автокодировщики помогают анализировать спектральные данные.
Они могут сжимать данные и строить модели для выделения индивидуальных компонентов.
Это позволяет сравнивать спектры с известными базами данных.
Алгоритмы могут читать статьи и выделять полезную информацию.
Они помогают находить взаимосвязи между лекарствами и болезнями.
Это сокращает расходы на разработку новых лекарств для редких заболеваний.
Квантовую химию можно ускорить до единиц секунд, сохраняя точность.
Модели требуют длительной тренировки, что сокращает их область применимости.
Нейронные сети могут апроксимировать сложные функции, но требуют большого количества параметров.
Модели не всегда применимы к новым классам соединений.
Можно встраивать проверки в модели для оценки их применимости.
Хорошо умеем предсказывать свойства соединений на основе структуры.
Умеем ускорять квантовую химию, но область применимости ограничена.
Учимся предсказывать свойства материалов с дефектами и строить модели в условиях нехватки данных.
Автоматизируем приборный анализ, но не все варианты анализа можно автоматизировать.
Умеем предлагать схемы синтеза, но это не всегда работает на 100%.
Анализируем текстовые данные, но это требует доработки.
Оптимизируем процессы, но убедить в этом химиков сложно.
Учимся автоматизировать лабораторные процессы, но это пока не рутинная задача.
Важно помнить, что искусственный интеллект в химии требует работы с данными и учета области применимости моделей.
Чем больше данных, тем лучше для развития моделей.
Большие базы данных доступны для академического сообщества, но иногда требуют подписки или оплаты.
Вопросы лицензирования данных остаются актуальными.
Клинические данные могут быть обезличенными или персональными.
Существуют открытые базы данных для исследований, но их использование ограничено.
ИИ используется в разработке лекарственных препаратов и материалов.
Методы ИИ для разработки материалов появились около пяти лет назад.
Студенты уже используют ИИ для написания дипломов, что можно считать примером внедрения.
Пример: ноутбук, созданный с использованием технологии органических полупроводников, начавшейся с машинного обучения.
Статья о таких материалах появилась в 2016 году.
Вопрос о возможности анализа эмоций с помощью химии.
Пример: прибор, созданный на факультете, который определяет уровень сахара в крови по содержанию метаболитов в поте, заменяя инвазивную процедуру взятия крови.
Благодарность за вопросы и внимание.
Прощание.