Видео недоступно для вставки
В 2012 году на конференции в Флоренции была представлена работа, которая показала, что нейронные сети могут значительно улучшить качество распознавания изображений.
Это привело к развитию многих областей, таких как мультимодальные беддинги, распознавание лиц, генерация текста и машинное обучение.
За последние десять лет искусственный интеллект значительно продвинулся в различных областях, включая распознавание речи, обработку текста и беспилотные автомобили.
Это привело к тому, что многие задачи, которые раньше казались невозможными, теперь решаются с помощью искусственного интеллекта.
В 2013 году была представлена работа "Word2vec", которая позволила создать цифровое представление для слов, что стало основой для многих современных технологий, таких как поиск и обработка естественного языка.
В 2014 году появились первые нейросети, которые требовали больших вычислительных мощностей и алгоритмов для обучения.
В 2015 году была представлена работа "Variational Autoencoders", которая решила проблему кусочного пространства в автоэнкодерах, сделав его более непрерывным.
В 2016 году была опубликована статья "Mastering the Game of Go with Deep Neural Networks and Tree Search", которая показала, что у машин есть свойство интуиции, которое ранее считалось только свойством людей.
В 2017 году компания DeepMind провела матч на миллион долларов между человеком и компьютером в игре Го, что вызвало огромный интерес и шумиху в СМИ.
В 1997 году человек по имени Седоль проиграл компьютеру в игре с полной информацией, что вызвало волну интереса к искусственному интеллекту.
После этого, термин "искусственный интеллект" стал популярным, и разработчики начали использовать его в своих продуктах.
Ганнер создал состязательные нейронные сети, которые обучаются, соревнуясь друг с другом.
Это позволило создавать более реалистичные изображения, которые трудно отличить от настоящих.
Google создал фреймворк TensorFlow, который стал первой нерастевой библиотекой, выложенной в открытый доступ.
Это позволило ускорить развитие нейронных сетей и привело к появлению новых архитектур.
Резнет - это архитектура нейронной сети, которая позволила увеличить емкость и глубину нейронных сетей.
Это привело к резкому увеличению эффективности и глубины глубокого обучения.
В видео обсуждается развитие машинного обучения, начиная с работы "Атешн и зол юнит", которая привела к появлению термина "трансформеры".
Далее обсуждается работа "Берт", которая стала популярной и привела к использованию аббревиатуры "Берт" для обозначения больших текстовых моделей.
В видео также упоминается работа "G5-3", которая стала еще большего размера и способна генерировать текст.
В видео обсуждаются современные технологии машинного обучения, такие как компьютерное зрение и анализ текста.
Упоминается работа "Дал", которая позволяет создавать изображения из текстовых описаний.
Также обсуждаются диффузионные модели, которые позволяют создавать изображения по текстовым описаниям и могут изменить мир машинного обучения.
В видео обсуждаются ожидания на следующие десять лет в области машинного обучения.
Ожидается прорыв в медицине, когда алгоритмы смогут анализировать множество слабых факторов, влияющих на постановку диагноза и выбор стратегии лечения.
Также ожидается, что в следующие десять лет произойдет синтез видео, когда фильмы будут создаваться по текстовым описаниям, созданным любым человеком.
Обсуждение нейросумаризации - анализа текста для создания выжимки информации.
Упоминается, что в будущем персональные ассистенты могут стать персонажами с собственным мнением и характером.
Автор считает, что порог входа в бигтех не снизится, так как для создания новых технологий потребуются фундаментальные знания и понимание происходящего.
Однако, он отмечает, что прогресс остановить нельзя, и приватность будет все сложнее сохранять.
Автор предполагает, что голосовые ассистенты могут стать полноценными личными помощниками в ближайшие десять лет.
Он также обсуждает возможность появления суммаризации на сайтах, но не уверен, что это произойдет.