Обсуждение интернета, Рунета и поисковых систем.
Представление поисковой системы "Мамонт", которая ищет по серверам.
"Мамонт" проиндексировал около пяти миллиардов документов и помогает определить утечки данных.
"Мамонт" разработан в середине 2000-х и запущен в августе 2006 года.
Обновленная версия вышла в августе этого года.
Используется специалистами в области разведки по открытым источникам и для раскрытия преступлений.
"Мамонт" проиндексировал более миллиона страниц и документов, а также более четырех миллиардов файлов.
База данных по Рунету содержит более двадцати миллионов страниц и документов.
Принцип формирования индекса уникален, что отличает "Мамонт" от других поисковых систем.
Пример поиска статьи о народной медицине, которую "Мамонт" находит, а другие поисковики нет.
Пример поиска фразы из новостной заметки, которую "Мамонт" находит, а другие поисковики нет.
Пример поиска удаленной статьи из Википедии, которую "Мамонт" находит.
Тестирование кода на компьютере ZX Spectrum через плату захвата RHB Digger.
Подготовка к сборке сотни таких устройств в Китае.
"Мамонт" и RHB Digger - основные проекты автора.
"Мамонт" сохраняет ушедшие в офлайн статьи и документы.
При обновлении страниц сохраняются все предыдущие версии документов.
"Мамонт" можно назвать информационной красной книгой.
"Мамонт" находит ссылки на первоисточники, например, роман Достоевского "Униженные и оскорбленные".
Пример поиска фразы "все счастливые семьи похожи друг на друга" и ее первоисточника.
Поиск в найденном помогает уточнить цитаты и найти первоисточники.
Сравнение результатов поиска по редким словам между "Мамонтом" и другими поисковиками.
Пример: по слову "вне индивидное" "Мамонт" находит одну уникальную статью, а Google - восемнадцать.
Сложный пятистопный метр из четырех хореев и одного дактиля.
В фильме "Покровские ворота" цитируется фрагмент из собрания сочинений Валерия Брюсова.
Поисковая система "Мамонт" сохраняет ссылки на дополнительные статьи в снипетах.
"Мамонт" хорошо справляется с поиском сайтов известных компаний и сервисов.
Не очень хорошо ищет по новостям и товарам из-за закрытости индекса.
Индекс обновляется ежедневно, что позволяет получать актуальные новости.
Название "Мамонт" появилось из-за больших размеров проекта.
В 2006 году "Мамонт" был запущен, и с тех пор он обошел по сроку службы другие крупные поисковики.
Сегодня в Рунете осталось две полнотекстовые индексирующие системы: "Мамонт" и "Яндекс".
"Мамонт" стал четвертым поисковым проектом автора.
Первый проект был "Крэк.ру", тематический поисковик с высоким показателем посещаемости.
Второй проект "Реферат.ком" позволял искать рефераты по их содержимому.
Интерфейс позволяет просматривать все ссылки без ограничений.
Файловый поиск также работает без ограничений, позволяя искать файлы по расширению.
Система выдает двойные заголовки: оригинальный и переведенный на русский язык.
Архивные ссылки, заблокированные Роскомнадзором и официальные сайты помечаются разными цветами.
Индекс "Мамонта" может быть увеличен до 40 миллионов документов.
Планируется доступ к расширенным возможностям для пользователей с подтвержденным возрастом.
Качество контента в интернете снижается, а объем Рунета сокращается.
Поисковые системы перестали публиковать данные о размерах своих индексов.
Количество сайтов в интернете остается неизвестным, но их качество ухудшается.
Общее количество сайтов в сети на август 2024 года составляет 1,107 миллиарда.
Активных сайтов всего 194 миллиона, что составляет 17% от общего числа.
Русскоязычных сайтов чуть более 4% от общего числа активных сайтов, что составляет чуть меньше 8 миллионов.
Мамонт индексирует сайты, выбирая в среднем по 9 ключевых страниц с каждого сайта.
Некоторые сайты, как Рувики, проиндексированы полностью, что составляет более 2 миллионов статей.
Индекс Мамонта хранит все найденные страницы и документы, аналогично человеческой памяти.
Крупные поисковые системы больше не публикуют статистику по объемам своих баз данных, так как рост этих баз прекратился.
Новый контент замещает старый, но часто уходит в офлайн более качественный контент.
Русский язык в интернете стал шестым по распространенности, что связано с сокращением объемов Рунета.
Контент перетекает в соцсети и видеохостинги.
Уход систем контекстной рекламы, таких как Бегун и Google AdSense.
Несогласованность в действиях операторов связи и Роскомнадзора по блокировке сайтов.
Идея архивации значимых страниц Рунета при помощи Мамонта своевременна.
Пример восстановления сайта Меди.ру, который содержал множество музыкальных произведений.
Восстановление сайта на 80% с использованием данных из архива Мамонта и коллекции MIDI-файлов.
Восстановлены интересные музыкальные произведения, такие как флейта, вариации на тему Золушки и турецкий марш Моцарта в джазовой обработке.
В базе Меди.ру более 58 тысяч MIDI-файлов, включая известные и авторские композиции.
Статическая копия сайта Меди.ру не имеет коммерческих целей и не индексируется другими поисковиками.
Пользователи могут вносить свой вклад в сохранение ключевых страниц и сайтов Рунета, сохраняя веб-страницы с интересным контентом.
Пример детективной истории с использованием Мамонта для поиска информации о песне и клипе.
Песня и клип были найдены, но исполнительница и полная запись песни не обнаружены.
Мамонт удобен для
Мамонт разрабатывает новую систему контекстной рекламы для поддержки сайтов и блогов с качественным контентом.
Оплата будет за сутки активной ротации, а не за показы или клики.
Начальная цена за день размещения: 1 рубль для некоммерческих сайтов и 2 рубля для коммерческих.
Система требует профессиональных модераторов, которые будут получать баллы за свою работу.
Модераторы смогут бесплатно продвигать свой контент через систему.
Они также смогут участвовать в ручной коррекции выдачи поисковой системы, улучшая качество поиска.
Система контекстной рекламы Мамонта будет называться "Мост", связывая тех, кто ищет качественный контент, и тех, кто его создает.
Предлагается сформировать профсоюз вебмастеров и блогеров для справедливого распределения трафика.
Коллектив профессионалов может создать справедливую систему распределения трафика.
Пример: строительство пирамид в Египте, где участвовали десятки тысяч профессионалов.
Современные технологии позволяют объединять профессионалов для решения задач, как в управлении комбайном или автотранспортом.
Это создает устойчивые системы и рабочие места, что полезно для экономики.
Проект Мамонт призывает поддержать его, рассказывая о поисковой системе знакомым или в соцсетях.
Подробности о поддержке проектов Мамонт и РЖБ Диггер можно найти в описании к видеоролику.
Вопрос о том, почему статья "Список масонов" удалена из Википедии.