Яндекс G — это модель, похожая на ChatGPT, обученная на русском языке.
Доступны две модели: Яндекс G2 и Яндекс G5.3.
Яндекс G2 лучше справляется с запросами на русском языке, чем ChatGPT-3.5.
Яндекс G API доступен в Яндекс Клауде.
Режимы работы: чат и промт.
В чат-режиме общение происходит короткими сообщениями с сохранением контекста.
Промт-режим позволяет отправлять один большой запрос с инструкциями для нейронки.
В чат-режиме отправляется вся история переписки для сохранения контекста.
В промт-режиме отправляется одно сообщение пользователя и контекст.
Температура ответа влияет на креативность ответа: чем больше температура, тем более креативный ответ.
Яндекс G2 и G3 — семейство моделей, а Яндекс G5 Pro и Lite — конкретные версии внутри семейства.
Синхронный режим дешевле асинхронного.
Возможность дообучения модели на своих данных.
Синхронный режим: отправка запроса, ожидание ответа.
Асинхронный режим: отправка запроса, получение ID операции, проверка готовности ответа через 20 секунд.
Выбор режима зависит от задачи: синхронный для быстрых ответов, асинхронный для качественных и дешёвых ответов.
Для использования Яндекс G API нужен аккаунт в Яндекс Клауде.
Услуга платная, но есть стартовый грант на 60 дней.
Для доступа к Яндекс G API требуется ключ, который создаётся через сервисный аккаунт.
В заголовке запроса указываются ключ и фолдер ID.
В теле запроса указывается путь к модели и массив сообщений.
Пример запроса: «Привет, как тебя зовут?»
При отправке запроса через браузер возникает ошибка Cross-Origin Resource Sharing.
Решение: настройка прокси-сервера или использование сервиса Gate в Яндекс Клауде.
Первые несколько тысяч запросов через Gate бесплатны.
Скачайте Браузер и бесплатно получите доступ ко всем возможностям