Интеллектуальные возможности > Генеративный ИИ > Сервис Directum LLM Service

Для работы с моделью генеративного ИИ используется универсальный запрос к API сервиса Directum LLM Service. В зависимости от текста для обработки, передаваемого в запросе, можно получить разный результат, например текст письма или приказа.

Если при установке сервиса в конфигурационном файле config.yml в параметре API_KEY задан токен, его нужно передавать в каждом запросе. Если токен не задан, при отправке запроса не используется авторизация.

Примечание. В разделе под текстом для обработки понимается пользовательский запрос к модели генеративного ИИ, на основании которого она формирует ответ.

Синтаксис

POST {{service_url}}/v1/chat/completions

{
"messages": [
{
"role": "system",
"content": "Текст системного запроса"
},
{
"role": "user",
"content": "Текст пользовательского запроса"
}

],
"model": "Наименование модели",
"max_tokens": Максимальное количество токенов в запросе,
"temperature": Креативность ответа,
"stream": false

}

Параметры

•messages – секция с текстом для обработки, передаваемый модели генеративного ИИ. Содержит параметры:

•role – роль, от которой передаются тексты для обработки. Возможные значения:

user – роль пользователя. Текст от нее передается всегда.

system – системная роль. Текст от нее передавать необязательно. Используется дополнительно, например если нужно создать несколько запросов с одинаковыми правилами формирования ответа от модели, но для разных ситуаций. При этом, если какие-то условия в текстах отличаются, модель формирует ответ с условием из текста от системной роли;

•content – текст для обработки. В зависимости от значения параметра role отличаются рекомендации к значению параметра content.

Текст от роли пользователя указывается в повелительном наклонении, а также в него, например, можно добавить:

•текст, который пользователь вводит в запросе на формирование содержимого в документе;

•текст документа, на основании которого нужно сформировать ответ или аннотацию;

•вид документа, на основании которого нужно сформировать ответ или аннотацию. Используется для более точного формирования текста.

Текст от системной роли указывается в повелительном наклонении, а также в нем рекомендуется:

•описывать правила, которым нужно следовать при формировании ответа. Например, писать на русском языке, проверять орфографию или соблюдать определенную структуру;

•указывать роль, от которой нужно формировать текст, например от роли делопроизводителя или менеджера продаж. Это позволяет формировать ответы корректнее.

За подробными рекомендациями к текстам для обработки обратитесь к компании‑вендору сервиса Directum LLM Service;

•model – наименование используемой модели генеративного ИИ. Укажите значение Qwen/Qwen2-7B-Instruct;

•max_tokens – максимальный размер ответа от модели в токенах;

•temperature – креативность ответа от модели. Значение параметра указывается в интервале от 0 до 2. Например, при значении 0,1 модель формирует наиболее вероятные и точные ответы, а при значении 2 – креативные и разнообразные;

•stream – признак, что токены ответа по мере их формирования передаются в отдельных сообщениях. Возможные значения: true и false. Значение по умолчанию false – после формирования всех токенов ответа он передается одним сообщением.

Пример запроса

https://gpt.ario.directum360.ru/v1/chat/completions
{
"messages": [
{
"role": "system",
"content": "Ты — опытный менеджер по взаимодействию с клиентами. Ты соблюдаешь грамматику русского языка, составляешь вежливые письма. Твои письма серьёзные и официальные, текст исключительно серьёзный."
},
{
"role": "user",
"content": "Клиент написал жалобу на задержку доставки его последнего заказа, который должен был прибыть на прошлой неделе. Напиши вежливый и официальный ответ, в котором нужно извиниться за неудобства, объяснить причины задержки и предложить возможные варианты компенсации"
}],
"model": "Qwen/Qwen2-7B-Instruct",
"max_tokens": 512,
"temperature": 0.4,
"stream": false
}

Ответ

{
"id": "chat-d7e8448b7a744b528cd25b2c690839fd",
"object": "chat.completion",
"created": 1732024450,
"model": "Qwen/Qwen2-7B-Instruct",
"choices": [...],
"usage": {...},
"prompt_logprobs": null
}

Содержит ответ на запрос и информацию о нем:

•id – идентификатор запроса;

•object – тип запроса. Всегда принимает значение chat.completion;

•created – дата и время формирования ответа на запрос в системе Unix-время;

•model – наименование модели генеративного ИИ. Принимает значение, указанное в запросе;

•choices – секция с ответом от модели;

•usage – секция с информацией о тексте для обработки и тексте ответа модели;

•prompt_logprobs – системный параметр. Всегда принимает значение null;

"message": {
"role": "assistant",
"content": " Уважаемый(ая) [Имя клиента],\n\nСпасибо за ваше обращение к нам. Мы ценим ваше терпение и понимание в данное сложное время.\n\nСожалея о том, что вы столкнулись с задержкой в доставке вашего последнего заказа, который был назначен к поставке на прошлой неделе, мы хотели бы извиниться за причиненные неудобства. Мы понимаем, что такое ожидание может быть неудобным и вызывать беспокойство, и мы хотели бы убедиться, что вы получите полное представление о ситуации и возможные варианты компенсации.\n\nПричиной задержки является непредвиденная ситуация, связанная с нарушением работы логистических партнеров нашей компании. В условиях текущей ситуации, включающих в себя повышенные нагрузки на логистические системы и потенциальные проблемы с доставкой, мы столкнулись с неожиданными задержками.\n\nВ качестве компенсации мы предлагаем следующие варианты:\n\n1. **Бесплатная доставка на следующей неделе** - мы можем предоставить вам бесплатную доставку вашего заказа на следующей неделе, как только он будет доступен для отправки.\n\n2. **Скидка на следующий заказ** - мы готовы предложить вам скидку на ваш следующий заказ в размере 15%, что может компенсировать возможные неудобства.\n\n3. **Возврат части стоимости** - мы можем возвратить вам определенную сумму в зависимости от стоимости вашего заказа, чтобы компенсировать вам затраты, связанные с ожиданием.\n\nМы ценим ваше терпение и понимание в сложившейся ситуации. Ваше удовлетворение и доверие для нас очень важно, и мы стремимся улучшить нашу работу, чтобы подобные ситуации в будущем не повторялись.\n\nЕсли вы выберете один из предложенных вариантов, пожалуйста, свяжитесь с нами для дальнейших инструкций.\n\nМы ожидаем ваш ответ",
"tool_calls": []
}

Содержит ответ модели на запрос:

•role – роль, от которой формируется ответ от модели. Всегда принимает значение assistant;

•content – текст ответа;

•tool_calls – системный параметр. Всегда принимает пустое значение.