接口文档
Chat Completion
请求地址
POST https://api.infly.cn/v1/chat/completions
请求Header
{
"Authorization": "Bearer <API_KEY>"
}
请求内容
示例
{
"model": "inf-chat-v1",
"messages": [
{
"role": "system",
"content": "You are a helpful assistant"
},
{ "role": "user", "content": "hi!" }
],
"temperature": 0.3
}
参数说明
参数 | 是否必须 | 说明 | 类型 | 默认取值 |
---|---|---|---|---|
model | required | 模型名称 | string | 目前支持inf-chat-v1 |
messages | required | 对话消息列表 | List[Dict] | 这是一个结构体的列表,每个元素类似如下:{"role": "user", "content": "你好"} role 只支持 system ,user ,assistant 其一,content 不得为空 |
max_tokens | optional | 对话完成时生成的最大token数,如果生成了max_tokens的内容仍然没有结束,finish_reason的值是‘length’,否则是'stop' | int | 4096 |
temperature | optional | 采样温度越高,输出越随机,越低时输出越确定,取值范围为[0,1] | float | 1.0 |
top_p | optional | 另一种采样机制,较小的topp值,生成的结果更具有确定性,较大的top_p值则会导致生成结果更多样化,取值范围[0, 1] | float | 0.9 |
n | optional | 每个prompt生成结果数,取值不大于4的正整数 | int | 1 |
presence_penalty | optional | 存在惩罚,正值会根据新生成的词汇是否出现在文 本中来进行惩罚,增加模型讨论新话题的可能性,取值范围[-2, 2] | float | 0.0 |
frequency_penalty | optional | 频率惩罚,正值会根据新生成的词汇在文本中现有的频率来进行惩罚,减少模型一字不差重复同样话语的可能性,取值范围[-2, 2] | float | 0.0 |
repetition_penalty | optional | 重复惩罚,较高的值会让模型更强烈地避免重复,取值范围(0, 2] | float | 1.0 |
stop | optional | 停止词,当匹配到这个(组)词后会停止输出,这个(组)词本身不会输出。 | List[string] | null |
stream | optional | 是否流式输出结果 | bool | false |
tools | optional | 工具列表,详情请查看 function calling | array | null |
response_format | optional | 结构化输出,详情请查看 structured output | object | null |