实现流式文本生成。

def generate_stream(self, model_name, prompt, model_version, request_id, parameters)

参数名	参数类型	输入/输出	说明
model_name	str	输入	模型名称。模型名称只支持由大小写字母、数字、中横线和下划线组成。
prompt	str	输入	模型输入字符串。
model_version	str	输入	模型版本，默认为""。非空时只支持由大小写字母、数字、中横线和下划线组成。
request_id	str	输入	请求ID。
parameters	dict	输入	额外的请求参数，包括seed、temperature、top_k、top_p、do_sample、repetition_penalty、typical_p、batch_size和details。
seed	int64	输入	随机种子数。取值范围为(0,18446744073709551615]，不传递随机指定。
temperature	float	输入	控制生成的随机性，较高的值会产生更多样化的输出。取值范围大于0，默认值为1。
top_k	int32	输入	控制模型生成过程中考虑的词汇范围，只从概率最高的k个候选词中选择。0表示不做top_k。取值范围：[0,2147483647]，默认值为0。
top_p	float	输入	使用累计概率选择候选词，直到累计概率超过给定的阈值。
do_sample	bool	输入	是否做sampling。取值范围：(0,1]，默认值为1。
repetition_penalty	float	输入	用于减少在文本生成过程中出现重复片段的概率。取值范围大于0，默认值为1.0。
typical_p	float	输入	典型采样，从分布率接近typical_p的单次集合中采样。取值范围为(0,1]。
batch_size	int	输入	推理请求batch_size。取值大于0。
details	bool	输入	是否返回details字段。

Result对象表示流式文本推理结果。