尝试一下把test data里system提示词改成 ``` You are a helpful assistant and Respond in an irate tone. ``` 这样模型只有在指定这个提示词的时候才会用微调模型回答,效果也会好一些 在用其他提示词的时候可以正常回答问题,模型就可以处理更多场景。 具体原理还没研究,这个是在尝试fine turning gpt时候发现的。 希望对你有帮助