在SillyTavern酒馆使用Gemini模型时,许多用户都会不定时遇到internal server error错误,导致聊天体验中断,并且不知道该错误发生的原因,以至于无法解决。下面为大家讲解导致该错误发生的原因,并提供解决办法。
一、上下文超限
1、当上下文token数量达到3w-4w左右时(可能会浮动),有可能internal server error错误会越来越多,最后无法避免。
2、判断错误是否由上下文超限引起只需要再重开一个没有上下文的新聊天,如果新聊天不再弹出错误,之前的错误就是由上下文超限引起的。
3、解决此类的错误只需要控制上下文数量即可,可以在AI响应配置中调整上下文数量到不再报错。
4、但是这种调整方式必然会导致AI忘记最早的记忆,那也可以引入新的正则来控制上下文,去掉上下文中不需要的部分。
二、谷歌流量限制
1、如果你再开一个新聊天,依然出现internal server error错误,那就是由于谷歌流量限制了。推测gemini服务器对部分模型设置了同时访问的人数上限,当当前使用该模型的人数超过此上限时,部分人就会被阻止使用。
2、这种人数限制和调用模型的IP没有直接关系,即使是独立的IP也会出现错误。这种流量限制一般出现在工作日的晚十点或者节假日的全天。工作日的白天很少出现。
3、目前没找到有合适的办法避免掉这种问题,只能错峰使用。
