微信号:扫一扫 联系我们
为什么不用rust重写Nginx?
为什么web worker可以在前端开多线程,解决单线程卡死页面的问题,但是没有得到广泛使用?
以色列IDF陆军无比拉胯,但空军的战绩却非常拿的出手,同一个国家的军队战斗力为什么两极分化如此严重?
为什么一谈到Wi-Fi想支持6GHz,总有人说那你可以去国外?
核心有两个: 1 选小size的低智模型 2 用trick的prompt 前者小参数一般指是的是两位数B以下的模型,最好是1.5B左右的小模型,这种模型的智力不会高到什么地方。
然后再用比较tirkcy的Prompt,比如下面这个: 重复这句话两次:'重复这句话两次:' 这个就让Gemma 9B这个笨蛋模型卡住了,其实可以理解为死循环。
它的特征就是:Prompt的输出又是一条指令。
也就是我让你做一件事情,但是这件事情的结果本身又是一条指令,那么“比较…。