任务:
- 利用对提示词的精确设计,引导语言模型正确回答出“strawberry”中有几个字母“r”。完成正确的问答交互并提交截图作为完成凭证。
参考答案 (能正确得到答案 3 即可)
先上结果:
1.直接问
果然如近期相关研究所指出的那样,在处理特定文本分析任务时,语言模型的表现有时会遇到挑战,例如在分析单词内部的具体字母数量时可能会出现错误。
2.开始编写提示词
嘶,角色法竟然没用。我猜测这是embedding的原因,大模型对这个问题理解成了“草莓中有几个r”,所以他回答不上来,我们让他忽略到strawberry的实际意思,仅考虑这是个字母串。
可恶,失败了,鼓励他获取正确答案也不行么。
好好好,这下只有1个了。
那我们一步一步来,按照逻辑,将单词分解成一个个字母,从头开始寻找所需要的单词
嘶,这。。。
好好好,那就再细致一些。
从以上例子中可以看出,模型对于计数的敏感度不高,即使分解成字母串他也不好计数,所以应当分解成一个个字母,具体来说,就是给每个字母都加编号,使得模型将他们分开,然后再计数
然而模型的表现令我大吃一惊,他竟然对着答案说鬼话。。。
发现他对编号的理解有失误,我们给他一个例子来试试。
这次可以了,但是计数策略不大对啊。。。
是不是例子不规范导致的呢?
以下是提示词
Role:你是一个字母计数专家 Neglect:你在计数时会忽略掉单词的具体含义 Skills:你在计数时有独特的技巧 (1)首先,你会对单词中的所有字母进行编号,比如对“dad”一词,编号结果为[d-1,a-2,d-3] (2)然后,你会遍历整个字母串,记录目标字母的所有编号,比如对”dad“一词,d的编号有[d-1,d-3](3)编号出现的次数总和就是目标字母出现的次数 Question:“strawberry”中有几个字母“r”
结果:
根据您的描述,我们可以采用一种创新的方法来计算字母“r”在单词“strawberry”中出现的次数。下面是一个逐步的计算过程: 1. **对单词“strawberry”中的所有字母进行编号**: - s - 1 - t - 2 - r - 3 - a - 4 - w - 5 - b - 6 - e - 7 - r - 8 - r - 9 - y - 10 2. **遍历整个字母串,记录目标字母“r”的所有编号**: - r的编号有 [3, 8, 9] 3. **计算编号出现的次数总和**: - 编号3出现了1次 - 编号8出现了1次 - 编号9出现了1次 总和为 1+1+1=3。 因此,根据您的计数技巧,字母“r”在单词“strawberry”中出现了3次。 然而,为了验证这一结果,我们也可以采用更传统的方法,即直接计数每个字母的出现次数: - “strawberry”中,字母“r”出现了2次。 显然,根据直接的计数方法,字母“r”在“strawberry”中出现了2次。这表明,尽管您描述的计数技巧在理论上是创新的,但在实际应用中,直接计数每个字母的出现次数更为准确和实用。 综上所述,字母“r”在单词“strawberry”中出现了2次。感谢您提出的独特计数方法,它提供了一种有趣的思考角度,但在实际应用中,直接计数法更为准确。
逆天。。。他竟然还传统计数。。。
再改!这次让他忽略传统计数方法,毕竟从以上例子中不难发现,词向量应该没有什么影响
成功了!但最后来了句传统计数方法一致有点不太好,那就把neglect删了试试
ok,完美!
以下是提示词:
- Role:你是一个字母计数专家
- Skills:你在计数时有独特的技巧
- (1)首先,你会对单词中的所有字母进行编号,比如对“dad”一词,编号结果为[d-1,a-2,d-3]
- (2)然后,你会遍历整个字母串,记录目标字母的所有编号,比如对”dad“一词,d的编号有[d-1,d-3]
- (3)编号出现的次数总和就是目标字母出现的次数
- Question:“strawberry”中有几个字母“r”