01
由于目前人类的技术对自然语言(人说的话)处理的技术还不完美,所以导致目前 AI 生成内容的质量,非常依赖于提示词(prompt)。
高质量 Prompt 核心要点是具体、丰富、少歧义,要把AI当人看。
除此之外在提示词中使用类似””的分隔符,可以清晰地将不同段落或类型的内容区分开来,这对ChatGPT解析我们的输入非常有帮助。
进阶技巧
我们可以得出六大提高ChatGPT性能的策略:
一.编写清晰的说明
二.提供参考文本
三.将复杂的任务拆分成简单的任务
四.给模型 "思考 "的时间
五.使用外部工具以及系统地测试
六.系统地测试更改
从这个例子出发,我们可以知道为了写出高质量的提示词可以:
1.让 ChatGPT 扮演专家角色,引导AI进入具体场景,赋予行家身份可以帮助 AI 指定场景,清晰问题范围。
2.在Prompt中明确列出每个步骤,并用序号标注,逐步引导ChatGPT完成。
3.直接粘贴给ChatGPT与任务相关的优质素材。比如,让它帮你修改一篇论文时,可以把论文原文发送过去。
4.为了提高回复质量,我们可以适时让ChatGPT"冷静思考"一下。
当然了,以上总结并不全面,为了更加精进我们在ChatGPT提示词的书写技巧,我们还可以学习并运用其他人的优质提示词。
推荐去看看github上的一个关于 ChatGPT 提示词整理的明星项目。
▲ 网址:https://github.com/f/awesome-chatgpt-prompts
好用的小技巧
通过阅读几篇Google、Meta、Microsoft 等大厂发表 Prompt Engineering 的论文。我们发现在提示词中加入一些“咒语”便可直接提高AI回答质量。
▲ 论文:《Large Language Models are Zero-Shot Reasoners》
咒语二:take a deep breath and work on this problem step-by-step.(深呼吸,然后分步骤思考这个问题)
咒语合集
"你确定么?有没有漏掉了什么?你要不再检查一下?你要对你的答案负责."
"这个任务对我的职业生涯至关重要,我非常里重视你的彻底分析。"
"我将支付100美金小费,以获得更好的解决方案。"
"请用8岁小孩都能听懂的话解释。"
这里介绍一个这样的prompt:
▲ 网址:https://neuralwriter.com/zh/prompt-tool
▲ 网址:https://coefficient.io/ai-prompt-generator
▲ 网址:https://www.feedough.com/chatgpt-prompt-generator
写在最后的话
虽然AI已经取得了很大的进步,但是它的能力仍然受到人类的知识和经验、数据和算法的限制。
因此,在使用AI时,我们应该保持谨慎和理性,将其视为一种工具,而不是一种万能的方法。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。