Needle in a Haystack(大海捞针)是评估大语言模型(LLM)长文本理解能力的测试方法。本次作业将多个关键信息(needles)随机插入不同文本文件(haystack)中,测试你实现的 Agent 能否准确检索并回答相关问题。
Latest commits.
Builders behind this project.