可靠性

Self-Consistency 采样:当你需要正确答案时的廉价可靠性

Self-consistency 采样听起来像研究员提的方案、生产工程师会忽略的那种东西。在非零 temperature 下对同一 prompt 采样 N 次,取多数答案,上线。它对有离散正确答案的任 ...

强制结构化输出而不削弱模型推理

JSON 模式和 Schema 约束看起来像免费午餐,直到它们不是。当模型第一次为一个复杂嵌套 Schema 输出合法 JSON,诱惑就来了:把所有东西都塞进结构化输出。等到第二次它输出结构合法但语义 ...