與標題答案進行對比

假設一個問題的正確回答是一組固定的答案。然後，我們可以使用模型來評估到底有多少模型輸出的答案是滿足了這個問題的預設結果。

示例1

示例2

考慮兩者之間的重疊和矛盾，更加全面的評估模型的表

下面是更深入的官方演示案例：

這種基於模型的評估方法有很多不同的變化。想象一下，我們在評估一個問題的候選答案時，會考慮很多不同的情況。比如，我們會看候選答案與專傢標準答案有多大程度的相似，還會考慮候選答案是否與專傢標準答案的任何部分相矛盾。這些都是評估方法的不同方面。

示例3

示例4

官方提供了兩種不同的場景，一種是與標題答案進行對比，另外一種則是考慮兩者之間的重疊和矛盾，更加全面的評估模型的表現,這兩種方式可以幫助程序開發人員從以下幾點中獲益。

在當下，掌握提示詞的技巧，利用提示詞幫助我們如何與機器互動，讓AI給我們提供真正的業務價值，是每一個人都需要思考的問題。