什麼是參數?

模型內部可學習的數值,決定了模型的「知識」。GPT-4 據傳有 1.8 兆個參數,Llama 3 有 70B/400B 版本。參數越多通常越聰明,但也越貴越慢。選模型時要平衡能力和成本。