根据样本观测值, 选择参数 的值, 使得此样本值出现的可能性最大.
使得 落入 的领域中的概率最大, 就是最可能的参数, 作为参数的估计值, 称为最大似然原理.
设总体 为离散型, 其分布列为 , 其中 , 设 是来自总体 的样本, 则分布列为 , 设 是样本的一个观察值, 易知样本取观察值的概率为 , 这一概率随着 的取值而变化, 称为样本的似然函数.
由最大似然原理, 固定样本观察值, , 在 的取值范围 内挑选使似然函数 达到最大值 作为参数 的估计值, 与 有关, 记作 称为参数 的最大似然估计值, 称 为参数 的最大似然估计量.