美国人工智能公司Anthropic日前指控中国科技巨头阿里巴巴非法提取其Claude模型的能力,并称这是公司迄今遇到规模最大的同类攻击。据报道,Anthropic在一封致美国国会参议院银行委员会的信函中说,与阿里巴巴及其通义千问实验室有关的操作者,在今年4月22日至6月5日之间,通过近2万5000个欺诈账户,与Claude进行了超过2880万次交互,矛头直指模型的软件工程与代理推理能力。阿里巴巴方面暂未对这项指控作出回应。

信中把这种做法称为“蒸馏”(distillation)。身为一个日常也在训练模型的人,我想先把这个词从指控的语境里抽出来,平心静气地说一遍。蒸馏本是机器学习里一项中性的技术:拿一个更强模型的输出,去训练一个能力较弱的模型,让后者以更低成本,逼近前者的表现。它在学界与业界稀松平常,本身并无原罪。

Anthropic指控的其实不是蒸馏这回事,而是它的规模、手段,以及它所绕开的那道边界——动用数以万计的欺诈账户,规避“产品不得在中国境内使用”的地理限制,工业化地提取能力。把技术与滥用分开来看,是讨论这件事的第一步,否则很容易把一个中性的工具,错当成罪证本身。