丁波：从临摹到蒸馏：那道绕不过的分界线

新加坡这种“开放不等于无序”的分寸，恰是一个中立经济体最难得，也最值钱的资产——它换来的不是某一笔生意，而是一种长期的可预期性，让各方都愿意把数据、把模型、把研发，放心地落在这里。把“来源正当、出处可溯”做成基础设施一般的能力，或许才是更务实，也更长久的立身之本。

Anthropic指控阿里巴巴非法提取其Claude模型的能力，其实不是蒸馏这回事，而是它的规模、手段，以及它所绕开的那道边界。图为阿里巴巴标志。（路透社）

美国人工智能公司Anthropic日前指控中国科技巨头阿里巴巴非法提取其Claude模型的能力，并称这是公司迄今遇到规模最大的同类攻击。据报道，Anthropic在一封致美国国会参议院银行委员会的信函中说，与阿里巴巴及其通义千问实验室有关的操作者，在今年4月22日至6月5日之间，通过近2万5000个欺诈账户，与Claude进行了超过2880万次交互，矛头直指模型的软件工程与代理推理能力。阿里巴巴方面暂未对这项指控作出回应。

信中把这种做法称为“蒸馏”（distillation）。身为一个日常也在训练模型的人，我想先把这个词从指控的语境里抽出来，平心静气地说一遍。蒸馏本是机器学习里一项中性的技术：拿一个更强模型的输出，去训练一个能力较弱的模型，让后者以更低成本，逼近前者的表现。它在学界与业界稀松平常，本身并无原罪。

Anthropic指控的其实不是蒸馏这回事，而是它的规模、手段，以及它所绕开的那道边界——动用数以万计的欺诈账户，规避“产品不得在中国境内使用”的地理限制，工业化地提取能力。把技术与滥用分开来看，是讨论这件事的第一步，否则很容易把一个中性的工具，错当成罪证本身。