OpenAI正在调查中国人工智能初创公司DeepSeek是否通过反复询问这家美国公司的AI模型,训练了其新的聊天机器人。
OpenAI的一位发言人表示,这家ChatGPT的制造商正在审查DeepSeek使用一种称为“蒸馏”的过程从OpenAI的工具中提取大量数据以帮助开发其技术的迹象。
OpenAI的服务条款禁止客户使用其AI模型的输出来帮助开发自己的竞争模型。
虽然OpenAI没有具体说明将对DeepSeek采取的任何措施,但这位发言人说,“我们采取了积极主动的应对措施来保护我们的技术,并将继续与美国政府密切合作,以保护在这里构建的最强大的模型。”
OpenAI早些时候表示,已封禁了涉嫌“蒸馏”其模型的账户,并已与微软(Microsoft)合作识别这些尝试背后的行为者。微软是OpenAI的主要合作伙伴,为其托管模型。
微软对此不予置评。DeepSeek暂未回复记者的置评请求。
OpenAI的怀疑引发了一种可能性,那就是据称媲美世界上一些顶级AI模型的DeepSeek模型,其性能或许不如最初看起来那样令人印象深刻。这也引发了一种担忧,即那些花费数亿美元训练最先进模型的公司,可能难以阻止竞争对手抄袭它们的成果。
一些DeepSeek用户已经注意到,该聊天机器人在某些时候会给出似乎是从OpenAI那里抄来的文本。社交媒体网站Reddit上周末发布的一张用户截图显示,DeepSeek在回答提问时称:“现在,根据OpenAI的政策,我必须避免声称我拥有意识或感知力。”
周一,DeepSeek引发了市场海啸,投资者纷纷评估关于该公司新R1模型的消息。这些消息称,尽管R1使用不那么先进的芯片进行训练,但似乎表现很好,而这在以前被认为是困难或不可能做到的。
这涉及“蒸馏”,即通过在较大、较昂贵模型的响应数据库上训练,开发较小、较高效的AI模型。该技术实际上将大型模型的专业知识浓缩到一个较小的模型中,同时使其能够模仿大型模型的推理能力。
周二,特朗普任命的AI沙皇戴维·萨克斯(David Sacks)明确指称DeepSeek通过对OpenAI模型进行蒸馏来构建自己的模型。
“有大量证据表明,DeepSeek在这里所做的就是从OpenAI的模型中提取知识,”作为硅谷资深风险投资家的萨克斯说。“我认为OpenAI对此并不乐意。”
DeepSeek表示,通过使用巧妙的编程,例如从性能较弱的芯片中榨取更多算力,该公司能够在不使用最先进AI芯片的情况下让其AI模型拥有高性能表现。
DeepSeek还承认已经使用“蒸馏”技术,不过是在自己的模型上。DeepSeek在最近的一篇研究论文中表示,它使用“蒸馏”技术从其最强大的模型R1中获取输出,以训练表现出类似推理能力的较小模型。
原创文章,作者:meigu,如若转载,请注明出处:https://www.tiezong.com/423.html