商用标准。但问题不在算法,在数据。”
他放大一张图表。
“你们用的训练数据,是公开的通用语料。但企业知识管理,需要的是行业垂直、场景特定的语料。用通用数据训练垂直模型,就像用教大学生的方法教小学生,效率低,效果差。”
赵成愣住了。
这确实是问题的核心。但团队讨论了两个月,才慢慢摸索到这个结论。林辰才看了几天材料,就一眼看穿?
“那……您的建议是?”赵成下意识用了敬语。
“换数据源。”林辰说,“我整理了星河过去五年服务过的企业客户资料——当然,是脱敏的。包括项目文档、会议纪要、客户反馈、解决方案,总共三百多万条数据。用这些数据重新训练模型,准确率能提到85%以上。够商用了。”
会议室里一片死寂。
三百多万条脱敏数据?这得是多大的工作量?而且还要清洗、标注、训练……林辰什么时候做的?
“数据我已经处理好了。”林辰像是看穿他们的心思,“训练框架也搭好了。赵成,会后你带技术团队跟我对一下,没问题的话,这周就开始训练。两周出结果,剩下六周开发产品,两个月上线,来得及。”
赵成张了张嘴,想说点什么,但一个字也说不出来。
他只能点头:“好。”
“还有什么问题吗?”林辰看向其他人。
没人吭声。
“那散会。赵成留一下,其他人可以回了。对了,”林辰补充,“刘薇,下午两点,市场部开会,讨论新业务线的推广方案。带上你的预算。”
“好的林总。”
人群陆续离开会议室。赵成坐在原位,看着林辰在平板上快速操作,心里那点不服气,慢慢变成了某种复杂的情绪。
是敬畏?还是恐惧?
他说不清。
2
下午一点半,林辰办公室。
赵成敲门进来时,林辰正在接电话。他指了指沙发,示意赵成先坐,继续对电话那头说:“对,数据安全协议必须签。我们的模型只输出结果,不保留客户原始数据。这是底线。”
电话打了五分钟。挂断后,林辰从办公桌后走出来,在赵成对面坐下。
“喝点什么?茶?咖啡?”
“不用了林总。”赵成摆摆手。
“那直接说正事。”林辰从茶几底下抽出厚厚一沓打印材料,“这是‘星链
本章未完,请点击下一页继续阅读!