不愿去烘焙专门店的年轻人,爱上了商超烘焙
他认为,不愿焙专虽然上述这些不像技术看起来那么复杂,但是需要时间,需要不断去搭资源。
张鹏:去烘轻人通用大模型的能力提升所衍生的能力,能让我们去寻找到大模型原生的应用或者大模型原生场景。所以我主张要在企业用大模型不要一下子宏大叙事,门店而是在内部业务链条,或在外部产品功能中,选取两到三个场景,用大模型赋能。
比如,上商超要给医疗机构做一个医药医疗大模型,上商超必须把医疗进行场景细分——在里边找出50到100个场景,并对每个场景分析,看看文章生成、情感判断、内容翻译等大模型最常见的功能能不能发挥作用。所以,烘焙我谈的小切口,就是刚开始宁可保守一点,积小胜于大胜。不愿焙专责任编辑:孟俊莲主编:张志伟。
但如果把大模型越做越小,去烘轻人走垂直化、去烘轻人产业化、企业化、场景化的道路,可能不需要万亿、千亿的参数,只需要百亿的参数,再加上一些私有的核心数据加持,在一个垂直单元上是可以超过GPT-4的。如果GPT-4是100分的话,门店GPT-3.5差不多应该有75分到80分,我认为这个速度就很快了。
能不能做这个大模型取决于两个因素:上商超一是场景下有没有数据知识,因为没有知识、光有场景,训不出大模型。
2023年,烘焙中国有上百家公司在做大模型,鱼龙混杂,泥沙俱下不愿焙专责任编辑:孟俊莲主编:张志伟。
这就对算力的要求就降到很低,去烘轻人可能有十张消费级显卡在一个场景就能用起来,非常适合我们国家,这也是我们弯道超车的一个场景。所以,门店我们要找到一个底盘,把发动机装上,再给它装上外壳、座椅,最后交付一辆车,企业才能用。
其次,上商超美国也不是全面领先,美国真正在人工智能领先的公司,我认为就两家,软件是OpenAI,硬件是英伟达。2024年两会期间,烘焙人工智能+首次被写入《政府工作报告》。
相关文章: