> 推荐 >

百度施恩:通用大模型是偏体验性的,解决问题应深入行业场景

时间:2023-06-07 15:10:51       来源:封面新闻


(资料图片)

尽管ChatGPT早在去年就吸引了不少关注,但国内的“百模大战”还是在大语言模型“文心一言”推出后,才掀起高潮。随着华为盘古、360智脑、阿里通义千问、京东灵犀等大模型产品先后上线,国产大模型还会在哪些领域实现突破?

“企业对于通用大模型的需求也是有,但不是说特别多;因为更多还是要解决专业的问题。”6月6日,百度智能云AI平台副总经理施恩在成都接受记者采访时表示,企业应用场景并不关注通用能力,更关注的是怎么样能够跟企业场景更好结合,帮助它们实现业务价值。

公开资料显示,以上线时间最久的文心一言为例,上线两个多月,已经迭代了4个版本,高频场景的性能提升了50倍,同时也在实现更多工具链相关的能力,推动其在企业场景中的落地。

“在生成式AI浪潮之前,已经有不少科技公司在训练行业大模型了。”据施恩介绍,当时虽然没有生产式AI应用形态,本身的基座模型其实是统一的;大语言模型出现后,则进一步推动了行业大模型之上应用进入企业场景。“不过由于行业大模型的训练门槛高,目前集中于金融、能源、政务领域。”

如果进入企业,当前以图文为主的应用外延势必不够。那么,通用大模型还有望在哪些应用领域进一步突破?对此,施恩表示,目前,大模型已经涵盖了跨模态的功能,并由自然语言处理技术驱动,除了文生图之外,还会有视觉、生物计算等方面的能力。“之所以现阶段的应用集中于视频、文本等多媒体领域,也是由于这方面应用的信息量更大,对算力的要求也更高”。

此外,从通用领域进入企业内部相对封闭的场景,跨越专业知识库数据的理解鸿沟,也是大模型产品所面对的一个挑战。在施恩看来,当前可行的解决方案是,让行业企业与平台结合,通过与企业业务系统集成、优化,实现大模型的精调。

“通用模型更多是偏体验性的,真正解决问题的还是深入行业场景,比如做营销文案创作这类基于通用模型与行业场景的结合,对企业来说更重要。”谈及大模型领域发展的趋势,施恩预测,大模型会像所有新事物的发展规律一样,面世初期发展得很快,然后逐步进入平稳发展的阶段。“大模型平台现在仍处于高速发展期,迭代节奏非常快;等到其能力完整性补齐后,就会进入正常的发展阶段。”

关键词:
精彩推送