5月6日,科大讯飞正式发布并现场展示其大模型产品“星火认知大模型”,以及在教育、办公、汽车、数字员工四个领域的应用,特别是大模型与旗下教育产品ai学习机以及办公产品讯飞听见相结合后的落地场景。
科大讯飞董事长刘庆峰在发布会上表示,当前讯飞星火认知大模型在文本生成、知识问答、数学能力三大能力上已超chatgpt,10月底将整体赶超chatgpt。
讯飞星火7项能力 图源:科大讯飞
国产大模型混战
刘庆峰和科大讯飞研究院院长刘聪一同在现场进行了1个小时左右的实时演示。
姗姗来迟的科大讯飞亮出了“拿手活儿”,可以通过语音对话交互的星火大模型引起线上不少观众的关注。不过受到口音的影响,星火大模型在“听”问题时偶尔会出现失误。
“今天是科大讯飞星火认知大模型的发布会……请帮我写一篇欢迎词。”刘聪用一个相对简单的长文本生成热场,并现场展示了其语言理解、知识问答、逻辑推理、数学能力、代码能力与多模态能力。
“俗话说,男子汉大丈夫宁死不屈,但俗话又说,男子汉大丈夫能屈能伸。”在语言理解方面,星火大模型解释了两句话在不同场景下的含义,还能解答在和女朋友吵架时的正确做法,“应该要能屈能伸”。
又比如,当问到“孔子在2008年的奥运会上说了些什么”,星火大模型及时指出,孔子为古代人物不可能在奥运会上发言。但如果假设孔子在2008年奥运会上做汉语培训,它就会重新生成一个符合设定的故事。
刘庆峰表示,虽然目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易“编造情节”等,但他认为这些问题在今年会有明显的改进。
“超出预期,国内能做到这个水平挺欣慰的。”一名长期关注大模型领域的从业者在看完科大讯飞发布会后向时代财经表示。
自3月16日百度率先公布“文心一言”以来,阿里、360、昆仑万维、商汤等公司相继对外展示了大模型项目进展,一时之间,国内大模型领域风起云涌。据民生银行不完全统计,国内已经有超过30项大模型产品亮相。
出门问问创始人、ceo李志飞预测,在中国,1-2年以后,会看到50家以上公司做大模型。
部分公开大模型进展的公司 图源:时代财经制图
为何各家公司如此密集地发布大模型产品?“aigc会带来科技变革,且chatgpt国内应用存在监管障碍,所以国内大模型存在市场空白。”浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林指出,各家企业密集抢跑,是为了在中文大模型领域占据先机,“大模型是根本,有大模型就有了aigc领域的入场券。”
“不看谁发的早一个月还是晚一个月,要看今天这个时间点上谁的水平最高,我自己非常自豪地告诉大家,在我们能测到的各种平台中,讯飞的水平是最好的。”在会后媒体群访时,刘庆峰解释道,科大讯飞发布大模型的时间并不晚,星火大模型还在快速升级和迭代过程中,但在中文长文本生成方面,科大讯飞已经明显领先于其他友商。
刘庆峰表示,今年内大模型技术还将经历3次升级,预计到10月24日,将实现通用模型对标chatgpt,中文超越chatgpt的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。
大模型开始拼场景
“谁能够在具备社会刚需的应用场景落地,谁就最先能形成自我造血的良性循环。”刘庆峰在会后采访中强调。
在4月的财报业绩会上,科大讯飞透露,公司自去年12月15日正式启动“1 n”认知大模型专项攻关,其中“1”就是指通用认知智能大模型,“n”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。
尽管大模型领域热度正高,但距离谈商业化还为时尚早。
时代财经注意到,比起通用大模型,国内不少公司将关注点放在垂直领域中大模型的应用。4月11日,毫末智行发布自动驾驶生成式大模型drivegpt,且将在长城汽车即将量产上市的新车型上落地。5月5日,学而思表示正在进行自研数学大模型(mathgpt)的研发,将以针对数学领域的解题为核心。
在具体产品上,科大讯飞着重展示了星火大模型与已有的ai学习机和录音转写工具讯飞听见相结合的落地,大模型的技术应用得以直观显现。
大模型与学习机结合批改作文 图源:科大讯飞发布会
例如,在搭载星火大模型的科大讯飞ai学习机t20系列上,可以实现像真人老师一样批改作文,从检查错别字、到语句措辞,再到整体结构,整体打分并给出修改意见,售价7399元起。
而在办公领域,大模型加上讯飞听见,就是新一代的“讯飞听见会写”。除了能够实现语音转文字外,还可以一键生成全文摘要、工作待办、工作计划、新闻稿件、宣传文案、多语种翻译等多种文本。
在上述c端服务之外,科大讯飞也展示了大模型与智能驾驶、智慧金融等企业用户结合的思考。刘庆峰坦言,关于大模型的商业模式仍在设想中,“n”中的每一个产品都可以变现,基于讯飞生态的超500万亚博电竞手机版的合作伙伴,也可以在通用大模型的加持下进一步发掘落地的机会。同时,还可以参考chatgpt的收费模式。
“另外,我也特别看好的是认知大模型所带来的新机会。因为语言理解能力的提升,它可以使用工具,然后加上代码能力,在工业互联网领域会形成巨大的突破,会有力地推动万物互联时代的到来。”他表示。
此外,刘庆峰在演示中还特别提到了星火大模型在医疗场景中的可能性。他表示,在专业领域中,科大讯飞目前推出的智医助理“比gpt-4还要强很多”。
不过考虑到医疗领域的特殊性,科大讯飞尚未发布医疗领域专用大模型,预计将会在10月24日左右正式推出。