赶“ChatGPT”潮的云知声
“山海”的故事。
2023-06-03撰文 | 田小梦
编辑 | 李信马
(相关资料图)
题图 | IC Photo
“去年12月份,我第一次看到ChatGPT的时候,是我创业十年中最灰暗、最沮丧的时候。ChatGPT所表现出的几乎百分之百准确的理解能力,以及前所未见的‘生存’能力,这让我们这些理工男能够安身立命的技能,好像瞬间没有了价值。”黄伟惆怅道。
面对ChatGPT的横空出世,发布仅5天注册用户就超100万的冲击,黄伟有差不多一周的时间里处于焦虑的状态。但这种焦虑,也让他有了解和钻研ChatGPT的冲动。通过网上的文章、论文等,以及与技术负责人交流后,在他看来,ChatGPT好像也没什么,它就像是一个做的更大的transform。
从挫折、沮丧,再到发现——“好像我们也可以”。正是抱着这样的期待,云知声在去年12月中下旬快速组建了团队,投身于大模型的研发过程中。今年2月底就研发出第一版“山海”大模型。黄伟感慨称:“看到一版的时候,我整个的感觉和我在十年前创业的第一刻是一样的。”
但伴随互联网巨头的加入,虽然为科技公司指出了发展的新路径、新机遇,但对于创业公司来说,这条路并不轻松。
在黄伟看来,人工智能正从1.0进入到2.0时代,但目前只是在2.0的起点位置。1.0时代,人工智能更多的是一种鉴别能力,即利用已有的数据来训练模型,让模型做出Yes or No的判断,但无法告知原因。而2.0时代,在大模型引领的AI 2.0时代,为人工智能带来了新的能力,可以打造更多新的产品,满足客户更多的需求,例如医疗、营销、沟通等,能够创造更多的商业机会。
同时,从数据来看,今天的数据还没充分发挥它应有的价值,而通过大模型的深度学习可以充分利用和使用数据价值。黄伟认为,大模型会成为人工智能2.0时代的“发电厂”。“谁拥有发电厂,谁就具有最大的商业价值。”
在业界都将目光锁定在大模型身上,并认为大模型是未来十年20年最大的机会之一时,云知声自然也不会放弃。再者,云知声在过去十年里,积累了大量算法、数据、工程落地经验,仿佛都是为“山海”而生。
天时地利加人和,这不正是云知声在去年12月份毅然决然投身大模型的底气。
图片来源:云知声
如今,“山海”大模型完成多轮优化升级,拥有超过十项技术能力。在通用能力上,包含语言生成、语言理解、知识问答、推理能力、数学能力、代码能力,以及与人类对齐的安全合规能力;在落地能力上,提供插件扩展、领域增强,以及企业定制能力。
01.
年内通用能力比肩ChatGPT
“目标年内通用能力比肩ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT4。”黄伟在发布会线上扬言称。这也透露出,云知声不是简单的将目光锁定在通用能力上,更看侧重TO B的落地场景中。
当然这步棋子的布局,离不开黄伟的经验。他从学术界到工业界,再到创业,完整的做过产品,深知人工智能只是一种能力,不能仅做酷炫的外表,而是要做完整的闭环。
其实,从云知声的发展也可以窥见一二。
2012年成立时,云知声就开始做自然语言理解,投入在整个对话AI的全栈能力研究中,形成数据、算力和算法完整的能力链条。2016年,当DeepMind AIphaGo 4:1 击败李世石时,云知声敏锐的意识到,人工智能的本质是认知智能,自然语言理解才是人工智能皇冠上的明珠,并在2016年年初开始布局超算——Atlas,并躬身入局物联网、医疗等领域,收获了真实的行业场景和数据。基于此,2022年云知声紧抓机遇,开启“山海”大模型研发,实现云知声的AI三级跳。
图片来源:云知声
在这新一轮的人工智能比拼中,为了提高大模型在具体场景的应用落地水平,云知声沿袭了一以贯之的U+X战略,即以 U(AI技术和产品能力),深度结合 X(行业应用场景),解决行业深层问题。
黄伟介绍称,山海大模型技术架构就是通用大模型,并针对知识密度高的领域,通过数据训练、训练数据、微调等方式,做一些专业的加强,这样模型既具备了通用应用水平,也针对特殊场景与领域进行了能力的加强。
如在医疗领域,以前医疗行业利用AI的方式去录入病例,但是医生依然需要逐字录入信息,如今借助山海大模型,只需要随着医患问答的过程中,就能够提取关键信息生成病例,提高了医疗的效率,同时,云知声在为医疗服务中积累的千万级的标准的医疗数据,并背靠国内最大的医疗知识数据图谱,使得山海大模型在MedQA评测能力中可超越GPT-4。
云知声科技董事长兼CTO梁家恩表示,就目前而言,大模型仍然是有限的东西,对于没有见过的东西,大模型会生成“似是而非”的回答,随着AI生成能力的不断增强,校验会更加困难,这也让AI行业需要不断去探索新的解决方法。
随着AGI时代的到来,云知声也迎来了自己的GPT时刻。“如果把通用大模型看作每科都能考到80分的学生,我们要做就是在某一两门学科上,考到95分甚至更高。”黄伟如是说。
02.
突围行业大模型
在这场声势浩大的 AGI 浪潮中,大模型与具体应用场景的深度融合已成必然。
近日,互联网大佬纷纷表态,百度创始人、董事长兼首席执行官李彦宏表示:“以后的应用、软件,基本都会基于大模型来进行开发。而产业界的变化,意味着很多新机会,其中一个方向就是AI for Science。”网易CEO丁磊认为:“AI的发展可以用百花齐放、百家争鸣来形容,但其中落地场景最关键。”
经过近几个月国内大模型的混战,除通用能力外,在B端已经开始拼场景、抢客户。
例如,第一个吃螃蟹的文心一言,其定位是一个通用的赋能平台,金融、能源、媒体、政务等千行百业。据了解,百度智能云大模型目前已经与不同领域客户联合研发,在智能办公、旅行服务、电商直播、政务服务、金融服务五大领域打造行业样板间。
阿里继发布大模型产品“通义千问”之后,阿里云先接入阿里“通义千问“大模型,又推出钉钉魔法棒功能。目前阿里云敲定了一系列生态伙伴——昆仑数智、中金财富、用友网络、亚信科技等七家数字化服务商成为首批伙伴,覆盖油气、电力、交通、金融、酒旅、企服、通信行业。
除“文心一言”“通义千问”为代表的互联网企业外,科大讯飞的“星火” 认知大模型也实现了应用落地,围绕“星火”认知大模型“1+N”架构中“N”个领域的内容,科大讯飞发布了大模型在教育、办公、汽车、数字员工等多个方向的行业应用成果。
图片来源:云知声
而同样在AI语音领域有一席之地的云知声,其市场策略上坚持“U+X”战略,在发布会线上除演示上述的医疗领域外,还在销售、知识管理、教育、智慧物联等方向有所落地。
不难看出,在这场AI对决中,无论是大厂还是创新企业的制胜点,不仅包括自身大模型的技术实力,还有大模型所赋能的场景,以及为合作伙伴带来的价值。
如今,企业发布大模型等同于拿到了进入AGI的门票,但场景的交叉、商业模式的落地,却打响了大模型落地的“发令枪”。谁能在这场博弈中突出重围,还有待考验。