ChatGPT短时间内的流量爆发,在众多创业者心里激起涟漪。今年2月,原搜狗CEO、现百川智能创始人兼CEO王小川在微博上这样评价OpenAI的成功:“首先是技术理想主义的胜利。中国需要自己的OpenAI,就需要技术理想主义。我相信中国能诞生自己的OpenAI。” 于是,两个月后,百川智能诞生了。宣告成立后的百川智能动作频频,短短4个月内就发布了三款中文大模型,近日,第四款大模型——Baichuan 2开源大模型也由王小川正式对外公布,该公司追赶ChatGPT的脚程逐渐加快。然而,大模型领域汇聚了国内外互联网巨头,且是一个十分“烧钱“的行业,百川智能作为一个没有强大资本靠山的新生儿,想要复制“搜狗”曾经的辉煌,必然要经过“千锤百炼”。
“五道口守门员”再创业
(相关资料图)
离开搜狗之后,王小川的去向一直备受外界关注,直到今年4月,才由他本人揭开真相。
王小川成立AI大模型公司“百川智能”,希望借助语言AI的突破,构建中国最好的大模型底座。他的志向并不仅限于做“中国的OpenAI”,而是“建立世界级的视野和技术品质,让中国享有世界级的产品,产生有世界影响力的技术的突破,进而服务海外。”
能够在短短的时间内筹划起一家新公司,是因为王小川已经在资金和人才方面做好了一定的准备。据他介绍,百川智能早前已经获得了5000万美元启动资金,初步搭建起包括搜狗、百度等技术骨干在内的团队,并获得了包括清华大学计算机系教授,中国工程院院士,中国科学院院士等众多中国人工智能学术界领军人物的支持。
除了5000万美元启动资金,天眼查数据显示,今年5月,百川智能还完成了一笔天使轮融资,2023年最豪华投资机构阵容汇聚,这一轮融资由腾讯、小米、金山、慕华资本、清华控股、好未来、渶策资本、深创投、红点中国、卓源资本、众为资本、愉悦资本、顺为资本、心资本等十余家联合投资,具体融资金额不详。
然而,百川智能和以前的搜狗所面临的境遇并不相同,搜狗的诞生有当年的搜狐作为靠山,又有阿里巴巴和腾讯后续的战略入股,且当时的输入法市场并不像现在的大模型市场,刚刚兴起就进入“百模大战”的阶段。
早年间,在王小川的主持下,搜狗创先后开发出搜狗搜索、搜狗输入法、搜狗浏览器等产品, 并在这几大领域创造过“辉煌”,尤其是在阿里巴巴注资,搜狗单独运营之后。据公开报道,10年前,搜狗输入法在国内的市场份额曾达到87.8%,排名第一;搜狗搜索覆盖2亿用户数,覆盖率达45%,排名第三;搜狗高速浏览器用户覆盖率达24.93%,排名第三。
2017年,王小川带领搜狗在美国纽交所上市,辉煌达到顶峰,但此后,搜狗再也讲不出新故事,加上成本高昂导致的亏损,其运营日益维艰,不得不卖身腾讯。2021年10月15日,王小川宣布卸任搜狗CEO,2021年12月2日,王小川退出搜狗股东行列。
此后入局AI领域,其实在王小川早年的言语之中已见端倪。在搜狗时,王小川就多次表达过对人工智能的看重:“搜索帮助用户更好地获取信息,输入法帮助用户更好地表达信息,而无论是获取信息还是表达信息,都离不开对语言的理解,这也正是搜狗人工智能战略的核心”、“语言是人工智能皇冠上的明珠”……
在ChatGPT大火之后,王小川又指出,搜狗输入法和搜狗搜索的数据制备和产品形态,与ChatGPT接近,都是把互联网上的全部语言数据收集、清洗,压缩成数据并构建超级产品。
有意思的是,王小川一直被称为“五道口守门员”,从在清华大学的求学,到在搜狐和搜狗的创业,再到如今的百川智能,他始终没有离开这个创业者的宝藏之地。
大模型战场搏杀
尽管一直以来,很多人说王小川并不适合作为一个创业者的身份,更符合一个职业经理人的定位,但他愿意通过百川智能证明自己在创业方面的才能。在今年的一次媒体交流会上,王小川曾坦诚回答:“我习惯了一切 ready才公布,我承认这有职业经理人的惯性思维,但我走出来了,所以先选择向大家公布。”
创办百川智能后,王小川的步子迈得很大,走得也很快。
在近日Baichuan 2开源大模型发布之前,百川智能已经连续发布了包括:Baichuan-7B、Baichuan-13B、Baichuan-53B在内的三款中文大模型,并且成为首批通过《生成式人工智能服务管理暂行办法》备案,成为可以正式面向公众提供服务的企业,这在今年创立的大模型公司中是唯一一家。
而在Baichuan 2开源大模型的发布会上,王小川也在不断强调自家产品的技术优势,将Baichuan2与LLaMA2等同尺寸模型竞品进行了多方面的比较,并宣布本次开源的两个模型在各大评测榜单上的表现优秀,在MMLU、CMMLU、GSM8K等几大权威评估基准中,以绝对优势领先LLaMA2。
据介绍,新发布的Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6万亿高质量多语言数据进行训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署门槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。
除了大模型的研发,王小川也在加快应用层面的动作。这源于他的一趟美国之行,在和OpenAI等众多大模型从业者聊完后,王小川认为应该“在理想上慢一步,在落地上快三步”。按照他的规划,百川智能在今年三季度发布500亿参数模型,四季度发布千亿参数模型,2024年一季度发布超级应用。
不过,想要将百川智能打造成为中国的OpenAI,要过的,不止自己这道坎儿,还有面前的几大互联网巨头。截至目前,阿里巴巴、腾讯、百度均已实现大模型的落地,且它们的资金和技术优势是显而易见的。
文渊智库创始人王超就此对《华夏时报》记者表示,“其实在这一波大模型浪潮里,创业公司是非常不占有优势的,百川智能和光年之外都一样,当然现在光年之外已经被收购了。没有大量数据,也无法背靠巨头获得足够的芯片支撑,Open AI的崛起是借助了微软的算力资源和数据优势,百川智能从无到有要面临很大的竞争压力。当然这并不意味着初创公司就完全没有机会,只不过作为一家初创公司,依赖一个巨头去提供生存发展必需的养料、提供一定的庇护,是很有必要的。”
当然,王超还指出,百川智能最终在大模型以及AI领域的地位如何,最关键的还是产品技术的成熟度、客户体验是否改进、在与同类竞品对比中是否存在优势、大模型能不能提高生产力,然后才能考虑后续扩展到硬件和更多场景应用的事。
而作为一个在互联网领域叱咤风云20多年的人,王小川对于百川智能的未来还是很有信心的,“在美国做开源大模型或做通用已没有悬念,投资也已经明确,但在中国不是,国内谁能做最好的大模型现在没有定论,大家都有争取的机会,而且不一定落在大厂里面。”
责任编辑:黄兴利 主编:寒丰
关键词:
周三,沪深两市出现震荡走势,消费板块继续反弹。今年以来,消费增速较低,影响到消费股的表现,但实际上从长期来看,消费白马股具有品牌价值
金丹科技(300829)12月06日在投资者关系平台上答复了投资者关心的问题。投资者:投资者之前提出的意见和问题,管理层有何反馈?金丹科技董秘:
记者从河南省农业农村厅了解到,截至5月28日17时,河南已收获小麦856万亩(约占全省种植面积的10%),日投入联合收割机3 7万台。其中:信阳22