王小川再创业“跑步入场”大模型，百川智能争锋大厂胜算几何

当前所在位置：首页 > 要闻

王小川再创业“跑步入场”大模型，百川智能争锋大厂胜算几何

2023-09-08 13:23:54来源：腾讯网

ChatGPT短时间内的流量爆发，在众多创业者心里激起涟漪。今年2月，原搜狗CEO、现百川智能创始人兼CEO王小川在微博上这样评价OpenAI的成功：“首先是技术理想主义的胜利。中国需要自己的OpenAI，就需要技术理想主义。我相信中国能诞生自己的OpenAI。” 于是，两个月后，百川智能诞生了。宣告成立后的百川智能动作频频，短短4个月内就发布了三款中文大模型，近日，第四款大模型——Baichuan 2开源大模型也由王小川正式对外公布，该公司追赶ChatGPT的脚程逐渐加快。然而，大模型领域汇聚了国内外互联网巨头，且是一个十分“烧钱“的行业，百川智能作为一个没有强大资本靠山的新生儿，想要复制“搜狗”曾经的辉煌，必然要经过“千锤百炼”。

“五道口守门员”再创业

(相关资料图)

离开搜狗之后，王小川的去向一直备受外界关注，直到今年4月，才由他本人揭开真相。

王小川成立AI大模型公司“百川智能”，希望借助语言AI的突破，构建中国最好的大模型底座。他的志向并不仅限于做“中国的OpenAI”，而是“建立世界级的视野和技术品质，让中国享有世界级的产品，产生有世界影响力的技术的突破，进而服务海外。”

能够在短短的时间内筹划起一家新公司，是因为王小川已经在资金和人才方面做好了一定的准备。据他介绍，百川智能早前已经获得了5000万美元启动资金，初步搭建起包括搜狗、百度等技术骨干在内的团队，并获得了包括清华大学计算机系教授，中国工程院院士，中国科学院院士等众多中国人工智能学术界领军人物的支持。

除了5000万美元启动资金，天眼查数据显示，今年5月，百川智能还完成了一笔天使轮融资，2023年最豪华投资机构阵容汇聚，这一轮融资由腾讯、小米、金山、慕华资本、清华控股、好未来、渶策资本、深创投、红点中国、卓源资本、众为资本、愉悦资本、顺为资本、心资本等十余家联合投资，具体融资金额不详。

然而，百川智能和以前的搜狗所面临的境遇并不相同，搜狗的诞生有当年的搜狐作为靠山，又有阿里巴巴和腾讯后续的战略入股，且当时的输入法市场并不像现在的大模型市场，刚刚兴起就进入“百模大战”的阶段。

早年间，在王小川的主持下，搜狗创先后开发出搜狗搜索、搜狗输入法、搜狗浏览器等产品，并在这几大领域创造过“辉煌”，尤其是在阿里巴巴注资，搜狗单独运营之后。据公开报道，10年前，搜狗输入法在国内的市场份额曾达到87.8%，排名第一；搜狗搜索覆盖2亿用户数，覆盖率达45%，排名第三；搜狗高速浏览器用户覆盖率达24.93%，排名第三。

2017年，王小川带领搜狗在美国纽交所上市，辉煌达到顶峰，但此后，搜狗再也讲不出新故事，加上成本高昂导致的亏损，其运营日益维艰，不得不卖身腾讯。2021年10月15日，王小川宣布卸任搜狗CEO，2021年12月2日，王小川退出搜狗股东行列。

此后入局AI领域，其实在王小川早年的言语之中已见端倪。在搜狗时，王小川就多次表达过对人工智能的看重：“搜索帮助用户更好地获取信息，输入法帮助用户更好地表达信息，而无论是获取信息还是表达信息，都离不开对语言的理解，这也正是搜狗人工智能战略的核心”、“语言是人工智能皇冠上的明珠”……

在ChatGPT大火之后，王小川又指出，搜狗输入法和搜狗搜索的数据制备和产品形态，与ChatGPT接近，都是把互联网上的全部语言数据收集、清洗，压缩成数据并构建超级产品。

有意思的是，王小川一直被称为“五道口守门员”，从在清华大学的求学，到在搜狐和搜狗的创业，再到如今的百川智能，他始终没有离开这个创业者的宝藏之地。

大模型战场搏杀

尽管一直以来，很多人说王小川并不适合作为一个创业者的身份，更符合一个职业经理人的定位，但他愿意通过百川智能证明自己在创业方面的才能。在今年的一次媒体交流会上，王小川曾坦诚回答：“我习惯了一切 ready才公布，我承认这有职业经理人的惯性思维，但我走出来了，所以先选择向大家公布。”

创办百川智能后，王小川的步子迈得很大，走得也很快。

在近日Baichuan 2开源大模型发布之前，百川智能已经连续发布了包括：Baichuan-7B、Baichuan-13B、Baichuan-53B在内的三款中文大模型，并且成为首批通过《生成式人工智能服务管理暂行办法》备案，成为可以正式面向公众提供服务的企业，这在今年创立的大模型公司中是唯一一家。

而在Baichuan 2开源大模型的发布会上，王小川也在不断强调自家产品的技术优势，将Baichuan2与LLaMA2等同尺寸模型竞品进行了多方面的比较，并宣布本次开源的两个模型在各大评测榜单上的表现优秀，在MMLU、CMMLU、GSM8K等几大权威评估基准中，以绝对优势领先LLaMA2。

据介绍，新发布的Baichuan2-7B-Base 和 Baichuan2-13B-Base，均基于 2.6万亿高质量多语言数据进行训练，在保留了上一代开源模型良好的生成与创作能力，流畅的多轮对话能力以及部署门槛较低等众多特性的基础上，两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。

除了大模型的研发，王小川也在加快应用层面的动作。这源于他的一趟美国之行，在和OpenAI等众多大模型从业者聊完后，王小川认为应该“在理想上慢一步，在落地上快三步”。按照他的规划，百川智能在今年三季度发布500亿参数模型，四季度发布千亿参数模型，2024年一季度发布超级应用。

不过，想要将百川智能打造成为中国的OpenAI，要过的，不止自己这道坎儿，还有面前的几大互联网巨头。截至目前，阿里巴巴、腾讯、百度均已实现大模型的落地，且它们的资金和技术优势是显而易见的。

文渊智库创始人王超就此对《华夏时报》记者表示，“其实在这一波大模型浪潮里，创业公司是非常不占有优势的，百川智能和光年之外都一样，当然现在光年之外已经被收购了。没有大量数据，也无法背靠巨头获得足够的芯片支撑，Open AI的崛起是借助了微软的算力资源和数据优势，百川智能从无到有要面临很大的竞争压力。当然这并不意味着初创公司就完全没有机会，只不过作为一家初创公司，依赖一个巨头去提供生存发展必需的养料、提供一定的庇护，是很有必要的。”

当然，王超还指出，百川智能最终在大模型以及AI领域的地位如何，最关键的还是产品技术的成熟度、客户体验是否改进、在与同类竞品对比中是否存在优势、大模型能不能提高生产力，然后才能考虑后续扩展到硬件和更多场景应用的事。

而作为一个在互联网领域叱咤风云20多年的人，王小川对于百川智能的未来还是很有信心的，“在美国做开源大模型或做通用已没有悬念，投资也已经明确，但在中国不是，国内谁能做最好的大模型现在没有定论，大家都有争取的机会，而且不一定落在大厂里面。”

责任编辑：黄兴利主编：寒丰

关键词：