1核心提示
2发布时间
3资讯详情
这在过去是罕见的,因为 ToB 和 ToC,意味着公司组织、DNA、团队的技术构建方式不一样,原来做用户产品的,很难想象一夜之间能服务 B 端客户。但在大模型这个高门槛、高不确定性的创业赛道上,同时兼顾,已经成为大家共同的选择。
零一万物团队表示,AI Infra 支撑了其超行业水平的训练效果。通过 AI Infra,Yi-34B 模型的训练成本实测下降了 40%——如果说别的公司需要 2000 台 GPU 训练一个模型,那么零一万物可能只要 1200 台——进一步模拟上到千亿规模训练成本可下降多达 50%。
零一万物的路径选择,也是 AI 2.0 创业潮的产业缩影。开源、闭源并线进行,基础模型和超级应用都做,甚至 ToB、ToC 的商业化同时探索。
摘要
考虑到 AI 1.0 时代有些做不出收入的公司被淘汰的前车之鉴,李开复谈到,在 AI 2.0 时代,做出收入,并且是「持续做出高质量收入」就非常重要,零一万物接下来的 APP 以及未来的 Super APP 都应该基于上述原则去推动与发展。
在语言模型中,上下文窗口是大模型综合运算能力的金指标之一,对于理解和生成与特定上下文相关的文本至关重要。在文档摘要、基于文档的问答等下游任务中,长上下文的能力也发挥着关键作用,应用场景广阔,比如在法律、财务、传媒、档案整理等诸多垂直场景里,如果使用更准确、更连贯、速度更快的长文本窗口功能,就能更高效地提高生产力。
而李开复本人,也为零一万物的团队构成做出了最好的背书。作为第一代留学 CMU 的华裔 AI 科学家,经历过微软的 PC 时代,谷歌的移动互联网时代,李开复对 AI Native 应用有异于常人的敏感。不久前,在极客公园组织的西溪论道上,李开复对「什么是 AI Native 的应用」的定义,在产业圈快速蔓延,得到了一致认可。
对于接下来的计划,李开复剧透,在模型上,未来会陆续宣布更多团队成果,包括:更大尺寸、对话模型、加强的数学和代码模型、多模态模型。除了模型之外,一个 Super APP 的雏形也会在不久的将来跟大家分享。
零一万物自研出一套「规模化训练实验平台」,数据配比、超参搜索、模型结构实验都可以在小规模实验平台上进行,对 34B 模型每个节点的预测误差都可以控制在 0.5% 以内。
零一万物 AI Infra 负责人戴宗宏透露:两千亿模型的前置实验已经做完,在按部就班训练中;针对万亿模型的相关研究工作已经同步开展,希望整个训练过程一棒接一棒地持续滚动下去。
据悉,零一万物已完成新一轮融资,由阿里云领投。当前,零一万物估值已超 10 亿美元。
根据 Hugging Face 英文开源社区平台和 C-Eval 中文评测的最新榜单,Yi-34B 预训练模型取得了多项 SOTA 国际最佳性能指标认可,在一些关键指标上优于包括 Meta 的 Llama 2 在内的领先开源模型,是目前唯一成功登顶 Hugging Face 全球开源模型排行榜的国产模型。公司企业资讯网 - 企业信息网
11 月 6 日,李开复在零一万物线上发布会中答记者问|截图来源:极客公园
他认为,如果 PC 时代赋予给开发者用户的机会,是 computer on every Desktop;移动互联网带来的可能是基于位置的、个性化的、随时随地的计算;AI 2.0 时代带来的巨大机会,就是把一个超级大脑对接、赋能给每一个应用。
宛辰2023/11/06
李开复将公司的首次公开亮相称为「Yi」鸣惊人,表示 Yi-34B 是「全球最强开源模型」,通用能力、知识推理、阅读理解等多指标击败全球玩家。并称零一万物在数据采集、算法研究、团队配置等环节均为「世界第一梯队」,对标 OpenAI、谷歌等一线大厂。
对于做 Super APP 的方法论,李开复认为一定是一个很简单的开始,用精益创业的方法不断地迭代。就像抖音和微信的第一个版本,并不是超级应用,而是捕捉到了用户需求,并用新平台的技术精髓,做一个大家喜欢的简单应用,然后根据用户反馈不断调整,最终迭代成为超级应用。
Yi-34B 拥有全球最长 200K 上下文窗口,可处理 40 万汉字超长文本输入,相比之下,OpenAI 的 GPT-4 上下文窗口为 32 K,文字处理量约 2.5 万字,Anthropic 的 Claude2-100K 上下文窗口也只有 100K 规模。
零一万物强调其对大模型的数据筛选能力,让它获得了更多高质量的数据。首先,它先用 AI 做筛选,再进行人工评估、不断迭代,其数据滤除率约为同行的十分之一。其次,它的英文语料要高于中文语料,因为英文语料的质量更高。
基于上述判断,零一万物选择在 AI 2.0 时代,开发最好的大模型底座、行业模型,一边寻找最大的商机——一个消费者级别的超级应用。
目前,「Yi」有 Yi-34B、Yi-6B 两尺寸可选,均为双语(英文/中文),适合多元场景,对学术研究完全开放、同步开放,商用申请免费。
几个月来,零一万物的进展不可谓不顺利:
同时,李开复宣布零一万物已启动下一个千亿参数模型的训练,接下来也将快节奏推出 Yi 系列量化版本、对话模型、数学模型、代码模型、多模态模型等。
零一万物解释为什么选择 34B 的规模,图源 | 零一万物
这次亮相,零一万物也揭开了其团队构成这个神秘面纱的一角。会上,零一万物两位技术副总裁,Pretrain 负责人黄文灏和 AI Infra 负责人戴宗宏,也一同出席。零一万物方面称,团队核心成员拥有 Google、微软、阿里巴巴、百度、字节跳动、腾讯等国内外顶级企业背景,并持续延揽全球范围内最优秀的华人 AI 精英。
4大家还在看:
- 寒潮,多云,冷空气,最高气温,北京最低温今年下半年来首次跌破冰点
- 反导系统,防空系统,有史以来首次在太空进行的战斗?以色列“王牌武器”大气层外击落胡塞武装导弹
- 总成交额,“中美缓和小周期”启动在即?以史为鉴这三大行业更易取得超额收益,关税,依赖度,加征,核心受益标的梳理
- 国际女子职业网联,网友:伴娘还是没能抢走新娘风头,斯瓦泰克送蛋夺冠重返世界第一
- 刘和平:连盟友也反对,刘和平(剧作家),编剧,布林肯,伊拉克,美国为何力挺以色列?,加沙地带
- 短剧,真人互动影视游戏火了!受益上市公司梳理,游戏制作
- 除非尽快找到新技术,乌方,俄罗斯,克里米亚,乌克兰战争,乌军总司令:俄乌冲突已经陷入僵局
- 薇拉·兹沃纳列娃,国际女子职业网联,网球运动员,中国网球赛事,时隔19年再度参加总决赛双打比赛,奥林匹克运动会,兹沃娜列娃成功夺冠!,美网
- 四川省,用房,住宅,四川规范农村宅基地范围及面积标准:住房用地面积平原地区每人不超30平方米
- 北京舞蹈学院BDA舞蹈论坛开幕,中国舞蹈,桃李杯,首推“学术月”概念,艺术
- 直播间里,伊能静贩卖自己,社交平台,刘文正,秦昊,梅艳芳,庾澄庆,娱乐圈
- 孙梅君任中共河南省委副书记,常委
- 勇士队,命中率超190俱乐部,这35岁?库里赛季场均31.7分钟轰30.9分,斯蒂芬·库里,底特律活塞队
- 国际足球赛事,波兰足球,法国足球,利云度夫斯基,罗伯特·莱万多夫斯基,足球竞赛,记者:多支美职联球队有意在休赛期引进莱万多夫斯基,巴塞罗那队,新合同
- BBA进博六年间,奥迪,梅赛德斯,汽势焦点,交互概念车,奔驰,bba,宝马,bmw
- “小兵张嘎”在雄县家乡大婚,摆千人流水席
- 突然分手?,罗志祥周扬青临近结婚