字节跳动布局大模型 分别在语言和图像两种模态上发力

  2月23日消息,据36氪报道,字节跳动在大模型上已有所布局,分别在语言和图像两种模态上发力。字节跳动相关技术负责人对此回应:技术中台在这些领域有探索,还很初期,不成熟。

  一名知情人士透露,语言大模型团队由字节搜索部门牵头,目前团队规模在十数人左右。图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。

  另有知情人士表示,字节跳动语言大模型团队在今年组建,探索方向主要为与搜索、广告等下游业务的结合,“搜索业务部门、AI Lab和AML(应用机器学习)团队都调了一部分人支援语言大模型,团队目前的预期是在今年年中推出大模型”。

  据悉,语言大模型团队负责人与图像大模型团队负责人的间接和直接汇报对象,均为Tik Tok产品技术负责人朱文佳。加入字节跳动前,朱文佳曾在百度担任搜索部主任架构师。朱文佳于2015年进入头条,被称为“头条里算法技术的Top 3人选”。四年后,他成为今日头条CEO。2021年2月,他又调任成为Tik Tok产品技术负责人,向Tik Tok CEO周受资汇报。

朱文佳,图源:今日头条官微

  此外,一名AI资深从业者透露,字节并不缺GPU。字节旗下的企业技术服务平台火山引擎,在2021年正式进军基础云市场(IaaS层),为大模型所需的算力奠定了基础。

  上述从业者表示:“从训练大模型的角度而言,工程团队和云服务团队一样关键,在两者上均无短板的字节跳动具有一定优势。”

  对AI领域的布局,字节的反应速度一直较快。据了解,目前AIGC(AI生成内容)技术也已结合到头条的内容创作以及抖音的图文内容生成中。比如2021年,抖音上线的可以把人脸卡通画的“漫画脸”特效就小有出圈。

  但ChatGPT的成功模式已证明,大模型的训练是入场费高昂的长跑。另有知情人士表示,在ChatGPT公开前,字节内部对大模型的投入依然较为犹疑,“对于字节的产品矩阵来说,目前的算法已经够用”。

电商资讯*版权声明:本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。 本网站所提供的信息,只供参考之用。本网站不保证信息的准确性、有效性、及时性和完整性。本网站及其雇员一概毋须以任何方式就任何信息传递或传送的失误、不准确或错误,对用户或任何其他人士负任何直接或间接责任。在法律允许的范围内,本网站在此声明,不承担用户或任何人士就使用或未能使用本网站所提供的信息或任何链接所引致的任何直接、间接、附带、从属、特殊、惩罚性或惩戒性的损害赔偿。
文章网址:http://www.cnecn.com.cn/service/tech/2023-02-23/9710.html
赞 | 0